CN111369007B - 一种人工智能模型上线的方法和装置 - Google Patents
一种人工智能模型上线的方法和装置 Download PDFInfo
- Publication number
- CN111369007B CN111369007B CN202010137007.3A CN202010137007A CN111369007B CN 111369007 B CN111369007 B CN 111369007B CN 202010137007 A CN202010137007 A CN 202010137007A CN 111369007 B CN111369007 B CN 111369007B
- Authority
- CN
- China
- Prior art keywords
- data
- storage unit
- feature
- unit
- queue
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 92
- 238000012545 processing Methods 0.000 claims abstract description 122
- 238000003860 storage Methods 0.000 claims description 310
- 230000002776 aggregation Effects 0.000 claims description 108
- 238000004220 aggregation Methods 0.000 claims description 108
- 230000008569 process Effects 0.000 claims description 27
- 238000013500 data storage Methods 0.000 claims description 20
- 238000011084 recovery Methods 0.000 claims description 9
- 230000005540 biological transmission Effects 0.000 claims description 4
- 230000004931 aggregating effect Effects 0.000 claims description 2
- 238000003672 processing method Methods 0.000 claims 11
- 238000004148 unit process Methods 0.000 claims 1
- 238000013473 artificial intelligence Methods 0.000 abstract description 5
- 238000012546 transfer Methods 0.000 description 10
- 238000010586 diagram Methods 0.000 description 6
- 230000006870 function Effects 0.000 description 5
- 238000009825 accumulation Methods 0.000 description 4
- 238000003491 array Methods 0.000 description 4
- 230000008878 coupling Effects 0.000 description 4
- 238000010168 coupling process Methods 0.000 description 4
- 238000005859 coupling reaction Methods 0.000 description 4
- 238000012549 training Methods 0.000 description 3
- 238000004590 computer program Methods 0.000 description 2
- 238000012805 post-processing Methods 0.000 description 2
- 230000000717 retained effect Effects 0.000 description 2
- 101000860173 Myxococcus xanthus C-factor Proteins 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 230000001934 delay Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/01—Protocols
- H04L67/12—Protocols specially adapted for proprietary or special-purpose networking environments, e.g. medical networks, sensor networks, networks in vehicles or remote metering networks
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Medical Informatics (AREA)
- Computing Systems (AREA)
- Software Systems (AREA)
- Data Mining & Analysis (AREA)
- Computer Networks & Wireless Communication (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Mathematical Physics (AREA)
- Signal Processing (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提供了一种人工智能模型上线的方法和装置,所述方法包括:由数据接入模块从至少一个传感器实时接收数据,并将接收的数据分配到至少一个数据处理模块;以及由所述至少一个数据处理模块中的每一个数据处理模块利用所述模型对各自分配到的数据进行处理。
Description
技术领域
本申请总体说来涉及人工智能(AI)模型上线的技术领域,更具体地讲,涉及AI模型上线的方法和装置。
背景技术
一套完整的AI开发及应用平台不仅需要包括数据采集、数据处理、特征工程构建、模型训练等离线调研环节,也应当包括模型上线、A/B测试、灰度发布等线上生产环节。在物联网(IoT)场景下,数据通常由成千上万个传感器产生,并实时传输到模型所在的系统中。数据通常为实时的数据流且数据量也都比较大。因此在模型上线时,需要系统有处理实时数据流的能力,如果处理速度慢于数据的输入速度,则会造成数据的慢慢积压,最终导致系统的崩溃。同时,一般在IoT场景下,数据是具有时效性和时序性的,过大的延迟和乱序会导致根据数据产生的结果失去意义。
发明内容
本申请的示例性实施例在于提供一种模型上线的方法及其装置,以至少解决现有技术存在的上述问题。
根据本申请的示例性实施例,提供一种模型上线的方法,所述方法可包括:由数据接入模块从至少一个传感器实时接收数据,并将接收的数据分配给至少一个数据处理模块;以及由所述至少一个数据处理模块中的每一个数据处理模块利用至少一个模型并行地对所述每一个数据处理模块分配到的数据进行处理。
可选地,由数据接入模块从至少一个传感器实时接收数据的步骤可包括:由第一数据接收单元从接收的数据中解析键值,并通过利用第一特征存储单元队列来存储解析出的键值和接收的数据中未被解析的其它数据;由至少一个数据存储单元并行地从存储的所述未被解析的其它数据中解析感测值,将解析出的感测值和通过利用第一特征存储单元队列存储的相应键值成对地存储到数据库中,并通过利用第二特征存储单元队列来存储所述相应键值;以及由第一数据聚合单元对通过利用第二特征存储单元队列存储的键值进行聚合处理以恢复键值的时序。
可选地,由第一数据聚合单元对通过利用第二特征存储单元队列存储的键值进行聚合处理的步骤可包括:由第一数据聚合单元确定消息列表中是否已存在与包括在通过利用第二特征存储单元队列存储的一个键值中的时间信息相应的特征列表;如果所述消息列表中已存在所述特征列表,则由第一数据聚合单元将通过利用第二特征存储单元队列存储的与该时间信息对应的所有键值存储到所述特征列表中;如果所述消息列表中不存在所述特征列表,则由第一数据聚合单元在所述消息列表中创建与该时间信息对应的特征列表,并将通过利用第二特征存储单元队列存储的与该时间信息对应的所有键值存储到创建的特征列表中。
可选地,由第一数据聚合单元通过利用第二特征存储单元队列存储的键值进行聚合处理的步骤还可包括:当数据接入模块未接收到新数据的时间超过预设阈值时,由第一数据聚合单元将所有特征列表中的键值传递给数据路由单元,并删除所有特征列表。
可选地,将接收的数据分配给至少一个数据处理模块的步骤可包括:由数据路由单元将经过聚合处理的键值以预定规则分配给所述至少一个数据处理模块。
可选地,由所述至少一个数据处理模块中的每一个数据处理模块利用至少一个模型并行地对所述每一个数据处理模块分配到的数据进行处理的步骤可包括:由第二数据接收单元通过利用第三特征存储单元队列来存储分配得到的键值;由所述至少一个模型中的样本拼接单元根据通过利用第三特征存储单元队列存储的键值在所述数据库中查找相应的感测值,并根据查找到的感测值计算特征;由所述至少一个模型中的模型预测单元根据样本拼接单元计算出的特征进行预测以获得预测结果,并通过利用第四特征存储单元队列来存储所述预测结果以及相应的键值。
可选地,由所述至少一个数据处理模块中的每一个数据处理模块利用所述模型对各自分配到的数据进行处理的步骤还可包括:由第二数据聚合单元根据通过利用第四特征存储单元队列存储的键值对存储的相应的预测结果进行聚合处理以恢复预测结果的时序;由专家规则单元按照预定规则对时序恢复后的预测结果进行处理以获得最终的预测结果。
可选地,由专家规则单元按照预定规则对时序恢复后的预测结果进行处理以获得最终的预测结果的步骤可包括:由专家规则单元按照包括在键值中的位置信息对预测结果进行累加统计;由专家规则单元确定与所述位置信息相应的被统计的预测结果的最大时间信息和最小时间信息之间的差值是否大于或等于预定阈值;当所述差值大于或等于所示预定阈值时,由专家规则单元按照预定规则对所述累加统计的结果执行专家规则。
根据本申请的另一示例性实施例,提供一种模型上线的装置,所述装置可包括:数据接入模块,被配置为从至少一个传感器实时接收数据,并将接收的数据分配给至少一个数据处理模块;以及所述至少一个数据处理模块,其中,每个数据处理模块被配置为利用至少一个模型并行地对所述每个数据处理模块分配得到的数据进行处理。
可选地,数据接入模块可包括:第一数据接收单元,被配置为从至少一个传感器实时接收数据,从接收的数据中解析键值,并通过利用第一特征存储单元队列来存储解析出的键值和接收的数据中未被解析的其它数据;至少一个数据存储单元,被配置为并行地从存储的所述未被解析的其它数据中解析感测值,将解析出的感测值和通过利用第一特征存储单元队列存储的相应键值成对地存储到数据库中,并通过利用第二特征存储单元队列来存储所述相应键值;以及第一数据聚合单元,被配置为对通过利用第二特征存储单元队列存储的键值进行聚合处理以恢复键值的时序。
可选地,第一数据聚合单元可通过以下操作对通过利用第二特征存储单元队列存储的键值进行聚合处理:确定第一数据聚合单元中的消息列表中是否已存在与包括在通过利用第二特征存储单元队列存储的一个键值中的时间信息相应的特征列表;如果所述消息列表中已存在所述特征列表,则将通过利用第二特征存储单元队列存储的与该时间信息对应的所有键值存储到所述特征列表中;如果所述消息列表中不存在所述特征列表,则在所述消息列表中创建与该时间信息对应的特征列表,并将通过利用第二特征存储单元队列存储的与该时间信息对应的所有键值存储到创建的特征列表中。
可选地,当数据接入模块未接收到新数据的时间超过预设阈值时,第一数据聚合单元还可被配置为将所有特征列表中的键值传递给数据路由单元,并删除所有特征列表。
可选地,数据接入模块还可包括:数据路由单元,被配置为将经过聚合处理的键值以预定规则分配给所述至少一个数据处理模块。
可选地,所述每个数据处理模块可包括:第二数据接收单元,被配置为从数据路由单元接收分配的键值,并通过利用第三特征存储单元队列来存储分配得到的键值;以及所述至少一个模型,其中,每个模型包括:样本拼接单元,被配置为根据通过利用第三特征存储单元队列存储的键值在所述数据库中查找相应的感测值,并根据查找到的感测值计算特征;以及模型预测单元,被配置为根据样本拼接单元计算出的特征进行预测以获得预测结果,并通过利用第四特征存储单元队列来存储所述预测结果以及相应的键值。
可选地,所述每个数据处理模块还可包括:第二数据聚合单元,被配置为根据通过利用第四特征存储单元队列存储的键值对存储的相应的预测结果进行聚合处理以恢复预测结果的时序;专家规则单元,被配置为按照预定规则对时序恢复后的预测结果进行处理以获得最终的预测结果。
可选地,专家规则单元可通过以下操作按照预定规则对时序恢复后的预测结果进行处理以获得最终的预测结果:按照包括在键值中的位置信息对预测结果进行累加统计;确定与所述位置信息相应的被统计的预测结果的最大时间信息和最小时间信息之间的差值是否大于或等于预定阈值;当所述差值大于或等于所述预定阈值时,按照预定规则对所述累加统计的结果执行专家规则。
根据本申请的另一示例性实施例,提供了一种存储指令的计算机可读存储介质,其中,当所述指令被至少一个计算装置运行时,促使所述至少一个计算装置执行如上所述的模型上线的方法。
根据本申请的另一示例性实施,提供了一种包括至少一个计算装置和存储指令的至少一个存储装置的系统,其中,所述指令在被所述至少一个计算装置运行时,促使所述至少一个计算装置执行如上所述的模型上线的方法。
根据本申请的示例性实施例的模型上线的方法和装置对外采用异步接口的方式,因此可提高吞吐量,此外,由于在装置中以类似于流水线的作业方式对接收的数据进行处理,并且装置中的每个处理单元之间采用统一的数据格式(即特征存储单元),从而可以降低各个处理单元之间的耦合度。
将在接下来的描述中部分阐述本发明总体构思另外的方面和/或优点,还有一部分通过描述将是清楚的,或者可以经过本发明总体构思的实施而得知。
附图说明
从下面结合附图对本申请实施例的详细描述中,本申请的这些和/或其他方面和优点将变得更加清楚并更容易理解,其中:
图1是示出根据本申请示例性实施例的模型上线的装置的框图;
图2是示出根据本申请示例性实施例的第一数据接收单元111和第一数据聚合单元113中使用的数据结构的示图;
图3是示出根据本申请示例性实施例的专家规则单元124中使用的数据结构的示图;
图4是示出根据本申请示例性实施例的模型上线的方法的总流程图;
图5示出了根据本申请示例性实施例的数据接入模块110接收数据的流程图;
图6示出了根据本申请示例性实施例的方法成员Add_Element的具体流程图;
图7示出了根据本申请示例性实施例的方法成员CheckTICnt的具体流程图;
图8示出了根据本申请示例性实施例的由数据处理模块120并行地对分配到的数据进行处理的具体流程图;
图9示出了根据本申请示例性实施例的由专家规则单元124对预测结果进行处理以获得最终的预测结果的具体流程图;
图10示出了根据本申请示例性实施例的方法成员Deal_History的具体流程图;
图11示出了根据本申请示例性实施例的方法成员Caculation_Rule的具体流程图。
具体实施方式
现在将详细参照本申请的实施例,所述实施例的示例在附图中示出。以下将通过参照附图来说明所述实施例,以便解释本发明。
在详细描述本申请的实施例之前,先对本申请中使用到的一些术语进行简单描述,以便本领域技术人员可更容易地理解本申请的各实施例:
模型:借助机器学习/深度学习平台通过特定算法训练得到的数据集;
特征工程:在训练模型之前构造特征的步骤;
IoT:物联网,就是互联网、传统电信网等的信息承载体,让所有能行使独立功能的普通物体实现互联互通的网络;
特征存储单元:用于存储传感器产生的数据或者在对传感器产生的数据进行一系列处理后得到的数据,包含键值Key(由时间信息和空间信息组成)和结果值Value(传感器产生的具体数据或者模型预测的结果)。
图1是示出根据本申请示例性实施例的模型上线的装置100的框图。
如图1中所示,装置100包括数据接入模块110和至少一个数据处理模块120,其中,数据接入模块110也可以被称为数据接入层,数据处理模块120也可以被称为数据处理层。数据接入模块110可被配置为从至少一个传感器实时接收数据,并将接收的数据分配给至少一个数据处理模块120,每个数据处理模块120可被配置为利用至少一个模型并行地对所述每个数据处理模块120分配得到的数据进行处理,其中,所述至少一个模型是任意的人工智能(AI)模型。由于所述至少一个数据处理模块120采用的是并行执行的,因此装置100可实现分布式架构。
如图1中所示,数据接入模块110包括第一数据接收单元111、至少一个数据存储单元112、第一数据聚合单元113和数据路由单元114,数据处理模块120包括第二数据接收单元121、至少一个模型122、第二数据聚合单元123和专家规则单元124。
第一数据接收单元111可被配置为从至少一个传感器实时地接收数据,下面将对此进行详细描述。所述至少一个传感器可以是任何类型的适当传感器,例如布置在不同位置的温度传感器、照度传感器、运动传感器等,在下面描述的示例中,以温度传感器为例进行描述,但是本发明不限于此。
此后,第一数据接收单元111可从接收的数据中解析键值,其中,接收的数据可以是二进制值组成的数据并且可被解析为键值和感测值,具体地讲,键值可以由时间信息Time_information和空间信息Location_information组成,感测值是由传感器产生的具体的数据。在该操作中,第一数据接收单元111从接收的数据中仅解析出键值,但不对接收的数据中的其它数据(即感测值)进行解析。下面参照图2对此进行详细说明。
如图2中所示,在装置100开始运行时,第一数据接收单元111会创建一个MessageCount数据结构,该MessageCount数据结构包括数据成员MessageQueue和方法成员Add_Unit,其中,数据成员MessageQueue是包括至少一个单元的队列,该队列中的每个单元由时间信息Time_information和接收计数Receive_Count组成。当第一数据接收单元111开始从传感器接收到数据时,第一数据接收单元111可从顺序接收的一个数据解析出键值,并将解析出的键值中的时间信息Time_information赋值给数据成员MessageQueue中的第一单元中的时间信息Time_information,同时使临时计数器加1,如果当前解析出的键值中包括的时间信息Time_information与前一个解析出的键值中包括的时间信息Time_information不同,则说明上一批具有相同时间信息Time_information的数据已经接收完成,并用临时计数器的值对接收计数Receive_Count进行赋值,换句话说,接收计数Receive_Count中记录的数值是一批具有相同时间信息Time_information的数据的数量。此时,第一数据接收单元111可调用方法成员Add_Unit在数据成员MessageQueue末尾创建一个新的单元,用于记录下一批具有相同时间信息Time_information的数据的时间信息Time_information和数量。
返回图1,第一数据接收单元111可通过利用第一特征存储单元队列来存储解析出的键值和接收的数据中未被解析的其它数据。具体地讲,如上所述,特征存储单元可用于存储传感器产生的数据或者在对传感器产生的数据进行一系列处理后得到的数据,而第一特征存储单元队列用于存储至少一个特征存储单元的存储地址,换句话说,第一特征存储单元队列并不用于直接存储特征存储单元,而是用于存储至少一个用于指示特征存储单元的存储地址,此外,在数据接入模块110中包括的其它处理单元以及在数据处理模块120中包括的处理单元也采用同样的数据结构来实现数据的存储和传递,这样使得数据接入模块110和数据处理模块120中的每个处理单元之间采用统一的数据格式(即特征存储单元),进而可以降低各个处理单元之间的耦合度,提高运行效率。因此,第一数据接收单元111按照特征存储单元的数据格式将解析出的键值和接收的数据中未被解析的其它数据成对地存储在特定的存储空间中,并将相应的存储空间的存储地址存储到第一特征存储队列中。
然后,如图1中所示,所述至少一个数据存储单元112可被配置为并行地从存储的所述未被解析的其它数据中解析感测值,例如,解析出由温度传感器感测的具体温度值。具体地讲,数据存储单元112可根据第一特征存储单元队列中存储的一个存储地址查找按照特征存储单元的数据格式存储的一个键值和相应的未被解析的其它数据,然后从查找到的该未被解析的其它数据中解析出与该一个键值相应的感测值。
此后,所述至少一个数据存储单元112可将解析出的感测值和通过利用第一特征存储单元队列存储的相应键值成对地存储到图1中的数据库200中,即,将根据第一特征存储单元队列中存储的一个存储地址查找到的键值和解析出的感测值存储到图1的数据库200中。图1中的数据库200未被包括在装置100中,但是在其它实施例中,数据库200可被包括在装置100中。
此后,所述至少一个数据存储单元112通过利用第二特征存储单元队列来存储所述相应键值,具体地讲,所述至少一个数据存储单元112在从特征存储单元中解析出感测值之后,将存储该特征存储单元的存储空间的存储地址存储到第二特征存储单元队列中,而不将该特征存储单元重新存储到其它的存储空间,这样做的原因在于存储特征存储单元可能需要很大的存储空间,而存储特征存储单元的存储地址仅需要较小的存储空间,从而节省了存储空间的开销。
第一数据聚合单元113可被配置为对通过利用第二特征存储单元队列存储的键值进行聚合处理以恢复键值的时序。具体地讲,由于在IoT场景下,数据接入模块110从传感器接收的数据具有时序特性,而所述至少一个数据存储单元112是并发执行的,所以存储到第二特征存储单元队列中的存储地址的顺序会由于所述至少一个数据存储单元112的并发执行而与第一特征存储单元队列中的存储地址的顺序不同,进而导致数据路由单元114利用第二特征存储单元队列中的存储地址依次从相应存储空间获得的特征存储单元中的数据(即键值)具有与从传感器接收的数据不同的时序特性。因此需要利用第一数据聚合单元113来恢复通过利用第二特征存储单元队列存储的键值的时序特性。下面将结合图2对此进行详细描述。
具体地讲,如图2中所示,第一数据聚合单元113会创建一个MessageAggreation数据结构,该MessageAggreation数据结构包括数据成员MessageList和方法成员Add_Element、CheckTICnt和GetAllValueList,其中,MessageList包含时间信息Time_Information和特征列表FeatureList,特征列表FeatureList用于存放与时间信息Time_Information对应的所有特征存储单元。总得来讲,第一数据聚合单元113可调用方法成员Add_Element、CheckTICnt和GetAllValueList来完成数据聚合处理。
首先,第一数据聚合单元113可调用方法成员Add_Element。具体地讲,第一数据聚合单元113可确定第一数据聚合单元113中的消息列表MessageList中是否已存在与包括在通过利用第二特征存储单元队列存储的一个键值中的时间信息Time_Information相应的特征列表FeatureList。具体地讲,第一数据聚合单元113首先利用第二特征存储单元队列中的存储地址查找到存储的一个键值,然后确定第一数据聚合单元113的消息列表MessageList中是否存在与该一个键值中的时间信息Time_Information相同的时间信息Time_Information,即,第一数据聚合单元113利用方法成员Add_Element确定消息队列MessageList中是否存在与该一个键值中的时间信息Time_Information相同的时间信息Time_Information,如果消息列表MessageList中存在与该一个键值中的时间信息Time_Information相同的时间信息Time_Information,则表明所述消息列表MessageList中已经存在与该时间信息Time_Information相应的特征列表FeatureList,如果消息列表MessageList中不存在与该一个键值中的时间信息Time_Information相同的时间信息Time_Information,则表明所述消息列表MessageList中不存在与该时间信息Time_Information相应的特征列表FeatureList,其中,特征列表FeatureList可包括至少一个特征存储单元。
如果消息列表MessageList中已存在与该一个键值中的该时间信息Time_Information相应的特征列表FeatureList,则第一数据聚合单元113可将通过利用第二特征存储单元队列存储的与该时间信息Time_Information对应的所有键值存储到所述特征列表FeatureList中,也就是说,第一数据聚合单元113可利用方法成员Add_Element按照类似的操作将根据第二特征存储单元队列中存储的每个存储地址查找到的特征存储单元中的与该时间信息Time_Information对应的键值以特征存储单元的数据格式存储到该特征列表FeatureList中。
如果消息列表MessageList中不存在与该一个键值中的该时间信息Time_Information相应的特征列表FeatureList,则第一数据聚合单元113可在消息列表MessageList中创建与该时间信息Time_Information对应的特征列表FeatureList,在消息列表MessageList中设置与该特征列表FeatureList相应的与该时间信息Time_Information相同的一个时间信息Time_Information,并将通过利用第二特征存储单元队列存储的与该时间信息Time_Information对应的所有键值存储到创建的特征列表FeatureList中,也就是说,第一数据聚合单元113可利用方法成员Add_Element将根据第二特征存储单元队列中存储的每个存储地址查找到的特征存储单元中的与该时间信息Time_Information对应的键值以特征存储单元的数据格式存储到该特征列表FeatureList中。
此外,当在接收一定数据(例如100条数据)后,第一数据聚合单元113可调用方法成员CheckTICnt来检查时间最早的一批数据是否已经完全达到第一数据聚合单元113。如果最早的一批数据已经完全达到,则第一数据聚合单元113可将该最早的一批数据提供给数据路由单元114。
具体地讲,如果第一数据聚合单元113确定MessageCount数据结构中的数据成员MessageQueue中的第一条时间信息Time_Information小于MessageAggregation数据结构中的消息列表MessageList中的第一条时间信息Time_Information,则使数据成员MessageQueue中的第一条数据出队列(即,删除该数据),并继续判断数据成员MessageQueue中的下一条数据的时间信息Time_Information。
如果数据成员MessageQueue中的第一条时间信息Time_Information不小于消息列表MessageList中的第一条时间信息Time_Information,则第一数据聚合单元113继续确定MessageCount数据结构中的数据成员MessageQueue中的第一条Receive_Count是否等于MessageAggregation数据结构中的消息列表MessageList中的第一个特征列表FeatureList的长度。如果数据成员MessageQueue中的第一条Receive_Count等于消息列表MessageList中的第一个特征列表FeatureList的长度,则使数据成员MessageQueue中的第一条数据出队列,取出MessageAggregation数据结构中的第一个特征列表FeatureList中的所有特征存储单元,并删除MessageAggregation数据结构中的第一条数据(即时间信息Time_Information和特征列表FeatureList),并将取出的MessageAggregation数据结构中的第一个特征列表FeatureList中的所有特征存储单元传送给数据路由单元114。
此外,当数据接入模块110未接收到新数据的时间超过预设阈值时,第一数据聚合单元113还可被配置为将MessageAggregation数据结构中的所有特征列表中的键值传递给数据路由单元114,并删除MessageAggregation数据结构中的所有特征列表。具体地讲,当数据接入模块110未接收到新数据的时间超过预设阈值时,会导致最后一批或几批数据滞留在MessageAggregation数据结构中,因此第一数据聚合单元113会调用方法成员GetAllValueList直接将消息列表MessageList中的所有特征列表FeatureList中的特征存储单元传送给数据路由单元114,并清空消息列表MessageList中的所有数据。
数据路由单元114可被配置为将经过聚合处理的键值以预定规则分配给所述至少一个数据处理模块。预定规则可以是任何合适的分配规则,例如,数据路由模块114可根据经过聚合处理的键值中的位置信息Location_Information将经过聚合处理的键值分配给所述至少一个数据处理模块。例如,数据理由单元114可维护一个IP数组,并可通过下标值0,1,2,3,…n访问该IP数组,其中,该IP数组的长度Length与所述至少一个数据处理模块120的数量相同。当数据路由单元114接收到一批数据(即接收到一批特征存储单元)时,数据路由单元114可创建一个临时二维数组,该临时二维数组的第一维的长度与IP数组的长度Length相同,并且该临时二维数组可用于存放仅包含键值的特征存储单元。此后,数据路由单元114根据每个键值中的位置信息Location_Information%IP数组的长度Length而得到的余数,将对应键值分配到该临时二维数组中第一维的下标值为该余数的临时数组。当分配完这一批特征存储单元之后,将该临时二维数组根据第一维的下标值发送到编号等于该下标值的数据处理模块120。例如,如果数据处理模块120的数量是5,则IP数组的长度Length为5(即下标值分别为0,1,2,3,4),在这种情况下,假设从第一数据聚合单元113接收到的特征存储单元的数量是6,并且这6个特征存储单元中的键值的位置信息Location_Information分别为0、1、2、3、4和5,则这6个键值中的每一个的位置信息Location_Information%IP数组的长度Length(即5)=0、1、2、3、4和0,因此数据路由单元114可将第1个和第6个特征存储单元分配到该临时二维数组中第一维的下标值为0的临时数组,并将第2个至第5个特征存储单元分配到该二维临时数组中第一维的下标值分别为1、2、3和4的临时数组。当分配完这一批特征存储单元之后,数据路由单元114将该临时二维数组中第一维的下标值为0、1、2、3、4的临时数组分别发送到第1个、第2个、第3个、第4个和第5个数据处理模块120。以上描述的数据路由单元114将经过聚合处理的键值分配给所述至少一个数据处理模块120的方法仅是示例性的,本发明不限于此。
如图1中所示,在每个数据处理模块120中,第二数据接收单元121可被配置为从数据路由单元114接收分配的键值,并通过利用第三特征存储单元队列来存储分配得到的键值。具体地讲,第二数据接收单元121可以按照特征存储单元的数据格式来存储接收到的键值,并将特征存储单元的存储地址存储在第三特征存储单元队列中,也就是说,第二数据接收单元121不是通过第三特征存储单元队列来直接存储特征存储单元,而是利用第三特征存储单元队列来存储特征存储单元的存储地址。
至少一个模型122中的每一个模型122可包括样本拼接单元1221和模型预测单元1222,其中,样本拼接单元1221可被配置为根据通过利用第三特征存储单元队列存储的键值在数据库200中查找相应的感测值,并根据查找到的感测值计算特征。具体地讲,样本拼接单元1221可通过利用第三特征存储单元队列中存储的存储地址获得特征存储单元,利用获得的特征存储单元中的键值(例如时间信息Time_Information)从数据库200中查找相应的感测值,然后利用获取的感测值计算模型预测单元1222需要的特征,并将计算出的特征传递给该样本拼接单元1221相应的模型预测单元1222。
模型预测单元1222可被配置为根据样本拼接单元1221计算出的特征进行预测以获得预测结果,并通过利用第四特征存储单元队列来存储所述预测结果以及相应的键值。具体地讲,模型预测单元1222在从样本拼接单元1221接收到计算出的特征之后利用训练的模型对特征进行预测以获得预测结果,并将所述预测结果与相应的键值存储到与该相应的键值对应的特征存储单元中,然后将该特征存储单元的存储空间的存储地址存储到第四特征存储单元队列中。其中,模型预测单元1222所利用的模型可以是任何适当模型,本发明对此不进行限定。
此外,每个数据处理模块120还可包括第二数据聚合单元123和专家规则单元124。第二数据聚合单元123可被配置为根据通过利用第四特征存储单元队列存储的键值对存储的相应的预测结果进行聚合处理以恢预测结果的时序。也就是说,第三特征存储单元队列中存储的存储地址和第四特征存储单元队列中存储的存储地址是相同的,但是第三特征存储单元队列中存储的存储地址的顺序和第四特征存储单元队列中存储的存储地址的顺序不同,然而通过由于数据接入模块110从传感器接收的数据具有时序特性,相应地,第二数据接收单元121从数据路由单元114接收的数据也具有时序性,而所述至少一个模型122是并发执行的,因此存储到第四特征存储单元队列中的存储地址的顺序会由于所述至少一个模型122的并发执行而与第三特征存储单元队列中的存储地址的顺序不同。因此,需要利用第二数据聚合单元123来恢复通过利用第四特征存储单元队列存储的预测结果的时序特性。由于第二数据聚合单元123的操作与第一数据聚合单元113的操作相同,因此此处不再对此进行详细描述。
专家规则单元124可被配置为按照预定规则对时序恢复后的预测结果进行处理以获得最终的预测结果。具体地讲,专家规则单元124的主要目的是为了统计所述至少一个模型122多次的产生的预测结果,按一定规则进行归纳总结以提高最终的业务效果。这样,专家规则单元124就需要对历史数据根据所述至少一个模型122的预测结果进行计数,然后通过对计数的分析,给出最终的业务结果。下面将详细描述专家规则单元124获得最终的预测结果的过程。
图3是示出根据本申请示例性实施例的专家规则单元124中使用的数据结构History和ExpertRule的示图。
首先,专家规则单元123可按照包括在键值中的位置信息对预测结果进行累加统计。
具体地讲,如图3中所示,History数据结构包括数据成员Start_Time_Information、End_Time_Information、Result,其中,数据成员Start_Time_Information表示统计结果的起始时间(即,被统计的预测结果的最小时间信息Time_Information),数据成员End_Time_Information表示统计结果的最新时间(即,被统计的预测结果的最大时间信息Time_Information,该最大时间信息会根据被统计的预测结果的时间信息Time_Information而更新),数据成员Result是一个n维的数组(n是大于或等于1的整数),该数据的维度与需要统计的维度相同,例如,如果当前需要统计的维度是两个维度,其中,一个维度表示信号的分类(A类信号、B类信号和C类信号),另一个维度表示威胁度(破坏、安全),则数据成员Result就是可用于存储信号分类和威胁度的一个二维数组,因此该数据成员Result可以用于记录相同维度在不同批次的预测结果的累加。此外,如图3中所示,ExpertRule数据结构包括数据成员HistoryTable以及方法成员Deal_History和Calulation_Rule。数据成员HistoryTable是一个Map,Map包括多个数据对,每个数据对由键值中的位置信息Location_Information和History数据结构实例组成。
在以下描述中,假设第二数据聚合单元123每当聚合完一批特征存储单元时,就将聚合的一批特征存储单元传递给专家规则单元124,其中,假设聚合的一批特征存储单元中的每个特征存储单元的时间信息Time_Information相同,换句话说,第二数据聚合单元123聚合的每批特征存储单元具有相同的时间信息Time_Information。首先,专家规则单元124调用方法成员Deal_History来对接收到的所述一批特征存储单元进行累加统计。具体地讲,方法成员Deal_History判断所述一批特征存储单元中是否还有未被处理的预测结果。如果所述一批特征存储单元中已经不存在未被处理的预测结果,则方法成员Deal_History结束并返回。如果所述一批特征存储单元中仍然有未被处理的预测结果,则方法成员Deal_History从所述一批特征存储单元中取出一个特征存储单元,并从所述一批特征存储单元中删除所述一个特征存储单元,然后获得所述一个特征存储单元中的位置信息Location_Information,并判断数据成员HistoryTable中是否存在该位置信息Location_Information。
如果数据成员HistoryTable中不存在该位置信息Location_Information,则方法成员Deal_History创建一个数据对(其中,数据对中的一个数据是该位置信息Location_Information,数据对中的另一个数据是History数据结构实例),然后在History数据结构实例中的数据成员Result中对所述一个特征存储单元中的预测结果进行累加,并将所述一个特征存储单元中的时间信息Time_Information赋值给History数据结构实例的数据成员Start_Time_Information和End_Time_Information(也就是说,此时,Start_Time_Information和End_Time_Information相等)。如果数据成员HistoryTable中已经存在该位置信息Location_Information,则直接在History数据结构实例的数据成员Result中对所述一个特征存储单元中的预测结果进行累加,并且如果所述一个特征存储单元中的时间信息Time_Information大于History数据结构实例的数据成员End_Time_Information,则将所述一个特征存储单元中的时间信息Time_Information赋值给History数据结构实例的数据成员End_Time_Information,否则不改变History数据结构实例的数据成员End_Time_Information。
通过对所述一批特征存储单元中的其余特征存储单元进行与以上描述的操作相同的操作,专家规则单元124就可以完成对所述一批特征存储单元中的预测结果的累加统计。
此后,专家规则单元124可确定与所述位置信息相应的被统计的预测结果的最大时间信息和最小时间信息之间的差值是否大于或等于预定阈值。具体地讲,在专家规则单元124利用方法成员Deal_History完成了对所述一批特征存储单元中的预测结果的累加统计之后,专家规则单元124可调用方法成员Calculation_Rule进行后续处理,具体地讲,在执行方法成员Calculation_Rule时,专家规则单元124首先从HistoryTable中获得一条数据,如图3所示,所述一条数据包括位置信息Location_Information和数据成员History,此后,专家规则单元124计算与位置信息Location_Information相应的数据成员History中的Start_Time_Information(即最小时间信息)和End_Time_Information(即最大时间信息)之间的差值,然后判断该差值是否大于或等于所述预定阈值。例如,当专家规则模块124被设计为对十批特征存储单元的预测结果执行专家规则以获得最终的预测结果时,所述预定阈值被设置为9,也就是说,当所述差值大于或等于9时,表明专家规则单元124获得了10批或更多批特征存储单元的预测结果。
当所述差值大于或等于所述预定阈值时,专家规则单元124按照预定规则对所述累加统计的结果执行专家规则。具体地讲,当所述差值大于或等于所述预定阈值时,专家规则单元124对所述一条数据中的History的数据成员result执行专家规则,并将所述一条数据的位置信息Location_Information添加到待删除列表,然后判断HistoryTable中是否还有其它未处理的数据,如果存在其它未处理的数据,则对其它未处理的数据执行与对所述一条数据的上述操作类似的操作直到HistoryTable中所有的数据处理完毕为止,如果不存在其它未处理的数据,则根据所述待删除列表中的所有位置信息Location_Information删除HistoryTable中的相应的History数据以及位置信息Location_Information。此外,专家规则单元124对所述累加统计的结果所执行专家规则可以是任意规则,例如,平均值、中值等规则,但本发明不限于此。
当所述差值小于所述预定阈值时,则专家规则单元124判断HistoryTable中是否还有其它未处理的数据,如果存在其它未处理的数据,则对其它未处理的数据执行与对所述一条数据的上述操作类似的操作直到HistoryTable中与所述一批特征存储单元对应的所有的数据处理完毕为止。
在专家规则单元124处理完HistoryTable中与所述一批特征存储单元对应的所有的数据处理完毕之后,专家规则单元124会按照与以上描述的过程类似的过程对从第二数据聚合单元123接收的下一批特征存储单元进行处理,即,先利用方法成员Deal_History对所述下一批特征存储单元的预测结果进行累加处理,然后接近着利用方法成员Calculation_Rule对所述下一批特征存储单元的预测结果执行专家规则。
此外,虽然图1中未示出,但是数据处理模块120还可包括后处理单元,该后处理单元可用于负责特征值、预测结果等后续业务,例如,将特征值、预测结果等存储到大数据平台、MySQL或Oracle等。为了提高处理效率,后处理单元可以通过利用第四特征存储单元队列获取一定量的数据后,再执行外部的读写操作。
下面将参照图4至图11来描述模型上线的方法。
图4是示出根据本发明的示例性实施例的模型上线的方法的总体流程图。
如图4中所示,在步骤S410,由数据接入模块110从至少一个传感器实时接收数据。所述至少一个传感器可以是任何类型的适当传感器,例如布置在不同位置的温度传感器、照度传感器、运动传感器等,在下面描述的示例中,以温度传感器为例进行描述,但是本发明不限于此。下面将参照图5步骤S410进行详细描述。
如图5中所示,在步骤S510,由第一数据接收单元111从接收的数据中解析键值,其中,接收的数据可以是二进制值组成的数据并且可被解析为键值和感测值,具体地讲,键值可以由时间信息Time_information和空间信息Location_information组成,感测值是由传感器产生的具体的数据。在该步骤中,第一数据接收单元111从接收的数据中仅解析出键值,但不对接收的数据中的其它数据(即感测值)进行解析。
具体地讲,如图2中所示,在模型上线的方法开始运行时,第一数据接收单元111会创建一个MessageCount数据结构,该MessageCount数据结构包括数据成员MessageQueue和方法成员Add_Unit,其中,数据成员MessageQueue是包括至少一个单元的队列,该队列中的每个单元由时间信息Time_information和接收计数Receive_Count组成。当第一数据接收单元111开始从传感器接收到数据时,第一数据接收单元111可从顺序接收的一个数据解析出键值,并将解析出的键值中的时间信息Time_information赋值给数据成员MessageQueue中的第一单元中的时间信息Time_information,同时使临时计数器加1,如果当前解析出的键值中包括的时间信息Time_information与前一个解析出的键值中包括的时间信息Time_information不同,则说明上一批具有相同时间信息Time_information的数据已经接收完成,并用临时计数器的值对接收计数Receive_Count进行赋值,换句话说,接收计数Receive_Count中记录的数值是一批具有相同时间信息Time_information的数据的数量。此时,第一数据接收单元111可调用方法成员Add_Unit在数据成员MessageQueue末尾创建一个新的单元,用于记录下一批具有相同时间信息Time_information的数据的时间信息Time_information和数量。
在步骤S520,由第一数据接收单元1111通过利用第一特征存储单元队列来存储解析出的键值和接收的数据中未被解析的其它数据。
具体地讲,如上所述,特征存储单元可用于存储传感器产生的数据或者在对传感器产生的数据进行一系列处理后得到的数据,而第一特征存储单元队列用于存储至少一个特征存储单元的存储地址,此外,在数据接入模块110中包括的其它处理单元以及在数据处理模块120中包括的处理单元也采用同样的数据结构来实现数据的存储和传递,这样使得数据接入模块110和数据处理模块120中的每个处理单元之间采用统一的数据格式(即特征存储单元),进而可以降低各个处理单元之间的耦合度,提高运行效率。因此,在步骤S520中,第一数据接收单元111按照特征存储单元的数据格式将解析出的键值和接收的数据中未被解析的其它数据成对地存储在特定的存储空间中,并将相应的存储空间的存储地址存储到第一特征存储队列中。
在步骤S530,由至少一个数据存储单元120并行地从存储的所述未被解析的其它数据中解析感测值,例如,解析出由温度传感器感测的具体温度值。具体地讲,在该步骤530中,数据存储单元112可根据第一特征存储单元队列中存储的一个存储地址查找按照特征存储单元的数据格式存储的一个键值和相应的未被解析的其它数据,然后从查找到的该未被解析的其它数据中解析出与该一个键值相应的感测值。
在步骤S540,由至少一个数据存储单元112将解析出的感测值和通过利用第一特征存储单元队列存储的相应键值成对地存储到图1中的数据库200中,即,将根据第一特征存储单元队列中存储的一个存储地址查找到的键值和解析出的感测值存储到图1的数据库200中。
在步骤S550,由至少一个数据存储单元112通过利用第二特征存储单元队列来存储所述相应键值。具体地讲,在步骤S550中,所述至少一个数据存储单元112在从特征存储单元中解析出感测值之后,将存储该特征存储单元的存储空间的存储地址存储到第二特征存储单元队列中,而不将该特征存储单元重新存储到其它的存储空间,这样做的原因在于存储特征存储单元可能需要很大的存储空间,而存储特征存储单元的存储地址仅需要较小的存储空间,从而节省了存储空间的开销。
在步骤S560,由第一数据聚合单元113对通过利用第二特征存储单元队列存储的键值进行聚合处理以恢复键值的时序。如图2中所示,第一数据聚合单元113会创建一个MessageAggreation数据结构,该MessageAggreation数据结构包括数据成员MessageList和方法成员Add_Element、CheckTICnt和GetAllValueList,其中,MessageList包含时间信息Time_Information和特征列表FeatureList,特征列表FeatureList用于存放与时间信息Time_Information对应的所有特征存储单元。下面将参照图6对此进行详细描述,其中,图6示出了根据本申请示例性实施例的方法成员Add_Element的具体流程图。
如图6中所示,在步骤S610,由第一数据聚合单元113可确定第一数据聚合单元113中的消息列表MessageList中是否已存在与包括在通过利用第二特征存储单元队列存储的一个键值中的时间信息Time_Information相应的特征列表FeatureList。具体地讲,第一数据聚合单元113首先利用第二特征存储单元队列中的存储地址查找到存储的一个键值,然后确定第一数据聚合单元113的消息列表MessageList中是否存在与该一个键值中的时间信息Time_Information相同的时间信息Time_Information,即,第一数据聚合单元113利用方法成员Add_Element确定消息队列MessageList中是否存在与该一个键值中的时间信息Time_Information相同的时间信息Time_Information,如果消息列表MessageList中存在与该一个键值中的时间信息Time_Information相同的时间信息Time_Information,则表明所述消息列表MessageList中已经存在与该时间信息Time_Information相应的特征列表FeatureList,如果消息列表MessageList中不存在与该一个键值中的时间信息Time_Information相同的时间信息Time_Information,则表明所述消息列表MessageList中不存在与该时间信息Time_Information相应的特征列表FeatureList,其中,特征列表FeatureList可包括至少一个特征存储单元。
如果在步骤S610确定出消息列表MessageList中已存在与该一个键值中的该时间信息Time_Information相应的特征列表FeatureList,则在步骤S640,由第一数据聚合单元113将通过利用第二特征存储单元队列存储的与该时间信息Time_Information对应的所有键值存储到所述特征列表FeatureList中,也就是说,第一数据聚合单元113可利用方法成员Add_Element按照类似的操作将根据第二特征存储单元队列中存储的每个存储地址查找到的特征存储单元中的与该时间信息Time_Information对应的键值以特征存储单元的数据格式存储到该特征列表FeatureList中。
如果在步骤S610确定出消息列表MessageList中不存在与该一个键值中的该时间信息Time_Information相应的特征列表FeatureList,则在步骤S620,由第一数据聚合单元113在消息列表MessageList中创建与该时间信息Time_Information对应的特征列表FeatureList,此后,在步骤S630在消息列表MessageList中针对该特征列表FeatureList设置与该时间信息Time_Information相同的一个时间信息Time_Information。之后,在步骤S630,由第一数据聚合单元113将通过利用第二特征存储单元队列存储的与该时间信息Time_Information对应的所有键值存储到创建的特征列表FeatureList中,也就是说,第一数据聚合单元113可利用方法成员Add_Element将根据第二特征存储单元队列中存储的每个存储地址查找到的特征存储单元中的与该时间信息Time_Information对应的键值以特征存储单元的数据格式存储到该特征列表FeatureList中。
此外,当在接收一定数据(例如100条数据)后,第一数据聚合单元113可调用方法成员CheckTICnt来检查时间最早的一批数据是否已经完全达到第一数据聚合单元113。如果最早的一批数据已经完全达到,则第一数据聚合单元113可将该最早的一批数据提供给数据路由单元114。该过程可通过方法成员CheckTICnt来实现,下面将参照图7对此进行详细描述。
图7示出了根据本申请示例性实施例的方法成员CheckTICnt的具体流程图。
如图7中所示,在步骤S710,由第一数据聚合单元113确定MessageCount数据结构中的数据成员MessageQueue中的第一条时间信息Time_Information是否小于MessageAggregation数据结构中的消息列表MessageList中的第一条时间信息Time_Information。
如果在步骤S710确定出MessageCount数据结构中的数据成员MessageQueue中的第一条时间信息Time_Information小于MessageAggregation数据结构中的消息列表MessageList中的第一条时间信息Time_Information,则在步骤S720,由第一数据聚合单元113使数据成员MessageQueue中的第一条数据出队列(即,删除该数据),并返回到步骤S710继续判断数据成员MessageQueue中的下一条数据的时间信息Time_Information.
如果在步骤S710确定出数据成员MessageQueue中的第一条时间信息Time_Information不小于消息列表MessageList中的第一条时间信息Time_Information,则在步骤S730,由第一数据聚合单元113确定MessageCount数据结构中的数据成员MessageQueue中的第一条Receive_Count是否等于MessageAggregation数据结构中的消息列表MessageList中的第一个特征列表FeatureList的长度。
如果在步骤S730确定出数据成员MessageQueue中的第一条Receive_Count等于消息列表MessageList中的第一个特征列表FeatureList的长度,则在步骤S740由第一数据聚合单元113使数据成员MessageQueue中的第一条数据出队列,在步骤S750取出MessageAggregation数据结构中的第一个特征列表FeatureList中的所有特征存储单元并删除MessageAggregation数据结构中的第一条数据(即时间信息Time_Information和特征列表FeatureList),此后,在步骤S760将取出的MessageAggregation数据结构中的第一个特征列表FeatureList中的所有特征存储单元传送给数据路由单元114,最后返回。
如果在步骤S730确定出数据成员MessageQueue中的第一条Receive_Count不等于消息列表MessageList中的第一个特征列表FeatureList的长度,则直接返回。
此外,当数据接入模块110未接收到新数据的时间超过预设阈值时,由第一数据聚合单元113将MessageAggregation数据结构中的所有特征列表中的键值传递给数据路由单元114,并删除MessageAggregation数据结构中的所有特征列表。具体地讲,当数据接入模块110未接收到新数据的时间超过预设阈值时,会导致最后一批或几批数据滞留在MessageAggregation数据结构中,因此第一数据聚合单元113会调用方法成员GetAllValueList直接将消息列表MessageList中的所有特征列表FeatureList中的特征存储单元传送给数据路由单元114,并清空消息列表MessageList中的所有数据。
返回参照图4,在步骤S420中,由数据接入模块110将接收的数据分配给至少一个数据处理模块。具体地讲,由数据路由单元114将经过聚合处理的键值以预定规则分配给所述至少一个数据处理模块。预定规则可以是任何合适的分配规则,例如,数据路由模块114可根据经过聚合处理的键值中的位置信息Location_Information将经过聚合处理的键值分配给所述至少一个数据处理模块。由于以上已参照图1至图3对此进行了详细描述,因此此处不再进行重复描述。
在步骤S430,由所述至少一个数据处理模块120中的每一个数据处理模块120利用至少一个模型122并行地对所述每个数据处理模块120分配到的数据进行处理。下面将参照图8对此进行详细描述。
如图8中所示,在步骤S810,由第二数据接收单元121通过利用第三特征存储单元队列来存储分配得到的键值。具体地讲,在步骤S810中,在每个数据处理模块120中,第二数据接收单元121从数据路由单元114接收分配的键值,并通过利用第三特征存储单元队列来存储分配得到的键值。具体地讲,第二数据接收单元121可以按照特征存储单元的数据格式来存储接收到的键值,并将特征存储单元的存储地址存储在第三特征存储单元队列中,也就是说,第二数据接收单元121不是通过第三特征存储单元队列来直接存储特征存储单元,而是利用第三特征存储单元队列来存储特征存储单元的存储地址。
在步骤S820,由所述至少一个模型122中的样本拼接单元1221根据通过利用第三特征存储单元队列存储的键值在所述数据库中查找相应的感测值,并根据查找到的感测值计算特征。具体地讲,在步骤S820中,样本拼接单元1221可通过利用第三特征存储单元队列中存储的存储地址获得特征存储单元,利用获得的特征存储单元中的键值(例如时间信息Time_Information)从数据库200中查找相应的感测值,然后利用获取的感测值计算模型预测单元1222需要的特征,并将计算出的特征传递给该样本拼接单元1221相应的模型预测单元1222。
在步骤S830,由所述至少一个模型122中的模型预测单元1222根据样本拼接单元1221计算出的特征进行预测以获得预测结果,并通过利用第四特征存储单元队列来存储所述预测结果以及相应的键值。具体地讲,在步骤S830中,模型预测单元1222在从样本拼接单元1221接收到计算出的特征之后利用训练的模型对特征进行预测以获得预测结果,并将所述预测结果与相应的键值存储到与该相应的键值对应的特征存储单元中,然后将该特征存储单元的存储空间的存储地址存储到第四特征存储单元队列中。其中,模型预测单元1222所利用的模型可以是任何适当模型,本发明对此不进行限定。
在步骤S840,由第二数据聚合单元123根据通过利用第四特征存储单元队列存储的键值对存储的相应的预测结果进行聚合处理以恢复预测结果的时序。由于已经参照图1-图3对此进行了详细描述,因此此处不再进行重复。
在步骤S850,由专家规则单元124按照预定规则对时序恢复后的预测结果进行处理以获得最终的预测结果。下面将参照图9、图10和图11对此进行详细描述。
如图9中所示,在步骤S910,由专家规则单元124按照包括在键值中的位置信息对预测结果进行累加统计。步骤S910由方法成员Deal_History来实现,并且其详细过程如图10中所示。
如图10中,在步骤S1010,方法成员Deal_History确定由第二数据聚合单元123聚合的一批特征存储单元中是否还有未被处理的预测结果,其中,假设由第二数据聚合单元123聚合的一批特征存储单元中的每个特征存储单元的时间信息Time_Information相同,并且每当第二数据聚合单元123聚合一批特征存储单元后,就将聚合的一批特征存储单元传递给专家规则单元124来对该批特征存储单元中的预测结果进行累加统计。
如果在步骤S1010确定出所述一批特征存储单元中已经不存在未被处理的预测结果,则方法成员Deal_History结束并返回。如果在步骤S1010确定出所述一批特征存储单元中仍然有未被处理的预测结果,则在步骤S1020从所述一批特征存储单元中取出一个特征存储单元并从所述一批特征存储单元中删除所述一个特征存储单元,在步骤S1030获得所述一个特征存储单元中的位置信息Location_Information,在步骤S1040确定数据成员HistoryTable中是否存在该位置信息Location_Information。
如果在步骤S1040确定出数据成员HistoryTable中不存在该位置信息Location_Information,则在步骤S1050创建一个数据对(其中,数据对中的一个数据是该位置信息Location_Information,数据对中的另一个数据是History数据结构实例),然后在步骤S1060,将所述一个特征存储单元中的时间信息Time_Information赋值给History数据结构实例的数据成员Start_Time_Information和End_Time_Information,并在步骤S1080在History数据结构实例的数据成员Result中对所述一个特征存储单元中的预测结果进行累加。
如果在步骤S1040确定出数据成员HistoryTable中已经存在该位置信息Location_Information,则在步骤S1070对History数据结构实例的数据成员End_Time_Information进行赋值,具体地讲,如果所述一个特征存储单元中的时间信息Time_Information大于History数据结构实例的数据成员End_Time_Information,则将所述一个特征存储单元中的时间信息Time_Information赋值给History数据结构实例的数据成员End_Time_Information,否则不改变History数据结构实例的数据成员End_Time_Information。然后,在步骤S1080在History数据结构实例的数据成员Result中对所述一个特征存储单元中的预测结果进行累加,并返回到步骤S1010。通过上述过程,专家规则单元124完成对从第二数据聚合单元123接收的一批特征存储单元中的预测结果的累加统计。
然后返回参照图9,在步骤S920,由专家规则单元124确定与所述位置信息相应的被统计的预测结果的最大时间信息和最小时间信息之间的差值是否大于或等于预定阈值。当在步骤S920确定出所述差值大于或等于所示预定阈值时,在步骤S930由专家规则单元按照预定规则对所述累加统计的结果执行专家规则。下面将参照图11对步骤S920和S930进行详细描述。
具体地讲,专家规则单元124在步骤S910利用方法成员Deal_History完成了对所述一批特征存储单元中的预测结果的累加统计之后,执行方法成员Caculation_Rule来进行后续处理。具体地讲,如图11中所示,在步骤S1110,专家规则单元124确定HistoryTable中是否还有未被处理的数据,如图3所示,该数据包括位置信息Location_Information和数据成员History。
如果在步骤S1110确定出HistoryTable中还有未被处理的数据,则在步骤S1120,专家规则单元124从HistoryTable中获得一条数据。
此后,在步骤S1130,专家规则单元124计算与位置信息Location_Information相应的数据成员History中的Start_Time_Information(即最小时间信息)和End_Time_Information(即最大时间信息)之间的差值。
然后,在步骤S1140,专家规则单元124确定该差值是否大于或等于所述预定阈值。例如,当专家规则模块124被设计为对10批特征存储单元的预测结果执行专家规则以获得最终的预测结果时,所述预定阈值被设置为9,也就是说,当所述差值大于或等于9时,表明专家规则单元124获得了10批或更多批特征存储单元的预测结果。
如果在步骤S1140专家规则单元124确定出所述差值大于或等于所述预定阈值时,则在步骤S1150专家规则单元124对所述一条数据中的History的数据成员result执行专家规则,然后在步骤S1160将所述一条数据的位置信息Location_Information添加到待删除列表,并返回到步骤S1110。此外,专家规则单元124对所述累加统计的结果所执行专家规则可以是任意规则,例如,平均值、中值等规则,但本发明不限于此。
如果在步骤S1140专家规则单元124确定出所述差值小于所述预定阈值,则返回到步骤S1110以获得下一条数据。
如果在步骤S1110确定出HistoryTable中没有未被处理的数据,则在步骤S1170,专家规则单元124根据所述待删除列表中的所有位置信息Location_Information删除HistoryTable中的相应的History数据以及位置信息Location_Information。
至此,通过以上描述的步骤S910、S920和S930,专家规则单元124就处理完从第二数据聚合单元123接收到的聚合的一批特征存储单元,然后当第二数据聚合单元123聚合完下一批特征存储单元之后,专家规则单元124会再次按照步骤S910、S920和S930对接收的下一批特征存储单元进行处理,即,先利用方法成员Deal_History对所述下一批特征存储单元的预测结果进行累加处理,然后接近着利用方法成员Calculation_Rule对所述下一批特征存储单元的预测结果执行专家规则。
根据以上描述的模型上线的方法和装置,本申请可对外采用异步接口的方式,从而可提高吞吐量,此外,由于在装置中以类似于流水线的作业方式对接收的数据进行处理,并且装置中的每个处理单元之间采用统一的数据格式(即特征存储单元),从而可以降低各个处理单元之间的耦合度。
以上已参照图1至图11描述了根据本申请示例性实施例的模型上线的方法和装置。然而,应理解的是:附图中示出的装置可被分别配置为执行特定功能的软件、硬件、固件或上述项的任意组合。例如,该装置可对应于专用的集成电路,也可对应于纯粹的软件代码,还可对应于软件与硬件相结合的模块。此外,该装置所实现的一个或多个功能也可由物理实体设备(例如,处理器、客户端或服务器等)中的组件来统一执行。
应当理解,根据本申请的示例性实施例的模型上线的方法可通过记录在计算机可读存储介质上的指令来实现,例如,根据本申请的示例性实施例,可提供一种存储指令的计算机可读存储介质,其中,当所述指令被至少一个计算装置运行时,促使所述至少一个计算装置执行以下步骤:由数据接入模块从至少一个传感器实时接收数据,并将接收的数据分配给至少一个数据处理模块;由所述至少一个数据处理模块中的每一个数据处理模块利用至少一个模型并行地对所述每个数据处理模块分配到的数据进行处理。
上述计算机可读存储介质中存储的指令可在诸如客户端、主机、代理装置、服务器等计算机设备中部署的环境中运行,应注意,所述指令还可在执行上述步骤时执行更为具体的处理,这些进一步处理的内容已经在参照图2至图11的描述中提及,因此这里为了避免重复将不再进行赘述。
应注意,根据本发明示例性实施例的模型上线的装置可完全依赖计算机程序的运行来实现相应的功能,即,各个装置与计算机程序的功能架构中与各步骤相应,使得整个系统通过专门的软件包(例如,lib库)而被调用,以实现相应的功能。
另一方面,根据本发明示例性实施例的模型上线的装置也可以通过硬件、软件、固件、中间件、微代码或其任意组合来实现。当以软件、固件、中间件或微代码实现时,用于执行相应操作的程序代码或者代码段可以存储在诸如存储介质的计算机可读介质中,使得处理器可通过读取并运行相应的程序代码或者代码段来执行相应的操作。
例如,根据本申请示例性实施例,可提供一种包括至少一个计算装置和存储指令的至少一个存储装置的系统,其中,所述指令在被所述至少一个计算装置运行时,促使所述至少一个计算装置执行下述步骤:由数据接入模块从至少一个传感器实时接收数据,并将接收的数据分配给至少一个数据处理模块;由所述至少一个数据处理模块中的每一个数据处理模块利用至少一个模型并行地对所述每个数据处理模块分配到的数据进行处理。应当注意,上述至少一个存储装置中存储的指令还可在执行上述步骤时执行更为具体的处理,这些进一步处理的内容已经在参照图2至图11的描述中提及,因此这里为了避免重复将不再进行赘述。
具体说来,上述系统可以部署在服务器或客户端中,也可以部署在分布式网络环境中的节点上。此外,所述系统可以是PC计算机、平板装置、个人数字助理、智能手机、web应用或其他能够执行上述指令集合的装置。此外,所述系统还可包括视频显示器(诸如,液晶显示器)和用户交互接口(诸如,键盘、鼠标、触摸输入装置等)。另外,所述系统的所有组件可经由总线和/或网络而彼此连接。
这里,所述系统并非必须是单个系统,还可以是任何能够单独或联合执行上述指令(或指令集)的装置或电路的集合体。所述系统还可以是集成控制系统或系统管理器的一部分,或者可被配置为与本地或远程(例如,经由无线传输)以接口互联的便携式电子装置。
在所述系统中,所述至少一个计算装置可包括中央处理器(CPU)、图形处理器(GPU)、可编程逻辑装置、专用处理器系统、微控制器或微处理器。作为示例而非限制,所述至少一个计算装置还可包括模拟处理器、数字处理器、微处理器、多核处理器、处理器阵列、网络处理器等。计算装置可运行存储在存储装置之一中的指令或代码,其中,所述存储装置还可以存储数据。指令和数据还可经由网络接口装置而通过网络被发送和接收,其中,所述网络接口装置可采用任何已知的传输协议。
存储装置可与计算装置集成为一体,例如,将RAM或闪存布置在集成电路微处理器等之内。此外,存储装置可包括独立的装置,诸如,外部盘驱动、存储阵列或任何数据库系统可使用的其他存储装置。存储装置和计算装置可在操作上进行耦合,或者可例如通过I/O端口、网络连接等互相通信,使得计算装置能够读取存储在存储装置中的指令。
以上描述了本发明的各示例性实施例,应理解,上述描述仅是示例性的,并非穷尽性的,本发明不限于所披露的各示例性实施例。在不偏离本发明的范围和精神的情况下,对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。因此,本发明的保护范围应该以权利要求的范围为准。
Claims (18)
1.一种由计算装置执行的数据处理方法,所述数据处理方法包括:
由数据接入模块从至少一个传感器实时接收数据,并将接收的数据分配给至少一个数据处理模块,其中,接收的数据为物联网场景中具有时效性和时序性的数据;以及
由所述至少一个数据处理模块中的每一个数据处理模块利用至少一个模型并行地对所述每一个数据处理模块分配到的数据进行处理,
其中,数据接入模块和所述至少一个数据处理模块通过基于特征存储单元队列和特征存储单元的数据结构进行数据存储和数据传递,其中,特征存储单元队列用于存储指示特征存储单元的存储地址,特征存储单元用于存储所述数据或者对所述数据进行处理得到的结果数据。
2.如权利要求1所述的数据处理方法,其中,
由数据接入模块从至少一个传感器实时接收数据的步骤包括:
由第一数据接收单元从接收的数据中解析键值,并通过利用第一特征存储单元队列来存储解析出的键值和接收的数据中未被解析的其它数据;
由至少一个数据存储单元并行地从存储的所述未被解析的其它数据中解析感测值,将解析出的感测值和通过利用第一特征存储单元队列存储的相应键值成对地存储到数据库中,并通过利用第二特征存储单元队列来存储所述相应键值;以及
由第一数据聚合单元对通过利用第二特征存储单元队列存储的键值进行聚合处理以恢复键值的时序。
3.如权利要求2所述的数据处理方法,其中,由第一数据聚合单元对通过利用第二特征存储单元队列存储的键值进行聚合处理的步骤包括:
由第一数据聚合单元确定消息列表中是否已存在与包括在通过利用第二特征存储单元队列存储的一个键值中的时间信息相应的特征列表;
如果所述消息列表中已存在所述特征列表,则由第一数据聚合单元将通过利用第二特征存储单元队列存储的与该时间信息对应的所有键值存储到所述特征列表中;
如果所述消息列表中不存在所述特征列表,则由第一数据聚合单元在所述消息列表中创建与该时间信息对应的特征列表,并将通过利用第二特征存储单元队列存储的与该时间信息对应的所有键值存储到创建的特征列表中。
4.如权利要求3所述的数据处理方法,其中,由第一数据聚合单元通过利用第二特征存储单元队列存储的键值进行聚合处理的步骤还包括:
当数据接入模块未接收到新数据的时间超过预设阈值时,由第一数据聚合单元将所有特征列表中的键值传递给数据路由单元,并删除所有特征列表。
5.如权利要求2所述的数据处理方法,其中,将接收的数据分配给至少一个数据处理模块的步骤包括:由数据路由单元将经过聚合处理的键值以预定规则分配给所述至少一个数据处理模块。
6.如权利要求5所述的数据处理方法,其中,由所述至少一个数据处理模块中的每一个数据处理模块利用至少一个模型并行地对所述每一个数据处理模块分配到的数据进行处理的步骤包括:
由第二数据接收单元通过利用第三特征存储单元队列来存储分配得到的键值;
由所述至少一个模型中的样本拼接单元根据通过利用第三特征存储单元队列存储的键值在所述数据库中查找相应的感测值,并根据查找到的感测值计算特征;
由所述至少一个模型中的模型预测单元根据样本拼接单元计算出的特征进行预测以获得预测结果,并通过利用第四特征存储单元队列来存储所述预测结果以及相应的键值。
7.如权利要求6所述的数据处理方法,其中,由所述至少一个数据处理模块中的每一个数据处理模块利用所述模型对各自分配到的数据进行处理的步骤还包括:
由第二数据聚合单元根据通过利用第四特征存储单元队列存储的键值对存储的相应的预测结果进行聚合处理以恢复预测结果的时序;
由专家规则单元按照预定规则对时序恢复后的预测结果进行处理以获得最终的预测结果。
8.如权利要求7所述的数据处理方法,其中,由专家规则单元按照预定规则对时序恢复后的预测结果进行处理以获得最终的预测结果的步骤包括:
由专家规则单元按照包括在键值中的位置信息对预测结果进行累加统计;
由专家规则单元确定与所述位置信息相应的被统计的预测结果的最大时间信息和最小时间信息之间的差值是否大于或等于预定阈值;
当所述差值大于或等于所示预定阈值时,由专家规则单元按照预定规则对所述累加统计的结果执行专家规则。
9.一种数据处理装置,所述数据处理装置包括:
数据接入模块,被配置为从至少一个传感器实时接收数据,并将接收的数据分配给至少一个数据处理模块,其中,接收的数据为IoT场景中具有时效性和时序性的数据;以及
所述至少一个数据处理模块,其中,每个数据处理模块被配置为利用至少一个模型并行地对所述每个数据处理模块分配得到的数据进行处理,
其中,数据接入模块和所述至少一个数据处理模块通过基于特征存储单元队列和特征存储单元的数据结构进行数据存储和数据传递,其中,特征存储单元队列用于存储指示特征存储单元的存储地址,特征存储单元用于存储所述数据或者对所述数据进行处理得到的结果数据。
10.如权利要求9所述的数据处理装置,其中,数据接入模块包括:
第一数据接收单元,被配置为从至少一个传感器实时接收数据,从接收的数据中解析键值,并通过利用第一特征存储单元队列来存储解析出的键值和接收的数据中未被解析的其它数据;
至少一个数据存储单元,被配置为并行地从存储的所述未被解析的其它数据中解析感测值,将解析出的感测值和通过利用第一特征存储单元队列存储的相应键值成对地存储到数据库中,并通过利用第二特征存储单元队列来存储所述相应键值;以及
第一数据聚合单元,被配置为对通过利用第二特征存储单元队列存储的键值进行聚合处理以恢复键值的时序。
11.如权利要求10所述的数据处理装置,其中,第一数据聚合单元通过以下操作对通过利用第二特征存储单元队列存储的键值进行聚合处理:
确定第一数据聚合单元中的消息列表中是否已存在与包括在通过利用第二特征存储单元队列存储的一个键值中的时间信息相应的特征列表;
如果所述消息列表中已存在所述特征列表,则将通过利用第二特征存储单元队列存储的与该时间信息对应的所有键值存储到所述特征列表中;
如果所述消息列表中不存在所述特征列表,则在所述消息列表中创建与该时间信息对应的特征列表,并将通过利用第二特征存储单元队列存储的与该时间信息对应的所有键值存储到创建的特征列表中。
12.如权利要求11所述的数据处理装置,其中,当数据接入模块未接收到新数据的时间超过预设阈值时,第一数据聚合单元还被配置为将所有特征列表中的键值传递给数据路由单元,并删除所有特征列表。
13.如权利要求10所述的数据处理装置,其中,数据接入模块还包括:数据路由单元,被配置为将经过聚合处理的键值以预定规则分配给所述至少一个数据处理模块。
14.如权利要求13所述的数据处理装置,其中,所述每个数据处理模块包括:
第二数据接收单元,被配置为从数据路由单元接收分配的键值,并通过利用第三特征存储单元队列来存储分配得到的键值;以及
所述至少一个模型,其中,每个模型包括:
样本拼接单元,被配置为根据通过利用第三特征存储单元队列存储的键值在所述数据库中查找相应的感测值,并根据查找到的感测值计算特征;以及
模型预测单元,被配置为根据样本拼接单元计算出的特征进行预测以获得预测结果,并通过利用第四特征存储单元队列来存储所述预测结果以及相应的键值。
15.如权利要求14所述的数据处理装置,其中,所述每个数据处理模块还包括:
第二数据聚合单元,被配置为根据通过利用第四特征存储单元队列存储的键值对存储的相应的预测结果进行聚合处理以恢复预测结果的时序;
专家规则单元,被配置为按照预定规则对时序恢复后的预测结果进行处理以获得最终的预测结果。
16.如权利要求15所述的数据处理装置,其中,专家规则单元通过以下操作按照预定规则对时序恢复后的预测结果进行处理以获得最终的预测结果:
按照包括在键值中的位置信息对预测结果进行累加统计;
确定与所述位置信息相应的被统计的预测结果的最大时间信息和最小时间信息之间的差值是否大于或等于预定阈值;
当所述差值大于或等于所述预定阈值时,按照预定规则对所述累加统计的结果执行专家规则。
17.一种存储指令的计算机可读存储介质,其中,当所述指令被至少一个计算装置运行时,促使所述至少一个计算装置执行如权利要求1-8中的任意一项所述的数据处理方法。
18.一种包括至少一个计算装置和存储指令的至少一个存储装置的系统,其中,所述指令在被所述至少一个计算装置运行时,促使所述至少一个计算装置执行如权利要求1-8中的任意一项所述的数据处理方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010137007.3A CN111369007B (zh) | 2020-03-02 | 2020-03-02 | 一种人工智能模型上线的方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010137007.3A CN111369007B (zh) | 2020-03-02 | 2020-03-02 | 一种人工智能模型上线的方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111369007A CN111369007A (zh) | 2020-07-03 |
CN111369007B true CN111369007B (zh) | 2024-02-13 |
Family
ID=71208348
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010137007.3A Active CN111369007B (zh) | 2020-03-02 | 2020-03-02 | 一种人工智能模型上线的方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111369007B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115374188B (zh) * | 2022-10-24 | 2023-01-31 | 沐曦科技(成都)有限公司 | 一种资源状态查询方法、装置、电子设备及存储介质 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104065540A (zh) * | 2014-07-11 | 2014-09-24 | 网之易信息技术(北京)有限公司 | 一种数据监控系统和方法 |
CN107390650A (zh) * | 2016-11-18 | 2017-11-24 | 厦门嵘拓物联科技有限公司 | 一种基于物联网的数据采集系统及基于该系统的数据压缩方法 |
CN109067732A (zh) * | 2018-07-26 | 2018-12-21 | 广州大学 | 物联网设备及数据接入系统、方法及计算机可读存储介质 |
CN109361577A (zh) * | 2018-12-20 | 2019-02-19 | 李斯嘉 | 一种基于分布式传感器的数据监测方法和系统 |
CN110244994A (zh) * | 2018-03-09 | 2019-09-17 | 埃森哲环球解决方案有限公司 | 用于数据处理系统的数据模块管理 |
KR20190117847A (ko) * | 2018-03-28 | 2019-10-17 | 주식회사 미래이씨피 | 인공지능을 이용한 온라인 쇼핑몰에서의 프로모션 성과 예측 및 추천 장치 |
CN110597057A (zh) * | 2019-08-22 | 2019-12-20 | 浙江工业大学 | 在工业应用场景下的数据处理系统 |
-
2020
- 2020-03-02 CN CN202010137007.3A patent/CN111369007B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104065540A (zh) * | 2014-07-11 | 2014-09-24 | 网之易信息技术(北京)有限公司 | 一种数据监控系统和方法 |
CN107390650A (zh) * | 2016-11-18 | 2017-11-24 | 厦门嵘拓物联科技有限公司 | 一种基于物联网的数据采集系统及基于该系统的数据压缩方法 |
CN110244994A (zh) * | 2018-03-09 | 2019-09-17 | 埃森哲环球解决方案有限公司 | 用于数据处理系统的数据模块管理 |
KR20190117847A (ko) * | 2018-03-28 | 2019-10-17 | 주식회사 미래이씨피 | 인공지능을 이용한 온라인 쇼핑몰에서의 프로모션 성과 예측 및 추천 장치 |
CN109067732A (zh) * | 2018-07-26 | 2018-12-21 | 广州大学 | 物联网设备及数据接入系统、方法及计算机可读存储介质 |
CN109361577A (zh) * | 2018-12-20 | 2019-02-19 | 李斯嘉 | 一种基于分布式传感器的数据监测方法和系统 |
CN110597057A (zh) * | 2019-08-22 | 2019-12-20 | 浙江工业大学 | 在工业应用场景下的数据处理系统 |
Non-Patent Citations (2)
Title |
---|
IBFRAME: IoT Data Processing Framework for Intelligent Building Management;Dongwoo Kwon 等;《2019 IEEE International Conference on Big Data》;5233-5238 * |
面向智慧工地监管的物联网设备设计与系统实现;汪俊林;《中国优秀硕士论文全文数据库信息科技辑》;I136-102 * |
Also Published As
Publication number | Publication date |
---|---|
CN111369007A (zh) | 2020-07-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10447772B2 (en) | Managed function execution for processing data streams in real time | |
US20220391771A1 (en) | Method, apparatus, and computer device and storage medium for distributed training of machine learning model | |
CN111340237B (zh) | 数据处理和模型运行方法、装置和计算机设备 | |
US20190294978A1 (en) | Inferring digital twins from captured data | |
Hayashi et al. | Fully dynamic betweenness centrality maintenance on massive networks | |
CN111339078A (zh) | 数据实时存储方法、数据查询方法、装置、设备、介质 | |
JP7000766B2 (ja) | 学習データ選択プログラム、学習データ選択方法、および、学習データ選択装置 | |
Huang et al. | DeepAdapter: A collaborative deep learning framework for the mobile web using context-aware network pruning | |
US20230252070A1 (en) | Method and apparatus for training retrieval model, retrieval method and apparatus, device and medium | |
CN111369007B (zh) | 一种人工智能模型上线的方法和装置 | |
CN115878824B (zh) | 图像检索系统、方法和装置 | |
CN110826683A (zh) | 一种预测用户行为发生概率的方法和装置 | |
CN117271122A (zh) | 基于cpu和gpu分离的任务处理方法、装置、设备及存储介质 | |
CN112732542A (zh) | 信息处理方法、信息处理装置及终端设备 | |
CN115965074A (zh) | 深度学习模型的训练方法、数据处理方法、装置和设备 | |
CN109992468A (zh) | 一种进程性能分析方法、装置、系统及计算机存储介质 | |
CN114356513B (zh) | 用于集群模式的任务处理方法及装置 | |
CN115080143B (zh) | 页面资源预加载方法、装置、设备及存储介质 | |
CN115396319B (zh) | 数据流分片方法、装置、设备及存储介质 | |
CN116719584B (zh) | 数据处理方法、装置、计算机、存储介质及程序产品 | |
WO2024119937A1 (zh) | 一种图像检索的方法、系统以及装置 | |
CN118796630A (zh) | 性能测试方法、装置、设备、存储介质及产品 | |
CN113656646A (zh) | 搜索图神经网络结构的方法和系统 | |
Zhou | Parallel Processing Systems for Data and Computation Efficiency with Applications to Graph Computing and Machine Learning | |
CN114022274A (zh) | 图神经网络结构搜索方法和系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |