CN115994601A - 训练预测模型的装置及方法 - Google Patents

训练预测模型的装置及方法 Download PDF

Info

Publication number
CN115994601A
CN115994601A CN202111268382.2A CN202111268382A CN115994601A CN 115994601 A CN115994601 A CN 115994601A CN 202111268382 A CN202111268382 A CN 202111268382A CN 115994601 A CN115994601 A CN 115994601A
Authority
CN
China
Prior art keywords
features
training
predictive model
abnormal
data set
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111268382.2A
Other languages
English (en)
Inventor
杨长恩
张靖雯
黄淑姿
李金武
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Institute for Information Industry
Original Assignee
Institute for Information Industry
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Institute for Information Industry filed Critical Institute for Information Industry
Publication of CN115994601A publication Critical patent/CN115994601A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Artificial Intelligence (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Medical Informatics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Feedback Control In General (AREA)
  • Train Traffic Observation, Control, And Security (AREA)

Abstract

一种训练预测模型的装置及方法。该装置将多个数据资料分类为一常态情况资料集及一非常态情况资料集,其中该多个数据资料的每一者包含多个第一特征。该装置基于该常态情况资料集及该多个第一特征中的多个第三特征,训练一第一预测模型。该装置将该非常态情况资料集输入至该第一预测模型,以产生一第一阶段预测值。该装置将该第一阶段预测值加入至该非常态情况资料集。该装置基于该非常态情况资料集及该多个第一特征,训练一第二预测模型。本发明所提供的训练预测模型技术,提升预测模型对于非常态情况预测的准确率。

Description

训练预测模型的装置及方法
技术领域
本发明是关于一种训练预测模型的装置及方法。具体而言,本发明是关于一种提升非常态情况的预测准确率的训练预测模型的装置及方法。
背景技术
近年来,与大数据相关的技术及应用快速的发展,企业端的供应链经常透过建置预测模型,以对于库存消耗量、采购数量、订单数量与销售量等等的数据进行预测。
然而,在实际的数据(例如:销售数据)及用于训练预测模型的数据中通常存在少量但不定期的非常态情况(non-normal situation),而发生明显的波动数值。举例而言,棒球比赛取得冠军时的促销事件、补班日、开工日、新节日、疫情解封、临时短期促销等等的非常态情况。因此,企业供应链在库存消耗量、采购数量、订单数量与销售量等等的预测模型常受到非常态情况的影响而不易预测,造成预测结果的准确性低且不易解释,导致预测模型失准。
此外,由于非常态情况发生的次数低,因此可获得的非常态情况数据资料稀少。由于训练的数据资料不足,因此企业端亦难以完全针对非常态情况进行预测模型的训练。
有鉴于此,如何提供一种可提升非常态情况预测的准确率的技术,乃业界亟需努力的目标。
发明内容
本发明的一目的在于提供一种训练预测模型的装置。该训练预测模型的装置包含一储存器、一收发接口及一处理器,该处理器电性连接至该储存器及该收发接口。该处理器将多个数据资料分类为一常态情况资料集及一非常态情况资料集,其中该多个数据资料的每一者包含多个第一特征。该处理器基于该常态情况资料集及该多个第一特征中的多个第三特征,训练一第一预测模型。该处理器将该非常态情况资料集输入至该第一预测模型,以产生一第一阶段预测值。该处理器将该第一阶段预测值加入至该非常态情况资料集。该处理器基于该非常态情况资料集及该多个第一特征,训练一第二预测模型。
本发明的另一目的在于提供一种训练预测模型的方法,该训练预测模型的方法用于一电子装置,该电子装置包含一储存器、一收发接口及一处理器。该训练预测模型的方法由该处理器所执行且包含下列步骤:(a)基于多个数据资料中的一常态情况资料集及该多个数据资料中的多个第三特征,训练一第一预测模型,其中该多个数据资料的每一者包含多个第一特征,该多个第三特征为该多个第一特征的其中一部分,(b)将该多个数据资料中的一非常态情况资料集输入至该第一预测模型,以产生一第一阶段预测值,(c)将该第一阶段预测值加入至该非常态情况资料集,以及(d)基于该非常态情况资料集及该多个第一特征,训练一第二预测模型。
在本发明的一实施方式中,其中该第一阶段预测值包含多个时间区间及对应该多个时间区间各者的一预测值。
在本发明的一实施方式中,其中运作(e)还包含以下运作:(e1)调降该多个第一特征中的该多个第三特征各者所对应的一权重;以及(e2)基于该非常态情况资料集、该多个第一特征及该多个权重,训练该第二预测模型。
在本发明的一实施方式中,其中运作(a)还包含以下运作:(a1)基于对应一第二特征的一时间区间,将该多个数据资料分类为该常态情况资料集及该非常态情况资料集,其中该第二特征为该多个第一特征其中之一。
在本发明的一实施方式中,其中运作(b)还包含以下运作:(b1)基于该第二特征,对该多个第一特征执行一关联性分析,以从该多个第一特征中选择其中一部分作为该多个第三特征。
在本发明的一实施方式中,还包含以下运作:(a2)基于一影响因子,调整对应该第二特征的该时间区间;(a3)基于该时间区间,分类该常态情况资料集及该非常态情况资料集;以及(f)执行运作(b)、运作(c)、运作(d)及运作(e),以训练一第三预测模型。
在本发明的一实施方式中,还包含以下运作:(g)重复地执行n次运作(a2)、运作(a3)及运作(f),以训练n个第三预测模型,其中n为一正整数;(h)基于各该第三预测模型,产生对应该多个第三预测模型中各者的一第三预测结果;以及(i)计算该多个第三预测结果各者的一误差值,以判断一最佳影响因子及对应该最佳影响因子的该第三预测模型。
在本发明的一实施方式中,其中该第一阶段预测值包含多个时间区间及对应该多个时间区间各者的一预测值。
在本发明的一实施方式中,其中步骤(d)还包含以下步骤:(d1)调降该多个第一特征中的该多个第三特征各者所对应的一权重;以及(d2)基于该非常态情况资料集、该多个第一特征及该多个权重,训练该第二预测模型。
在本发明的一实施方式中,还包含以下步骤:基于对应一第二特征的一时间区间,将该多个数据资料分类为该常态情况资料集及该非常态情况资料集,其中该第二特征为该多个第一特征其中之一。
在本发明的一实施方式中,还包含以下步骤:基于该第二特征,对该多个第一特征执行一关联性分析,以从该多个第一特征中选择其中一部分作为该多个第三特征。
在本发明的一实施方式中,还包含以下步骤:(a1)基于一影响因子,调整对应该第二特征的该时间区间;(a2)基于该时间区间,分类该常态情况资料集及该非常态情况资料集;以及(e)执行步骤(a)、步骤(b)、步骤(c)及步骤(d),以训练一第三预测模型。
在本发明的一实施方式中,还包含以下步骤:(f)重复地执行n次步骤(a1)、步骤(a2)及步骤(e),以训练n个第三预测模型,其中n为一正整数;(g)基于各该第三预测模型,产生对应该多个第三预测模型中各者的一第三预测结果;以及(h)计算该多个第三预测结果各者的一误差值,以判断一最佳影响因子及对应该最佳影响因子的该第三预测模型。
本发明所提供的训练预测模型技术(至少包含装置及方法),于第一预测模型训练阶段,将多个数据资料分类为常态情况资料集及非常态情况资料集,且基于该常态情况资料集及该多个第一特征中的多个第三特征,训练第一预测模型。于第二预测模型训练阶段,将该非常态情况资料集输入至该第一预测模型,产生一第一阶段预测值。将该第一阶段预测值加入至该非常态情况资料集。基于该非常态情况资料集及该多个第一特征,训练第二预测模型。于调整阶段,根据多种不同的影响因子,多次调整对应该第二特征的该时间区间,产生不同的第三预测模型及对应的第三预测结果,并计算该多个第三预测结果各者的一误差值,以判断最佳影响因子及对应该最佳影响因子的该第三预测模型。
本发明所提供的训练预测模型技术,基于三个不同阶段的运作,提升预测模型对于非常态情况预测的准确率,解决已知技术产生的预测模型常受到非常态情况的影响而不准确的问题。此外,本发明亦在第二预测模型训练阶段的训练资料中,加入第一阶段对非常态情况预测值,使第二阶段模型可具有一般情况的模型特性,解决已知技术训练的数据资料不足,因此难以针对非常态情况进行预测模型的训练的问题。
以下结合附图阐述本发明的详细技术及实施方式,以使本发明所属技术领域中具有通常知识者能理解所请求保护的发明的技术特征。
附图说明
图1是描绘第一实施方式的训练预测模型的装置的架构示意图;
图2是描绘第一实施方式的数据资料示意图;以及
图3是描绘第二实施方式的训练预测模型的方法的部分流程图。
【符号说明】
1:训练预测模型的装置
11:储存器
13:收发接口
15:处理器
200:数据资料
T1、T2、T3、T4、T5:时间段
300:训练预测模型的方法
S301、S303、S305、S307:步骤
具体实施方式
以下将透过实施方式来解释本发明所提供的一种训练预测模型的装置及方法。然而,该多个实施方式并非用以限制本发明需在如该多个实施方式所述的任何环境、应用或方式方能实施。因此,关于实施方式的说明仅为阐释本发明的目的,而非用以限制本发明的范围。应理解,在以下实施方式及附图中,与本发明非直接相关的元件已省略而未绘示,且各元件的尺寸以及元件间的尺寸比例仅为例示而已,而非用以限制本发明的范围。
本发明的第一实施方式为训练预测模型装置1,其架构示意图是描绘于图1。训练预测模型装置1包含一储存器11、收发接口13及处理器15,处理器15电性连接至储存器11及收发接口13。储存器11可为记忆体、通用串行总线(Universal Serial Bus;USB)盘、硬盘、光盘、随身盘或本发明所属技术领域中具有通常知识者所知且具有相同功能的任何其他储存媒体或电路。收发接口13为可接收及传输资料的接口或本发明所属技术领域中具有通常知识者所知悉的其他可接收及传输资料的接口,收发接口13可透过例如:外部装置、外部网页、外部应用程序等等来源接收资料。处理器15可为各种处理单元、中央处理单元(CentralProcessing Unit;CPU)、微处理器或本发明所属技术领域中具有通常知识者所知悉的其他计算装置。
先简单说明本发明的第一实施方式的运作,本发明主要包含二阶段的运作,分别为第一预测模型训练阶段及第二预测模型训练阶段。于某些实施方式中,本发明还包含一调整阶段以最佳化预测模型,在该调整阶段中调整非常态情况区间范围,以找寻对应最好预测准确率的非常态情况区间范围。以下段落将详细说明与本发明相关的实施细节。
首先,先说明在第一预测模型训练阶段中用于训练预测模型的的训练资料。于本实施方式中,用于训练预测模型的数据资料为针对一商品于多个时间区间的数值,例如:以各周次为单位的库存消耗量。
为便于理解,以一实际范例举例而言,请参考图2。图2例示了一组关于饮料A的库存消耗量的数据资料200的数值波动。在图2中,其中X座标轴的数值为周次(单位:周)、Y座标轴的数值为库存消耗量(单位:个),各个资料点代表该周的库存消耗量,数据资料200记录了共100周的库存消耗量的异动数据。
须说明者,图2仅用于例示数据资料的其中一种态样,于某些实施方式中亦可使用其他的数据,例如:采购数量、订单数量与销售量等等的参数作为预测模型的训练资料,视预测模型的用途及规模而定,本发明所属技术领域中具有通常知识者应可理解其内容,故不赘言。
于本实施方式中,数据资料200中的各个资料点(即,图2上的每个资料点)的数据资料还包含多个特征(未绘示),各个特征对应至一特征项目及对应该特征项目的参数值。须说明者,为便于说明及辨识本发明不同阶段所使用的特征,以下段落中将以“第一特征”代称数据资料200中各个资料点所包含的各个特征。
举例而言,数据资料200中的各个资料点还记录了“工作日”、“温度”、“促销事件”及“广告投放”等四个第一特征。又举例而言,对应第一特征为“工作日”的参数值可能为“该星期的工作日天数”、对应第一特征为“温度”的参数值可能为“该星期的平均温度”或是“该星期的温度波动值”、对应第一特征为“促销事件”的参数值为“促销事件的类型”(例如:一次购买二件商品五折、买三送一等等)、对应第一特征为“广告投放”的参数值为“广告投放的类型”或是“广告投放的时间长度”。须说明者,本发明并未限制该多个第一特征的类型及其对应的参数值种类,任何能协助用以训练预测模型的数据资料,均为本发明要保护的范围。
接着,将具体说明第一预测模型训练阶段中关于第一预测模型建置的运作流程。于本实施方式中,为更准确的区分数据资料中各个资料点的影响程度,处理器15会先将数据资料200区分为不同的资料集。具体而言,处理器15执行运作(a),将多个数据资料分类为常态情况资料集(normal situation data set)及非常态情况资料集(non-normalsituation data set),其中该多个数据资料的每一者包含多个第一特征。
举例而言,常态情况资料集可利用以下等式表示:
Figure BDA0003327746450000061
于上述公式中,D1为常态情况资料集,参数
Figure BDA0003327746450000062
代表预测目标(即,各资料点),参数
Figure BDA0003327746450000063
代表该多个第一特征,参数N1为资料数。
举例而言,非常态情况资料集可利用以下等式表示:
Figure BDA0003327746450000064
于上述公式中,D2为非常态情况资料集,参数
Figure BDA0003327746450000065
代表预测目标(即,各资料点),参数
Figure BDA0003327746450000071
代表该多个第一特征,参数N2为资料数。
于某些实施方式中,处理器15从该多个第一特征中选出一部分特征作为第二特征,以基于该第二特征分类该多个数据资料(即,利用该第二特征分类出待预测的非常态情况区间)。具体而言,处理器15基于对应第二特征的一时间区间,将该多个数据资料分类为该常态情况资料集及该非常态情况资料集,其中该第二特征为该多个第一特征其中之一。
举例而言,若将该多个第一特征中的“促销事件”作为第二特征,处理器15将具有同样“促销事件”特征的资料点分类出来。如图2所示,处理器15分类出数据资料200中具有同样“促销事件”特征的资料点,其对应的时间段为T1、T2、T3、T4及T5(即,该段时间区间内均有该“促销事件”特征)。换言之,该非常态情况资料集的资料点即为在时间段T1、T2、T3、T4及T5中的资料点,其余的资料点则被分类至常态情况资料集。
在上述范例中,由于“促销事件”通常为固定时间区间,例如:持续5个周次,因此图2中的各个时间段T1、T2、T3、T4及T5均由5个资料点所组成。于其他实施方式中,非常态情况资料集亦可能由非固定时间区间组成,视不同的特征性质而定,本发明所属技术领域中具有通常知识者应可理解非固定时间区间时的实施态样,故不赘言。
接着,处理器15从该多个第一特征中选出与预测目标相关的特征(下称:第三特征),用以训练第一预测模型。具体而言,处理器15执行运作(b),基于该常态情况资料集及该多个第一特征中的多个第三特征,训练一第一预测模型。
于某些实施方式中,处理器15在训练该第一预测模型前,先对该多个第一特征进行筛选,以排除部分非与该第二特征相关的特征(即,该多个特征对应的数值波动与该第二特征所对应时间段的数值波动较无关系),以避免某些非相关的特征影响预测模型的训练结果。具体而言,处理器15基于该第二特征,对该多个第一特征执行一关联性分析,以从该多个第一特征中选择其中一部分作为该多个第三特征。
接续前述的范例举例而言,若处理器15将该多个第一特征中的“促销事件”作为第二特征,则处理器15将基于被选作为第二特征的“促销事件”,对该多个第一特征执行关连性分析(即,判断该多个第一特征中与“促销事件”有关连的特征)。于本范例中,处理器15判断该多个第一特征中与该第二特征“促销事件”较有相关的为“工作日”及“温度”(例如:该星期的工作日天数及该星期的平均温度可能会影响“促销事件”所对应区间的数值,因此“工作日”的天数波动及“温度”的数值波动对于“促销事件”的影响较有关联),因此处理器15选择第一特征中的“工作日”及“温度”作为第三特征,且将在后续运作中使用该多个第三特征训练预测模型。
于某些实施方式中,在训练第一预测模型前,处理器15还对于常态情况资料中的该多个第三特征执行正则化(regularization),以降低过度拟合(overfitting)的发生。须说明者,处理器15在对常态情况资料的该多个第三特征执行正则化后,产生该多个第三特征各自对应的权重值,该多个第三特征的权重值将还用以训练该第一预测模型。须说明者,本发明所属技术领域中具有通常知识者应可根据前述说明内容,理解如何透过权重值训练该第一预测模型,故不赘言。
举例而言,正则化的目标函数可利用以下公式表示:
Figure BDA0003327746450000081
于上述公式中,w1为第一阶段的该多个第三特征对应的权重值,w为各个第三特征对应的权重值,wTw<C1为正则化的规则,
Figure BDA0003327746450000082
为第一阶段正则化后的结果。
须说明者,该第一预测模型可透过大量的输入资料进行训练,并透过各种已知的架构(例如:神经网络)进行机器学习,本领域具有通常知识者应可根据前述说明内容,理解训练该第一预测模型的运作内容,兹不赘言。
接着,以下段落将具体说明第二预测模型训练阶段中关于第二预测模型建置的运作流程。于本阶段中,处理器15将使用常态情况建置的预测模型(即,第一预测模型)预测非常态情况区间的数值,并将预测结果加入训练资料中,以使得第二阶段的训练资料中含有第一阶段模型的特性,增强第二阶段产生的第二预测模型预测非常态数值的能力。
首先,处理器15执行运作(c),将该非常态情况资料集输入至该第一预测模型,以产生一第一阶段预测值。接着,处理器15执行运作(d),将该第一阶段预测值加入至该非常态情况资料集,以使得该非常态情况资料集含有第一阶段预测值。最后,处理器15执行运作(e),基于该非常态情况资料集及该多个第一特征,训练一第二预测模型。
于某些实施方式中,该第一阶段预测值包含多个时间区间及对应该多个时间区间各者的一预测值。举例而言,该预测值可为预测库存消耗量、预测采购数量、预测订单数量与预测销售量等等。
于某些实施方式中,在训练第二预测模型前,处理器15还对于非常态情况资料中的该多个第一特征执行正则化,以降低过度拟合的发生。须说明者,处理器15在对非常态情况资料的该多个第一特征执行正则化后,产生该多个第一特征各自对应的权重值,该多个第一特征的权重值将还用以训练该第二预测模型。
于某些实施方式中,处理器15除了正则化之外,还在训练第二预测模型时优先使用没有在第一次训练阶段所使用的第三特征(即,降低使用第一次训练阶段所使用的第三特征的权重),此运作可重点加强相对于非常态情况的特征,因而降低训练预测模型时的特征维度与提升效能。具体而言,处理器15调降该多个第一特征中的该多个第三特征各者所对应的一权重,处理器15基于该非常态情况资料集、该多个第一特征及该多个权重,训练该第二预测模型。
举例而言,第二阶段的正则化的目标函数可利用以下公式表示:
Figure BDA0003327746450000091
于上述公式中,w2为第二阶段的该多个第一特征对应的权重值,w为各个第一特征对应的权重值,wTw<C1
Figure BDA0003327746450000092
为正则化的规则,
Figure BDA0003327746450000093
为第二阶段正则化后的结果。
另须说明者,由于某些特征影响的时间范围不仅止于具有该第二特征的时间区间(例如:促销事件或广告投放),而会发生预先或延迟的影响效应,因而提早或延长影响的时间范围,例如:广告投放结束后一周,销售量仍持续维持高点。因此,于某些实施方式中,在训练该第二预测模型后,处理器15更进一步调整时间区间的影响范围,以找到最佳的非常态情况所影响的时间区间。以下段落将具体说明调整阶段的运作流程。
于某些实施方式中,处理器15更进一步基于影响因子r调整时间区间的范围,并基于调整后的时间区间,训练新的预测模型。举例而言,当影响因子r设定为“一周”时,将原先的时间段T的时间点前后各延长一周。换言之,若原先对应某特征的时间段T是由时间点a及时间点b组成,处理器15将时间段T扩大为时间点a-r及时间点b+r组成的新时间段T’。
具体而言,在执行前述运作(b)、运作(c)、运作(d)及运作(e)后,处理器15还执行运作(a2)基于一影响因子,调整对应该第二特征的该时间区间。接着,处理器15还执行运作(a3)基于该时间区间,分类该常态情况资料集及该非常态情况资料集。随后,处理器15还执行运作(f),执行运作(b)、运作(c)、运作(d)及运作(e),以训练一第三预测模型。
于某些实施方式中,处理器15更进一步多次调整时间区间(即,调整影响因子r),产生多个依据不同影响因子r所训练的新的预测模型,并比较各个预测模型的预测结果,以找到最佳的非常态情况所影响的时间区间及影响因子r。举例而言,处理器15可透过方均根误差(root-mean-square error;RMSE),计算不同影响因子r所相对应的非常态情况区间范围预测数值的方均根误差(即,比较多个不同影响因子r的预测模型的预测结果)。
具体而言,处理器15还执行运作(g),以重复地执行n次运作(a2)、运作(a3)及运作(f),以训练n个第三预测模型,其中n为一正整数。接着,处理器15执行运作(h),以基于各该第三预测模型,产生对应该多个第三预测模型中各者的一第三预测结果。最后,处理器15执行运作(i),以计算该多个第三预测结果各者的一误差值,以判断一最佳影响因子及对应该最佳影响因子的该第三预测模型。
由上述说明可知,本发明所提供的训练预测模型的装置,于第一预测模型训练阶段,将多个数据资料分类为常态情况资料集及非常态情况资料集,且基于该常态情况资料集及该多个第一特征中的多个第三特征,训练第一预测模型。于第二预测模型训练阶段,将该非常态情况资料集输入至该第一预测模型,产生一第一阶段预测值。将该第一阶段预测值加入至该非常态情况资料集。基于该非常态情况资料集及该多个第一特征,训练第二预测模型。于调整阶段,根据多种不同的影响因子,多次调整对应该第二特征的该时间区间,产生不同的第三预测模型及对应的第三预测结果,并计算该多个第三预测结果各者的一误差值,以判断最佳影响因子及对应该最佳影响因子的该第三预测模型。
本发明所提供的训练预测模型技术,基于三个不同阶段的运作,提升预测模型对于非常态情况预测的准确率,解决已知技术产生的预测模型常受到非常态情况的影响而不准确的问题。此外,本发明亦在第二预测模型训练阶段的训练资料中,加入第一阶段对非常态情况预测值,使第二阶段模型可具有一般情况的模型特性,解决已知技术训练的数据资料不足,因此难以针对非常态情况进行预测模型的训练的问题。
本发明的第二实施方式为一训练预测模型的方法,其流程图是描绘于图3。训练预测模型的方法300适用于一电子装置,该电子装置包含一储存器、一收发接口及一处理器,例如:第一实施方式所述的训练预测模型的装置1。训练预测模型的方法300透过步骤S301至步骤S307训练预测模型。
于步骤S301,由电子装置基于多个数据资料中的一常态情况资料集及该多个数据资料中的多个第三特征,训练一第一预测模型,其中该多个数据资料的每一者包含多个第一特征,该多个第三特征为该多个第一特征的其中一部分。于步骤S303,由电子装置将该多个数据资料中的一非常态情况资料集输入至该第一预测模型,以产生一第一阶段预测值。
于某些实施方式中,训练预测模型的方法300还包含以下步骤:基于对应一第二特征的一时间区间,将该多个数据资料分类为该常态情况资料集及该非常态情况资料集,其中该第二特征为该多个第一特征其中之一。
于某些实施方式中,训练预测模型的方法300还包含以下步骤:基于该第二特征,对该多个第一特征执行一关联性分析,以从该多个第一特征中选择其中一部分作为该多个第三特征。
于某些实施方式中,其中该第一阶段预测值包含多个时间区间及对应该多个时间区间各者的一预测值。
接着,于步骤S305,由电子装置将该第一阶段预测值加入至该非常态情况资料集。最后,于步骤S307,由电子装置基于该非常态情况资料集及该多个第一特征,训练一第二预测模型。
于某些实施方式中,其中步骤S307还包含以下步骤:步骤(d1)调降该多个第一特征中的该多个第三特征各者所对应的一权重,以及步骤(d2)基于该非常态情况资料集、该多个第一特征及该多个权重,训练该第二预测模型。
于某些实施方式中,训练预测模型的方法300还包含以下步骤:步骤(a1)基于一影响因子,调整对应该第二特征的该时间区间。步骤(a2)基于该时间区间,分类该常态情况资料集及该非常态情况资料集。步骤(e)执行步骤(a)、步骤(b)、步骤(c)及步骤(d),以训练一第三预测模型。
于某些实施方式中,训练预测模型的方法300还包含以下步骤:步骤(f)重复地执行n次步骤(a1)、步骤(a2)及步骤(e),以训练n个第三预测模型,其中n为一正整数。步骤(g)基于各该第三预测模型,产生对应该多个第三预测模型中各者的一第三预测结果。步骤(h)计算该多个第三预测结果各者的一误差值,以判断一最佳影响因子及对应该最佳影响因子的该第三预测模型。
除了上述步骤,第二实施方式亦能执行第一实施方式所描述的训练预测模型的装置1的所有运作及步骤,具有同样的功能,且达到同样的技术效果。本发明所属技术领域中具有通常知识者可直接了解第二实施方式如何基于上述第一实施方式以执行此等运作及步骤,具有同样的功能,并达到同样的技术效果,故不赘述。
需说明者,于本发明专利说明书及权利要求书中,某些用语(包含:特征及预测模型等等)前被冠以“第一”、“第二”或“第三”,该多个“第一”、“第二”或“第三”仅用来区分不同的用语。例如:第一特征、第二特征及第三特征中的“第一”、“第二”及“第三”仅用来表示不同运作时所使用的特征。
综上所述,本发明所提供的训练预测模型技术(至少包含装置及方法),于第一预测模型训练阶段,将多个数据资料分类为常态情况资料集及非常态情况资料集,且基于该常态情况资料集及该多个第一特征中的多个第三特征,训练第一预测模型。于第二预测模型训练阶段,将该非常态情况资料集输入至该第一预测模型,产生一第一阶段预测值。将该第一阶段预测值加入至该非常态情况资料集。基于该非常态情况资料集及该多个第一特征,训练第二预测模型。于调整阶段,根据多种不同的影响因子,多次调整对应该第二特征的该时间区间,产生不同的第三预测模型及对应的第三预测结果,并计算该多个第三预测结果各者的一误差值,以判断最佳影响因子及对应该最佳影响因子的该第三预测模型。
本发明所提供的训练预测模型技术,基于三个不同阶段的运作,提升预测模型对于非常态情况预测的准确率,解决已知技术产生的预测模型常受到非常态情况的影响而不准确的问题。此外,本发明亦在第二预测模型训练阶段的训练资料中,加入第一阶段对非常态情况预测值,使第二阶段模型可具有一般情况的模型特性,解决已知技术训练的数据资料不足,因此难以针对非常态情况进行预测模型的训练的问题。
上述实施方式仅用来例举本发明的部分实施态样,以及阐释本发明的技术特征,而非用来限制本发明的保护范畴及范围。任何本发明所属技术领域中具有通常知识者可轻易完成的改变或均等性的安排均属于本发明所主张的范围,而本发明的权利保护范围以权利要求书为准。

Claims (14)

1.一种训练预测模型的装置,其特征在于,包含:
一储存器;
一收发接口;以及;
一处理器,电性连接至该储存器及该收发接口,用以执行以下运作:
(a)将多个数据资料分类为一常态情况资料集及一非常态情况资料集,其中该多个数据资料的每一者包含多个第一特征;
(b)基于该常态情况资料集及该多个第一特征中的多个第三特征,
训练一第一预测模型;
(c)将该非常态情况资料集输入至该第一预测模型,以产生一第一阶段预测值;
(d)将该第一阶段预测值加入至该非常态情况资料集;以及
(e)基于该非常态情况资料集及该多个第一特征,训练一第二预测模型。
2.根据权利要求1所述的训练预测模型的装置,其特征在于,其中该第一阶段预测值包含多个时间区间及对应该多个时间区间各者的一预测值。
3.根据权利要求1所述的训练预测模型的装置,其特征在于,其中运作(e)还包含以下运作:
(e1)调降该多个第一特征中的该多个第三特征各者所对应的一权重;以及
(e2)基于该非常态情况资料集、该多个第一特征及该多个权重,训练该第二预测模型。
4.根据权利要求1所述的训练预测模型的装置,其特征在于,其中运作(a)还包含以下运作:
(a1)基于对应一第二特征的一时间区间,将该多个数据资料分类为该常态情况资料集及该非常态情况资料集,其中该第二特征为该多个第一特征其中之一。
5.根据权利要求4所述的训练预测模型的装置,其特征在于,其中运作(b)还包含以下运作:
(b1)基于该第二特征,对该多个第一特征执行一关联性分析,以从该多个第一特征中选择其中一部分作为该多个第三特征。
6.根据权利要求4所述的训练预测模型的装置,其特征在于,还包含以下运作:
(a2)基于一影响因子,调整对应该第二特征的该时间区间;
(a3)基于该时间区间,分类该常态情况资料集及该非常态情况资料集;以及
(f)执行运作(b)、运作(c)、运作(d)及运作(e),以训练一第三预测模型。
7.根据权利要求6所述的训练预测模型的装置,其特征在于,还包含以下运作:
(g)重复地执行n次运作(a2)、运作(a3)及运作(f),以训练n个第三预测模型,其中n为一正整数;
(h)基于各该第三预测模型,产生对应该多个第三预测模型中各者的一第三预测结果;以及
(i)计算该多个第三预测结果各者的一误差值,以判断一最佳影响因子及对应该最佳影响因子的该第三预测模型。
8.一种训练预测模型的方法,其特征在于,用于一电子装置,该电子装置包含一储存器、一收发接口及一处理器,该训练预测模型的方法由该处理器所执行且包含下列步骤:
(a)基于多个数据资料中的一常态情况资料集及该多个数据资料中的多个第三特征,训练一第一预测模型,其中该多个数据资料的每一者包含多个第一特征,该多个第三特征为该多个第一特征的其中一部分;
(b)将该多个数据资料中的一非常态情况资料集输入至该第一预测模型,以产生一第一阶段预测值;
(c)将该第一阶段预测值加入至该非常态情况资料集;以及
(d)基于该非常态情况资料集及该多个第一特征,训练一第二预测模型。
9.根据权利要求8所述的训练预测模型的方法,其特征在于,其中该第一阶段预测值包含多个时间区间及对应该多个时间区间各者的一预测值。
10.根据权利要求8所述的训练预测模型的方法,其特征在于,其中步骤(d)还包含以下步骤:
(d1)调降该多个第一特征中的该多个第三特征各者所对应的一权重;以及
(d2)基于该非常态情况资料集、该多个第一特征及该多个权重,训练该第二预测模型。
11.根据权利要求8所述的训练预测模型的方法,其特征在于,还包含以下步骤:
基于对应一第二特征的一时间区间,将该多个数据资料分类为该常态情况资料集及该非常态情况资料集,其中该第二特征为该多个第一特征其中之一。
12.根据权利要求11所述的训练预测模型的方法,其特征在于,还包含以下步骤:
基于该第二特征,对该多个第一特征执行一关联性分析,以从该多个第一特征中选择其中一部分作为该多个第三特征。
13.根据权利要求11所述的训练预测模型的方法,其特征在于,还包含以下步骤:
(a1)基于一影响因子,调整对应该第二特征的该时间区间;
(a2)基于该时间区间,分类该常态情况资料集及该非常态情况资料集;以及
(e)执行步骤(a)、步骤(b)、步骤(c)及步骤(d),以训练一第三预测模型。
14.根据权利要求13所述的训练预测模型的方法,其特征在于,还包含以下步骤:
(f)重复地执行n次步骤(a1)、步骤(a2)及步骤(e),以训练n个第三预测模型,其中n为一正整数;
(g)基于各该第三预测模型,产生对应该多个第三预测模型中各者的一第三预测结果;以及
(h)计算该多个第三预测结果各者的一误差值,以判断一最佳影响因子及对应该最佳影响因子的该第三预测模型。
CN202111268382.2A 2021-10-15 2021-10-29 训练预测模型的装置及方法 Pending CN115994601A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
TW110138448 2021-10-15
TW110138448A TWI795949B (zh) 2021-10-15 2021-10-15 訓練預測模型的裝置及方法

Publications (1)

Publication Number Publication Date
CN115994601A true CN115994601A (zh) 2023-04-21

Family

ID=85982003

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111268382.2A Pending CN115994601A (zh) 2021-10-15 2021-10-29 训练预测模型的装置及方法

Country Status (3)

Country Link
US (1) US20230120224A1 (zh)
CN (1) CN115994601A (zh)
TW (1) TWI795949B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11715043B2 (en) * 2019-03-01 2023-08-01 Apple Inc. Semantics preservation for machine learning models deployed as dependent on other machine learning models

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20180046773A1 (en) * 2016-08-11 2018-02-15 Htc Corporation Medical system and method for providing medical prediction
CN108846525A (zh) * 2018-08-02 2018-11-20 阿里巴巴集团控股有限公司 外汇交易量预测方法和装置
CN111242356A (zh) * 2020-01-06 2020-06-05 中国建设银行股份有限公司 一种财富走势预测方法、装置、设备及存储介质

Also Published As

Publication number Publication date
TWI795949B (zh) 2023-03-11
US20230120224A1 (en) 2023-04-20
TW202318278A (zh) 2023-05-01

Similar Documents

Publication Publication Date Title
WO2020024716A1 (zh) 一种针对新场景的预测模型训练方法及装置
CN113574325B (zh) 通过选择控制设置来控制环境的方法和系统
US20210319366A1 (en) Method, apparatus and device for generating model and storage medium
CN113869801B (zh) 一种企业数字中台的成熟状态评估方法和装置
CN108369664A (zh) 调整神经网络的大小
US11210673B2 (en) Transaction feature generation
US20240168808A1 (en) Systems and methods of optimizing resource allocation using machine learning and predictive control
US9866440B2 (en) Recording medium, handling method generation method, and information processing apparatus
US20220391672A1 (en) Multi-task deployment method and electronic device
CN115994601A (zh) 训练预测模型的装置及方法
CN107451157B (zh) 异常数据识别方法、装置及系统、搜索方法及装置
US20220207420A1 (en) Utilizing machine learning models to characterize a relationship between a user and an entity
CN113516185A (zh) 模型训练的方法、装置、电子设备及存储介质
US10636044B2 (en) Projecting resource demand using a computing device
US7457788B2 (en) Reducing number of computations in a neural network modeling several data sets
CN108229572B (zh) 一种参数寻优方法及计算设备
JP2007164346A (ja) 決定木変更方法、異常性判定方法およびプログラム
JP2006350883A (ja) 知識データベースを利用した需要予測値自動判定システムおよびそれに用いられる需要予測値自動判定プログラム並びにそのプログラムが記録された記録媒体
US11042837B2 (en) System and method for predicting average inventory with new items
CN111382874B (zh) 实现线上机器学习模型的更新迭代的方法和装置
CN111898626A (zh) 模型确定方法、装置和电子设备
US7720771B1 (en) Method of dividing past computing instances into predictable and unpredictable sets and method of predicting computing value
US20240127080A1 (en) Systems and methods of optimizing resource allocation using machine learning and predictive control
CN111831585A (zh) 数据储存设备及其数据预测方法
CN111563548B (zh) 一种基于强化学习的数据预处理方法、系统及相关设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination