TWI795949B - 訓練預測模型的裝置及方法 - Google Patents

訓練預測模型的裝置及方法 Download PDF

Info

Publication number
TWI795949B
TWI795949B TW110138448A TW110138448A TWI795949B TW I795949 B TWI795949 B TW I795949B TW 110138448 A TW110138448 A TW 110138448A TW 110138448 A TW110138448 A TW 110138448A TW I795949 B TWI795949 B TW I795949B
Authority
TW
Taiwan
Prior art keywords
training
features
data set
prediction
predictive model
Prior art date
Application number
TW110138448A
Other languages
English (en)
Other versions
TW202318278A (zh
Inventor
楊長恩
張靖雯
黃淑姿
李金武
Original Assignee
財團法人資訊工業策進會
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 財團法人資訊工業策進會 filed Critical 財團法人資訊工業策進會
Priority to TW110138448A priority Critical patent/TWI795949B/zh
Priority to CN202111268382.2A priority patent/CN115994601A/zh
Priority to US17/647,345 priority patent/US20230120224A1/en
Application granted granted Critical
Publication of TWI795949B publication Critical patent/TWI795949B/zh
Publication of TW202318278A publication Critical patent/TW202318278A/zh

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Artificial Intelligence (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Medical Informatics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Feedback Control In General (AREA)
  • Train Traffic Observation, Control, And Security (AREA)

Abstract

一種訓練預測模型的裝置及方法。該裝置將複數個數據資料分類為一常態情況資料集及一非常態情況資料集,其中該等數據資料之每一者包含複數個第一特徵。該裝置基於該常態情況資料集及該等第一特徵中之複數個第三特徵,訓練一第一預測模型。該裝置將該非常態情況資料集輸入至該第一預測模型,以產生一第一階段預測值。該裝置將該第一階段預測值加入至該非常態情況資料集。該裝置基於該非常態情況資料集及該等第一特徵,訓練一第二預測模型。

Description

訓練預測模型的裝置及方法
本發明係關於一種訓練預測模型的裝置及方法。具體而言,本發明係關於一種提升非常態情況的預測準確率之訓練預測模型的裝置及方法。
近年來,與大數據相關的技術及應用快速的發展,企業端的供應鏈經常透過建置預測模型,以對於庫存消耗量、採購數量、訂單數量與銷售量等等的數據進行預測。
然而,在實際的數據(例如:銷售數據)及用於訓練預測模型的數據中通常存在少量但不定期的非常態情況(non-normal situation),而發生明顯的波動數值。舉例而言,棒球比賽取得冠軍時的促銷事件、補班日、開工日、新節日、疫情解封、臨時短期促銷等等的非常態情況。因此,企業供應鏈在庫存消耗量、採購數量、訂單數量與銷售量等等的預測模型常受到非常態情況的影響而不易預測,造成預測結果的準確性低且不易解釋,導致預測模型失準。
此外,由於非常態情況發生的次數低,因此可獲得的非常態情況數據資料稀少。由於訓練的數據資料不足,因此企業端亦難以完全針對非常態情況進行預測模型的訓練。
有鑑於此,如何提供一種可提升非常態情況預測的準確率之技術,乃業界亟需努力之目標。
本發明之一目的在於提供一種訓練預測模型的裝置。該訓練預測模型的裝置包含一儲存器、一收發介面及一處理器,該處理器電性連接至該儲存器及該收發介面。該處理器將複數個數據資料分類為一常態情況資料集及一非常態情況資料集,其中該等數據資料之每一者包含複數個第一特徵。該處理器基於該常態情況資料集及該等第一特徵中之複數個第三特徵,訓練一第一預測模型。該處理器將該非常態情況資料集輸入至該第一預測模型,以產生一第一階段預測值。該處理器將該第一階段預測值加入至該非常態情況資料集。該處理器基於該非常態情況資料集及該等第一特徵,訓練一第二預測模型。
本發明之另一目的在於提供一種訓練預測模型的方法,該訓練預測模型的方法用於一電子裝置,該電子裝置包含一儲存器、一收發介面及一處理器。該訓練預測模型的方法由該處理器所執行且包含下列步驟:(a)基於複數個數據資料中之一常態情況資料集及該等數據資料中之複數個第三特徵,訓練一第一預測模型,其中該等數據資料之每一者包含複數個第一特徵,該等第三特徵為該等第一特徵的其中一部分,(b)將該等數據資料中之一非常態情況資料集輸入至該第一預測模型,以產生一第一階段預測值,(c)將該第一階段預測值加入至該非常態情況資料集,以及(d)基於該非常態情況資料集及該等第一特徵,訓練一第二預測模型。
本發明所提供之訓練預測模型技術(至少包含裝置及方法),於第一預測模型訓練階段,將複數個數據資料分類為常態情況資料集及非常態情況資料集,且基於該常態情況資料集及該等第一特徵中之複數個第三特徵,訓練第一預測模型。於第二預測模型訓練階段,將該非常態情況資料集輸入至該第一預測模型,產生一第一階段預測值。將該第一階段預測值加入至該非常態情況資料集。基於該非常態情況資料集及該等第一特徵,訓練第二預測模型。於調整階段,根據多種不同的影響因子,多次調整對應該第二特徵之該時間區間,產生不同的第三預測模型及對應之第三預測結果,並計算該等第三預測結果各者之一誤差值,以判斷最佳影響因子及對應該最佳影響因子之該第三預測模型。
本發明所提供之訓練預測模型技術,基於三個不同階段的運作,提升預測模型對於非常態情況預測的準確率,解決習知技術產生的預測模型常受到非常態情況的影響而不準確的問題。此外,本發明亦在第二預測模型訓練階段的訓練資料中,加入第一階段對非常態情況預測值,使第二階段模型可具有一般情況的模型特性,解決習知技術訓練的數據資料不足,因此難以針對非常態情況進行預測模型的訓練的問題。
以下結合圖式闡述本發明之詳細技術及實施方式,俾使本發明所屬技術領域中具有通常知識者能理解所請求保護之發明之技術特徵。
以下將透過實施方式來解釋本發明所提供之一種訓練預測模型的裝置及方法。然而,該等實施方式並非用以限制本發明需在如該等實施方式所述之任何環境、應用或方式方能實施。因此,關於實施方式之說明僅為闡釋本發明之目的,而非用以限制本發明之範圍。應理解,在以下實施方式及圖式中,與本發明非直接相關之元件已省略而未繪示,且各元件之尺寸以及元件間之尺寸比例僅為例示而已,而非用以限制本發明之範圍。
本發明之第一實施方式為訓練預測模型裝置1,其架構示意圖係描繪於第1圖。訓練預測模型裝置1包含一儲存器11、收發介面13及處理器15,處理器15電性連接至儲存器11及收發介面13。儲存器11可為記憶體、通用串列匯流排(Universal Serial Bus;USB)碟、硬碟、光碟、隨身碟或本發明所屬技術領域中具有通常知識者所知且具有相同功能之任何其他儲存媒體或電路。收發介面13為可接收及傳輸資料之介面或本發明所屬技術領域中具有通常知識者所知悉之其他可接收及傳輸資料之介面,收發介面13可透過例如:外部裝置、外部網頁、外部應用程式等等來源接收資料。處理器15可為各種處理單元、中央處理單元(Central Processing Unit;CPU)、微處理器或本發明所屬技術領域中具有通常知識者所知悉之其他計算裝置。
先簡單說明本發明之第一實施方式的運作,本發明主要包含二階段的運作,分別為第一預測模型訓練階段及第二預測模型訓練階段。於某些實施方式中,本發明更包含一調整階段以最佳化預測模型,在該調整階段中調整非常態情況區間範圍,以找尋對應最好預測準確率的非常態情況區間範圍。以下段落將詳細說明與本發明相關之實施細節。
首先,先說明在第一預測模型訓練階段中用於訓練預測模型的的訓練資料。於本實施方式中,用於訓練預測模型的數據資料為針對一商品於複數個時間區間的數值,例如:以各週次為單位之庫存消耗量。
為便於理解,以一實際範例舉例而言,請參考第2圖。第2圖例示了一組關於飲料A的庫存消耗量的數據資料200的數值波動。在第2圖中,其中X座標軸的數值為週次(單位:週)、Y座標軸的數值為庫存消耗量(單位:個),各個資料點代表該週之庫存消耗量,數據資料200記錄了共100週的庫存消耗量的異動數據。
須說明者,第2圖僅用於例示數據資料的其中一種態樣,於某些實施方式中亦可使用其他的數據,例如:採購數量、訂單數量與銷售量等等的參數作為預測模型的訓練資料,視預測模型的用途及規模而定,本發明所屬技術領域中具有通常知識者應可理解其內容,故不贅言。
於本實施方式中,數據資料200中的各個資料點(即,第2圖上的每個資料點)的數據資料更包含複數個特徵(未繪示),各個特徵對應至一特徵項目及對應該特徵項目之參數值。須說明者,為便於說明及辨識本發明不同階段所使用的特徵,以下段落中將以「第一特徵」代稱數據資料200中各個資料點所包含的各個特徵。
舉例而言,數據資料200中的各個資料點更紀錄了「工作日」、「溫度」、「促銷事件」及「廣告投放」等四個第一特徵。又舉例而言,對應第一特徵為「工作日」的參數值可能為「該星期的工作日天數」、對應第一特徵為「溫度」的參數值可能為「該星期的平均溫度」或是「該星期的溫度波動值」、對應第一特徵為「促銷事件」的參數值為「促銷事件的類型」(例如:一次購買二件商品五折、買三送一等等)、對應第一特徵為「廣告投放」的參數值為「廣告投放的類型」或是「廣告投放的時間長度」。須說明者,本發明並未限制該等第一特徵的類型及其對應的參數值種類,任何能協助用以訓練預測模型的數據資料,均為本發明要保護的範圍。
接著,將具體說明第一預測模型訓練階段中關於第一預測模型建置的運作流程。於本實施方式中,為更準確的區分數據資料中各個資料點的影響程度,處理器15會先將數據資料200區分為不同的資料集。具體而言,處理器15執行運作(a),將複數個數據資料分類為常態情況資料集(normal situation data set)及非常態情況資料集(non-normal situation data set),其中該等數據資料之每一者包含複數個第一特徵。
舉例而言,常態情況資料集可利用以下等式表示:
Figure 02_image001
於上述公式中,
Figure 02_image003
為常態情況資料集,參數
Figure 02_image005
代表預測目標(即,各資料點),參數
Figure 02_image007
代表該等第一特徵,參數
Figure 02_image009
為資料數。
舉例而言,非常態情況資料集可利用以下等式表示:
Figure 02_image011
於上述公式中,
Figure 02_image013
為非常態情況資料集,參數
Figure 02_image015
代表預測目標(即,各資料點),參數
Figure 02_image017
代表該等第一特徵,參數
Figure 02_image019
為資料數。
於某些實施方式中,處理器15從該等第一特徵中選出一部分特徵作為第二特徵,以基於該第二特徵分類該等數據資料(即,利用該第二特徵分類出待預測之非常態情況區間)。具體而言,處理器15基於對應第二特徵之一時間區間,將該等數據資料分類為該常態情況資料集及該非常態情況資料集,其中該第二特徵為該等第一特徵其中之一。
舉例而言,若將該等第一特徵中的「促銷事件」作為第二特徵,處理器15將具有同樣「促銷事件」特徵的資料點分類出來。如第2圖所示,處理器15分類出數據資料200中具有同樣「促銷事件」特徵的資料點,其對應的時間段為T1、T2、T3、T4及T5(即,該段時間區間內均有該「促銷事件」特徵)。換言之,該非常態情況資料集的資料點即為在時間段T1、T2、T3、T4及T5中的資料點,其餘的資料點則被分類至常態情況資料集。
在上述範例中,由於「促銷事件」通常為固定時間區間,例如:持續5個週次,因此第2圖中的各個時間段T1、T2、T3、T4及T5均由5個資料點所組成。於其他實施方式中,非常態情況資料集亦可能由非固定時間區間組成,視不同的特徵性質而定,本發明所屬技術領域中具有通常知識者應可理解非固定時間區間時的實施態樣,故不贅言。
接著,處理器15從該等第一特徵中選出與預測目標相關的特徵(下稱:第三特徵),用以訓練第一預測模型。具體而言,處理器15執行運作(b),基於該常態情況資料集及該等第一特徵中之複數個第三特徵,訓練一第一預測模型。
於某些實施方式中,處理器15在訓練該第一預測模型前,先對該等第一特徵進行篩選,以排除部分非與該第二特徵相關的特徵(即,該等特徵對應的數值波動與該第二特徵所對應時間段的數值波動較無關係),以避免某些非相關的特徵影響預測模型的訓練結果。具體而言,處理器15基於該第二特徵,對該等第一特徵執行一關聯性分析,以從該等第一特徵中選擇其中一部分作為該等第三特徵。
接續前述的範例舉例而言,若處理器15將該等第一特徵中的「促銷事件」作為第二特徵,則處理器15將基於被選作為第二特徵的「促銷事件」,對該等第一特徵執行關連性分析(即,判斷該等第一特徵中與「促銷事件」有關連的特徵)。於本範例中,處理器15判斷該等第一特徵中與該第二特徵「促銷事件」較有相關的為「工作日」及「溫度」(例如:該星期的工作日天數及該星期的平均溫度可能會影響「促銷事件」所對應區間的數值,因此「工作日」的天數波動及「溫度」的數值波動對於「促銷事件」的影響較有關聯),因此處理器15選擇第一特徵中的「工作日」及「溫度」作為第三特徵,且將在後續運作中使用該等第三特徵訓練預測模型。
於某些實施方式中,在訓練第一預測模型前,處理器15更對於常態情況資料中的該等第三特徵執行正則化(regularization),以降低過度擬合(overfitting)的發生。須說明者,處理器15在對常態情況資料的該等第三特徵執行正則化後,產生該等第三特徵各自對應之權重值,該等第三特徵之權重值將更用以訓練該第一預測模型。須說明者,本發明所屬技術領域中具有通常知識者應可根據前述說明內容,理解如何透過權重值訓練該第一預測模型,故不贅言。
舉例而言,正則化的目標函式可利用以下公式表示:
Figure 02_image021
於上述公式中,
Figure 02_image023
為第一階段之該等第三特徵對應之權重值,
Figure 02_image025
為各個第三特徵對應之權重值,
Figure 02_image027
為正則化的規則,
Figure 02_image029
為第一階段正則化後的結果。
須說明者,該第一預測模型可透過大量的輸入資料進行訓練,並透過各種已知的架構(例如:神經網路)進行機器學習,本領域具有通常知識者應可根據前述說明內容,理解訓練該第一預測模型的運作內容,茲不贅言。
接著,以下段落將具體說明第二預測模型訓練階段中關於第二預測模型建置的運作流程。於本階段中,處理器15將使用常態情況建置的預測模型(即,第一預測模型)預測非常態情況區間的數值,並將預測結果加入訓練資料中,以使得第二階段的訓練資料中含有第一階段模型的特性,增強第二階段產生的第二預測模型預測非常態數值的能力。
首先,處理器15執行運作(c),將該非常態情況資料集輸入至該第一預測模型,以產生一第一階段預測值。接著,處理器15執行運作(d),將該第一階段預測值加入至該非常態情況資料集,以使得該非常態情況資料集含有第一階段預測值。最後,處理器15執行運作(e),基於該非常態情況資料集及該等第一特徵,訓練一第二預測模型。
於某些實施方式中,該第一階段預測值包含複數個時間區間及對應該等時間區間各者之一預測值。舉例而言,該預測值可為預測庫存消耗量、預測採購數量、預測訂單數量與預測銷售量等等。
於某些實施方式中,在訓練第二預測模型前,處理器15更對於非常態情況資料中的該等第一特徵執行正則化,以降低過度擬合的發生。須說明者,處理器15在對非常態情況資料的該等第一特徵執行正則化後,產生該等第一特徵各自對應之權重值,該等第一特徵之權重值將更用以訓練該第二預測模型。
於某些實施方式中,處理器15除了正則化之外,更在訓練第二預測模型時優先使用沒有在第一次訓練階段所使用的第三特徵(即,降低使用第一次訓練階段所使用的第三特徵的權重),此運作可重點加強相對於非常態情況的特徵,因而降低訓練預測模型時的特徵維度與提升效能。具體而言,處理器15調降該等第一特徵中之該等第三特徵各者所對應之一權重,處理器15基於該非常態情況資料集、該等第一特徵及該等權重,訓練該第二預測模型。
舉例而言,第二階段之正則化的目標函式可利用以下公式表示:
Figure 02_image031
於上述公式中,
Figure 02_image033
為第二階段之該等第一特徵對應之權重值,
Figure 02_image025
為各個第一特徵對應之權重值,
Figure 02_image027
Figure 02_image035
為正則化的規則,
Figure 02_image037
為第二階段正則化後的結果。
另須說明者,由於某些特徵影響的時間範圍不僅止於具有該第二特徵的時間區間(例如:促銷事件或廣告投放),而會發生預先或延遲的影響效應,因而提早或延長影響的時間範圍,例如:廣告投放結束後一週,銷售量仍持續維持高點。因此,於某些實施方式中,在訓練該第二預測模型後,處理器15更進一步調整時間區間的影響範圍,以找到最佳的非常態情況所影響的時間區間。以下段落將具體說明調整階段的運作流程。
於某些實施方式中,處理器15更進一步基於影響因子r調整時間區間的範圍,並基於調整後的時間區間,訓練新的預測模型。舉例而言,當影響因子r設定為「一週」時,將原先的時間段T的時間點前後各延長一週。換言之,若原先對應某特徵的時間段T是由時間點a及時間點b組成,處理器15將時間段T擴大為時間點a-r及時間點b+r組成的新時間段T’。
具體而言,在執行前述運作(b)、運作(c)、運作(d)及運作(e)後,處理器15更執行運作(a2)基於一影響因子,調整對應該第二特徵之該時間區間。接著,處理器15更執行運作(a3)基於該時間區間,分類該常態情況資料集及該非常態情況資料集。隨後,處理器15更執行運作(f),執行運作(b)、運作(c)、運作(d)及運作(e),以訓練一第三預測模型。
於某些實施方式中,處理器15更進一步多次調整時間區間(即,調整影響因子r),產生多個依據不同影響因子r所訓練的新的預測模型,並比較各個預測模型的預測結果,以找到最佳的非常態情況所影響的時間區間及影響因子r。舉例而言,處理器15可透過方均根誤差(root-mean-square error;RMSE),計算不同影響因子r所相對應的非常態情況區間範圍預測數值的方均根誤差(即,比較多個不同影響因子r的預測模型的預測結果)。
具體而言,處理器15更執行運作(g),以重複地執行n次運作(a2)、運作(a3)及運作(f),以訓練n個第三預測模型,其中n為一正整數。接著,處理器15執行運作(h),以基於各該第三預測模型,產生對應該等第三預測模型中各者之一第三預測結果。最後,處理器15執行運作(i),以計算該等第三預測結果各者之一誤差值,以判斷一最佳影響因子及對應該最佳影響因子之該第三預測模型。
由上述說明可知,本發明所提供之訓練預測模型的裝置,於第一預測模型訓練階段,將複數個數據資料分類為常態情況資料集及非常態情況資料集,且基於該常態情況資料集及該等第一特徵中之複數個第三特徵,訓練第一預測模型。於第二預測模型訓練階段,將該非常態情況資料集輸入至該第一預測模型,產生一第一階段預測值。將該第一階段預測值加入至該非常態情況資料集。基於該非常態情況資料集及該等第一特徵,訓練第二預測模型。於調整階段,根據多種不同的影響因子,多次調整對應該第二特徵之該時間區間,產生不同的第三預測模型及對應之第三預測結果,並計算該等第三預測結果各者之一誤差值,以判斷最佳影響因子及對應該最佳影響因子之該第三預測模型。
本發明所提供之訓練預測模型技術,基於三個不同階段的運作,提升預測模型對於非常態情況預測的準確率,解決習知技術產生的預測模型常受到非常態情況的影響而不準確的問題。此外,本發明亦在第二預測模型訓練階段的訓練資料中,加入第一階段對非常態情況預測值,使第二階段模型可具有一般情況的模型特性,解決習知技術訓練的數據資料不足,因此難以針對非常態情況進行預測模型的訓練的問題。
本發明之第二實施方式為一訓練預測模型的方法,其流程圖係描繪於第3圖。訓練預測模型的方法300適用於一電子裝置,該電子裝置包含一儲存器、一收發介面及一處理器,例如:第一實施方式所述之訓練預測模型的裝置1。訓練預測模型的方法300透過步驟S301至步驟S307訓練預測模型。
於步驟S301,由電子裝置基於複數個數據資料中之一常態情況資料集及該等數據資料中之複數個第三特徵,訓練一第一預測模型,其中該等數據資料之每一者包含複數個第一特徵,該等第三特徵為該等第一特徵的其中一部分。於步驟S303,由電子裝置將該等數據資料中之一非常態情況資料集輸入至該第一預測模型,以產生一第一階段預測值。
於某些實施方式中,訓練預測模型的方法300更包含以下步驟:基於對應一第二特徵之一時間區間,將該等數據資料分類為該常態情況資料集及該非常態情況資料集,其中該第二特徵為該等第一特徵其中之一。
於某些實施方式中,訓練預測模型的方法300更包含以下步驟:基於該第二特徵,對該等第一特徵執行一關聯性分析,以從該等第一特徵中選擇其中一部分作為該等第三特徵。
於某些實施方式中,其中該第一階段預測值包含複數個時間區間及對應該等時間區間各者之一預測值。
接著,於步驟S305,由電子裝置將該第一階段預測值加入至該非常態情況資料集。最後,於步驟S307,由電子裝置基於該非常態情況資料集及該等第一特徵,訓練一第二預測模型。
於某些實施方式中,其中步驟S307更包含以下步驟:步驟(d1)調降該等第一特徵中之該等第三特徵各者所對應之一權重,以及步驟(d2)基於該非常態情況資料集、該等第一特徵及該等權重,訓練該第二預測模型。
於某些實施方式中,訓練預測模型的方法300更包含以下步驟:步驟(a1)基於一影響因子,調整對應該第二特徵之該時間區間。步驟(a2)基於該時間區間,分類該常態情況資料集及該非常態情況資料集。步驟(e)執行步驟(a)、步驟(b)、步驟(c)及步驟(d),以訓練一第三預測模型。
於某些實施方式中,訓練預測模型的方法300更包含以下步驟:步驟(f)重複地執行n次步驟(a1)、步驟(a2)及步驟(e),以訓練n個第三預測模型,其中n為一正整數。步驟(g)基於各該第三預測模型,產生對應該等第三預測模型中各者之一第三預測結果。步驟(h)計算該等第三預測結果各者之一誤差值,以判斷一最佳影響因子及對應該最佳影響因子之該第三預測模型。
除了上述步驟,第二實施方式亦能執行第一實施方式所描述之訓練預測模型的裝置1之所有運作及步驟,具有同樣之功能,且達到同樣之技術效果。本發明所屬技術領域中具有通常知識者可直接瞭解第二實施方式如何基於上述第一實施方式以執行此等運作及步驟,具有同樣之功能,並達到同樣之技術效果,故不贅述。
需說明者,於本發明專利說明書及申請專利範圍中,某些用語(包含:特徵及預測模型等等)前被冠以「第一」、「第二」或「第三」,該等「第一」、「第二」或「第三」僅用來區分不同之用語。例如:第一特徵、第二特徵及第三特徵中之「第一」、「第二」及「第三」僅用來表示不同運作時所使用之特徵。
綜上所述,本發明所提供之訓練預測模型技術(至少包含裝置及方法),於第一預測模型訓練階段,將複數個數據資料分類為常態情況資料集及非常態情況資料集,且基於該常態情況資料集及該等第一特徵中之複數個第三特徵,訓練第一預測模型。於第二預測模型訓練階段,將該非常態情況資料集輸入至該第一預測模型,產生一第一階段預測值。將該第一階段預測值加入至該非常態情況資料集。基於該非常態情況資料集及該等第一特徵,訓練第二預測模型。於調整階段,根據多種不同的影響因子,多次調整對應該第二特徵之該時間區間,產生不同的第三預測模型及對應之第三預測結果,並計算該等第三預測結果各者之一誤差值,以判斷最佳影響因子及對應該最佳影響因子之該第三預測模型。
本發明所提供之訓練預測模型技術,基於三個不同階段的運作,提升預測模型對於非常態情況預測的準確率,解決習知技術產生的預測模型常受到非常態情況的影響而不準確的問題。此外,本發明亦在第二預測模型訓練階段的訓練資料中,加入第一階段對非常態情況預測值,使第二階段模型可具有一般情況的模型特性,解決習知技術訓練的數據資料不足,因此難以針對非常態情況進行預測模型的訓練的問題。
上述實施方式僅用來例舉本發明之部分實施態樣,以及闡釋本發明之技術特徵,而非用來限制本發明之保護範疇及範圍。任何本發明所屬技術領域中具有通常知識者可輕易完成之改變或均等性之安排均屬於本發明所主張之範圍,而本發明之權利保護範圍以申請專利範圍為準。
1:訓練預測模型的裝置 11:儲存器 13:收發介面 15:處理器 200:數據資料 T1、T2、T3、T4、T5:時間段 300:訓練預測模型的方法 S301、S303、S305、S307:步驟
第1圖係描繪第一實施方式之訓練預測模型的裝置之架構示意圖; 第2圖係描繪第一實施方式之數據資料示意圖;以及 第3圖係描繪第二實施方式之訓練預測模型的方法之部分流程圖。
國內寄存資訊(請依寄存機構、日期、號碼順序註記) 無 國外寄存資訊(請依寄存國家、機構、日期、號碼順序註記) 無
300:訓練預測模型方法
S301、S303、S305、S307:步驟

Claims (14)

  1. 一種訓練預測模型的裝置,包含: 一儲存器; 一收發介面;以及; 一處理器,電性連接至該儲存器及該收發介面,用以執行以下運作: (a)將複數個數據資料分類為一常態情況資料集及一非常態情況資料集,其中該等數據資料之每一者包含複數個第一特徵; (b)基於該常態情況資料集及該等第一特徵中之複數個第三特徵,訓練一第一預測模型; (c)將該非常態情況資料集輸入至該第一預測模型,以產生一第一階段預測值; (d)將該第一階段預測值加入至該非常態情況資料集;以及 (e)基於該非常態情況資料集及該等第一特徵,訓練一第二預測模型。
  2. 如請求項1所述之訓練預測模型的裝置,其中該第一階段預測值包含複數個時間區間及對應該等時間區間各者之一預測值。
  3. 如請求項1所述之訓練預測模型的裝置,其中運作(e)更包含以下運作: (e1)調降該等第一特徵中之該等第三特徵各者所對應之一權重;以及 (e2)基於該非常態情況資料集、該等第一特徵及該等權重,訓練該第二預測模型。
  4. 如請求項1所述之訓練預測模型的裝置,其中運作(a)更包含以下運作: (a1)基於對應一第二特徵之一時間區間,將該等數據資料分類為該常態情況資料集及該非常態情況資料集,其中該第二特徵為該等第一特徵其中之一。
  5. 如請求項4所述之訓練預測模型的裝置,其中運作(b)更包含以下運作: (b1)基於該第二特徵,對該等第一特徵執行一關聯性分析,以從該等第一特徵中選擇其中一部分作為該等第三特徵。
  6. 如請求項4所述之訓練預測模型的裝置,更包含以下運作: (a2)基於一影響因子,調整對應該第二特徵之該時間區間; (a3)基於該時間區間,分類該常態情況資料集及該非常態情況資料集;以及 (f)執行運作(b)、運作(c)、運作(d)及運作(e),以訓練一第三預測模型。
  7. 如請求項6所述之訓練預測模型的裝置,更包含以下運作: (g)重複地執行n次運作(a2)、運作(a3)及運作(f),以訓練n個第三預測模型,其中n為一正整數; (h)基於各該第三預測模型,產生對應該等第三預測模型中各者之一第三預測結果;以及 (i)計算該等第三預測結果各者之一誤差值,以判斷一最佳影響因子及對應該最佳影響因子之該第三預測模型。
  8. 一種訓練預測模型的方法,用於一電子裝置,該電子裝置包含一儲存器、一收發介面及一處理器,該訓練預測模型的方法由該處理器所執行且包含下列步驟: (a)基於複數個數據資料中之一常態情況資料集及該等數據資料中之複數個第三特徵,訓練一第一預測模型,其中該等數據資料之每一者包含複數個第一特徵,該等第三特徵為該等第一特徵的其中一部分; (b)將該等數據資料中之一非常態情況資料集輸入至該第一預測模型,以產生一第一階段預測值; (c)將該第一階段預測值加入至該非常態情況資料集;以及 (d)基於該非常態情況資料集及該等第一特徵,訓練一第二預測模型。
  9. 如請求項8所述之訓練預測模型的方法,其中該第一階段預測值包含複數個時間區間及對應該等時間區間各者之一預測值。
  10. 如請求項8所述之訓練預測模型的方法,其中步驟(d)更包含以下步驟: (d1)調降該等第一特徵中之該等第三特徵各者所對應之一權重;以及 (d2)基於該非常態情況資料集、該等第一特徵及該等權重,訓練該第二預測模型。
  11. 如請求項8所述之訓練預測模型的方法,更包含以下步驟: 基於對應一第二特徵之一時間區間,將該等數據資料分類為該常態情況資料集及該非常態情況資料集,其中該第二特徵為該等第一特徵其中之一。
  12. 如請求項11所述之訓練預測模型的方法,更包含以下步驟: 基於該第二特徵,對該等第一特徵執行一關聯性分析,以從該等第一特徵中選擇其中一部分作為該等第三特徵。
  13. 如請求項11所述之訓練預測模型的方法,更包含以下步驟: (a1)基於一影響因子,調整對應該第二特徵之該時間區間; (a2)基於該時間區間,分類該常態情況資料集及該非常態情況資料集;以及 (e)執行步驟(a)、步驟(b)、步驟(c)及步驟(d),以訓練一第三預測模型。
  14. 如請求項13所述之訓練預測模型的方法,更包含以下步驟: (f)重複地執行n次步驟(a1)、步驟(a2)及步驟(e),以訓練n個第三預測模型,其中n為一正整數; (g)基於各該第三預測模型,產生對應該等第三預測模型中各者之一第三預測結果;以及 (h)計算該等第三預測結果各者之一誤差值,以判斷一最佳影響因子及對應該最佳影響因子之該第三預測模型。
TW110138448A 2021-10-15 2021-10-15 訓練預測模型的裝置及方法 TWI795949B (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
TW110138448A TWI795949B (zh) 2021-10-15 2021-10-15 訓練預測模型的裝置及方法
CN202111268382.2A CN115994601A (zh) 2021-10-15 2021-10-29 训练预测模型的装置及方法
US17/647,345 US20230120224A1 (en) 2021-10-15 2022-01-06 Prediction model training apparatus and method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
TW110138448A TWI795949B (zh) 2021-10-15 2021-10-15 訓練預測模型的裝置及方法

Publications (2)

Publication Number Publication Date
TWI795949B true TWI795949B (zh) 2023-03-11
TW202318278A TW202318278A (zh) 2023-05-01

Family

ID=85982003

Family Applications (1)

Application Number Title Priority Date Filing Date
TW110138448A TWI795949B (zh) 2021-10-15 2021-10-15 訓練預測模型的裝置及方法

Country Status (3)

Country Link
US (1) US20230120224A1 (zh)
CN (1) CN115994601A (zh)
TW (1) TWI795949B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11715043B2 (en) * 2019-03-01 2023-08-01 Apple Inc. Semantics preservation for machine learning models deployed as dependent on other machine learning models

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TW201805887A (zh) * 2016-08-11 2018-02-16 宏達國際電子股份有限公司 醫學系統、醫學方法及非暫態電腦可讀取媒體
TW202008231A (zh) * 2018-08-02 2020-02-16 香港商阿里巴巴集團服務有限公司 外匯交易量預測方法和裝置
CN111242356A (zh) * 2020-01-06 2020-06-05 中国建设银行股份有限公司 一种财富走势预测方法、装置、设备及存储介质

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TW201805887A (zh) * 2016-08-11 2018-02-16 宏達國際電子股份有限公司 醫學系統、醫學方法及非暫態電腦可讀取媒體
TW202008231A (zh) * 2018-08-02 2020-02-16 香港商阿里巴巴集團服務有限公司 外匯交易量預測方法和裝置
CN111242356A (zh) * 2020-01-06 2020-06-05 中国建设银行股份有限公司 一种财富走势预测方法、装置、设备及存储介质

Also Published As

Publication number Publication date
CN115994601A (zh) 2023-04-21
TW202318278A (zh) 2023-05-01
US20230120224A1 (en) 2023-04-20

Similar Documents

Publication Publication Date Title
US10599999B2 (en) Digital event profile filters based on cost sensitive support vector machine for fraud detection, risk rating or electronic transaction classification
WO2020024716A1 (zh) 一种针对新场景的预测模型训练方法及装置
US11715015B2 (en) Methods and arrangements to identify feature contributions to erroneous predictions
US20210287222A1 (en) Systems and methods for classifying imbalanced data
TWI536284B (zh) 針對線上店面之聲譽評分
US8190537B1 (en) Feature selection for large scale models
US11869021B2 (en) Segment valuation in a digital medium environment
US11854022B2 (en) Proactively predicting transaction dates based on sparse transaction data
US11210673B2 (en) Transaction feature generation
US11244366B2 (en) Catalog quality management model
US11842238B2 (en) Methods and arrangements to detect a payment instrument malfunction
TWI795949B (zh) 訓練預測模型的裝置及方法
US11301763B2 (en) Prediction model generation system, method, and program
JP6159056B2 (ja) 選択プログラム、選択方法及び選択装置
JP7117440B1 (ja) 情報処理装置、情報処理方法、及び情報処理プログラム
US20220083571A1 (en) Systems and methods for classifying imbalanced data
US11042837B2 (en) System and method for predicting average inventory with new items
US11188568B2 (en) Prediction model generation system, method, and program
WO2019227415A1 (zh) 一种评分卡模型的调整方法、装置、服务器及存储介质
WO2024012219A1 (zh) 一种模型的训练方法的相关装置
JP7133698B1 (ja) 情報処理装置、情報処理方法、及び情報処理プログラム
US20240161183A1 (en) Methods and arrangements to determine quiz questions
US20240135084A1 (en) Optimizing machine learning classification models for resource constraints in electronic design automation (eda) computer aided design (cad) flows
TWM645360U (zh) 個人化推薦系統
JP2023075895A (ja) 情報処理装置、情報処理方法、及び情報処理プログラム