TWI581591B - Data usage forecasting system, method and computer program product - Google Patents

Data usage forecasting system, method and computer program product Download PDF

Info

Publication number
TWI581591B
TWI581591B TW104121968A TW104121968A TWI581591B TW I581591 B TWI581591 B TW I581591B TW 104121968 A TW104121968 A TW 104121968A TW 104121968 A TW104121968 A TW 104121968A TW I581591 B TWI581591 B TW I581591B
Authority
TW
Taiwan
Prior art keywords
data
data set
period
comparison
target
Prior art date
Application number
TW104121968A
Other languages
English (en)
Other versions
TW201703462A (zh
Inventor
Yue-Ting Lai
zhi-hua Chen
Ya-Ping Wu
jia-xuan Yu
Fang-Sen Lu
Original Assignee
Chunghwa Telecom Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chunghwa Telecom Co Ltd filed Critical Chunghwa Telecom Co Ltd
Priority to TW104121968A priority Critical patent/TWI581591B/zh
Priority to CN201510916761.6A priority patent/CN105468774B/zh
Publication of TW201703462A publication Critical patent/TW201703462A/zh
Application granted granted Critical
Publication of TWI581591B publication Critical patent/TWI581591B/zh

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2462Approximate or statistical queries

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Fuzzy Systems (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Description

數據用量預測系統、方法及其電腦程式產品
本發明係一種數據用量預測裝置、方法及其電腦程式產品。尤指一種分析比對資料模式,以進行數據用量預測裝置、方法及其電腦程式產品。
隨著行動上網各項服務以及內容之發展,使用者在申辦各種上網資費方案時並無法準確的預估未來的行動數據使用量是否會超出申辦時之使用量。而現行電信收費上,當超出預定使用量時,其超出部分之資費會遠高於申請之資費。因此,對使用者而言預估未來可能之數據使用量並適時的調整資費極其重要。
另外,對電信服務業者而言,當電信服務區域之使用人員有所變動時,其所需提供之數據用量亦會隨之改變,為維護高品質之數據服務,電信業者則必需透過預估數據用量來調整後各個電信服務區域內的電信設備數量。
目前行動數據用量預測方法多對大量的數據進行平均預測。由於各個用戶的行動網路數據用量變異性極大,因此前揭技術所計算出來之行動網路數據用量估計值其誤差值不甚理想,而嚴重影響後端之決策作業。
綜上所述,如何提供一種可有效預估數據用量之技術手段乃 本領域亟需解決之技術問題。
為解決前揭之問題,本發明之目的係提供一種數據預測系統、方法及其電腦程式產品。
為達上述目的,本發明提出一種數據預測系統。該裝置包含資料庫以及數據預測裝置,前述之資料庫包含複數筆數據集合,其中數據集合係包含目標數據集合以及複數筆對比數據集合,而目標數據集合以及對比數據集合分別包含複數個期間記錄數據。數據預測裝置依據目標數據集合之N個期間記錄數據值以及各對比數據集合之N個期間記錄數據值,以提供複數個向量距離值。預測裝置更依據向量距離值以選取K個對比數據集合之第T個期間記錄數據值,並依據K個之第T個期間記錄數據進行加權平均,以提供目標數據集合之第T個期間記錄數據之數據用量預測值。
為達上述目的,本發明提出一種數據預測方法。該方法包含下列步驟:存取複數筆數據集合,其中數據集合係包含目標數據集合以及複數筆對比數據集合,而目標數據集合以及對比數據集合分別包含複數個期間記錄數據。依據目標數據集合之N個期間記錄數據值以及各對比數據集合之N個期間記錄數據值,以提供複數個向量距離值。又依據前述之多個向量距離值以選取K個對比數據集合之第T個期間記錄數據值,並依據K個之第T個期間記錄數據進行加權平均,以提供目標數據集合之第T個期間記錄數據之數據用量預測值。
為達上述目的,本發明提出一種數據預測之電腦程式產品。當電腦裝置載入並執行該產品,可完成前述方法之步驟。
綜上所述,本發明之數據預測裝置、方法及其電腦程式產品透過分析目標客戶之一期間內的數據用量之向量,並從相同群組的客戶中,依向量距離挑選出特定之期間記錄數據值,以從挑選出的期間記錄數據值作為數據用量預測之依據,而能提供更為精準之預測結果。
1‧‧‧數據用量預測系統
10‧‧‧數據用量預測裝置
11‧‧‧決策伺服器
12‧‧‧資料庫
13‧‧‧帳務計算伺服器
14‧‧‧電信網路
15‧‧‧客戶端設備
S101~S103‧‧‧步驟
第1圖係為本發明之數據用量預測系統之系統架構圖。
第2圖係為本發明之數據用量預測方法之方法流程圖。
以下將描述具體之實施例以說明本發明之實施態樣,惟其並非用以限制本發明所欲保護之範疇。
請參閱第1圖,其為本發明之數據用量預測系統1之系統架構圖。數據用量預測系統1包含數據用量預測裝置10、決策伺服器11、資料庫12、帳務計算伺服器13、電信網路14以及複數個客戶端設備15。前述之客戶端設備15係經由電信網路14連接至帳務計算伺服器13。帳務計算伺服器13則將記錄之帳務資料傳送至資料庫12,以供數據用量預測裝置10進行存取,而數據用量預測裝置10係依據資料庫12內之數據之進行預測,以提供決策伺服器11數據預測值作為決策判斷之依據。前述之數據用量預測裝置10、決策伺服器11以及帳務計算伺服器13係為具有運算功能之電子裝置,例如電腦裝置。客戶端設備15係為行動通訊裝置,例如智慧型手機、平版電腦、筆記型電腦等。
前述之資料庫12係儲存複數筆數據集合,而數據集合中又包 含目標數據集合以及對比數據集合,而目標數據集合以及對比數據集合分別包含複數個期間記錄數據。當數據用量預測裝置10需預測目標數據時,則存取歷史資料之目標數據集合以及對比數據集合,再計算目標數據集合之N個期間記錄數據值以及各對比數據集合之N個期間記錄數據值,以提供複數個向量距離值,數據用量預測裝置10依據向量距離值以選取出K個對比數據集合之第T個期間記錄數據值,T個期間得為N個期間加上X個期間並依據K個之第T個期間記錄數據進行加權平均,以提供目標數據集合之第T個期間記錄數據之數據用量預測值。
請接著參閱第2圖,其為本發明之數據用量預測方法,該方法係應用於一電腦裝置,該方法包含下列之步驟:
S101:存取複數筆數據集合,其中數據集合係包含目標數據集合以及複數筆對比數據集合,而目標數據集合以及對比數據集合分別包含複數個期間記錄數據。
S102:計算目標數據集合之N個期間記錄數據值以及各對比數據集合之N個期間記錄數據值,以提供複數個向量距離值。
S103:依據向量距離值以選取K個對比數據集合之第T個期間記錄數據值,並依據K個之第T個期間記錄數據進行加權平均,以提供目標數據集合之第T個期間記錄數據之數據用量預測值。
本發明又提供一種用於數據用量預測之電腦程式產品。當電腦裝置載入並執行該電腦程式產品時,可完成步驟S101~103之步驟。
其中,前述之向量距離值為目標數據集合以及各對比數據集合之歐幾里德距離。而各個期間記錄數據之權重則為向量距離值之倒數。 於另一實施例中,目標數據集合與各個對比數據集合係屬相同集合類型。於另一實施例中,目標數據集合與各個對比數據集合係屬相似集合類型。於另一實施例中,參數T=N+X,於此實施例中設定X為1,惟其數值不在此限。
本案之數據用量預測系統1選擇行動通訊數據量之預測作為說明,惟其用途不在此限。本案之範例設定數據用量預測系統1係包含多個客戶端設備15,客戶端設備15擁有P種行動上網資費方案。客戶端設備15經由電信網路14將通信記錄傳送至帳務計算伺服器13進行帳務處理。帳務計算伺服器13於統計每個客戶每D天(1週期)的用量集合與資費方案資訊,再依不同資費方案(集合類型)分類儲存於資料庫12。
帳務計算伺服器13統計每個客戶每個週期的行動數據用量結果如表1所示,並將其儲存於資料庫12,其中包含有使用者編號、期間值(週期時間)、集合類型(資費方案)、以及期間記錄數據(行動數據用量資訊)。預測裝置則根據資料庫12所儲存的各種資費方案、各週期的行動數據用量資料,運用行動數據用量預測方法預測客戶下一週期預計的行動數據用量。接著預測裝置再將此預測結果給予決策伺服器11進行決策運算。
處理程序(1):設定相關參數值
數據用量預測裝置10分析每個客戶每個週期(包含D天)的行動數據用量、每個客戶前N個週期的行動數據用量集合、以及取得歷史資料中最相似的K筆資料。接著設定D、N、K等參數值以進行後續預測計算。於一實施例中,設定D值為5(即一個週期5天)、N值為5(即分析前5個週期)、K值為2(即取得資料庫12中最相似的2筆記錄)、T=6(T=N+X,在此設定X=1,待預測之期間記錄數據,預測第T個週期)。前揭之變數D、N、K、X、T係為實數。
處理程序(2):收集和統計各客戶於每一週期的行動數據用量
於此程序中,帳務計算伺服器13透過電信網路14收集和記錄各客戶的行動數據通信記錄。接著,計算並儲存客戶每一週期的行動數據用量。
處理程序(3)取得前N個週期之行動數據用量,並轉換為向量集合
於此程序中,數據用量預測裝置10依參數值設定取出資料庫12資料,取得目標客戶前5個週期的行動數據用量集合,並將此集合作為該客戶行動上網行為的參考依據,依此進行後續的分析與判斷使用。於本實施例中,待預測之目標數據為使用者編號1於第i個週期(2014/07/26~2014/07/31)的行動數據用量q1,i,故將取得其N個期間記錄數據(前5個週期的行動數據用量)集合Q1,i-1,i-5={q1,i-5,q1,i-4,q1,i-3,q1,i-2,q1,i-1}(即2014/07/01~2014/07/25期間的行動數據用量),如公式Eq(1)、Eq(2)、以及表2所示。
Q 1,i-1,i-5={q 1,i-5,q 1,i-4,q 1, i-3,q 1,i-2,q 1,i-1} Eq(1)
Q 1,i-1,i-5={1881531,5651084,1875929,3116748,1808503} Eq(2)
處理程序(4):與歷史資料進行比對,取得最相似的K筆資料
於此程序中,數據用量預測裝置10自資料庫12取出目標客戶相同資費方案(使用者編號1的資費方案為Group 1)的歷史行動數據用量資料,不同資費方案的客戶行動數據用量資料將不被考慮(如表1中的使用者編 號2)。
考量客戶歷史行動數據用量資料集合如表3所示。例如:使用者編號c的歷史行動數據用量資料集合為Qc,i-6,i-11={qc,i-11,qc,i-10,qc,i-9,qc,i-8,qc,i-7,qc,i-6}(即2014/06/01~2014/06/30期間的行動數據用量),如公式Eq(3)、Eq(4)所示。
Q c,i-6,i-11={q c,i-11,q c,i-10,q c,i-9,q c,i-8,q c,i-7,q c,i-6} Eq(3)
Q c,i-6,i-11={1731307,4234143,2018105,3696109,2513784,3622136} Eq(4)
接著,數據用量預測裝置10將目標客戶前5個週期的行動數據用量集合Q 1,i-1,i-5與歷史資料每筆行動數據用量集合進行比對,而在本實施例中,相似度權重計算主要採用歐幾里德距離的倒數。使用者編號1與使用者編號j的歐幾里德距離d(Q 1,i-1,i-5,Q j,i-7i-11)如公式Eq(5)所示,而使用者編號1與使用者編號j的相似度權重w 1,j 則如公式Eq(6)所示。其中,M為一個極大 數,在本實施例中設定為1000000。依此可計算出使用者編號1前5個週期的行動數據用量集合Q 1,i-1,i-5={q 1,i-5,q 1,i-4,q 1,i-3,q 1,i-2,q 1,i-1}(即2014/07/01~2014/07/25期間的行動數據用量)與歷史資料每筆行動數據用量集合計算的相似度權重(如表4所示)。
當與每一筆歷史行動數據用量資料集合比對得到權重w 1,j 後,取得權重最大的K筆(在此實施例中K為2),其中權重最大值為f 1和其對應的前第i-(N+1)個週期行動數據用量為g 1、權重第二大值為f 2和其對應的前第i-(N+1)個週期行動數據用量為g 2,依此類推如公式(7)所示。
處理程序(5)依每筆資料向量距離進行加權平均,估計行動數據用量
於此程序中,分別將相似度最大的k筆資料所對應的前第i-(N+1)個週期行動數據用量依權重進行加權平均(如公式Eq(8)所示)。在此 實施例中,與使用者編號1前5個週期的行動數據用量集合Q 1,i-1,i-5相似度最高的2筆分別為使用者編號c的歷史行動數據用量資料集合Q c,i-7,i-11和使用者編號1的歷史行動數據用量資料集合Q 1,i-7,i-11,故f 1w 1,c =0.00000048977、g 1q c,i-6=3622136、f 2w 1,1=0.00000020074、g 2q 1,i-6=3423594。因此,使用者編號1於2014/07/26~2014/07/31此週期(第i個週期)的行動數據估計用量q 1,i '為3,140,242,如公式(9)所示。
當數據用量預測裝置10完成目標客戶行動數據用量預測後,可將此預測值傳送至決策伺服器11,並依據預測的行動數據用量,經過決策運算產生相關的行銷、預警、網路部署等策略,並提供相關建議資訊予企業主管和客戶決策參考。在此實施例中,使用者編號1的資費方案允許之封包數量為15,000,000,而目前使用者編號1已使用封包數量14,333,795,並且估計使用者編號1到2014/07/31時將累計使用封包數量為17474037,故將由決策伺服器11提供預警資訊予使用者編號1,並推薦使用者編號1其他資費方案。
本案更以中華電信北區用戶多種資費方案資料(mPro50、mPro150、mPro450、mPro550、mPro650、mPro750;用戶記錄數:565606個,K值:10)來進行測試。測試結果如下表所示,相較於傳統預測方法(平均值方法、類神經網路),本案之數據用量預測裝置、方法及其電腦程式產品具有更優異的預測準確度。
上列詳細說明係針對本發明之一可行實施例之具體說明,惟該實施例並非用以限制本發明之專利範圍,凡未脫離本發明技藝精神所為之等效實施或變更,均應包含於本案之專利範圍中。
1‧‧‧數據用量預測系統
10‧‧‧數據用量預測裝置
11‧‧‧決策伺服器
12‧‧‧資料庫
13‧‧‧帳務計算伺服器
14‧‧‧電信網路
15‧‧‧客戶端設備

Claims (9)

  1. 一種數據用量預測系統,包含:資料庫,包含複數筆數據集合,其中該數據集合係包含目標數據集合以及複數筆對比數據集合,而該目標數據集合以及各該對比數據集合分別包含複數個期間記錄數據;以及數據用量預測裝置,連接該資料庫,並依據該目標數據集合之N個該期間記錄數據值以及各該對比數據集合之N個該期間記錄數據值以提供複數個向量距離值,又依據該等向量距離值以選取K個該對比數據集合中之第T個該期間記錄數據值,並依據K個之第T個該期間記錄數據進行加權平均,以提供該目標數據集合之第T個該期間記錄數據之數據用量預測值;其中,該向量距離值為該目標數據集合以及各該對比數據集合之歐幾里德距離,並依據該向量距離之倒數以取得第T個該期間記錄數據之權重值。
  2. 如請求項1所述之數據用量預測系統,其中T=N個期間+X個期間。
  3. 如請求項1所述之數據用量預測系統,其中該目標數據集合與該等對比數據集合係屬相同集合類型。
  4. 如請求項1所述之數據用量預測系統,其中該目標數據集合與該等對比數據集合係屬相似集合類型。
  5. 一種數據用量預測方法,包含:存取複數筆數據集合,其中該數據集合係包含目標數據集合以及複數筆對比數據集合,而該目標數據集合以及各該對比數據集合分別包含複數 個期間記錄數據;依據該目標數據集合之N個該期間記錄數據值以及各該對比數據集合之N個該期間記錄數據值,以提供複數個向量距離值;以及依據該等向量距離值以選取K個該對比數據集合之第T個該期間記錄數據值,並依據K個之第T個該期間記錄數據進行加權平均,以提供該目標數據集合之第T個該期間記錄數據之數據用量預測值;其中,該向量距離值為該目標數據集合以及各該對比數據集合之歐幾里德距離,並依據該向量距離之倒數以取得第T個該期間記錄數據之權重值。
  6. 如請求項5所述之數據用量預測方法,其中T=N個期間+X個期間。
  7. 如請求項5所述之數據用量預測方法,其中該目標數據集合與該等對比數據集合係屬相同集合類型。
  8. 如請求項5所述之數據用量預測方法,其中該目標數據集合與該等對比數據集合係屬相似集合類型。
  9. 一種數據用量預測之電腦程式產品,當電腦裝置載入並執行該產品,可完成如請求項5至8任一項所述之方法。
TW104121968A 2015-07-07 2015-07-07 Data usage forecasting system, method and computer program product TWI581591B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
TW104121968A TWI581591B (zh) 2015-07-07 2015-07-07 Data usage forecasting system, method and computer program product
CN201510916761.6A CN105468774B (zh) 2015-07-07 2015-12-10 数据用量预测装置、方法及其系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
TW104121968A TWI581591B (zh) 2015-07-07 2015-07-07 Data usage forecasting system, method and computer program product

Publications (2)

Publication Number Publication Date
TW201703462A TW201703462A (zh) 2017-01-16
TWI581591B true TWI581591B (zh) 2017-05-01

Family

ID=55606474

Family Applications (1)

Application Number Title Priority Date Filing Date
TW104121968A TWI581591B (zh) 2015-07-07 2015-07-07 Data usage forecasting system, method and computer program product

Country Status (2)

Country Link
CN (1) CN105468774B (zh)
TW (1) TWI581591B (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5812526A (en) * 1995-12-21 1998-09-22 Industrial Technology Research Institute Traffic control mechanism in ATM communications network
EP0883075A2 (en) * 1997-06-05 1998-12-09 Nortel Networks Corporation A method and apparatus for forecasting future values of a time series
US5898673A (en) * 1997-02-12 1999-04-27 Siemens Information And Communication Networks, Inc. System and method for prevention of cell loss due to quality of service contracts in an ATM network
CN101541016B (zh) * 2009-05-06 2011-01-05 华为技术有限公司 数据预测方法和设备

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102111284B (zh) * 2009-12-28 2013-09-04 北京亿阳信通科技有限公司 电信业务量预测方法和装置
US8996549B2 (en) * 2011-10-11 2015-03-31 Microsoft Technology Licensing, Llc Recommending data based on user and data attributes
CN104144431B (zh) * 2013-05-10 2018-01-30 中国电信股份有限公司 一种移动网络状态预测的方法、装置及移动网络

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5812526A (en) * 1995-12-21 1998-09-22 Industrial Technology Research Institute Traffic control mechanism in ATM communications network
US5898673A (en) * 1997-02-12 1999-04-27 Siemens Information And Communication Networks, Inc. System and method for prevention of cell loss due to quality of service contracts in an ATM network
EP0883075A2 (en) * 1997-06-05 1998-12-09 Nortel Networks Corporation A method and apparatus for forecasting future values of a time series
CN101541016B (zh) * 2009-05-06 2011-01-05 华为技术有限公司 数据预测方法和设备

Also Published As

Publication number Publication date
TW201703462A (zh) 2017-01-16
CN105468774B (zh) 2020-11-17
CN105468774A (zh) 2016-04-06

Similar Documents

Publication Publication Date Title
JP5313990B2 (ja) 応答時間に基づいてサービスリソース消費を推定すること
US20170323330A1 (en) Media spend management using real-time predictive modeling of touchpoint exposure effects
Deif Assessing lean systems using variability mapping
Gmach et al. Resource and virtualization costs up in the cloud: Models and design choices
US20100280861A1 (en) Service Level Agreement Negotiation and Associated Methods
CN109741177A (zh) 用户信用的评估方法、装置及智能终端
CN108876076A (zh) 基于指令数据的个人信用评分方法及装置
CN104618949B (zh) 一种基于arma模型的投诉预测方法及装置
CN109697637A (zh) 对象类别确定方法、装置、电子设备及计算机存储介质
CN109842896A (zh) 一种栅格价值评估方法及装置
Narayan et al. Smart metering of cloud services
WO2019086522A1 (en) A COMPUTER IMPLEMENTED METHOD, A SYSTEM AND A COMPUTER PROGRAM FOR OPTIMIZING THE OPERATION OF A CLOUD HOSTED SOFTWARE AS A SERVICE (SaaS) SYSTEM
CN114553661A (zh) 一种面向无线联邦学习的移动用户设备分簇训练方法
CN107798615A (zh) 保单续期收费难度预测方法和装置
AU2014201264A1 (en) Scenario based customer lifetime value determination
CN111626767B (zh) 资源数据的发放方法、装置及设备
JP5628745B2 (ja) トラヒック予測方法及び装置及びプログラム
CN108171423A (zh) 一种行政审批效能评估系统及方法
CN101324939A (zh) 基于数据挖掘的新业务市场预测系统及其方法
CN109858756A (zh) 一种服务质量缺陷诊断方法和装置
TWI581591B (zh) Data usage forecasting system, method and computer program product
CN115964570B (zh) 基于QoS多时段变化特征预测的云服务推荐方法及装置
CN106127345A (zh) 一种移动用户投诉的预测方法和预测系统
CN104680400B (zh) 基于灰色关联的企业售电量变化的短期和长期预测方法
Schwanengel et al. Challenges with tenant-specific cost determination in multi-tenant applications

Legal Events

Date Code Title Description
MM4A Annulment or lapse of patent due to non-payment of fees