TWI725640B - 透過客戶訊務流量模型識別客戶屬性之方法 - Google Patents

透過客戶訊務流量模型識別客戶屬性之方法 Download PDF

Info

Publication number
TWI725640B
TWI725640B TW108143714A TW108143714A TWI725640B TW I725640 B TWI725640 B TW I725640B TW 108143714 A TW108143714 A TW 108143714A TW 108143714 A TW108143714 A TW 108143714A TW I725640 B TWI725640 B TW I725640B
Authority
TW
Taiwan
Prior art keywords
traffic
customer
circuit
complex
attributes
Prior art date
Application number
TW108143714A
Other languages
English (en)
Other versions
TW202121871A (zh
Inventor
林怡君
Original Assignee
中華電信股份有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 中華電信股份有限公司 filed Critical 中華電信股份有限公司
Priority to TW108143714A priority Critical patent/TWI725640B/zh
Application granted granted Critical
Publication of TWI725640B publication Critical patent/TWI725640B/zh
Publication of TW202121871A publication Critical patent/TW202121871A/zh

Links

Images

Landscapes

  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本發明為一種透過客戶訊務流量模型識別客戶屬性之方法,其包括取得複數電路訊號以分析該複數電路訊號,進而得到對應之特徵值,藉由計算特徵值以預先建構訊務流量模型,再於接收到客戶電路訊務後,利用訊務流量模型分析客戶電路訊務,進而得到影響力數值,據以判斷影響力數值是否高於預設門檻,以識別客戶之屬性,藉此,網管人員即可利用識別結果,針對不同屬性之客戶制定對應之各種策略。

Description

透過客戶訊務流量模型識別客戶屬性之方法
本發明為一種識別客戶屬性之方法,尤指一種可透過客戶訊務流量模型識別客戶屬性之方法。
每個人在使用網路方面,各自表現出不同的網路行為,其網路行為背後代表著許多意義,例如,有些人申辨之網路頻寬及其網路使用量皆大,其代表著該些人的網路行為對於整體網路具有相當程度之影響性,易成為網路變慢的原因,是以,對於網路使用量大的人,應透過分析客戶的網路行為來識別其屬性,以幫助業者制定相對應的策略規劃以及改善其所帶來之問題,另有一些人,其網路使用量雖大,但是所申辦之網路頻寬則相對小,表示其申請之網路頻寬與網路使用量嚴重失衡,應提供增加網路頻寬之建議,以達到較佳的網路使用效率。
然而,上述之網路行為需要透過追蹤特定人之網路使用情況才能得知,但就大型業者來說,在動輒百萬的網路內之客戶數量裡,找出具有影響力的代表性客戶,或區辨客戶屬於何種屬性之使用者,著實不易,電信業者往往需要額外建置龐大的運算設備才能達成,無形中增加營 運上的成本。亦即,分析客戶的上網行為所耗費的成本過大且繁雜,在瞬息萬變的網路環境中,如何有效率地辨別客戶屬性實屬重要。
由上可知,若能找出一種快速且有效識別客戶屬性之方法,提供給網管人員作訊務管理之用,以強化電路使用效率,亦可識別出潛在型客戶屬性,此將成為目前本技術領域人員極力追求之技術目標。
本發明之目的係在龐大網路客戶數量下,快速且有效地提供網管人員識別客戶屬性之依據,藉以達到預先制定因應策略、提高客戶之網路使用品質、或可識別出潛在型客戶屬性之目的。
為了達成上述或其他目的,本發明提出一種透過客戶訊務流量模型識別客戶屬性之方法,其包括:取得複數電路訊務;分析該複數電路訊務以產生對應之特徵值;計算各該特徵值以建構對應之訊務流量模型;以及接收客戶電路訊務後,透過已建構之該訊務流量模型計算影響力數值,以識別客戶屬性。
於一實施例中,該複數電路訊務係透過決定母體之抽樣數並進行抽樣而取得者。
於一實施例中,本發明復包括依據申裝速率資料進行收集以取得收集之電路訊務,且依據該收集之電路訊務以決定該母體之抽樣數。
於另一實施例中,於判斷所收集之該複數電路訊務符合抽樣信心水準95%之條件時,進行該複數電路訊務之抽樣。
於另一實施例中,本發明復包括於抽樣後,利用標準差法去除離群值,以分析各該特徵值。
於另一實施例中,分析該複數電路訊務以產生對應之特徵值復包括加入日期標簽特徵進行分析,以獲得該特徵值。於一具體實施例中,該特徵值包括頻寬使用率、忙時訊務佔比、平均標準差及/或變異數。
於另一實施例中,該訊務流量模型係利用SVM演算法所建構。
於另一實施例中,於接收該客戶電路訊務後,先依據客戶端電路之區域屬性進行該客戶端電路之分類,以透過該訊務流量模型計算該影響力數值。
於又一實施例中,預先制定影響力數值門檻,經由比對該影響力數值與該影響力數值門檻,以識別該客戶屬性。於一具體實施例中,透過專家法則依據不同的申裝速率制定該影響力數值門檻。
綜上所述,本發明之透過客戶訊務流量模型識別客戶屬性之方法係藉由收集和分析電路中之電路訊號,以預先建構訊務流量模型,即可於接收到客戶電路訊務後,利用訊務流量模型分析客戶電路訊務,進而得到影響力數值,據以判斷影響力數值是否高於預設門檻,以識別客戶之屬性,進一步地,提供網管人員識別結果以進行利用,進而制定策略以因應不同屬性之客戶。
201~212‧‧‧流程
301~307‧‧‧流程
S101~S104‧‧‧步驟
第1圖為本發明之透過客戶訊務流量模型識別客戶屬性之方法的步驟圖;
第2圖為本發明之透過客戶訊務流量模型識別客戶屬性之方法中建構訊務流量模型之流程圖;
第3圖為本發明之透過客戶訊務流量模型識別客戶屬性之方法中查找各申裝速率潛在型客戶之流程圖;以及
第4圖為本發明之透過客戶訊務流量模型識別客戶屬性之方法的具體實施示意圖。
以下藉由特定的具體實施形態說明本發明之技術內容,熟悉此技藝之人士可由本說明書所揭示之內容輕易地瞭解本發明之優點與功效。然本發明亦可藉由其他不同的具體實施形態加以施行或應用。
第1圖係說明本發明之步驟圖。本發明之透過客戶訊務流量模型識別客戶屬性之方法自電路之電路訊務中淬取出特徵值,以建構訊務流量模型,俾於接收到客戶之客戶電路訊務後,透過該訊務流量模型進行分析,進而識別客戶之屬性,關於本發明之方法步驟,詳述如下。
於步驟S101中,取得複數電路訊務,於決定母體之抽樣數後,對於至少一電路之複數電路訊務進行抽樣,以取得經抽樣之複數電路訊務,亦即,在建構訊務流量特徵模型前,須先決定抽樣之母體,其中,於決定母體之抽樣數之前,可先依據申裝速率資料來收集電路中之電路訊務,亦即,將所收集之電路訊務依據申裝速率進行分類,例如將電路訊務 分類為100M/100M之電路訊務、60M/20M之電路訊務或20M/5M之電路訊務,進一步依據不同申裝速率所收集之各別電路訊務,以建立各自的抽樣母體。另外,在收集電路訊務時,可經由判斷所收集之複數電路訊務是否符合抽樣信心水準95%之條件,於條件符合時,再進行至少一電路之複數電路訊務之抽樣。
於步驟S102中,分析該複數電路訊務以產生對應之特徵值,其中,特徵值包括頻寬使用率、忙時訊務佔比、平均標準差及/或變異數,進一步地,完成對於電路進行抽樣後,可先進行樣本資料前置處理,亦即,透過標準差法去除離群值,以分析各特徵值,從而減少離群值的影響力,進而為提高訊務特徵精準度。再者,於分析複數電路訊務以產生對應之特徵值時,復可加入日期標簽特徵進行分析,以獲得該特徵值。
於步驟S103中,計算各特徵值以建構對應之訊務流量模型,其中,訊務流量模型係利用SVM(Support Vector Machine,支持向量機)演算法所建構。
於步驟S104中,於接收客戶電路訊務後,透過已建構之該訊務流量模型計算影響力數值,以識別客戶屬性,本發明於上述建構訊務流量模型後,即可於接收之客戶電路訊務後,透過訊務流量模型進行分析運算,以獲得對應該客戶電路訊務之影響力數值(S),進而透過影響力數值來判斷客戶之屬性。
第2圖為本發明之建構訊務流量模型之流程圖,如圖所示,為建構訊務特徵模型,需先建立一信賴標準內之網路訊務特徵抽樣母體,首先,於流程201-203中,依據客戶之網路的申裝速率進行屬性之分類, 以收集電路中之各類電路訊務,進一步建立母體之抽樣數,於流程204-205中,母體樣本的抽樣設計係於Margin of Error(%)=3的條件下,以每一母體區間(各類速率之電路)之信心水準95%,即訊務收集比率達95%的設定,亦即,針對所收集之電路訊務進行追蹤訊務收集成功比率之判定,以於所收集之電路訊務符合信賴標準95%時,則進入流程206中進行各類電路訊務抽樣。於流程207-208中,為提高訊務特徵精準度,可先進行樣本資料前置處理,假設樣本資料符合常態分佈,利用3 σ法(標準差法)去除離群值,從而減少離群值的影響力,於流程209中,於完成樣本母體後,以中央極限定理為假設基礎,分層抽樣分析各速率之電路訊務,以計算個別訊務指標(如平均數、標準差),其中,各申裝速率之客戶的使用行為各自獨立,亦即,依據不同類之申裝速率而建構各自的母體,以進行特徵值之計算。將每小時的訊務資料,綜整為日訊務、月訊務中長期訊務資料,即於流程210中加入日期標籤資訊,進一步分別產生各類速率電路的訊務特徵值,即產生頻寬使用率、忙時訊務佔比、平均標準差、變異數,如此逐步建立各申裝速率下的訊務特徵值演算法則,於流程211-212中,透過SVM(Support Vector Machine,支持向量機)方法進行訊務流量模型演算。
透過上述之建構流程,即可獲得各速率的分類門檻特徵值(T)以及各客戶的特徵數值向量。其中,SVM方程式如下:
Figure 108143714-A0101-12-0007-13
於SVM方程式中,特徵向量值訓練集資料為{(Xi,Yi)},其中,Z為此訓練集矩陣、H係Hessian matrix(即為Z矩陣的對稱矩陣)、C為數值1的矩陣、A為Yi的矩陣以及b為數值0的矩陣,而上述公式係求
Figure 108143714-A0101-12-0007-14
的α i最大化使得滿足
Figure 108143714-A0101-12-0007-17
的條件,其目的在解出所有的α i(α矩陣),即α i解為文中所提的用戶影響力數值(S)。
第3圖為本發明之查找各申裝速率潛在型客戶之流程圖。如圖所示,於欲查找各速率下的潛在型客戶時,透過上述建構訊務流量模型估算出各速率特徵值後,於流程301-302中,接收該客戶電路訊務,並查找客戶之申裝速率下,其電路訊務經訊務流量模型分析得到特徵值(T),於流程303中,將客戶電路訊務套入SVM方法,以估算該客戶電路訊務所對應之客戶的影響力數值(S),其中,於流程304中,可先依據客戶端電路之區域屬性進行客戶端電路之分類,以透過該訊務流量模型計算該影響力數值,於一實施例中,本發明透過預先制定影響力數值門檻(T*),進而經由比對該影響力數值與該影響力數值門檻,以識別該客戶屬性,其中,該影響力數值門檻係可透過專家法則依據不同的申裝速率制定。具體而言,在上述建構訊務流量模型下,進一步輔以客戶之電路所在機房之區域給予 相對應的屬性權重值,以提高或降低影響力數值門檻,例如,位於都會區之機房,可設定忙時的特徵屬性權重參數略高於偏遠區的屬性參數,將此特徵向量再次導入SVM演算模型,其中,特徵向量為SVM方程式之{Xi,Yi}數值(即Z矩陣),據此估算客戶影響力數值,以獲得客戶影響力數值(S)以及影響力數值門檻。於步驟305-307中,網管人員可透過此客戶影響力數值是否高於影響力數值門檻,於客戶影響力數值低於影響力數值門檻時,將該客戶列入觀察名單中,以於再次收到其客戶電路訊務時,導入SVM演算模型進行估算,反之,針對客戶影響力數值高的目標客戶進行網管之因應措施,例如,若在高申裝速率下之目標客戶,其影響力數值高者,將會提高整體訊務壅塞之機率,據此,網管人員可採取訊務疏通或改接之方法先行預防,另外,若在低申裝速率下之目標客戶,其影響力數值高者,表示該目標客戶為成長型客戶,電信業者即可針對該目標客戶採取相對應之營銷方案策劃,以助於營收。
另外,為因應瞬息萬變的客戶網路行為趨勢變化,為確保此機率模型的精準度,須定期確認訊務母體樣本之有效性,且當各申裝速率之訊務型態改變時,如平均訊務變異數、頻寬使用率等特徵值超過信賴區間時,或該速率的客戶數驟升驟降時,則將重新建立建構模型機制,以確保訊務特徵值抽樣之適切性,潛在性目標客戶機率估算的精準度。
第4圖為為本發明之具體實施示意圖,並一併參閱第1-3圖。如圖所示,當網管人員欲分析各類電路訊務流量,查找可能存在頻寬不足的成長型客戶或訊務量大可能影響整體客戶族群的目標客戶時,本發明可提供潛在性客戶排行資料以供進一步策略規劃。
首先,如上述之流程中取得預查找的目標速率電路群,進行資料收集、抽樣、過濾離群值、訊務指標值演算,取得特徵數值向量,即各速率各自建立其訊務特徵建構模型。接著以各速率的訊務特徵模型為立基,利用式一SVM演算法(訊務指標向量值為Xi數值),計算出α i數值,即客戶的影響力數值(S)。
以10GE電路為例進行說明,於10GE電路可具有上萬筆(例如3萬多筆)客戶電路訊務,將此電路下各客戶電路訊務依申裝速率進行分類,例如100M/40M、100M/100M、60M/20M、35M/6M、20M/5M、10M/10M、4M/4M各群,其中,依據各群(各申裝速率)具有各自的訊務流量模型,針對已分類之各別客戶電路訊務以計算出該客戶之訊務特徵值,例如客戶35Y000003的特徵值為0.77,再輔以該客戶所在機房的區域屬性特徵,利用SVM演算法進行預估演算,其中,訊務特徵向量值即為上述SVM方程式中之Xi數值,而客戶所在機房的區域屬性特徵即為Yi數值,進而計算出該客戶的影響力數值(S),即上述SVM方程式中之α i數值,其中,該影響力數值可例如客戶35Y000003的S=0.95,以及該速率的影響力數值門檻設定值T*=0.8。各速率的影響力數值門檻設定(T*)將會受到當時的網管政策策略考量及網管人員的專家法則影響,例如,若該速率為現行較多客戶使用的高速率(如100M/100M),其影響力數值門檻之數值可能較低,以利查找出潛在型的高用量、影響力較大的客戶,若該速率為較低的速率(如10M/10M、4M/4M),因其速率對整體訊務影響力較小,其制定的影響力數值門檻之數值較高,才能排除掉普遍正常型客戶,有效地查找出潛在型的成長型客戶。最後依照各速率的影響力數值門檻(T*), 若該客戶的影響力數值(S)大於影響力數值門檻(T*)即為潛在型客戶,如客戶35Y000003的S=0.95大於T*=0.8即為潛在型客戶。
據此,利用本發明之透過客戶訊務流量模型識別客戶屬性之方法可在百萬名客戶中發現各申裝速率下之潛在型客戶,網管人員可密切觀察這些客戶的長期訊務趨勢,推估各速率客戶對各電路所造成的可負荷程度,作為頻寬適切性評估參考依據。此訊務流量模型亦可與頻寬使用率等訊務參考指標相輔相成,將成長型客戶移至頻寬使用率較低的電路,提高電路頻寬使用成效,強化網路服務品質,以提供更強健之網路服務環境。
綜上所述,本發明提出一種透過客戶訊務流量模型識別客戶屬性之方法,利用具代表性的訊務指標來識別客戶行為,透過本發明建構訊務流量模型以識別潛在性客戶屬性作為網路管理方法,將各申裝速率的各類電路訊務於信賴標準區間內作分層抽樣分析,建立訊務抽樣母體,輔以中長期訊務資料,建立各類網路訊務指標,經過特徵參數交叉驗證自動學習,刻畫出目標客戶的群體特徵,有助於網管人員深入了解客戶之屬性,進而依據不同客戶之網路使用特性有效地制定相對應的網路管理策略及營銷方案,掌握訊務成長影響大、對營收貢獻度大的目標市場,幫助強化網路服務品質。
由上述可知,本發明之透過客戶訊務流量模型識別客戶屬性之方法具備下列優點。
首先,本發明非僅應用於單一目標客戶,亦即,本發明可根據各申裝速率之電路訊務建構個別之訊務流量模型,其特徵值再輔以各 類參數演算,以查找出不同型態的潛在性成長型或高訊務量、貢獻度大的客戶,是以,本發明可適用於各類電路類型。
其次,本發明無須建置額外的網路設備,藉由分析電路流量資訊,萃取客戶特徵值,查找潛在性目標客戶,無須進行客戶搜尋瀏覽行為儲存、也無須客戶主動提供任何相關上網資訊。
再者,本發明亦無須額外耗費電路設備運算效能,本發明之機制以實際數據立基,建立各類網路訊務指標,利用數學理論模型,刻劃目標客戶的群體特徵,不會因為網路環境的短暫不穩定因素(例如jitter)而產生錯誤估算。
又,本發明之技術具有全面性且應用層面較廣,即可提供網管人員在電路訊務管理時作為參考依據,以協助找出潛在型具有影響力的目標客戶,提高電路使用效率,亦可應用在營運行銷上,以提供更符合客戶需求的策劃方案。
上述實施形態僅例示性說明本發明之原理及其功效,而非用於限制本發明。任何熟習此項技藝之人士均可在不違背本發明之精神及範疇下,對上述實施形態進行修飾與改變。因此,本發明之權利保護範圍,應如後述之申請專利範圍所列。
S101~S104‧‧‧步驟

Claims (8)

  1. 一種透過客戶訊務流量模型識別客戶屬性之方法,其包括:取得複數電路訊務;分析該複數電路訊務以產生對應之複數特徵值;利用標準差法計算該複數特徵值之頻寬使用率、忙時訊務佔比、平均標準差或變異數,以透過支持向量機(SVM)演算法依據該複數特徵值之頻寬使用率、忙時訊務佔比、平均標準差或變異數建構對應之訊務流量模型;以及接收客戶電路訊務後,透過該支持向量機(SVM)演算法依據該複數特徵值之頻寬使用率、忙時訊務佔比、平均標準差或變異數所建構之該訊務流量模型計算影響力數值,以識別客戶屬性。
  2. 如申請專利範圍第1項所述之透過客戶訊務流量模型識別客戶屬性之方法,其中,該複數電路訊務係透過決定母體之抽樣數並進行抽樣而取得者。
  3. 如申請專利範圍第2項所述之透過客戶訊務流量模型識別客戶屬性之方法,復包括依據申裝速率資料進行收集以取得收集之電路訊務,且依據該收集之電路訊務以決定該母體之抽樣數。
  4. 如申請專利範圍第3項所述之透過客戶訊務流量模型識別客戶屬性之方法,其中,於判斷所收集之該複數電路訊務符合抽樣信心水準95%之條件時,進行該至少一電路之複數電路訊務之抽樣,而於抽樣後,利用標準差法去除離群值,以分析該複數特徵值。
  5. 如申請專利範圍第1項所述之透過客戶訊務流量模型識別客戶屬性之方法,其中,分析該複數電路訊務以產生對應之複數特徵值復包括加入日期標簽資訊進行分析,以獲得該複數特徵值。
  6. 如申請專利範圍第1項所述之透過客戶訊務流量模型識別客戶屬性之方法,更包括:於接收該客戶電路訊務後,先依據客戶端電路之區域屬性進行該客戶端電路之分類,以透過該訊務流量模型計算該影響力數值。
  7. 如申請專利範圍第1項所述之透過客戶訊務流量模型識別客戶屬性之方法,其中,預先制定影響力數值門檻,經由比對該影響力數值與該影響力數值門檻,以識別該客戶屬性。
  8. 如申請專利範圍第7項所述之透過客戶訊務流量模型識別客戶屬性之方法,其中,透過專家法則依據不同的申裝速率制定該影響力數值門檻。
TW108143714A 2019-11-29 2019-11-29 透過客戶訊務流量模型識別客戶屬性之方法 TWI725640B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
TW108143714A TWI725640B (zh) 2019-11-29 2019-11-29 透過客戶訊務流量模型識別客戶屬性之方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
TW108143714A TWI725640B (zh) 2019-11-29 2019-11-29 透過客戶訊務流量模型識別客戶屬性之方法

Publications (2)

Publication Number Publication Date
TWI725640B true TWI725640B (zh) 2021-04-21
TW202121871A TW202121871A (zh) 2021-06-01

Family

ID=76604832

Family Applications (1)

Application Number Title Priority Date Filing Date
TW108143714A TWI725640B (zh) 2019-11-29 2019-11-29 透過客戶訊務流量模型識別客戶屬性之方法

Country Status (1)

Country Link
TW (1) TWI725640B (zh)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10277476B2 (en) * 2014-01-06 2019-04-30 Cisco Technology, Inc. Optimizing network parameters based on a learned network performance model

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10277476B2 (en) * 2014-01-06 2019-04-30 Cisco Technology, Inc. Optimizing network parameters based on a learned network performance model

Also Published As

Publication number Publication date
TW202121871A (zh) 2021-06-01

Similar Documents

Publication Publication Date Title
WO2022111327A1 (zh) 风险等级的数据处理方法及装置、存储介质、电子设备
CN107154088B (zh) 基于信道状态信息的活动人员数量估计方法
CN109598278B (zh) 聚类处理方法、装置、电子设备及计算机可读存储介质
CN106572493A (zh) Lte网络中的异常值检测方法及系统
CN109962795A (zh) 一种基于多维组合变量的4g用户流失预警方法和系统
CN108989092A (zh) 一种无线网络预测方法、电子设备及存储介质
CN107633257B (zh) 数据质量评估方法及装置、计算机可读存储介质、终端
Chen et al. Pattern recognition using clustering algorithm for scenario definition in traffic simulation-based decision support systems
CN110532485A (zh) 基于多源数据融合的用户行为检测方法及装置
CN113469730A (zh) 一种非合同场景下的基于RF-LightGBM融合模型的客户复购预测方法及装置
CN110417867A (zh) 移动边缘环境下的Web服务QoS监控方法
CN106713267A (zh) 一种网络安全评估方法及系统
CN113542236A (zh) 一种基于核密度估计和指数平滑算法的异常用户检测方法
TWI725640B (zh) 透過客戶訊務流量模型識別客戶屬性之方法
CN113298296A (zh) 一种自下而上的输电变电站日前负荷概率预测方法
CN103699546A (zh) 一种生成网吧ip数据库的方法及装置
CN107222319B (zh) 一种通信操作分析方法及装置
CN110457387B (zh) 一种应用于网络中用户标签确定的方法及相关装置
CN108521435B (zh) 一种用户网络行为画像的方法及系统
CN116361974A (zh) 一种基于公路业务及数据网络的数据源重要性判别方法
CN106817710A (zh) 一种网络问题的定位方法及装置
CN115392351A (zh) 风险用户识别方法、装置、电子设备及存储介质
CN108805603A (zh) 营销活动质量评估方法、服务器及计算机可读存储介质
CN114936614A (zh) 一种基于神经网络的作业风险识别方法及系统
CN114820219A (zh) 一种基于复杂网络的欺诈社团识别方法及系统