TW201514889A - 顧客資料解析系統 - Google Patents
顧客資料解析系統 Download PDFInfo
- Publication number
- TW201514889A TW201514889A TW103111958A TW103111958A TW201514889A TW 201514889 A TW201514889 A TW 201514889A TW 103111958 A TW103111958 A TW 103111958A TW 103111958 A TW103111958 A TW 103111958A TW 201514889 A TW201514889 A TW 201514889A
- Authority
- TW
- Taiwan
- Prior art keywords
- customer
- data
- value
- prediction
- probability
- Prior art date
Links
- 238000007405 data analysis Methods 0.000 title claims abstract description 25
- 238000012545 processing Methods 0.000 claims abstract description 68
- 238000004458 analytical method Methods 0.000 claims abstract description 32
- 238000000034 method Methods 0.000 claims description 74
- 238000004364 calculation method Methods 0.000 claims description 18
- 238000012795 verification Methods 0.000 claims description 16
- 238000012360 testing method Methods 0.000 claims description 14
- 238000005070 sampling Methods 0.000 claims description 12
- 238000012937 correction Methods 0.000 claims description 5
- 238000009825 accumulation Methods 0.000 description 7
- 238000011160 research Methods 0.000 description 7
- 238000010411 cooking Methods 0.000 description 6
- 239000000463 material Substances 0.000 description 5
- 241000209094 Oryza Species 0.000 description 4
- 235000007164 Oryza sativa Nutrition 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 235000009566 rice Nutrition 0.000 description 4
- 238000004891 communication Methods 0.000 description 3
- 238000013480 data collection Methods 0.000 description 3
- 235000011194 food seasoning agent Nutrition 0.000 description 3
- 238000004519 manufacturing process Methods 0.000 description 2
- 230000000391 smoking effect Effects 0.000 description 2
- 241000972773 Aulopiformes Species 0.000 description 1
- 239000004278 EU approved seasoning Substances 0.000 description 1
- 240000005856 Lyophyllum decastes Species 0.000 description 1
- 235000013194 Lyophyllum decastes Nutrition 0.000 description 1
- 238000004220 aggregation Methods 0.000 description 1
- 230000002776 aggregation Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000001186 cumulative effect Effects 0.000 description 1
- 230000002354 daily effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000003203 everyday effect Effects 0.000 description 1
- 235000013305 food Nutrition 0.000 description 1
- 235000012020 french fries Nutrition 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 230000000644 propagated effect Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000013215 result calculation Methods 0.000 description 1
- 235000019515 salmon Nutrition 0.000 description 1
- 235000013580 sausages Nutrition 0.000 description 1
- 238000011282 treatment Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0281—Customer communication at a business location, e.g. providing product or service information, consulting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0241—Advertisements
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Accounting & Taxation (AREA)
- Development Economics (AREA)
- Strategic Management (AREA)
- Finance (AREA)
- Game Theory and Decision Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Economics (AREA)
- Marketing (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本發明之目的在於提供在短時間內,高精度地解析運用公司系統中所收集、累積之顧客資料之解析系統。
顧客資料解析系統1係解析運用公司系統2中所收集、累積之明細資料之系統,其特徵在於:具有預測處理手段,將任意之明細資料的複數個項目設為說明變數,將其他複數個項目設為目的變數,根據項目之間的相關度,藉由概率推論而算出複數個項目的概率值。
Description
本發明係關於收集與顧客相關之資料且解析該資料之系統。
已知透過點數卡、信用卡的用戶、銷售網路用戶及顧客總帳登錄者等,每日收集與會員顧客相關之各種資料,將儲存於資料庫之此種資料例如用於發佈迎合顧客趣向之商品廣告(引用文獻1~5)。又,自顧客收集之資料能夠用製作為各種分析之基礎之資料,上述各種分析係以如上所述之用於對顧客推薦廣告等且用於抽出最佳顧客之分析、用於商品、服務開發之研究或商品、服務銷售傾向之研究等市場調查之分析為代表。先前,作為用以生成此種成為分析基礎之資料之解析方法,採用了如下方法:為了瞭解與另一個項目相關聯之資料會以何種程度對與一個項目相關聯之資料產生影響,對於每一個目的變數製作模型,且對於一個或複數個目的變數進行計分(scoring)。然而,於解析由大量顧客提供之資料量極大的被稱為巨量資料等之原始資料之情形下,當利用上述解析方法對於複數個目的變數進行計分時,運算會耗費較長時間,且會對運算裝置造成巨大負荷,因此,需要對該方面進行改善。
[先前技術文獻]
[專利文獻]
[專利文獻1]日本特開2010-211687號公報
[專利文獻2]日本特開2009-163533號公報
[專利文獻3]日本特開2012-247926號公報
[專利文獻4]日本特開2004-70504號公報
[專利文獻5]日本特開2012-190061號公報
因此,本發明之目的在於提供如下系統,該系統能夠效率良好地解析所收集之資料,從而在短時間內生成能夠用於廣告、市場調查等各種分析形態的成為分析基礎之資料。
本發明之顧客資料解析系統係解析運用公司系統中所收集、累積之明細資料之系統,其特徵在於,具有:預測處理手段,將任意之明細資料的複數個項目設為說明變數,將其他複數個項目設為目的變數,藉由概率推論而算出複數個項目的概率值。
根據本發明之另一形態,上述顧客資料解析系統具有預測處理手段,將任意之明細資料的複數個項目設為說明變數,將其他複數個項目設為目的變數,且將該目的變數設為用於下一代之目的變數的說明變數,藉由概率推論而算出其他複數個項目的概率值。
本發明之特徵在於,具有:資料市集生成處理手段,對明細資料進行彙總,生成由適合於解析之明細資料構成之資料市集。
本發明之特徵在於,具有:取樣處理手段,對任意數量之顧客的明細資料進行取樣。
本發明之特徵在於,具有:驗證手段,判定對明細資料的項目進行預測處理而獲得之概率值、與根據所收集之實績值的明細資料而獲得之事前概率值之差分。
本發明之特徵在於,具有:修正手段,對預測處理之預測測試模型進行修正,直至驗證手段判定出概率值與事前概率值之差分為任意值以下為止。
本發明之特徵在於,具有:計分手段,將已由驗證手段判定出差分為任意值以下之預測測試模型設為預測處理的預測模型,藉由該預測模型而對全部顧客的明細資料進行預測處理,從而算出概率值。
本發明之特徵在於:對算出之概率值進行臨界值判定,算出映射推定值。
根據本發明,無論目的變數為多少,均能夠一次性地進行預測模型製作過程及計分過程。
1‧‧‧顧客資料解析系統
2‧‧‧運用公司系統
3‧‧‧網路聯盟系統
4‧‧‧真實聯盟系統
5‧‧‧問卷調查手段
圖1係本發明之顧客資料解析系統的方塊圖。
圖2係本發明之顧客資料解析系統的流程圖。
圖3係表示本發明之明細資料解析階段的流程圖。
圖4係先前之預測處理的示意圖。
圖5係本發明之顧客資料解析系統之預測處理的示意圖。
圖6係本發明之顧客資料解析系統之預測處理的示意圖。
圖7係本發明之顧客資料解析系統之預測處理的示意圖。
圖8係本發明之顧客資料解析系統之預測處理的示意圖。
圖9係本發明之顧客資料解析系統之預測處理的示意圖。
圖10係本發明之顧客資料解析系統之預測處理的示意圖。
圖11係本發明之顧客資料解析系統之預測處理的示意圖。
圖12係本發明之顧客資料解析系統之資料表的例子。
圖13係本發明之顧客資料解析系統之資料表的例子。
圖14係本發明之顧客資料解析系統之資料表的例子。
圖15係作為本發明之顧客資料解析系統的解析結果之利用例之波形生成處理及近似率算出處理的流程圖。
圖16係波形生成處理後的曲線圖。
圖17係波形生成處理後的曲線圖。
圖18係波形生成處理後的曲線圖。
圖19係近似率算出處理的算出例。
圖20係近似率算出處理的算出例。
(系統之構成)
以下,參照圖式說明本發明之顧客資料解析系統1。
如圖1所示,顧客資料解析系統1(以下,有時僅稱為系統1)具有:運用公司系統2,其包含處於運用公司管轄下的運算裝置、資料庫群等;EC網站等網路聯盟系統3,其以能夠傳輸資訊之方式與運用公司系統2連接,且包含運算裝置、輸入輸出終端等;真實聯盟系統(Real Alliance system)4,其以能夠傳輸資訊之方式與運用公司系統2連接,包含運算裝置、輸入輸出終端等且設置於實體店鋪;以及問卷調查手段5。
參照圖1說明系統1之概要。系統1係如下系統,其儲存、
解析經由網路聯盟系統3、真實聯盟系統4及問卷調查手段5等而自利用系統1之顧客收集之各種資料。於自顧客儲存至運用公司系統2之資料中,第一有在利用登錄系統時給予各個顧客之顧客ID、在利用登錄系統1時由顧客提供之性別、年齡等顧客的基本屬性等屬性資料。第二有明細資料,該明細資料包含:每當顧客在聯盟企業中購入商品、服務(以下稱為商品等)時所收集、傳輸之商品等的品種或商品名、來店時段、利用店鋪等歷史記錄系資料、及經由任意之問卷調查而自顧客收集、傳輸之有無結婚、有無子女、住宅種類、歲入、有無駕駛執照、顧客意向性等研究系資料。屬性資料在儲存於會員主資料庫之顧客的屬性資料發生變更時會被更新。又,明細資料隨時被提供給運用公司系統2且儲存於解析資料庫。
根據顧客ID管理以上述方式收集之各資料。若列舉顧客ID的一例,則針對每個顧客而有所不同之任意位數之數字或字串為一例,於顧客持有點數卡之情形時,該顧客ID藉由磁方式、電氣方式等各種方式而記錄於該卡,能夠利用真實聯盟系統4的POS終端等輸入裝置讀取顧客ID,且以相關聯之狀態向運用公司系統2傳輸顧客ID與顧客資料。又,於經由網路聯盟系統3進行傳輸之情形時,能夠利用顧客所持有之行動終端或電腦等顧客終端的輸入裝置輸入顧客ID,且以相關聯之狀態向運用公司系統2傳輸顧客ID與顧客資料。
再者,於系統1中,作為附加功能之服務點數加法、減法處理係由運用公司系統2的點數系系統進行,當顧客在聯盟企業中購入了商品等時,或每當在其他各種機會下利用服務點數,積累服務點數時,即,每當傳輸服務點數之加法、減法資料時,對與該顧客的顧客ID相對應之口
座的服務點數進行加法、減法處理。
(明細資料之收集、累積及其解析處理)
如圖2的流程圖所示,本發明之系統1的基幹為明細資料之收集、累積及其解析處理。系統1的正統流程由明細資料收集累積階段與明細資料解析階段構成,該明細資料收集累積階段包含兩個步驟:對每當顧客在聯盟企業中購入商品等時傳輸至運用公司系統2之明細資料進行收集處理(S1);累積已取得之明細資料之明細資料累積處理(S2),上述明細資料解析階段包含資料市集之生成處理(S3)、取樣處理(S4)、建模處理(S5)、驗證處理(S6)、計分處理(S7)及解析結果算出處理(S8)之步驟。
(明細資料收集、累積處理階段)
關於明細資料之收集處理(S1),當顧客在真實聯盟系統4中購入商品等時,藉由歷史記錄系輸入裝置而自POS終端輸入明細資料,明細資料以與顧客ID相關聯之狀態,經由網際網路線路或專用線路等通訊線路而傳輸至運用公司系統2。又,當在網路聯盟系統3中購入了商品等時,明細資料與顧客ID以相關聯之狀態,自顧客終端經由網際網路線路等通訊線路而傳輸至運用公司系統2。
其次,藉由明細資料累積處理(S2),將經由真實聯盟系統4、網路聯盟系統3而傳輸至運用公司系統2之明細資料累積於解析資料資料庫。如此,每當傳輸明細資料時,進行明細資料之收集、累積。
(明細資料解析階段)
對作為明細資料解析階段的最初步驟之資料彙總處理(S3)進行說明。資料彙總處理為如下處理:根據需要對屬性資料及/或明細資料進行離散化處
理,進而將該屬性資料及/或明細資料彙集為類別資料、上層階級或大分類、中分類的項目群,藉此生成資料市集。藉由生成資料市集,能夠將屬性資料及/或明細資料彙集為易於解析之資料項目。參照圖12說明資料市集生成處理的一例。例如進行如下處理:將屬性資料中的「性別」之類的並非連續量之項目彙集為類別資料。又,針對明細資料中的與歷史記錄系資料相關之商品等品種,進行如下處理:將「炸雞、炸薯條、維也納香腸」概括為中分類的「家常菜」,將「鮭魚飯團、梅子飯團、金槍魚飯團」概括為中分類的「飯團」。如此,進行資料市集生成處理,其利用與項目特性相對應之方法,將屬性資料與明細資料彙集為易於解析之項目數。鑒於運算處理裝置的處理能力、由聯盟企業請求提供之資料項目而決定該項目數。例如目前,若彙總為約3000個項目左右,則適合於解析,但項目數任意。
其次,對本發明之預測處理進行說明,該本發明之預測處理成為後述之製作預測模型之過程、計分過程的基幹。如圖4所示,先前之預測處理係進行如下處理:對於一個目的變數,給予一個或複數個說明變數,對於一個項目,算出說明變數相對於(結婚、未婚)之影響程度。亦即,若欲對於一個目的變數項目算出(結婚、未婚)之概率值,則需要以目的變數之數量,對於一個目的變數進行預測處理。
另一方面,圖3、圖5~圖11所示之本發明之新穎的預測處理係利用例如以貝氏網路(Bayesian network)為代表之概率推論,將任意明細資料的複數個項目作為目的變數,且將其他的複數個項目作為說明變數,根據項目之間的相關度,藉由概率推論而算出複數個項目的概率值。
以下,參照圖5~圖11所示之預測處理的示意圖而說明本
發明之預測處理。圖5~圖7所示之事例1係預測處理為單階層模型之情形。如圖5所示,關於任意之顧客A之預測處理,若將有無結婚之概率設為目的變數,則於未對運用公司系統2提供任何與顧客A相關之資訊之狀態下,即,於顧客A的說明變數中無任何明細資料之狀態下,關於有無結婚之概率值,將根據提供了研究系資料之顧客們的資料而獲得之事前概率值(已婚0.5478、未婚0.4252)分配至有無結婚之項目。同樣地,於其他說明變數(調味料購入、家常菜購入、深夜時間利用比率)中亦無任何明細資料之狀態下,分配根據提供了歷史記錄系資料之顧客們的資料而獲得之調味料購入的事前概率值(多0.2、少0.8)、家常菜購入的事前概率值(有購入0.35、未購入0.65)、及深夜時段利用比率的事前概率值(多0.1、普通0.3、少0.6)。
參照圖6,其次,若對於顧客A的說明變數中的家常菜購入提供了「有購入」之明細資料,則會出現有家常菜購入之項目的概率值(1.0),進行預測處理之後,相當於目的變數之未婚概率值自0.4252(約43%)上升至約0.63(63%)。
參照圖7,若進而對於顧客A的說明變數中的深夜時段之利用提供了「多」之明細資料,則會出現深夜時段比率之項目的概率值(1.0),進行如下預測處理:相當於目的變數之未婚概率值自0.63(63%)進而上升至0.9(90%)。
其次,參照圖8~圖11所示之預測處理的示意圖,說明雙階層模型時之預測處理。如圖8所示,關於任意之顧客A之預測處理,若將自製意向之概率設為第2目的變數,則於無顧客A的明細資料之狀態下,關於自製意向的概率值,分配根據提供了研究系資料之顧客們的資料而獲
得之事前概率值(高0.4809、低0.5191),關於作為第1目的變數之有無結婚之概率值,分配根據提供了研究系資料之顧客們的資料而獲得之事前概率值(已婚0.5748、未婚0.4252)。
參照圖9,其次,若對於顧客A的說明變數中的調味料購入,獲得了「購入多」之明細資料,則與上述單階層模型之結構同樣地會出現調味料購入多之概率值(1.0),藉由預測處理,自製意向的概率值自0.4809(約48%)上升至0.715(約71%)。
進而,若對於顧客A的說明變數中的家常菜購入,獲得了「未購入」之明細資料,則會出現無家常菜購入的概率值(1.0),相當於第1目的變數之有無結婚之已婚概率值自0.5748(約57%)上升至0.685(約68%)。而且,相當於第1目的變數之結婚之有無亦為與相當於第2目的變數之自製意向相對之說明變數,因此,作為第1目的變數之有無結婚之概率值會因無家常菜購入的概率值(1.0)之變動而發生變動,該第1目的變數之變動會傳播至第2目的變數之變動,相當於第2目的變數之自製意向的概率值進而自0.715(約71%)上升至0.737(約74%)。
如圖11所示,預測處理係說明變數(父)的概率值之變動使第1目的變數(子)的概率值發生變動之處理,且係如下處理:當第1目的變數(子)進一步為說明變數(父)時,使第2目的變數(子(相對於最初之說明變數而言為孫))的概率值發生變動。亦即,一個目的變數對於下一代以下之目的變數而言亦會成為說明變數,能夠根據需要而設定為被鏈接(link)之全部之目的變數(第n代之目的變數)。亦即,本發明之預測處理係進行如下預測處理:由於出現了任意的說明變數之明細資料,故而算出與其鏈接之各項目
的概率值,該預測處理會對被鏈接之全部之目的變數的概率值產生影響。又,於雙階層以上之預測處理中進行如下預測處理:由於出現了父代的說明變數之實績值,故而影響會傳播至被鏈接之(子、孫、第n世代之目的變數)變動,算出各項目的概率值。上述預測處理係於預測模型之製作過程與計分過程中算出概率值之預測處理,此處,以父、子、孫之關係表示了預測處理的傳播模型,但預測處理的鏈接並不限於此種一個方向之鏈接。
其次,對製作計分處理中所使用之預測模型之過程進行說明。首先,取樣處理(S4)為如下動作:作為製作用於全部顧客份的明細資料之預測處理之精度高之預測模型,即概率推論的運算體系之前階段,為了製作預測測試模型而抽出任意的顧客。取樣處理手段進行如下處理:抽出任意數量的顧客(例如100萬人份)的彙總後的資料市集(例如3000個項目之資料市集)。於取樣處理中,亦能夠隨機地抽出成為為了製作預測測試模型而抽出之對象之顧客,但為了能夠在後述之驗證處理中進行準確驗證,較佳為自具有相對於概率值之響應之顧客,即累積有特定項目以上之實績值的明細資料之顧客中,抽出任意數量之顧客。
其次,建模處理(S5)、驗證處理(S6)為如下處理:對於由上述取樣手段進行取樣所得之明細資料,使用預測測試模型進行預測處理即概率推論,算出概率值,對算出之概率值、與根據實際收集累積之明細資料而獲得之響應即事前概率值進行驗證,從而製作計分用之預測模型。
建模處理手段對於取樣所得之顧客的明細資料,使用預測測試模型進行預測處理。其次,驗證處理手段進行如下驗證處理:對於全部項目或任意項目,算出由利用了預測測試模型之預測處理獲得之概率值、
與關於事前作為實績值收集之各目的變數而獲得之事前概率值之差分。修正處理手段係以使作為驗證處理的結果而算出的概率值與事前概率值之差分成為任意值以下的方式,進行預測測試模型之修正處理,例如更換目的變數或說明變數的項目,或者變更對於項目之離散化方法。反復地進行該驗證處理與修正處理,將由預測測試模型獲得之概率值與事前概率值之差分成為任意值以下之狀態下的預測測試模型決定為預測模型。再者,每當收集累積明細資料時,此處決定之預測模型有可能會變舊,因此其被用作暫定模型,定期地或者每當累積了一定量之明細資料時,經由上述過程而製作用於預測處理之預測模型。
其次說明計分過程。計分處理為如下處理:使用上述建模處理中所製作之預測模型,對於全部顧客之資料市集的明細資料展開預測處理。藉此,對於全部顧客之資料市集的全部項目算出概率值。
參照圖12,未進行計分之狀態為如下狀態:如實績表所示,僅對實際所收集之屬性資料、明細資料的項目分配了實績值。若對此藉由上述預測模型而進行預測處理,則會成為如下狀態:對於圖13所示之亦被稱為顧客DNA(顧客概況分析)表之全部項目分配了概率推論後的概率值。而且,若追加如下處理,即,如圖14所示,根據實績表的傾向,表示以臨界值對所輸入之概率值進行判定所得之結果,則亦能夠獲得映射推定值。
先前,產生了依照目的變數之數量而製作預測模型之過程、及進行計分之過程,但於本發明中,無論目的變數為多少,均能夠一次性地進行預測模型製作過程、及計分過程。亦即,藉由此種預測處理來解析明細資料,藉此,能夠在短時間內解析全部顧客之全部明細資料的項目。
又,在對於全部顧客之明細資料的項目展開利用預測處理之計分之前,經由取樣處理、建模處理及驗證處理而製作預測測試模型,反復地對該預測測試模型進行驗證與修正,製作精度高之預測模型,藉此,能夠以概率值這一形式預測切合顧客的現實活動之值,能夠在短時間內,對於全部顧客之全部明細資料的項目而獲得精度高之概率值。又,由於將預測模型作為暫定版本而時常進行更換,因此,能夠對每日被更新之明細資料進行接近於現實之預測處理。再者,於展開計分之解析對象之顧客數極少之情形時,亦能夠省略取樣處理、建模處理、驗證處理而直接對全部顧客份的明細資料實施預測處理。
(概率值之利用例)
其次,說明藉由上述顧客資料解析系統而獲得之概率值的利用方式之例子。於緊接著顧客資料解析系統之一個系統中,存在波形生成與近似度算出之過程。如圖15所示,運用公司系統2使波形生成手段進行動作之後,波形生成手段進行描繪縱軸上的與類別相對應之各項目的概率值之繪圖處理(S1),且進行折線圖表化之波形生成處理(S2)。例如,於生成顧客A的波形之情形時,如圖16所示,將橫軸設為項目,將縱軸設為顧客資料(%),描繪相對於顧客A的各項目(例如歲入水準、吸煙率、汽車持有率)之概率值,並使其波形化。藉此,由波形表示顧客A的性質。同樣地,亦能夠表示顧客B的波形。
又,如圖17所示,其他形態之波形生成手段將橫軸設為項目,將縱軸設為概率值(%),算出各項目的概率值之平均值,進行描繪平均值化後的概率值之繪圖處理,且進行折線圖表化之波形生成處理。例如,
如圖12所示,於生成商品G的波形之情形時,將橫軸設為項目,將縱軸設為概率值(%),算出具有購入了商品G之歷史記錄系資料之顧客們的各項目類別的概率值之平均值,描繪相對於商品G的各項目(例如歲入水準、吸煙率、汽車持有率)之平均值化後的概率值,且使其波形化。而且,如圖18所示,亦能夠生成店A的波形與店B的波形。
(近似度算出處理)
參照圖19、圖20,說明作為算出近似度之方法之近似度算出處理。波形生成處理係指如下處理,該處理算出波形生成手段所生成之至少2個以上的波形之近似度(亦稱為同步率)。該近似度係根據算出波形生成手段所生成之至少2個以上之波形的點間之差分之方法、算出上述波形生成手段所生成之至少2個以上之波形的線段角度之差分之方法、判定上述點間之差分是否處於臨界值內之方法、判定上述線段角度之差分是否處於臨界值內之方法、算出上述點間之差分處於臨界值內之比例之方法、算出上述線段角度之差分處於臨界值內之比例之方法、上述點間之差分處於臨界值內之比例、及上述線段角度之差分處於臨界值內之比例而求出。
如圖19、圖20所示,此處所謂之概率差分,係指以縱軸上的概率值之差來表示對應之描繪出的點間之距離所得之值,參照圖16,例如當將目標資料A的項目之項目X1(例如歲入水準)的概率描繪於X1A%(例如75%)之位置,將目標資料B的項目之項目X1(歲入水準)的概率描繪於X1B%(例如73%)之位置時,進行X1A%(75%)-X1B%(73%)=概率差分Y1%(2%)之運算,對於與X1~Xn的全部項目相對應之點反復地進行該運算,算出概率差分Y1~Yn。其次,於該概率差分之值處於臨界值(例如5%)內之情形時,
判定為點一致,於未處於臨界值內之情形時,判定為點不一致。進而,算出相對於全部算出結果之點之一致率。
又,所謂線段角度之差分,係指折線曲線的線的角度之差分,參照圖19、圖20,進行線段角度之差分θ=θ1-θ2=tan-1D/C-tan-1D'/C之運算,對於與X1~Xn之間的全部項目相對應之線反復地進行該運算。其次,於該線段角度之差分之值處於臨界值(例如3一)內之情形時,判定為波形一致,於未處於臨界值內之情形時,判定為波形不一致。進而,算出相對於全部算出結果之波形之一致率。
繼而,根據由上述運算獲得之點的一致率、波形的一致率,且藉由近似度=(點的一致率+波形的一致率)/2之運算而算出相當於波形近似度之近似度。再者,能夠將上述臨界值的值設為可變條件。
如此,透過波形生成手段、近似度算出手段,求出如下近似度即顧客對顧客、企業對企業、店鋪對店鋪等的相同類別之間的近似度、或顧客對企業、顧客對店鋪、顧客對商品、顧客對區域、企業對商品、店鋪對商品、店鋪對區域等的不同類別之間的近似度,使該近似度可視化,藉此,當然能夠使本系統有助於針對顧客之推薦作業,且能夠利用本系統進行例如企業或店鋪的品種豐富性之分析、分店地域之分析等用於各種目的之調查分析。
又,作為其他利用例,由於亦能夠對於無明細資料之顧客求出概率值,因此,實際上亦能夠用於如下市場調查例如挑選雖未購入商品A,但購入概率較高之顧客。此外,亦能夠用於如下市場調查例如分析被某類別的顧客群購入之可能性較高之商品。
1‧‧‧顧客資料解析系統
2‧‧‧運用公司系統
3‧‧‧網路聯盟系統
4‧‧‧真實聯盟系統
5‧‧‧問卷調查手段
Claims (8)
- 一種顧客資料解析系統,其係解析運用公司系統中所收集、累積之明細資料之系統,其特徵在於具有:預測處理手段,將任意之明細資料的複數個項目設為說明變數,將其他複數個項目設為目的變數,藉由概率推論而算出複數個項目的概率值。
- 如申請專利範圍第1項之顧客資料解析系統,其具有預測處理手段,將任意之明細資料的複數個項目設為說明變數,將其他複數個項目設為目的變數,且將該目的變數設為用於下一代以下之目的變數的說明變數,藉由概率推論而算出複數個項目的概率值。
- 如申請專利範圍第1或2項之顧客資料解析系統,其具有資料市集生成處理手段,資料市集對明細資料進行彙總,生成由適合於解析之明細資料構成之資料市集。
- 如申請專利範圍第1或2項之顧客資料解析系統,其具有取樣處理手段,對任意數量之顧客的明細資料進行取樣。
- 如申請專利範圍第1或2項之顧客資料解析系統,其具有驗證手段,判定對明細資料的項目進行預測處理而獲得之概率值、與根據所收集之實績值的明細資料而獲得之事前概率值之差分。
- 如申請專利範圍第5項之顧客資料解析系統,其具有修正手段,對預測處理之預測測試模型進行修正,直至驗證手段判定出概率值與事前概率值之差分為任意值以下為止。
- 如申請專利範圍第6項之顧客資料解析系統,其具有計分手段,將已由驗證手段判定出差分為任意值以下之預測測試模型設為預測處理的預測模型,藉由該預測模型而對全部顧客的明細資料進行預測處理,從而算出概率值。
- 如申請專利範圍第1或2項之顧客資料解析系統,其中,對算出之概 率值進行臨界值判定,算出映射推定值。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013214213A JP6059122B2 (ja) | 2013-10-11 | 2013-10-11 | 顧客データ解析システム |
Publications (2)
Publication Number | Publication Date |
---|---|
TW201514889A true TW201514889A (zh) | 2015-04-16 |
TWI597679B TWI597679B (zh) | 2017-09-01 |
Family
ID=52812694
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW103111958A TWI597679B (zh) | 2013-10-11 | 2014-03-31 | Customer data analysis system |
Country Status (6)
Country | Link |
---|---|
JP (1) | JP6059122B2 (zh) |
KR (1) | KR20150053256A (zh) |
CN (1) | CN104718547A (zh) |
HK (1) | HK1209867A1 (zh) |
TW (1) | TWI597679B (zh) |
WO (1) | WO2015052851A1 (zh) |
Families Citing this family (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6603600B2 (ja) * | 2015-06-30 | 2019-11-06 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ | 需要予測方法、需要予測装置及び需要予測プログラムを記録したコンピュータ読み取り可能な記録媒体 |
US11593817B2 (en) | 2015-06-30 | 2023-02-28 | Panasonic Intellectual Property Corporation Of America | Demand prediction method, demand prediction apparatus, and non-transitory computer-readable recording medium |
US20170004411A1 (en) * | 2015-07-04 | 2017-01-05 | Tata Consultancy Services Limited | Method and system for fusing business data for distributional queries |
JP6320353B2 (ja) * | 2015-08-27 | 2018-05-09 | 株式会社アクシバル | デジタルマーケティングシステム |
CN106651409A (zh) * | 2015-10-29 | 2017-05-10 | 北京京东尚科信息技术有限公司 | 预测用户婚姻状态的方法和装置 |
JP6058104B1 (ja) * | 2015-11-06 | 2017-01-11 | 株式会社南山デイリーサービス | 顧客情報更新装置及びコンピュータプログラム |
JP6784000B2 (ja) * | 2015-12-25 | 2020-11-11 | インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation | 情報処理装置、情報処理方法、及び、プログラム |
CN105701498B (zh) * | 2015-12-31 | 2021-09-07 | 腾讯科技(深圳)有限公司 | 一种用户分类方法及服务器 |
WO2019188102A1 (ja) | 2018-03-27 | 2019-10-03 | カルチュア・コンビニエンス・クラブ株式会社 | 顧客の属性情報に基づきレコメンドを行う装置、方法、およびプログラム |
JP6598321B1 (ja) * | 2018-05-21 | 2019-10-30 | Necプラットフォームズ株式会社 | 情報処理装置、制御方法、及びプログラム |
JP7197391B2 (ja) * | 2019-02-01 | 2022-12-27 | 株式会社オービック | データ分析装置、データ分析方法およびデータ分析プログラム |
EP4120147B1 (en) * | 2020-06-12 | 2024-06-26 | ASICS Corporation | Data estimation device, method, and program |
CN113177642A (zh) * | 2021-05-24 | 2021-07-27 | 北京融七牛信息技术有限公司 | 一种针对数据不平衡的自动建模系统 |
CN113177643A (zh) * | 2021-05-24 | 2021-07-27 | 北京融七牛信息技术有限公司 | 一种基于大数据的自动建模系统 |
Family Cites Families (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001229150A (ja) * | 2000-02-14 | 2001-08-24 | Hitachi Ltd | データ分析方法 |
JP2002366401A (ja) * | 2001-06-06 | 2002-12-20 | Nippon Yunishisu Kk | 統合的データマート構築及び運用支援システム |
WO2003085548A1 (fr) * | 2002-04-04 | 2003-10-16 | Ishihara Sangyo Kaisha, Ltd. | Dispositif et procede d'analyse de donnees |
US20040064357A1 (en) * | 2002-09-26 | 2004-04-01 | Hunter Jeffrey D. | System and method for increasing the accuracy of forecasted consumer interest in products and services |
JP4847916B2 (ja) * | 2007-05-18 | 2011-12-28 | 日本電信電話株式会社 | 購買順序を考慮したリコメンド装置、リコメンド方法、リコメンドプログラムおよびそのプログラムを記録した記録媒体 |
JP5334038B2 (ja) * | 2008-08-11 | 2013-11-06 | Kddi株式会社 | 嗜好推定装置、嗜好推定方法及びコンピュータプログラム |
CN101354757B (zh) * | 2008-09-08 | 2010-08-18 | 中国科学院地理科学与资源研究所 | 一种精细尺度下的动态风险及易损性预测方法 |
US20100203876A1 (en) * | 2009-02-11 | 2010-08-12 | Qualcomm Incorporated | Inferring user profile properties based upon mobile device usage |
JP5544314B2 (ja) * | 2011-01-25 | 2014-07-09 | 株式会社日立製作所 | 用役設備の最適運転システム |
JP2012190061A (ja) * | 2011-03-08 | 2012-10-04 | Sony Corp | 情報処理装置、端末装置、情報提示システム、評価スコアの算出方法、及びプログラム |
CN102360386A (zh) * | 2011-10-12 | 2012-02-22 | 朱一超 | 电子商务网站智能导购系统和方法 |
CN102662832A (zh) * | 2012-03-20 | 2012-09-12 | 浙江大学 | 一种生产过程数据校正软件的评测方法 |
CN103235981B (zh) * | 2013-04-10 | 2016-03-09 | 东南大学 | 一种风电电能质量趋势预测方法 |
-
2013
- 2013-10-11 JP JP2013214213A patent/JP6059122B2/ja active Active
- 2013-11-20 KR KR1020147022254A patent/KR20150053256A/ko not_active Application Discontinuation
- 2013-11-20 CN CN201380013637.8A patent/CN104718547A/zh active Pending
- 2013-11-20 WO PCT/JP2013/081284 patent/WO2015052851A1/ja active Application Filing
-
2014
- 2014-03-31 TW TW103111958A patent/TWI597679B/zh not_active IP Right Cessation
-
2015
- 2015-10-23 HK HK15110464.9A patent/HK1209867A1/zh unknown
Also Published As
Publication number | Publication date |
---|---|
TWI597679B (zh) | 2017-09-01 |
CN104718547A (zh) | 2015-06-17 |
HK1209867A1 (zh) | 2016-04-08 |
JP6059122B2 (ja) | 2017-01-11 |
WO2015052851A1 (ja) | 2015-04-16 |
KR20150053256A (ko) | 2015-05-15 |
JP2015076076A (ja) | 2015-04-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TWI597679B (zh) | Customer data analysis system | |
KR20160071990A (ko) | 고객 데이터 분석·검증 시스템 | |
KR102091529B1 (ko) | 사용자의 시계열적 행동 데이터를 이용하여 인공지능 모델을 학습시키는 방법 및 장치 | |
CN106251174A (zh) | 信息推荐方法及装置 | |
CN104463637A (zh) | 一种基于电商平台的商品推荐方法、装置及服务器 | |
KR101963817B1 (ko) | 키워드 검색량 기반 예측 정보 생성 장치 및 방법 | |
KR102321987B1 (ko) | 온라인 쇼핑몰 관리 시스템 및 방법 | |
US20210012359A1 (en) | Device, method and computer-readable medium for making recommendations on the basis of customer attribute information | |
KR20180052489A (ko) | 사용자 경험분석 및 환경요인에 기초한 크로스보더 전자상거래 상품 추천 방법 | |
US10846352B1 (en) | System and method for identifying potential clients from aggregate sources | |
Raval et al. | A semiparametric discrete choice model: An application to hospital mergers | |
US20170316442A1 (en) | Increase choice shares with personalized incentives using social media data | |
CN104616180A (zh) | 一种热销商品预测方法 | |
JP2019215862A (ja) | 行動履歴データを用いた行動分析システム及びそのプログラム | |
CN105303447A (zh) | 利用网络信息进行信用评级的方法和系统 | |
TWI634499B (zh) | 資料分析方法、系統及非暫態電腦可讀取媒體 | |
CN112070559A (zh) | 状态获取方法和装置、电子设备和存储介质 | |
Bi et al. | Modeling spatiotemporal heterogeneity of customer preferences in engineering design | |
CN110490682B (zh) | 分析商品属性的方法和装置 | |
CN115660733A (zh) | 一种基于人工智能的销量预测系统及方法 | |
KR102405503B1 (ko) | 소비 데이터와 소셜 데이터를 이용한 소비동향 예측 지수 생성 방법과 이를 적용한 소비동향 예측 지수 생성 시스템 및 이를 위한 컴퓨터 프로그램 | |
CN114399352A (zh) | 一种信息推荐方法、装置、电子设备及存储介质 | |
Guo et al. | EC‐Structure: Establishing Consumption Structure through Mining E‐Commerce Data to Discover Consumption Upgrade | |
CN110727797A (zh) | 标签生成方法、装置、电子设备和计算机可读介质 | |
Ines et al. | Customer Success Analysis and Modeling in Digital Marketing |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
MM4A | Annulment or lapse of patent due to non-payment of fees |