CN109840796B - 决策因素分析装置与决策因素分析方法 - Google Patents
决策因素分析装置与决策因素分析方法 Download PDFInfo
- Publication number
- CN109840796B CN109840796B CN201711388816.6A CN201711388816A CN109840796B CN 109840796 B CN109840796 B CN 109840796B CN 201711388816 A CN201711388816 A CN 201711388816A CN 109840796 B CN109840796 B CN 109840796B
- Authority
- CN
- China
- Prior art keywords
- commodity
- decision
- regression model
- product
- feature
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0631—Item recommendations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2457—Query processing with adaptation to user needs
- G06F16/24578—Query processing with adaptation to user needs using ranking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/18—Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
- G06N20/20—Ensemble learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/01—Dynamic search techniques; Heuristics; Dynamic trees; Branch-and-bound
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/04—Inference or reasoning models
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/04—Inference or reasoning models
- G06N5/045—Explanation of inference; Explainable artificial intelligence [XAI]; Interpretable artificial intelligence
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- Data Mining & Analysis (AREA)
- Finance (AREA)
- Accounting & Taxation (AREA)
- Development Economics (AREA)
- Strategic Management (AREA)
- Mathematical Physics (AREA)
- General Engineering & Computer Science (AREA)
- Software Systems (AREA)
- Economics (AREA)
- Mathematical Analysis (AREA)
- Pure & Applied Mathematics (AREA)
- Mathematical Optimization (AREA)
- Computational Mathematics (AREA)
- Entrepreneurship & Innovation (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Computational Linguistics (AREA)
- Computing Systems (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Databases & Information Systems (AREA)
- Game Theory and Decision Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Algebra (AREA)
- Operations Research (AREA)
- Probability & Statistics with Applications (AREA)
- Medical Informatics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明提供用于分析导致商品类型的商品被购买的多个决策因素的一种决策因素分析装置与决策因素分析方法。所述方法包括自消费者数据库对应多个消费者的多个浏览历史数据与多个购买历史数据中辨识对应所述商品类型的多个商品序列,其中每一个商品序列包括未购买商品与购买商品;根据所述多个商品序列与多个商品信息获得特征序列;根据特征序列的K个决策因素训练对应所述商品类型的回归模型以获得最佳回归模型,并且根据所述最佳回归模型获得分别对应所述K个决策因素的K个决策值,以产生对应所述商品类型的决策因素序列。
Description
技术领域
本发明是有关于一种决策因素分析装置与决策因素分析方法。
背景技术
随着时代的进步、网络的发达及运送通路的演进,现在人的购物方式也由从实体店面中购物的方式转为从电商网站购物的方式。换言之,网络购物已经是一种趋势。
对于利用电商网站来进行货物贩卖的卖家(或相关的商品管理者)来说,虽然可根据电商网站所提供的统计信息/历史记录(如,已贩卖商品的数量/类型)来判断哪些商品是畅销的。但是,卖家不容易从这些统计信息/历史记录中来判断影响这些畅销商品之所以畅销的因素,导致卖家难以进一步地提高在电商网站中所贩卖的商品的被购买率,即,卖家并不能够充分地享受到利用电商网站贩卖商品的好处。例如,卖家不容易经由电商网站所提供的统计信息/历史记录来有效地辨识出购买率较高的商品(以及其规格)或是辨识出可吸引人购买商品的贩卖网页的设计特征/规格。
基此,要如何利用电商网站所提供的统计信息/历史数据来分析出商品之所以被购买的决策因素,进而使卖家可辨识出购买率较高的产品,或是设计出较具卖相的网页,是本领域人员致力发展的目标。
发明内容
本发明提供一种决策因素分析装置与决策因素分析方法,可分析影响所述特定商品类型的商品是否被购买的多个决策因素。
本发明的一实施例提供用于分析导致一商品类型的商品被购买的多个决策因素的一种决策因素分析装置。所述决策因素分析装置包括通信电路单元、存储装置以及处理器。通信电路单元用以连接至电商网站的电商服务器。存储装置用以储存多个程序代码模块。所述处理器用以存取且执行所述多个程序代码模块,以执行对应所述商品类型的决策因素分析操作。所述多个程序代码模块包括数据撷取模块、决策因素管理模块与回归模型管理模块。数据撷取模块用以自所述电商服务器的消费者数据库读取分别对应多个消费者的多个消费者历史数据,并且自所述电商服务器的商品数据库中读取多个商品数据,其中所述多个消费者历史数据的每一个消费者历史数据报括浏览历史数据与购买历史数据。决策因素管理模块用以管理所述决策因素分析操作。回归模型管理模块用以训练回归模型。所述决策因素管理模块根据所述商品类型指示所述数据撷取模块从对应所述多个消费者的所述多个浏览历史数据与所述多个购买历史数据中辨识对应所述商品类型的多个商品序列,其中每一个商品序列包括属于所述商品类型的分别对应所述多个消费者的多个已浏览商品,其中所述多个已浏览商品包括一或多个未购买商品与一购买商品。此外,所述决策因素管理模块根据所述多个商品序列中各自的所述一或多个未购买商品与所述购买商品来获得分别对应所述多个商品序列的多个特征组,其中每一个特征组包括多个特征及分别对应所述多个特征的多个特征值。所述决策因素管理模块更根据对应所述商品类别的所述多个商品序列与所述多个特征组获得一特征序列,其中所述决策因素管理模块选择所述特征序列中已排序的所述多个特征的前K个特征作为K个决策因素。所述回归模型管理模块根据所述K个决策因素与所述多个商品数据训练对应所述商品类型的一回归模型以获得一最佳回归模型,并且根据所述最佳回归模型获得分别对应所述K个决策因素的K个决策值。所述决策因素管理模块根据所述K个决策值由大至小排序所述K个决策因素,以产生对应所述商品类型的具有K个决策因素的一决策因素序列,其中所述决策因素管理模块判定在对应所述商品类型的所述决策因素序列的所述K个决策因素中排序最前面的一第一决策因素为最影响所述商品类型的商品是否会被购买的所述商品的关键商品信息。
本发明的一实施例提供用于分析导致一商品类型的商品被购买的多个决策因素的一种决策因素分析方法。所述方法包括自一电商网站的一电商服务器的消费者数据库读取分别对应多个消费者的多个消费者历史数据,并且自所述电商服务器的商品数据库中读取多个商品数据,其中所述多个消费者历史数据的每一个消费者历史数据报括浏览历史数据与购买历史数据;根据所述商品类型从对应所述多个消费者的所述多个浏览历史数据与所述多个购买历史数据中辨识对应所述商品类型的多个商品序列,其中每一个商品序列包括属于所述商品类型的分别对应所述多个消费者的多个已浏览商品,其中所述多个已浏览商品包括一或多个未购买商品与一购买商品;根据所述多个商品序列中各自的所述一或多个未购买商品与所述购买商品来获得分别对应所述多个商品序列的多个特征组,其中每一个特征组包括多个特征及分别对应所述多个特征的多个特征值;根据对应所述商品类别的所述多个商品序列与所述多个特征组获得一特征序列;选择所述特征序列中已排序的所述多个特征的前K个特征作为K个决策因素;根据所述K个决策因素与所述多个商品数据训练对应所述商品类型的一回归模型以获得一最佳回归模型,并且根据所述最佳回归模型获得分别对应所述K个决策因素的K个决策值;以及根据所述K个决策值由大至小排序所述K个决策因素,以产生对应所述商品类型的具有K个决策因素的一决策因素序列,其中在对应所述商品类型的所述决策因素序列的所述K个决策因素中排序最前面的一第一决策因素被判定为最影响所述商品类型的商品是否会被购买的所述商品的关键商品信息。
基于上述,本发明的实施例所提供的决策因素分析装置与决策因素分析方法,可藉由电商网站的多个消费者的对应一特定商品类型的多个浏览历史记录与多个购买历史记录来辨识对应该特定商品类型的多个商品序列,根据对应所述多个商品序列中未被购买及被购买的商品的多个商品信息与回归模型以分析影响所述特定商品类型的商品是否被购买的多个决策因素,进而可提供参考信息来设计可吸引购买的所述特定商品类型的商品。
为让本发明的上述特征和优点能更明显易懂,下文特举实施例,并配合所附图式作详细说明如下。
附图说明
图1是根据本发明的一实施例所绘示的决策因素分析系统的方块示意图。
图2A是根据本发明的一实施例所绘示的决策因素分析方法的流程图。
图2B是根据本发明的一实施例所绘示的图2A的步骤S22的流程图。
图2C是根据本发明的一实施例所绘示的图2A的步骤S23的流程图。
图3A是根据本发明的一实施例所绘示的辨识对应一商品类型的商品序列的示意图。
图3B是根据本发明的一实施例所绘示的已辨识的多个商品序列。
图4是根据本发明的一实施例所绘示的计算稀有值的示意图。
图5是根据本发明的一实施例所绘示的特征转换操作的示意图。
图6是根据本发明的一实施例所绘示的计算特征序列的示意图。
图7是根据本发明的一实施例所绘示的回归模型训练的示意图。
图8是根据本发明的一实施例所绘示的显示对应所查询的商品类型的决策因素序列的示意图。
图9是根据本发明的一实施例所绘示的显示对应所查询的商品类型的决策因素序列与对应所查询的多个商品信息的预测购买率的示意图。
1:决策因素分析系统
10:电商服务器
20:决策因素分析装置
110、210:通信电路单元
120、220:处理器
130、230:存储装置
131、1311、1312、132、234:数据库
240:输入/输出装置
231:数据撷取模块
232:决策因素管理模块
233:回归模型管理模块
BHD:浏览历史数据
PHD:购买历史数据
QD:查询/查询数据
DD:决策因素数据
S21、S22、S23:决策因素分析方法的流程步骤
S221、S222、S223:步骤S22的流程步骤
S231、S232、S233:步骤S23的流程步骤
3、PA、PB、PC、PD、PE、P1、P2、P3、P4:商品
PS1、PS2:商品序列
30、31:消费者
410、420、430、440、450、520、610、620、710、730:表格
510:曲线
A41、A42、A43、A44、A51、A61、A71、A72、A73、A74、A75:箭头
711:实际购买率
720:回归模型
810:字段
820、910、920、930:区域
830:区域/商品页面
具体实施方式
本发明所提供的决策因素分析系统(装置)与决策因素分析方法的主要精神为:利用电商(E-commerce)网站所提供的统计数据/历史数据,来挖掘出可供利用的信息,以找出一商品类型的商品会吸引消费者购买的关键的商品特征(包含商品本身的规格与显示商品的页面的规格)。换句话说,本发明所提供的决策因素分析系统(装置)与决策因素分析方法可配合电商网站的商品数据、历史数据来分析对应一电商网站的特定商品类型的多个决策因素,进而使相关人员可进一步地利用这些分析出的所述多个决策因素来设计欲贩卖的所述特定商品类型的商品的商品规格与页面规格。如此一来,贩卖商品的相关人员可据此更进一步地下架(停止贩卖)较低购买率的商品,增加较高购买率的商品的上架,修改对应特定商品类型的营销策略与物流系统。
图1是根据本发明的一实施例所绘示的决策因素分析系统的方块示意图。请参考图1,在本实施例中,决策因素分析系统1包括电商网站的电商服务器(E-commerce server)10与决策因素分析装置20。电商服务器10与决策因素分析装置20可藉由因特网、局域网络或无线网络的方式来连接。所述电商网站可指任何贩卖实体商品的网站,如,业马逊(Amazon)、淘宝网(Taobao)、虾皮拍卖(Shopee)、ebay等购物网站,此些电商网站贩卖属于不同商品种类的实体商品。所述电商网站也可指特定品牌本身的网络商店,例如,Uniqlo、DELL等品牌的网络商店,此些网络商店贩卖属于单一品牌的不同商品种类的实体商品。所述电商网站也可指贩卖(以供下载)应用程序/软件/数字商品的网络商店,如,GooglePlay、itunes、Steam或App Store,此些电商网站贩卖属于不同商品种类的数字(虚拟)商品。为了方便说明,在以下所描述的实施例中,电商网站属于任何贩卖实体商品的网站(如,亚马逊)。
应注意的是,在另一实施例中,所述决策因素分析装置20也可整合至电商服务器10。如此一来,在此另一实施例中,具有决策因素分析装置20的电商服务器10可直接利用本身的历史数据来进行关于其所贩卖的商品的商品类型的决策因素的分析。
在本实施例中,电商服务器10包括通信电路单元110、处理器120、存储装置130。所述处理器120耦接至通信电路单元110与存储装置130。决策因素分析装置20包括通信电路单元210、处理器220、存储装置230与输入/输出装置240。处理器220耦接至通信电路单元210、存储装置230与输入/输出装置240。
在本实施例中,所述通信电路单元110、210用以透过无线通信的方式建立电商服务器10与决策因素分析装置20之间的联机,以使电商服务器10与决策因素分析装置20可彼此传输或是接收数据。在本实施例中,通信单元110、210可为具有一无线通信模块(未绘示)的电路单元,并支持全球行动通信(Global System for Mobile Communication,GSM)系统、个人手持式电话系统(Personal Handy-phone System,PHS)、码多重撷取(CodeDivision Multiple Access,CDMA)系统、无线兼容认证(Wireless Fidelity,WiFi)系统、全球互通微波存取(Worldwide Interoperability for Microwave Access,WiMAX)系统、第三代无线通信技术(3G)、长期演进技术(Long Term Evolution,LTE)、红外线(Infrared)传输、蓝芽(bluetooth)通信技术的其中之一或其组合,且不限于此。除此之外,所述通信电路单元110、210也可为具有一有线通信模块(未绘示)的电路单元,并透过有线通信的方式来传输或是接收数据。此有线通信模块可为一光纤网络模块,并透过一光纤接口与一光纤建立一光纤网络使通信电路单元110、210彼此连接。在所建立的光纤网络中,电商服务器10与决策因素分析装置可以互相传递信息。本发明并不限制光纤的种类与材质。此外,电商服务器10与决策因素分析装置20的通信电路单元110、120也可先连接至因特网,再联机至彼此。
在本实施例中,所述存储装置130、230用以储存数据。储存单元130、230可分别经由处理单元120、220的指示来储存数据。所述数据报括分别用以管理电商服务器10与决策因素分析装置20的管理数据。存储装置130、230可以是任何型态的硬盘机(hard diskdrive,HDD)或非易失性存储器存储装置。
在本实施例中,存储装置130所储存的数据报括消费者数据库131与商品数据库132。所述消费者数据库131用以记录关于使用电商网站的所有消费者的信息,如,分别对应多个消费者的多个消费者历史数据。在本实施例中,所述消费者数据库131包括浏览历史数据库1311与购买历史数据库1312。
所述浏览历史数据库1311储存关于所有消费者所浏览的所述电商网站的网络页面与商品(页面)的信息。即,可以从浏览历史数据库1311中查询到特定使用者在特定期间内所浏览过的商品/网页。所述购买历史数据库1312储存关于所有消费者所购买的所述电商网站的商品的信息。即,可以从购买历史数据库1312中查询到特定使用者在特定期间内所购买的商品。
所述商品数据库132用以储存关于电商网站的所有商品与所有(商品)网页的信息,例如,所述商品数据库132储存多个商品数据。所述商品数据例如为记录其对应的商品的商品规格特征与其对应的商品的网页(贩卖该对应的商品的网页)的网页规格(页面规格)的特征(亦称,商品展览特征)。应注意的是,所述网页与商品页面亦可泛指任何可供浏览器开启(显示)的网路页面或是供应用程序/资料库程序所开启(显示)的应用程式的商品页面。例如,卖家或相关的使用者可经由电商网站的网路页面中展览(或浏览)商品,或是经由电商网站的应用程序/资料库程序的商品页面来展览(或浏览)商品。
存储装置230所记录的数据报括多个程序代码模块231~233与决策因素数据库234,处理器220可存取此些程序代码模块231~233来实现本发明所提供的决策因素分析方法,以执行对应一商品类型的决策因素分析操作。决策因素数据库234用以记录所产生的分别对应不同商品类型的多组决策因素。
在本实施例中,所述程序代码模块包括数据撷取模块231、决策因素管理模块232与回归模型管理模块233。在另一实施例中,数据撷取模块231与回归模型管理模块233也可整合至决策因素管理模块232中。
所述数据撷取模块231用以自电商服务器10的消费者数据库131读取分别对应多个消费者的多个消费者历史数据,并且自该电商服务器10的商品数据库132中读取多个商品数据(Product Information Data,PID),其中对应一消费者的一消费者历史数据报括对应该消费者的浏览历史数据(Browse History Data,BHD)(读取自浏览历史数据库1311)与购买历史数据(Purchase History Data,PHD)(读取自购买历史数据库1312)。
所述决策因素管理模块232用以管理所执行的整体决策因素分析操作。所述回归模型管理模块233用以训练回归模型。
所述处理器120、220为具备运算能力的硬件(例如芯片组、处理器等),用以各自管理电商服务器10与决策因素分析装置的整体运作。在本实施例中,处理器120、220,例如是一核心或多核心的中央处理单元(Central Processing Unit,CPU)、微处理器(micro-processor)、或是其他可程序化的处理单元(Programmable processor)、数字信号处理器(Digital Signal Processor,DSP)、可程序化控制器、特殊应用集成电路(ApplicationSpecific Integrated Circuits,ASIC)、可程序化逻辑设备(Programmable LogicDevice,PLD)或其他类似装置。
所述输入/输出装置240可分为输入设备与输出设备。一般来说,常见的输入设备例如是鼠标、键盘、扫描仪、数字相机、数字板、麦克风、触摸板、触控面板等设备,其用以让用户输入数据(如,查询数据QD)或是经由输入设备来控制所用户所欲运作的功能。输出设备例如是屏幕(其用以接收显示数据来显示视觉内容,如,画面)、喇叭(其可用以接收音频数据来发出听觉内容,如,声音)等设备,本案不以此为限。输入设备也可与输出设备整合在一起,例如,同时具有数据输入功能与数据输出功能的触控屏幕。以下会藉由多个图式与实施例来进一步详细说明数据撷取模块231、决策因素管理模块232与回归模型管理模块233之间的互动与各自的功能。
图2A是根据本发明的一实施例所绘示的决策因素分析方法的流程图。请同时参考图1与图2A,在步骤S21中,数据撷取模块231自一电商服务器读取多个商品数据与分别对应多个消费者的多个浏览历史数据与多个购买历史数据。更详细来说,数据撷取模块231根据决策因素管理模块的指示自一电商网站的所述电商服务器的消费者数据库读取分别对应多个消费者的多个消费者历史数据,并且自所述电商服务器的商品数据库中读取所述多个商品数据,其中所述多个消费者历史数据报括分别对应所述多个消费者的所述多个浏览历史数据与所述多个购买历史数据。
在本实施例中,在获得所有的浏览历史数据与购买历史数据后,所述决策因素管理模块232可根据所输入的查询数据QD从电商网站所贩卖的全部商品的多个商品类型中选择对应所述查询数据QD的商品类型,以进行对应所述商品类型的决策因素分析操作,以分析导致所述商品类型(的商品)被购买的多个决策因素。
在步骤S22中,决策因素管理模块232根据一商品类型从所述多个浏览历史数据与所述多个购买历史数据中获得对应所述商品类型的一特征序列。
图2B是根据本发明的一实施例所绘示的图2A的步骤S22的流程图。详细来说,请参照图2B,步骤S22包括步骤S221、S222、S223。在步骤S221中,决策因素管理模块232根据所述商品类型从对应所述多个消费者的所述多个浏览历史数据与所述多个购买历史数据中辨识对应所述商品类型的多个商品序列,其中每一个商品序列包括属于所述商品类型的分别对应所述多个消费者的多个已浏览商品,其中所述多个已浏览商品包括一或多个未购买商品与一购买商品。
图3A是根据本发明的一实施例所绘示的辨识对应一商品类型的商品序列的示意图。请参照图3A,在本实施例中,数据撷取模块231根据相较于今天N天内的多个浏览历史数据(也称,近期浏览历史数据)中辨识多个已浏览商品3,并且根据相较于今天N天内的多个购买历史数据(也称,近期购买历史数据)中判断所述多个已浏览商品3是否被购买(如,白色圆形所绘示的商品为未购买商品(即,已浏览但未被购买的商品),及灰色圆形所绘示的商品为购买商品(即,已浏览且被购买的商品))。接着,数据撷取模块231会以单一消费者为单位来辨识分别对应每个消费者的已浏览商品。例如,辨识已浏览商品3中对应消费者30的已浏览商品(即,虚线圆形30中的商品,其表示消费者30在N天内所浏览的多个商品),与辨识已浏览商品3中对应消费者31的已浏览商品(即,虚线圆形31中的商品,其表示消费者31在N天内所浏览的多个商品)。在另一实施例中,数据撷取模块231也可以每个消费者为单位,直接经由浏览历史数据库1311来从对应每个消费者的浏览历史数据中辨识/读取消费者在N天内所浏览的商品,并且经由购买历史数据库1312来从对应每个消费者的购买历史数据中辨识/读取消费者在N天内所购买的商品。
接着,数据撷取模块231会分别辨识消费者30所浏览的商品中属于所述商品类别的商品(即,实线圆形PS1所示,其表示消费者30在N天内所浏览的所述多个商品中属于所述商品类别的多个商品PA、PB、PC),以及消费者31所浏览的商品中属于所述商品类别的商品(即,实线圆形PS2所示,其表示消费者31在N天内所浏览的所述多个商品中属于所述商品类别的多个商品PD、PE)。此外,数据撷取模块231会进一步经由对应消费者30的购买历史数据来辨识且区分商品PA、PB、PC的关系为未购买商品PA、PB与购买商品PC。举例来说,数据撷取模块231先根据对应消费者30的近期购买历史数据来辨识对应消费者30的多个已浏览商品PA、PB、PC中的购买商品PC,并且藉此辨识对应消费者30的多个已浏览商品PA、PB、PC中的不是购买商品PC的商品为未购买商品PA、PB,其中购买商品PC表示消费者30浏览已浏览商品PA、PB、PC后从所述已浏览商品PA、PB、PC中所选择以购买的商品。相似地,数据撷取模块231也会经由对应消费者31的购买历史数据来辨识且区分商品PD、PE的关系为未购买商品PD与购买商品PE。
图3B是根据本发明的一实施例所绘示的已辨识的多个商品序列。请参照图3B,接续上述的例子,数据撷取模块231会将对应所述商品类型的所述多个已浏览商品PA、PB、PC中的未购买商品PA、PB与购买商品PC作为对应所述商品类型的一商品序列PS1。相似地,数据撷取模块231会将对应所述商品类型的所述多个已浏览商品PD、PE中的未购买商品PD与购买商品PE作为对应所述商品类型的另一商品序列PS2。依此类推,数据撷取模块231便可从对应所述多个消费者的所述多个浏览历史数据与所述多个购买历史数据中辨识对应所述商品类型的多个商品序列。一或多个商品序列可对应一个消费者。此外,数据撷取模块231还会找出消费者真正有在比较商品的时间区间(例如,根据一定时间区间中浏览同类型商品的次数),以将距离购买行为前的浏览纪录过久的商品的浏览记录剔除。在一实施例中,数据撷取模块231也会排除只有购买没有浏览其他商品的商品浏览记录,即,数据撷取模块231也会排除消费者没有经由比较该商品类别的多个商品便直接购买一商品的行为。如此一来,数据撷取模块231可过滤较不可被用来分析决策因素的的购买/浏览行为。
在辨识出多个商品序列后,请再参照图2B,在步骤S222中,决策因素管理模块232根据所述多个商品序列中各自的所述一或多个未购买商品与所述购买商品来获得分别对应所述多个商品序列的多个特征组,其中每一个特征组包括多个特征及分别对应所述多个特征的多个特征值。
详细来说,以对应消费者30的商品序列PS1为例子,决策因素管理模块232指示数据撷取模块231根据所读取的所述多个商品数据与商品序列PS1(也称,第一商品序列)撷取对应购买商品PC(也称,第一购买商品)的第一商品信息组,并且根据所述多个商品数据与所述第一商品序列PS1撷取分别对应所述一或多个第一未购买商品(即,未购买商品PA、PB)的第二商品信息组,其中每一个第一商品信息组具有不同的多个第一商品信息,并且每一个第二商品信息组具有不同的多个第二商品信息。
举例来说,数据撷取模块231可从所述商品数据库132中找寻对应购买商品PC的商品数据。具体来说,若所述商品数据已经依据特定的数据结构而储存在商品数据库132中,则数据撷取模块231可直接找寻对应购买商品PC的商品本身的规格数据(例如,购买商品PC的重量、价格、成份等商品本身的商品信息),并且直接找寻对应购买商品PC的商品页面的规格数据(如,购买商品PC的商品页面的配色、广告图片张数、描述内容的长短、是否免运费等购买商品PC的网页或本身规格之外的商品信息)。
若所述商品数据并不是依据特定的数据结构而储存在商品数据库132中(如,商品数据库132仅储存了用以展览购买商品PC的网页数据(半结构化/非结构化商品数据)),数据撷取模块231会从商品数据库132中对应购买商品PC的半结构化/非结构化商品数据来撷取购买商品PC的多个商品信息。例如,数据撷取模块231将购买商品PC的半结构化商品数据进行特征萃取,以获得对应的多个商品信息。又例如,数据撷取模块231将购买商品PC的非结构化商品数据视为一个文本,透过文字探勘后以便取得每个商品的多个代表字集,再透过独热编码(one-hot encoding)转成多个二元编码,再根据二元编码来辨识对应的多个商品信息。应注意的是,本发明并不限定于上述对非结构化商品数据来撷取商品信息的方式。
图4是根据本发明的一实施例所绘示的计算稀有值的示意图。请参照图4,(如,图4中的表格410所绘示)假设商品类型为“沐浴乳”,并且数据撷取模块231所撷取的购买商品PC的商品信息组(也称,第一商品信息组)为[润肤(1)、滑顺(1)、弱酸(1)、美白(1)、天然(1)](位值“1”用以表示具备对应的商品信息/特征),其中多个商品信息(也称,第一商品信息)分别为润肤(1)、滑顺(1)、弱酸(1)、美白(1)、天然(1)。第一商品信息组用以表示购买商品PC具有润肤、滑顺、弱酸、美白、天然,5种商品信息(也可视为购买商品PC具有5种特征,分别为润肤、滑顺、弱酸、美白、天然)。此外,假设数据撷取模块231所撷取的未购买商品PA的商品信息组(也称,第二商品信息组)为[润肤(1)、滑顺(0)、弱酸(0)、美白(1)、天然(0)](位值“0”用以表示不具备对应的商品信息/特征),其中多个商品信息(也称,第二商品信息)分别为润肤(1)、滑顺(0)、弱酸(0)、美白(1)、天然(0);所撷取的未购买商品PB的商品信息组(也称,第二商品信息组)为[润肤(1)、滑顺(1)、弱酸(0)、美白(0)、天然(1)],其中多个商品信息(也称,第二商品信息)分别为润肤(1)、滑顺(1)、弱酸(0)、美白(0)、天然(1)。换言之,决策因素管理模块232会以购买商品PC所具有的多个第一商品信息为主,来辨识未购买商品PA、PB是否也具有所述多个第一商品信息。应注意的是,多个第一商品信息被视为代表商品序列PS1的多个商品信息,即,决策因素管理模块232会认为商品序列PS1的商品的特征可利用第一商品信息“润肤”、“滑顺”、“弱酸”、“美白”、“天然”来表示。
在撷取分别对应未购买商品PA、PB与购买商品PC的第二商品信息组与第一商品信息组后,决策因素管理模块232经由比较分别对应第一未购买商品PA、PB的第二商品信息组的所述多个第二商品信息(即,未购买商品PA、PB的多个商品信息)与所述多个第一商品信息(即,购买商品PC的多个商品信息)来计算分别对应所述第一商品信息的多个稀有值。换言之,决策因素管理模块232会进一步根据第一商品信息出现在未购买商品PA、PB与购买商品PC的次数与第一商品信息出现在对应商品类别“沐浴乳”所有商品的次数来计算所述第一商品信息各自的稀有值。
详细来说,在上述的例子中,决策因素管理模块232会统计每个商品信息出现在其所属商品序列中的次数(如,箭头A41所示)。举例来说,决策因素管理模块232可将对应未购买商品PA、PB与购买商品PC的所有商品信息及对应的位值整理如表格410。接着,决策因素管理模块232会分别统计每个商品信息出现在商品序列PS1中的次数。在上述例子中,由于商品信息“润肤”出现了3次(未购买商品PA、PB与购买商品PC皆具有商品信息“润肤”);商品信息“滑顺”出现了2次(未购买商品PB与购买商品PC皆具有商品信息“滑顺”);商品信息“弱酸”出现了1次;商品信息“美白”出现了2次;商品信息“天然”出现了2次。决策因素管理模块232会整理上述的统计结果(如,表格420所示)。
此外,决策因素管理模块232会辨识每个商品信息出现在该商品类别中所有商品的出现频率(如,箭头A42所示)。举例来说,接续上述例子,决策因素管理模块232会计算从对应商品类别“沐浴乳”的所有商品所撷取出的多个商品信息中商品信息“润肤”、“滑顺”、“弱酸”、“美白”、“天然”出现的频率。为了方便说明,假设商品类别“沐浴乳”共具有100个商品,并且在此100商品所撷取的多个商品信息中,商品信息“润肤”出现了40次;商品信息“滑顺”出现了20次;商品信息“弱酸”出现了20次;商品信息“美白”出现了10次;商品信息“天然”出现了30次。据此,决策因素管理模块232会计算出对应的出现频率为(如,表格430所示)商品信息“润肤”的出现频率为100/40;商品信息“滑顺”的出现频率为100/20;商品信息“弱酸”的出现频率为100/20;商品信息“美白”的出现频率为100/10;商品信息“天然”的出现频率为100/30。
接着,决策因素管理模块232可依据每个商品信息出现在其所属商品序列中的次数与每个商品信息出现在该商品类别中所有商品的出现频率来计算稀有值(如,箭头A43所示)。计算稀有值的目的在于本发明的精神在于消费者在挑选商品至购买商品的这段过程,其所挑选的商品信息出现次数越多,可表示消费者对于这个商品的这个商品信息十分的在意(此商品信息是消费者所必定选择的);若商品信息出现的次数较少,表示消费者是在比较次要多的商品信息的重要性。在一些情况下,一商品序列的多个浏览商品中被消费者购买的购买商品有很大的机率会包含有其他非购买商品所不具有的商品信息(仅存在于购买商品的特定商品信息,此商品便可视为有价值且稀有)。故商品信息的稀有值必须要符合一组由小至大排序的序列(在另一实施例,也可由大至小排序)。此外,本发明精神还在于,有价值的(较会影响消费者是否购买此商品)稀有值将会落在该组序列的头段(排列在较前方的稀有值)与尾段(排列在较后方的稀有值)。因此本案的稀有值计算即是要找出一组有排序过的序列,再藉由(经由特征转换)此稀有值序列来取得位于头段与尾段的商品信息。稀有值的计算方式为,将该商品信息的所述次数的倒数乘以该商品信息的所述出现频率的Log值所获得的积作为该商品信息的稀有值。接续上述的例子,(如,表格440所示)所计算出的商品信息“润肤”的稀有值为0.13(即,(1/3)*log(100/40));商品信息“滑顺”的稀有值为0.34(即,(1/2)*log(100/20));商品信息“弱酸”的稀有值为0.69(即,(1/1)*log(100/20));商品信息“美白”的稀有值为0.5(即,(1/2)*log(100/10));商品信息“天然”的稀有值为0.26(即,(1/2)*log(100/30))。应注意的是,本发明并不限定于上述稀有值的计算方式。例如,在其他实施例中,可利用其他表达式来根据一商品信息出现于商品序列中的所有商品的出现次数与所述商品信息所出现在电商网站的所述商品类型的所有商品的出现次数计算出其他形式的稀有值,此稀有值可反映出其对应的商品信息于商品序列中所有商品的出现的次数与在电商网站的所述商品类型的所有商品的出现次数的关系。例如,其他实施例中,可将所述商品信息的所述次数的所述倒数直接乘以所述商品信息的所述出现频率所获得的积。
决策因素管理模块232可更将所计算出的多个稀有值进行排序(如,箭头A44所示),即,将代表商品序列PS1的第一商品信息经由各自的稀有值来进行排序(如,表格450所示)。
在计算出第一商品信息各自的稀有值后,决策因素管理模块232根据所述多第一商品信息与分别对应的所述多个稀有值执行一特征转换,以转换所述多个稀有值为对应第一商品序列的第一特征组的多个第一特征值,其中决策因素管理模块232将该些第一商品信息作为该第一特征组的多个第一特征。
图5是根据本发明的一实施例所绘示的特征转换操作的示意图。在计算出稀有值后,决策因素管理模块232会更进一步对第一商品序列PS1的多个第一商品信息的多个稀有值进行特征转换操作(如,箭头A51所示),以猜测所述多个第一商品信息各自影响购买商品PC被购买的程度。
具体来说,决策因素管理模块232透过曲线方程式,将已排序的多个稀有值(如,表格450所示)转换为特征值,其中靠近左右两侧的稀有值所转换的特征值较大,中间的稀有值所转换的特征值最小。换言之,经过特征转换后,原本排序在中间的第一商品信息所对应的特征值会成为最小的特征值,并且原本排序在前后两端的第一商品信息所对应的特征值会成为最大或次大的特征值。也就是说,特征转换的精神在于猜测稀有值最小的商品信息是一定必备的该商品类型的特征,并且稀有值最大的商品信息是最影响的该商品类型的商品是否会被购买的特征。此外,稀有值在中间区段的商品信息是相较之下没有影响力的特征。
更详细来说,首先,决策因素管理模块232从所述多个稀有值中选择一基准稀有值,其中所述基准稀有值小于所述多个稀有值中的最大稀有值且大于所述多个稀有值中的最小稀有值。例如,决策因素管理模块232选择中间区段的第一商品信息“滑顺”的稀有值为基准稀有值,其值为0.34。换言之,基准稀有值会从最中间或是次中间的稀有值中来进行挑选。
接着,决策因素管理模块232将基准稀有值作为一曲线方程式的一参数,将所述多个稀有值全部输入至该曲线方程式以输出分别对应所述稀有值的所述多个特征值(也称,第一特征值),其中基准稀有值被转换为所述多个第一特征值中的最小的第一特征值,最大稀有值被转换为所述多个第一特征值中的最大者与次大者的其中之一,并且最小稀有值被转换为所述多个第一特征值中的最大者与次大者的其中另一。所述曲线方程式包括输出值、输入值、参数、第一预设常数与第二预设常数,所述输出值藉由所述多个输入值、所述参数、所述第一预设常数与所述第二预设常数之间的运算所获得,其中在上述将所述多个稀有值输入至所述曲线方程式以输出分别对应所述多个稀有值的所述多个第一特征值的步骤包括将每一个稀有值设定为所述输入值且将所选择的基准稀有值设定为所述参数,以获得对应每一个稀有值的输出值,其中分别对应所述多个稀有值的所述多个输出值为分别对应所述多个稀有值的所述多个第一特征值。
举例来说,请参照图5,在本实施例中,用以进行特征转换的曲线方程式(1)可为:
f(y)=B(x-A)2 (1)
其中,f(y)为所输出的特征值,x为所输入的稀有值,A为所选择的基准稀有值,B为大于零的预设常数(如,2或其他大于2的数值)。此外,在其他实施例中,曲线方程式中“(x-A)”的次方数也可大于2。
接续上述的例子(即,A=0.34;B=2),假设曲线方程式为f(y)=2(x-0.34)2,据此,可转换对应商品序列PS1的第一商品信息的稀有值的曲线510。曲线的横坐标为所输入的稀有值,纵坐标为对应输出的特征值。即,经由特征转换,第一商品信息的稀有值[0.13、0.26、0.34、0.5、0.69]会分别被转换为特征值[0.0882、0.0128、0、0.0512、0.0245](也称,第一特征值)。换言之,经由特征转换操作,如表格520所示,决策因素管理模块232可获得对应商品序列PS1的特征组(也称,第一特征组)。第一商品信息“润肤”、“滑顺”、“弱酸”、“美白”、“天然”成为第一特征组的多个第一特征,并且分别对应所转换的多个第一特征值。依此类推,决策因素管理模块232可获得分别对应所有所辨识出的多个商品序列的多个特征组。应注意的是,本发明并不限于上述例子中的曲线方程式。本领域人员应可藉由上述曲线方程式的启示设计出其他方程序,以转换稀有值为特征值。
在辨识出多个商品序列后,请再参照图2B,在步骤S223中,决策因素管理模块232根据对应所述商品类别的所述多个商品序列与所述多个特征组获得一特征序列。
图6是根据本发明的一实施例所绘示的计算特征序列的示意图。请参照图6,假设辨识出对应商品类型“沐浴乳”的商品序列共有M个,其中多个商品序列PS1、PS2...的特征组(及其中的特征/特征值)分别如表格610所绘示。决策因素管理模块232会针对对应于每个商品序列的每个特征来计算平均值。举例来说,针对特征“弱酸”,决策因素管理模块232会加总商品序列PS1、PS2...PSM共M个商品序列的特征“弱酸”的特征值,再将所获得的总和除以M,以获得对应特征“弱酸”的平均特征值。M为正整数。
在计算出每个特征的平均特征值后,决策因素管理模块232会根据分别对应所述多个特征的所述多个平均特征值,由大到小来排序对应所述商品类别的所述多个特征(如,箭头A61所示),以产生所述特征序列(如组件620所示),如,[天然(0.6031)、美白(0.4136)、润肤(0.2327)、滑顺(0.1231)、多个图片(0.0713)、弱酸(0.0321)、杀菌(0.0116)...]。
应注意的是,在本实施例中,当一商品序列没有一特征(也没有该特征的特征值)时,在计算该特征的平均特征值的操作中,会将该商品序列的该特征的该特征值视为0,以进行计算。例如,商品序列PS1的特征“杀菌”的特征值会被设定为0。
获得对应所述商品类型的所述特征序列后,决策因素管理模块232会进一步指示回归模型管理模块233利用回归模型来进行优化,以获得对应所述商品类型的决策因素。
具体来说,请再回到图2A,在步骤S23中,决策因素管理模块232根据所述特征序列、所述多个商品数据与回归模型获得对应所述商品类型的决策因素序列,其中在对应所述商品类型的所述决策因素序列的多个决策因素中排序最前面的一第一决策因素被判定为最影响所述商品类型的商品是否会被购买的所述商品的关键商品信息。
图2C是根据本发明的一实施例所绘示的图2A的步骤S23的流程图。详细来说,请参照图2C,步骤S23包括步骤S231、S232、S233。在步骤S231中,回归模型管理模块233选择所述特征序列中已排序的所述多个特征的前K个特征作为K个决策因素。
图7是根据本发明的一实施例所绘示的回归模型训练的示意图。请参照图7,假设K被设定为7,并且如组件620所示,对应所述商品类型的特征序列为[天然(0.6031)、美白(0.4136)、润肤(0.2327)、滑顺(0.1231)、多个图片(0.0713)、弱酸(0.0321)、杀菌(0.0116)...]。基此,从中所选择的7个决策因素为“天然”、“美白”、“润肤”、“滑顺”、“多个图片”、“弱酸”、“杀菌”。
接着,请再回到图2C,在步骤S232中,回归模型管理模块233根据所述K个决策因素与所述多个商品数据训练对应所述商品类型的一回归模型以获得一最佳回归模型(Optimized Regression Model),并且根据所述最佳回归模型获得分别对应所述K个决策因素的K个决策值,其中分别对应所述多个决策因素的所述多个决策值用以指示所对应的决策因素对于所述商品类型的商品是否会被购买的影响程度。
更详细来说,回归模型管理模块于步骤S232中会对回归模型执行留一法(Leave-One-Out)交叉验证操作来训练/验证回归模型,其包括下列步骤(1)至步骤(6)。
步骤(1),所述回归模型管理模块233根据所述多个商品序列的所述多个未购买商品与所述多个购买商品计算属于所述商品类别的多个第一目标商品的实际购买率。其中,所述多个第一目标商品的总数大于等于N。在此,N为预设的一正整数,用以决定训练样本的数目。
具体来说,回归模型管理模块233可根据所有购买历史数据与浏览历史数据来计算每个商品的实际购买率。在本实施例中,商品的实际购买率等所述商品的实际购买次数除以所述商品的实际浏览次数。举例来说,商品PC实际购买率即为商品PC于所有购买历史数据中的总购买次数除以所有浏览历史数据中的总浏览次数所获得的商。回归模型管理模块233可计算出所述商品类型的所有商品P1、P2、P3....(也称,第一目标商品)各自的实际购买率(如组件710所示)。
步骤(2),所述回归模型管理模块从所述多个第一目标商品中选择(N-1)个第二目标商品作为训练样本,并且根据所述K个决策因素与每一个第二目标商品的所有特征来辨识每一个第二目标商品的所述K个决策因素的位值。
具体来说,所述多个第一目标商品中用以进行回归模型训练的训练样本(也称,第二目标商品)的数量为(N-1)。接着,回归模型管理模块233可对每个第二目标商品的所有特征来与7个决策因素为“天然”、“美白”、“润肤”、“滑顺”、“多个图片”、“弱酸”、“杀菌”进行比对(比对每个第二目标商品是否有相同于所述7个决策因素的特征),以辨识出每个第二目标商品的7个决策因素的位值。例如,如组件710所示,对应所述7个决策因素,商品P2具有的特征(商品信息)为“天然”、“美白”、“润肤”、“滑顺”、“多个图片”、“杀菌”(位值为“1”),并且商品P2不具有的特征(商品信息)为“弱酸”(位值为“0”)。在辨识出所有第二目标商品(如,商品P2~PN)的7个决策因素的位值后,会接续步骤(3)。
步骤(3),所述回归模型管理模块233将所述(N-1)个第二目标商品中的每一个第二目标商品的所述K个决策因素的位值作为自变量(independent variable)且将所述(N-1)个第二目标商品中的每一个第二目标商品的实际购买率作为对应所述自变量的因变量(dependent variable)来输入至所述回归模型,以执行回归模型训练(如,箭头A71所示)。于本实施例中,采用梯度提升判定树(Gradient Boost Decision Tree,GBDT)回归模型720以预测获选率能力最高的回归模型参数组合。GBDT是一个透过不断迭代预测树的误差并按照梯度方向修正该误差且产生下一颗预测树的方法,GBDT一般可设定的参数为树的最大深度、最大叶节点数量、样本特征最大数量等。但,本发明并不限定于采用GBDT回归模型,例如,其他可以应用于本发明的回归模型可包括单变量线性(Univariate)回归模型、多变量线性(Multivariate)回归模型、随机森林(Random Forest)回归模型或XGBoost回归模型、或其他适合的回归模型。在经由(N-1)个第二目标商品的训练后,回归模型管理模块233会进行步骤(4),以验证训练后的回归模型是否为优化回归模型。
步骤(4),所述回归模型管理模块233从所述多个第一目标商品中选择所述(N-1)个第二目标商品以外的一第三目标商品作为验证样本来进行验证,将所述第三目标商品的所述K个决策因素的位值输入至所述回归模型,以输出所述第三目标商品的一预测购买率。
举例来说,所述回归模型管理模块233执行回归模型验证操作,选择第一目标商品中的商品P1(其并未在本次的训练过程中被选择为第二目标商品)作为第三目标商品,并且将商品P1的7个决策因素与对应的位值输入至训练后的GBDT回归模型720(如,箭头A72所示),以获得验证样本的预测购买率。即,训练后的GBDT回归模型720会根据所接收的验证样本P1的7个决策因素与对应的位值来预测(计算且输出)验证样本P1的预测购买率(如,箭头A73所示)。
接着,在步骤(5)中,所述回归模型管理模块233计算所述第三目标商品的所述预测购买率与所述实际购买率之间的差值作为对应所述第三目标商品的一误差值(如,箭头A74所示)。假设验证样本的预测购买率为0.25,则根据对应商品P1的实际购买率711与预测购买率,可计算出误差值为0.13(即,0.38-0.25)。
在一实施例中,所述回归模型管理模块233会比较所获得的误差值与预设的误差门坎值来判断回归模型是否完成训练。
例如,在接续的步骤(6)中,若所述误差值小于误差门坎值,所述回归模型管理模块判定所述回归模型已完成训练,将所述回归模型作为对应所述商品类型的所述最佳回归模型,并且结束训练对应所述商品类型的所述回归模型的整体操作。
若所述误差值不小于一误差门坎值,所述回归模型管理模块重新执行步骤(2),并且在重新执行的步骤(2)中,新的所选择的(N-1)个第二目标商品不完全相同于之前所选择的旧的所述(N-1)个第二目标商品。依此类推,直到所获得的误差值小于误差门坎值为止。
在本实施例中,若在重复执行N次回归模型验证操作后,误差值一直没有收敛(即,一直没有获得小于误差门坎值的误差值),则所述回归模型管理模块233可先调整该K的数值(可以调高或者调小K值),再重新执行步骤(2)至步骤(6)。应注意的是,在另一实施例中,在每次重新执行步骤(2)之前,所述回归模型管理模块233可决定是否先调整该K的数值,再重新执行步骤(2)至步骤(6)。
在另一实施例中,所述回归模型管理模块233会重复进行Q次的步骤(1)至步骤(5),以获得Q个误差值,并且求出此些Q个误差值的平均误差值,再比较平均误差值与误差门坎值,以根据比较结果来执行步骤(6)。
在实施例中,当获得最佳回归模型后,所述回归模型管理模块233会根据所述最佳回归模型获得分别对应所述K个决策因素的K个决策值。举例来说,经训练完成后的最佳回归模型可产生一组决策因素序列,包括K个决策因素与对应的K个决策值。接着,在步骤S233中,所述回归模型管理模块233会根据所述K个决策值由大至小排序所述K个决策因素,以产生对应所述商品类型的具有所述K个决策因素的一决策因素序列。如上所述,分别对应所述多个决策因素的所述多个决策值用以指示所对应的决策因素对于所述商品类型的商品是否会被购买的影响程度,即,在对应所述商品类型的所述决策因素序列的所述K个决策因素中排序最前面的第一决策因素会被判定为最影响所述商品类型的商品是否会被购买的所述商品的关键商品信息。
举例来说,所述回归模型管理模块233可从所述最佳回归模型中读取分别对应所述7个决策因素的7个决策值(如,箭头A75所示),并且排序为决策因素序列(也称,决策因素数据DD)为[天然(0.8)、美白(0.4)、润肤(0.2)、滑顺(0.15)、多个图片(0.1)、弱酸(0.05)、杀菌(0.01)](如组件730所示)。其中,排序在决策因素序列中最前面的决策因素“天然”为影响属于商品类别“沐浴乳”中的商品是否会被购买的最大因素,并且排序在其后的决策因素的对于属于商品类别“沐浴乳”中的商品是否会被购买的影响力会依据顺序递减。
如此一来,本发明所提供的决策因素分析方法与决策因素分析装置可分析出对于特定商品类型的多个决策因素,并且可知道所述多个决策因素各自的重要度(影响是否被购买的程度)。
依此类推,经由上述步骤S21~S23所执行的决策因素分析操作可分析出分别对应电商网站的多个商品类型的多组决策因素序列。在本实施例中,其中决策因素管理模块232会储存所产生的对应每个商品类别的决策因素序列至决策因素数据库234,其中决策因素数据库234包括分别对应多个商品类型的多个决策因素序列。应注意的是,决策因素数据库234也可储存分别对应所述多个商品类型的多个最佳回归模型。
在本实施例中,使用者也可应用所产生/储存的分别对应多个商品类型的多个决策因素序列。
图8是根据本发明的一实施例所绘示的显示对应所查询的商品类型的决策因素序列的示意图。具体来说,决策因素管理模块232经由输入/输出装置240接收查询QD,其中所述查询包括请求商品类型,并且决策因素管理模块232根据所述请求商品类型从决策因素数据库234中查找所储存的所述多个决策因素序列中对应所述请求商品类型的目标决策因素序列。决策因素管理模块232经由输入/输出装置240显示目标决策因素序列的多个目标决策因素。
举例来说,请参照图8,决策因素管理模块232可提供决策因素分析接口且经由输入/输出装置240(如,触控屏幕)显示所述决策因素分析接口。决策因素接口中具有一查询字段810,以让使用者可输入想要查询的请求商品类型(如,“沐浴乳”)。对应所输入的请求商品类型“沐浴乳”,决策因素管理模块232从决策因素数据库234中查找出对应的目标决策因素序列为[天然(0.8)、美白(0.4)、润肤(0.2)、滑顺(0.15)、多个图片(0.1)、弱酸(0.05)、杀菌(0.01)],并且决策因素管理模块232会经由触控屏幕显示其中的目标决策因素[天然、美白、润肤、滑顺、多个图片、弱酸、杀菌]。
在本实施例中,对应请求商品类型的目标决策因素序列可区分为对应商品规格特征的第一目标决策因素序列与对应商品展览特征的第二目标决策因素序列。其中,对应所述商品规格特征的所述第一目标决策序列的多个第一目标决策因素属于商品本身的规格的商品信息,并且对应所述商品展览特征的所述第二目标决策序列的多个第二目标决策因素属于电商网站的用以展览商品的网页的特征的商品信息。
举例来说,请参照图8区域820,由于所述目标决策因素[天然、美白、润肤、滑顺、多个图片、弱酸、杀菌]中对应商品规格特征的第一目标决策序列为[天然、美白、润肤、滑顺、弱酸、杀菌],并且对应商品展览特征的第二目标决策序列为[多个图片]。因此,如区域820所示,决策因素管理模块232会显示分别对应商品规格特征与商品展览特征的第一目标决策因素与第二目标决策因素。
此外,用户也可经由决策因素分析接口来直接浏览所述电商网站。在经由决策因素分析接口浏览所述电商网站的商品页面(如区域830)时,决策因素管理模块232辨识商品页面830所显示的展览商品(如,商品P1、P2、P3、P4)。接着,决策因素管理模块232根据所读取的商品数据PID与展览商品P1~P4,来分别辨识每个展览商品P1~P4的多个第一展览商品信息。若每个展览商品P1~P4的所述第一展览商品信息中的一或多个第二展览商品信息相同于目标决策因素序列的所述多个目标决策因素的其中之一,决策因素管理模块232经由该输入/输出装置240显示所述一或多个第二展览商品信息于商品页面830中对应展览商品的区域内。
例如,商品P1的所有商品信息(即,第一展览商品信息)中相同于所述目标决策因素[天然、美白、润肤、滑顺、多个图片、弱酸、杀菌]的商品信息(即,第二展览商品信息)为“天然”、“润肤”、“弱酸”。如组件830所示,决策因素管理模块232便会显示文字“天然”、“润肤”、“弱酸”于商品P1上。
此外,在本实施例中,每个展览商品的所述一或多个第二展览商品信息会根据商品规格特征与商品展览特征被显示。举例来说,商品P2的所有商品信息中相同于对应商品规格特征的第一目标决策因素[天然、美白、润肤、滑顺、弱酸、杀菌]的商品信息(即,第二展览商品信息)为“天然”、“美白”、“润肤”、“滑顺”、“杀菌”,并且商品P2的所有商品信息中相同于对应商品展览特征的第二目标决策因素[多个图片]的商品信息(即,第二展览商品信息)为“多个图片”。如组件830所示,决策因素管理模块232便会分别显示文字“天然”、“美白”、“润肤”、“滑顺”、“杀菌”与文字“多个图片”于商品P2上,以让使用者可清楚辨识商品P2所具有的分别对应商品规格特征与商品展览特征的决策因素/商品信息。
在一实施例中,当查询更包括一或多个查询商品信息时,回归模型管理模块233根据所述多个最佳回归模型中对应所述请求商品类型的最佳回归模型(也称,请求最佳回归模型)与所述一或多个查询商品信息计算对应所述一或多个查询商品信息与所述请求商品类型的预测购买率。决策因素管理模块232经由该输入/输出装置240显示对应所述一或多个查询商品信息与所述请求商品类型的所述预测购买率。
图9是根据本发明的一实施例所绘示的显示对应所查询的商品类型的决策因素序列与对应所查询的多个商品信息的预测购买率的示意图。请参照图9,决策因素分析接口也可提供输入所述一或多个查询商品信息的字段。如区域910、920所示的分别对应商品规格特征与商品展览特征的所述一或多个查询商品信息。使用者可输入欲查询的请求商品类型(如,“沐浴乳”)及选择欲设计的商品的所述一或多个查询商品信息,并且当用户完成输入时,回归模型管理模块233会查找对应商否类型“沐浴乳”的最佳回归模型,并且实时地将所述一或多个查询商品信息输入至所述最佳回归模型,以获得对应的预测购买率R。决策因素分析接口可显示所获得的对应所述一或多个查询商品信息与所述请求商品类别的预测购买率R(如组件930所示)。如此一来,使用者(如,商品PM或是卖家)可藉由输入请求商品类别、输入查询商品信息及所对应产生的预测购买率来设计属于所述请求商品类别的商品规格或/及用以展览商品的商品网页。
应注意的是,图9所绘示的经由选择操作来输入所述一或多个查询商品信息的方式仅为示例性的,并不限定本发明。例如,在另一实施例中,使用者可直接输入所述一或多个查询商品信息的文字于决策因素分析接口中用以接收所述一或多个查询商品信息的输入的字段内。
综上所述,本发明的实施例所提供的决策因素分析装置与决策因素分析方法,可藉由电商网站的多个消费者的对应一特定商品类型的多个浏览历史记录与多个购买历史记录来辨识对应该特定商品类型的多个商品序列,根据对应所述多个商品序列中未被购买及被购买的商品的多个商品信息与回归模型以分析影响所述特定商品类型的商品是否被购买的多个决策因素,并且可预测对应该特定商品类型的一或多个商品信息所导致的购买率,进而可提供参考信息来设计可吸引购买的所述特定商品类型的商品及设计出吸引消费者购买的对应特定商品类型的网页。如此一来,贩卖商品的相关人员可据此更进一步地下架(停止贩卖)较低购买率的商品,增加较高购买率的商品的上架,修改对应特定商品类型的营销策略与物流系统。
以上对本公开的实施例进行了描述。但是,这些实施例仅仅是为了说明的目的,而并非为了限制本公开的范围。尽管在以上分别描述了各实施例,但是这并不意味着各个实施例中的措施不能有利地结合使用。本公开的范围由所附权利要求及其等同物限定。不脱离本公开的范围,本领域技术人员可以做出多种替代和修改,这些替代和修改都应落在本公开的范围之内。
Claims (30)
1.一种决策因素分析装置,其特征在于,所述决策因素分析装置包括:
通信电路单元,用以连接至电商网站的电商服务器;
存储装置,用以储存多个程序代码模块;以及
处理器,其中该处理器用以存取且执行该些程序代码模块,以执行对应商品类型的决策因素分析操作,其中该些程序代码模块包括,
数据撷取模块,用以自该电商服务器读取多个商品数据与分别对应多个消费者的多个浏览历史数据与多个购买历史数据;
决策因素管理模块,用以管理该决策因素分析操作;以及
回归模型管理模块,用以训练回归模型,
其中该决策因素管理模块根据该商品类型从该些浏览历史数据与该些购买历史数据中获得对应该商品类型的特征序列,
其中该决策因素管理模块根据该特征序列、该些商品数据与回归模型获得对应该商品类型的决策因素序列,其中在对应该商品类型的该决策因素序列的多个决策因素中排序最前面的第一决策因素被判定为最影响该商品类型的商品是否会被购买的关键商品信息。
2.根据权利要求1所述的决策因素分析装置,其中在该决策因素管理模块根据该商品类型从该些浏览历史数据与该些购买历史数据中获得对应该商品类型的该特征序列的操作中,
该决策因素管理模块根据该商品类型指示该数据撷取模块从对应该些消费者的该些浏览历史数据与该些购买历史数据中辨识对应该商品类型的多个商品序列,其中每一个商品序列包括属于该商品类型的分别对应该些消费者的多个已浏览商品,其中该些已浏览商品包括一或多个未购买商品与购买商品,
其中该决策因素管理模块根据该些商品序列中各自的所述一或多个未购买商品与该购买商品来获得分别对应该些商品序列的多个特征组,其中每一个特征组包括多个特征及分别对应该些特征的多个特征值,
其中该决策因素管理模块根据对应该商品类别的该些商品序列与该些特征组获得特征序列。
3.根据权利要求2所述的决策因素分析装置,其中在上述该决策因素管理模块根据该商品类型指示该数据撷取模块从对应该些消费者的该些浏览历史数据与该些购买历史数据中辨识对应该商品类型的该些商品序列的操作中,
针对该些消费者中的第一消费者,该数据撷取模块从对应该第一消费者的第一浏览历史数据中选择在N天内的第一近期浏览历史数据,并且从对应该第一消费者的第一购买历史数据中选择在N天内的第一近期购买历史数据,
其中该数据撷取模块从该第一近期浏览历史数据中辨识出该第一消费者所浏览的对应该商品类型的多个第一已浏览商品,并且根据该第一近期购买历史数据辨识该些第一已浏览商品中的第一购买商品,其中该些第一已浏览商品中非该第一购买商品的一或多个其他已浏览商品为一或多个第一非购买商品,其中该第一购买商品表示该第一消费者浏览该些第一已浏览商品后从该些第一已浏览商品中所选择以购买的商品,
其中该数据撷取模块将该第一购买商品与所述一或多个第一非购买商品作为对应该商品类别的第一商品序列。
4.根据权利要求3所述的决策因素分析装置,其中在上述该决策因素管理模块根据该些商品序列中各自的所述一或多个未购买商品与该购买商品来获得分别对应该些商品序列的多个特征组的操作中,
该决策因素管理模块指示该数据撷取模块根据该些商品数据与该第一商品序列撷取对应该第一购买商品的第一商品信息组,并且根据该些商品数据与该第一商品序列撷取分别对应所述一或多个第一未购买商品的第二商品信息组,其中该第一商品信息组具有不同的多个第一商品信息,并且每一个第二商品信息组具有不同的多个第二商品信息,
该决策因素管理模块经由比较分别对应所述一或多个第一未购买商品的该第二商品信息组的该些第二商品信息与该些第一商品信息来计算分别对应该些第一商品信息的多个稀有值,
该决策因素管理模块根据该些第一商品信息与对应的该些稀有值执行特征转换,以转换该些稀有值为对应该第一商品序列的第一特征组的多个第一特征值,其中该决策因素管理模块将该些第一商品信息作为该第一特征组的多个第一特征。
5.根据权利要求4所述的决策因素分析装置,其中在上述该决策因素管理模块根据该些第一商品信息与对应的该些稀有值执行该特征转换,以转换该些稀有值为对应该第一商品序列的第一特征组的该些第一特征值的操作中,
该决策因素管理模块从该些稀有值中选择基准稀有值,其中该基准稀有值小于该些稀有值中的最大稀有值且大于该些稀有值中的最小稀有值,
该决策因素管理模块将该基准稀有值作为曲线方程式的参数,将该些稀有值输入至该曲线方程式以输出分别对应该些稀有值的该些第一特征值,其中该基准稀有值被转换为该些第一特征值中的最小的第一特征值,该最大稀有值被转换为该些第一特征值中的最大者与次大者的其中之一,并且该最小稀有值被转换为该些第一特征值中的最大者与次大者的其中另一。
6.根据权利要求5所述的决策因素分析装置,其中该曲线方程式包括输出值、输入值、该参数、第一预设常数与第二预设常数,
其中该输出值藉由该输入值、该参数、该第一预设常数与该第二预设常数之间的运算所获得,其中在上述将该些稀有值输入至该曲线方程式以输出分别对应该些稀有值的该些第一特征值的步骤包括将每一该些稀有值设定为该输入值且将所选择的基准稀有值设定为该参数,以获得对应每一该些稀有值的输出值,其中分别对应该些稀有值的该些输出值为分别对应该些稀有值的该些第一特征值。
7.根据权利要求4所述的决策因素分析装置,其中在上述该决策因素管理模块根据对应该商品类别的该些商品序列与该些特征组获得该特征序列的操作中,
该决策因素管理模块根据对应该商品类别的该些特征组的该些特征与分别对应该些特征的特征值来计算每一个特征的平均特征值,
其中该决策因素管理模块根据分别对应该些特征的该些平均特征值由大到小来排序对应该商品类别的该些特征,以产生该特征序列。
8.根据权利要求1所述的决策因素分析装置,其中在该决策因素管理模块根据该特征序列、该些商品数据与该回归模型获得对应该商品类型的该决策因素序列的操作中,
该回归模型管理模块选择该特征序列中已排序的该些特征的前K个特征作为K个决策因素,
其中该回归模型管理模块根据所述K个决策因素与该些商品数据训练对应该商品类型的该回归模型以获得一最佳回归模型,并且根据该最佳回归模型获得分别对应所述K个决策因素的K个决策值,
其中该决策因素管理模块根据所述K个决策值由大至小排序所述K个决策因素,以产生对应该商品类型的具有所述K个决策因素的该决策因素序列。
9.根据权利要求8所述的决策因素分析装置,其中在上述该回归模型管理模块根据所述K个决策因素与该些商品数据训练对应该商品类型的该回归模型以获得该最佳回归模型的操作中,该回归模型管理模块执行下列步骤:
(1)该回归模型管理模块根据该些商品序列的该些未购买商品与该些购买商品计算属于该商品类别的多个第一目标商品的实际购买率,其中该些第一目标商品的总数大于等于N;
(2)该回归模型管理模块从该些第一目标商品中选择N-1个第二目标商品作为训练样本,并且根据所述K个决策因素与每一个第二目标商品的所有特征来辨识每一个第二目标商品的所述K个决策因素的位值;
(3)该回归模型管理模块将所述N-1个第二目标商品中的每一个第二目标商品的所述K个决策因素的位值作为自变量且将所述N-1个第二目标商品中的每一个第二目标商品的实际购买率作为对应该自变量的因变量来输入至该回归模型,以训练该回归模型;
(4)该回归模型管理模块从该些第一目标商品中选择所述N-1个第二目标商品以外的第三目标商品作为验证样本来进行验证,将该第三目标商品的所述K个决策因素的位值输入至该回归模型,以输出该第三目标商品的预测购买率;
(5)该回归模型管理模块计算该第三目标商品的该预测购买率与该实际购买率之间的差值作为对应该第三目标商品的误差值;以及
(6)若该误差值小于误差门坎值,该回归模型管理模块判定该回归模型已完成训练,将该回归模型作为对应该商品类型的该最佳回归模型,并且结束训练对应该商品类型的该回归模型的整体操作,
其中若该误差值不小于误差门坎值,该回归模型管理模块重新执行步骤(2),并且在重新执行的步骤(2)中,新的所选择的N-1个第二目标商品不完全相同于之前所选择的旧的所述N-1个第二目标商品。
10.根据权利要求9所述的决策因素分析装置,其中在重新执行步骤(2)之前,该回归模型管理模块先调整该K的数值,再重新执行步骤(2)。
11.根据权利要求10所述的决策因素分析装置,其中该回归模型包括梯度提升判定树回归模型、单变量线性回归模型、多变量线性回归模型、随机森林回归模型或XGBoost回归模型。
12.根据权利要求1所述的决策因素分析装置,其中所述决策因素分析装置更包括输入/输出装置,其中该决策因素管理模块储存所产生的对应该商品类别的该决策因素序列至决策因素数据库,其中该决策因素数据库包括分别对应多个商品类型的多个决策因素序列,
其中该决策因素管理模块经由该输入/输出装置接收查询,其中该查询包括请求商品类型,并且根据该请求商品类型从该决策因素数据库中查找该些决策因素序列中对应该请求商品类型的目标决策因素序列,
其中该决策因素管理模块经由该输入/输出装置显示该目标决策因素序列的多个目标决策因素。
13.根据权利要求12所述的决策因素分析装置,
其中在浏览该电商网站的商品页面时,该决策因素管理模块辨识该商品页面所显示的展览商品,
该决策因素管理模块根据该些商品数据与该展览商品,辨识该展览商品的多个第一展览商品信息,
其中若该些第一展览商品信息中的一或多个第二展览商品信息相同于该目标决策因素序列的所述多个目标决策因素的其中之一或多个目标决策因素,该决策因素管理模块经由该输入/输出装置显示所述一或多个第二展览商品信息于该商品页面中对应该展览商品的区域内。
14.根据权利要求13所述的决策因素分析装置,其中对应该请求商品类型的该目标决策因素序列可区分为对应商品规格特征的第一目标决策因素序列与对应商品展览特征的第二目标决策因素序列,其中对应该商品规格特征的该第一目标决策序列的多个第一目标决策因素属于商品本身的规格的商品信息,并且对应该商品展览特征的该第二目标决策序列的多个第二目标决策因素属于该电商网站的用以展览商品的页面的特征的商品信息,
其中在上述该决策因素管理模块经由该输入/输出装置显示该目标决策因素序列的操作中,
该决策因素管理模块经由该输入/输出装置分别显示该些第一目标决策因素与该些第二目标决策因素,
其中所述一或多个第二展览商品信息根据该商品规格特征与该商品展览特征被显示。
15.根据权利要求12所述的决策因素分析装置,其中该决策因素数据库更包括分别对应所述多个商品类型的多个最佳回归模型,
其中当该查询更包括一或多个查询商品信息时,该回归模型管理模块根据该些最佳回归模型中对应该请求商品类型的请求最佳回归模型与所述一或多个查询商品信息计算对应所述一或多个查询商品信息与该请求商品类型的预测购买率,
其中该决策因素管理模块经由该输入/输出装置显示对应所述一或多个查询商品信息与该请求商品类型的该预测购买率。
16.一种决策因素分析方法,其特征在于,所述方法包括:
自电商网站的电商服务器读取多个商品数据与分别对应多个消费者的多个浏览历史数据与多个购买历史数据;
根据一商品类型从该些浏览历史数据与该些购买历史数据中获得对应该商品类型的特征序列;以及
根据该特征序列、该些商品数据与回归模型获得对应该商品类型的决策因素序列,其中在对应该商品类型的该决策因素序列的多个决策因素中排序最前面的第一决策因素被判定为最影响该商品类型的商品是否会被购买的关键商品信息。
17.根据权利要求16所述的决策因素分析方法,其中上述根据该商品类型从该些浏览历史数据与该些购买历史数据中获得对应该商品类型的该特征序列的步骤包括:
根据该商品类型从对应该些消费者的该些浏览历史数据与该些购买历史数据中辨识对应该商品类型的多个商品序列,其中每一个商品序列包括属于该商品类型的分别对应该些消费者的多个已浏览商品,其中该些已浏览商品包括一或多个未购买商品与购买商品;
根据该些商品序列中各自的所述一或多个未购买商品与该购买商品来获得分别对应该些商品序列的多个特征组,其中每一个特征组包括多个特征及分别对应该些特征的多个特征值;以及
根据对应该商品类别的该些商品序列与该些特征组获得特征序列。
18.根据权利要求17所述的决策因素分析方法,其中上述根据该商品类型从对应该些消费者的该些浏览历史数据与该些购买历史数据中辨识对应该商品类型的多个商品序列的步骤包括:
针对该些消费者中的第一消费者,从对应该第一消费者的第一浏览历史数据中选择在N天内的第一近期浏览历史数据,并且从对应该第一消费者的第一购买历史数据中选择在N天内的第一近期购买历史数据;
从该第一近期浏览历史数据中辨识出该第一消费者所浏览的对应该商品类型的多个第一已浏览商品,并且根据该第一近期购买历史数据辨识该些第一已浏览商品中的第一购买商品,其中该些第一已浏览商品中非该第一购买商品的一或多个其他已浏览商品为一或多个第一非购买商品,其中该第一购买商品表示该第一消费者浏览该些第一已浏览商品后从该些第一已浏览商品中所选择以购买的商品;以及
将该第一购买商品与所述一或多个第一非购买商品作为对应该商品类别的第一商品序列。
19.根据权利要求17所述的决策因素分析方法,其中上述根据该些商品序列中各自的所述一或多个未购买商品与该购买商品来获得分别对应该些商品序列的多个特征组的步骤包括:
根据该些商品数据与该第一商品序列撷取对应该第一购买商品的第一商品信息组,并且根据该些商品数据与该第一商品序列撷取分别对应所述一或多个第一未购买商品的第二商品信息组,其中该第一商品信息组具有不同的多个第一商品信息,并且每一个第二商品信息组具有不同的多个第二商品信息;
经由比较分别对应所述一或多个第一未购买商品的该第二商品信息组的该些第二商品信息与该些第一商品信息来计算分别对应该些第一商品信息的多个稀有值;以及
根据该些第一商品信息与对应的该些稀有值执行特征转换,以转换该些稀有值为对应该第一商品序列的第一特征组的多个第一特征值,其中该些第一商品信息为该第一特征组的多个第一特征。
20.根据权利要求19所述的决策因素分析方法,其中上述根据该些第一商品信息与对应的该些稀有值执行特征转换,以转换该些稀有值为对应该第一商品序列的第一特征组的多个第一特征值的步骤包括:
从该些稀有值中选择基准稀有值,其中该基准稀有值小于该些稀有值中的最大稀有值且大于该些稀有值中的最小稀有值;以及
将该基准稀有值作为曲线方程式的参数,将该些稀有值输入至该曲线方程式以输出分别对应该些稀有值的该些第一特征值,其中该基准稀有值被转换为该些第一特征值中的最小的第一特征值,该最大稀有值被转换为该些第一特征值中的最大者与次大者的其中之一,并且该最小稀有值被转换为该些第一特征值中的最大者与次大者的其中另一。
21.根据权利要求20所述的决策因素分析方法,其中该曲线方程式包括输出值、输入值、该参数、第一预设常数与第二预设常数,
其中该输出值藉由该输入值、该参数、该第一预设常数与该第二预设常数之间的运算所获得,其中在上述将该些稀有值输入至该曲线方程式以输出分别对应该些稀有值的该些第一特征值的步骤包括将每一该些稀有值设定为该输入值且将所选择的基准稀有值设定为该参数,以获得对应每一该些稀有值的输出值,其中分别对应该些稀有值的该些输出值为分别对应该些稀有值的该些第一特征值。
22.根据权利要求18所述的决策因素分析方法,其中上述根据对应该商品类别的该些商品序列与该些特征组获得该特征序列的步骤包括:
根据对应该商品类别的该些特征组的该些特征与分别对应该些特征的特征值来计算每一个特征的平均特征值;以及
根据分别对应该些特征的该些平均特征值由大到小来排序对应该商品类别的该些特征,以产生该特征序列。
23.根据权利要求16所述的决策因素分析方法,其中上述根据该特征序列、该些商品数据与该回归模型获得对应该商品类型的该决策因素序列的步骤包括:
选择该特征序列中已排序的该些特征的前K个特征作为K个决策因素;
根据所述K个决策因素与该些商品数据训练对应该商品类型的该回归模型以获得最佳回归模型,并且根据该最佳回归模型获得分别对应所述K个决策因素的K个决策值;以及
根据所述K个决策值由大至小排序所述K个决策因素,以产生对应该商品类型的具有所述K个决策因素的该决策因素序列。
24.根据权利要求23所述的决策因素分析方法,其中上述根据所述K个决策因素与该些商品数据训练对应该商品类型的该回归模型以获得该最佳回归模型的步骤包括:
(1)根据该些商品序列的该些未购买商品与该些购买商品计算属于该商品类别的多个第一目标商品的实际购买率,其中该些第一目标商品的总数大于等于N;
(2)从该些第一目标商品中选择N-1个第二目标商品作为训练样本,并且根据所述K个决策因素与每一个第二目标商品的所有特征来辨识每一个第二目标商品的所述K个决策因素的位值;
(3)将所述N-1个第二目标商品中的每一个第二目标商品的所述K个决策因素的位值作为自变量且将所述N-1个第二目标商品中的每一个第二目标商品的实际购买率作为对应该自变量的因变量来输入至该回归模型,以训练该回归模型;
(4)从该些第一目标商品中选择所述N-1个第二目标商品以外的第三目标商品作为验证样本来进行验证,将该第三目标商品的所述K个决策因素的位值输入至该回归模型,以输出该第三目标商品的预测购买率;
(5)计算该第三目标商品的该预测购买率与该实际购买率之间的差值作为对应该第三目标商品的误差值;以及
(6)若该误差值小于误差门坎值,判定该回归模型已完成训练,将该回归模型作为对应该商品类型的该最佳回归模型,并且结束训练对应该商品类型的该回归模型的整体操作,
其中若该误差值不小于误差门坎值,重新执行步骤(2),并且在重新执行的步骤(2)中,新的所选择的N-1个第二目标商品不完全相同于之前所选择的旧的所述N-1个第二目标商品。
25.根据权利要求24所述的决策因素分析方法,其中在重新执行步骤(2)之前,上述根据所述K个决策因素与该些商品数据训练对应该商品类型的该回归模型,以获得该最佳回归模型的步骤更包括先调整该K的数值,再重新执行步骤(2)。
26.根据权利要求24所述的决策因素分析方法,其中该回归模型包括梯度提升判定树回归模型、单变量线性回归模型、多变量线性回归模型、随机森林回归模型或XGBoost回归模型。
27.根据权利要求16所述的决策因素分析方法,更包括:
储存所产生的对应该商品类别的该决策因素序列至决策因素数据库,其中该决策因素数据库包括分别对应多个商品类型的多个决策因素序列;
接收查询,其中该查询包括请求商品类型,并且根据该请求商品类型从该决策因素数据库中查找对应该请求商品类型的目标决策因素序列;以及
显示该目标决策因素序列的多个目标决策因素。
28.根据权利要求27所述的决策因素分析方法,更包括:
在浏览该电商网站的商品页面时,辨识该商品页面所显示的展览商品;
根据该些商品数据与该展览商品,辨识该展览商品的多个第一展览商品信息;以及
若该些第一展览商品信息中的第二展览商品信息相同于该目标决策因素序列的该些目标决策因素的其中之一或多个目标决策因素,显示该第二展览商品信息于该商品页面中对应该展览商品的区域内。
29.根据权利要求28所述的决策因素分析方法,其中对应该请求商品类型的该目标决策因素序列可区分为对应商品规格特征的第一目标决策因素序列与对应商品展览特征的第二目标决策因素序列,其中对应该商品规格特征的该第一目标决策序列的多个第一目标决策因素属于商品本身的规格的商品信息,并且对应该商品展览特征的该第二目标决策序列的多个第二目标决策因素属于该电商网站的用以展览商品的页面的特征的商品信息,
其中上述显示该目标决策因素序列的步骤包括:
分别显示该些第一目标决策因素与该第二目标决策因素,其中所述一或多个第二展览商品信息根据该商品规格特征与该商品展览特征被显示。
30.根据权利要求27所述的决策因素分析方法,其中该决策因素数据库更包括分别对应所述多个商品类型的多个最佳回归模型,所述方法更包括:
当该查询包括一或多个查询商品信息时,根据该些最佳回归模型中对应该请求商品类型的请求最佳回归模型与所述一或多个查询商品信息计算对应所述一或多个查询商品信息与该请求商品类型的预测购买率;以及
显示对应所述一或多个查询商品信息与该请求商品类型的该预测购买率。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
TW106141043A TWI645350B (zh) | 2017-11-24 | 2017-11-24 | 決策因素分析裝置與決策因素分析方法 |
TW106141043 | 2017-11-24 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109840796A CN109840796A (zh) | 2019-06-04 |
CN109840796B true CN109840796B (zh) | 2021-08-24 |
Family
ID=65431822
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201711388816.6A Active CN109840796B (zh) | 2017-11-24 | 2017-12-20 | 决策因素分析装置与决策因素分析方法 |
Country Status (3)
Country | Link |
---|---|
US (1) | US10572929B2 (zh) |
CN (1) | CN109840796B (zh) |
TW (1) | TWI645350B (zh) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112256740A (zh) * | 2019-07-22 | 2021-01-22 | 王其宏 | 整合定性资料及定量资料进行稽核准则推荐的系统及方法 |
CN111160781B (zh) * | 2019-12-30 | 2023-09-08 | 内蒙古鄂尔多斯资源股份有限公司东昊厂 | 一种羊绒纺织生产计算投入量的复合动态制成率模型 |
US20210241332A1 (en) * | 2020-02-05 | 2021-08-05 | Coupang Corp. | Computerized systems and methods for intelligent selection of available sellers and associated user interface modification. |
CN111340115B (zh) * | 2020-02-27 | 2023-05-12 | 青岛创新奇智科技集团股份有限公司 | 基于特征动态构造的推荐模型训练方法及系统 |
US20230169540A1 (en) * | 2021-12-01 | 2023-06-01 | Walmart Apollo, Llc | Systems and methods of providing enhanced contextual intelligent information |
CN115187344B (zh) * | 2022-09-13 | 2022-12-09 | 南通久拓智能装备有限公司 | 基于大数据的用户偏好分析识别方法 |
CN117151829B (zh) * | 2023-10-31 | 2024-02-13 | 阿里健康科技(中国)有限公司 | 导购决策树的构建方法、装置、设备和存储介质 |
CN117455543B (zh) * | 2023-12-21 | 2024-04-16 | 中邮消费金融有限公司 | 营销数据监控方法、装置、设备及存储介质 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101206752A (zh) * | 2007-12-25 | 2008-06-25 | 北京科文书业信息技术有限公司 | 电子商务网站相关商品推荐系统及其方法 |
CN102360386A (zh) * | 2011-10-12 | 2012-02-22 | 朱一超 | 电子商务网站智能导购系统和方法 |
US8799096B1 (en) * | 2005-06-03 | 2014-08-05 | Versata Development Group, Inc. | Scoring recommendations and explanations with a probabilistic user model |
CN104866474A (zh) * | 2014-02-20 | 2015-08-26 | 阿里巴巴集团控股有限公司 | 个性化数据搜索方法及装置 |
CN106202516A (zh) * | 2016-07-24 | 2016-12-07 | 广东聚联电子商务股份有限公司 | 一种根据时间节点的电子商务平台商品展示方法 |
CN106447463A (zh) * | 2016-10-21 | 2017-02-22 | 南京大学 | 一种基于马尔科夫决策过程模型的商品推荐方法 |
CN106485562A (zh) * | 2015-09-01 | 2017-03-08 | 苏宁云商集团股份有限公司 | 一种基于用户历史行为的商品信息推荐方法及系统 |
Family Cites Families (24)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6321221B1 (en) | 1998-07-17 | 2001-11-20 | Net Perceptions, Inc. | System, method and article of manufacture for increasing the user value of recommendations |
US7287017B2 (en) * | 2001-04-12 | 2007-10-23 | Igego Methodologies, Inc. | Decision engine |
US20030220834A1 (en) * | 2002-05-21 | 2003-11-27 | Brian Leung | Retail loyalty system (RLS) with embedded web server |
TWI347535B (en) * | 2004-05-05 | 2011-08-21 | Eplus Inc | System and method for ecatalog supplier portal |
US7561158B2 (en) | 2006-01-11 | 2009-07-14 | International Business Machines Corporation | Method and apparatus for presenting feature importance in predictive modeling |
TW200731149A (en) * | 2006-02-06 | 2007-08-16 | Hsiao-Hsien Yang | Method for commodity management based on the peer-to-peer network, and system and method for electronic commerce using the same |
US7853599B2 (en) | 2008-01-21 | 2010-12-14 | Microsoft Corporation | Feature selection for ranking |
US20110106594A1 (en) | 2009-11-05 | 2011-05-05 | Cbs Interactive, Inc. | Expandable product feature and relation comparison system |
TWI433042B (zh) | 2010-10-06 | 2014-04-01 | Chunghwa Telecom Co Ltd | Multi - product recommendation method and system |
TW201222443A (en) * | 2010-11-16 | 2012-06-01 | Ind Tech Res Inst | Cooperative Personalized Promotion method according to consumer-store transaction history and system using the same |
CN103577413B (zh) | 2012-07-20 | 2017-11-17 | 阿里巴巴集团控股有限公司 | 搜索结果排序方法及系统、搜索结果排序优化方法及系统 |
CN104077306B (zh) | 2013-03-28 | 2018-05-11 | 阿里巴巴集团控股有限公司 | 一种搜索引擎的结果排序方法及系统 |
US20140344102A1 (en) * | 2013-05-18 | 2014-11-20 | Chaya Cooper | Virtual Personal Shopping System |
US20150073931A1 (en) | 2013-09-06 | 2015-03-12 | Microsoft Corporation | Feature selection for recommender systems |
US20150081469A1 (en) | 2013-09-17 | 2015-03-19 | International Business Machines Corporation | Assisting buying decisions using customer behavior analysis |
US9911130B1 (en) * | 2013-12-20 | 2018-03-06 | Amazon Technologies, Inc. | Attribution modeling using regression analysis |
US10217148B2 (en) | 2015-01-23 | 2019-02-26 | Ebay Inc. | Predicting a status of a transaction |
JP6543986B2 (ja) | 2015-03-25 | 2019-07-17 | 日本電気株式会社 | 情報処理装置、情報処理方法およびプログラム |
CN105243392B (zh) | 2015-10-08 | 2017-06-16 | 淮海工学院 | 一种基于灵敏度分析的非线性支持向量回归特征提取方法 |
US20170168996A1 (en) | 2015-12-09 | 2017-06-15 | Quad Analytix Llc | Systems and methods for web page layout detection |
CN105630957B (zh) * | 2015-12-24 | 2019-05-21 | 北京大学 | 一种基于用户管理应用行为的应用质量判别方法及系统 |
CN105760474B (zh) | 2016-02-14 | 2021-02-19 | Tcl科技集团股份有限公司 | 一种基于位置信息的文档集的特征词提取方法及系统 |
CN107038190A (zh) * | 2016-10-28 | 2017-08-11 | 厦门大学 | 一种应用于淘宝网的智能促销方案建模方法 |
CN107230133B (zh) * | 2017-05-26 | 2020-12-22 | 努比亚技术有限公司 | 一种数据处理方法、设备和计算机存储介质 |
-
2017
- 2017-11-24 TW TW106141043A patent/TWI645350B/zh active
- 2017-12-20 CN CN201711388816.6A patent/CN109840796B/zh active Active
- 2017-12-25 US US15/853,866 patent/US10572929B2/en active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8799096B1 (en) * | 2005-06-03 | 2014-08-05 | Versata Development Group, Inc. | Scoring recommendations and explanations with a probabilistic user model |
CN101206752A (zh) * | 2007-12-25 | 2008-06-25 | 北京科文书业信息技术有限公司 | 电子商务网站相关商品推荐系统及其方法 |
CN102360386A (zh) * | 2011-10-12 | 2012-02-22 | 朱一超 | 电子商务网站智能导购系统和方法 |
CN104866474A (zh) * | 2014-02-20 | 2015-08-26 | 阿里巴巴集团控股有限公司 | 个性化数据搜索方法及装置 |
CN106485562A (zh) * | 2015-09-01 | 2017-03-08 | 苏宁云商集团股份有限公司 | 一种基于用户历史行为的商品信息推荐方法及系统 |
CN106202516A (zh) * | 2016-07-24 | 2016-12-07 | 广东聚联电子商务股份有限公司 | 一种根据时间节点的电子商务平台商品展示方法 |
CN106447463A (zh) * | 2016-10-21 | 2017-02-22 | 南京大学 | 一种基于马尔科夫决策过程模型的商品推荐方法 |
Non-Patent Citations (2)
Title |
---|
Product Aspect Ranking and Its Applications;Zheng-Jun Zha等;《IEEE TRANSACTIONS ON KNOWLEDGE AND DATA ENGINEERING》;20050505;第26卷(第5期);全文 * |
基于购物倾向的商品推荐方案研究;王树西等;《集成技术》;20130515;第2卷(第03期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
US10572929B2 (en) | 2020-02-25 |
TWI645350B (zh) | 2018-12-21 |
US20190164213A1 (en) | 2019-05-30 |
CN109840796A (zh) | 2019-06-04 |
TW201926183A (zh) | 2019-07-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109840796B (zh) | 决策因素分析装置与决策因素分析方法 | |
US11538060B2 (en) | Systems and methods for search query refinement | |
US11228660B2 (en) | Systems and methods for webpage personalization | |
KR100961783B1 (ko) | 인공지능에 기반한 제품 및 제품 벤더 추천 장치 및 방법, 그 기록 매체 | |
CN105718184A (zh) | 一种数据处理方法和装置 | |
US10664888B2 (en) | Method and system for attribute extraction from product titles using sequence labeling algorithms | |
US20150066586A1 (en) | Evaluation calculating device, evaluation calculating method, and recording medium | |
CN106708821A (zh) | 基于用户个性化购物行为进行商品推荐的方法 | |
TW201520790A (zh) | 個性化資料搜尋方法和裝置 | |
US20110238615A1 (en) | Systems and methods for trend aware self-correcting entity relationship extraction | |
CN110827112B (zh) | 深度学习的商品推荐方法、装置、计算机设备及存储介质 | |
CN111738805B (zh) | 基于行为日志的搜索推荐模型生成方法、设备和存储介质 | |
US10628458B2 (en) | Systems and methods for automated recommendations | |
CN111966886A (zh) | 对象推荐方法、对象推荐装置、电子设备及存储介质 | |
CN111967924A (zh) | 商品推荐方法、商品推荐装置、计算机设备和介质 | |
CN107093122B (zh) | 对象分类方法及装置 | |
US11803889B2 (en) | Systems and methods for determining price bands and user price affinity predictions using machine learning architectures and techniques | |
US10592577B2 (en) | Systems and methods for updating a webpage | |
KR101637986B1 (ko) | 최적 상품 제공 시스템 및 그 방법 | |
KR102576123B1 (ko) | 제품 공동구매 연계 시스템 및 방법 | |
CN115239421A (zh) | 商品推荐方法、装置、设备及介质 | |
CN114926236A (zh) | 商品信息的展示方法、装置、电子设备及存储介质 | |
KR102653483B1 (ko) | 인공지능에 기반하여 미술품의 가격을 예측하는 방법 | |
US11842375B2 (en) | Systems and methods for determining price bands and user price affinity predictions using machine learning architectures and techniques | |
Liu et al. | Automatic Recommendation Algorithm for E-Commerce Personalized Information Based on B2C Data Model Analysis |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |