TWI747674B - 基於人工智慧的將產品分類的電腦實行系統以及使用人工智慧對產品進行分類的方法 - Google Patents

基於人工智慧的將產品分類的電腦實行系統以及使用人工智慧對產品進行分類的方法 Download PDF

Info

Publication number
TWI747674B
TWI747674B TW109145276A TW109145276A TWI747674B TW I747674 B TWI747674 B TW I747674B TW 109145276 A TW109145276 A TW 109145276A TW 109145276 A TW109145276 A TW 109145276A TW I747674 B TWI747674 B TW I747674B
Authority
TW
Taiwan
Prior art keywords
training data
categories
product
highest
initial training
Prior art date
Application number
TW109145276A
Other languages
English (en)
Other versions
TW202133066A (zh
Inventor
李吉浩
潘克希 巴莫特拉
Original Assignee
南韓商韓領有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 南韓商韓領有限公司 filed Critical 南韓商韓領有限公司
Publication of TW202133066A publication Critical patent/TW202133066A/zh
Application granted granted Critical
Publication of TWI747674B publication Critical patent/TWI747674B/zh

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0623Item investigation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/08Logistics, e.g. warehousing, loading or distribution; Inventory or stock management
    • G06Q10/087Inventory or stock management, e.g. order filling, procurement or balancing against orders
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • G06F16/215Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • G06F18/2148Generating training patterns; Bootstrap methods, e.g. bagging or boosting characterised by the process organisation or structure, e.g. boosting cascade
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2413Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F7/00Methods or arrangements for processing data by operating upon the order or content of the data handled
    • G06F7/06Arrangements for sorting, selecting, merging, or comparing data on individual record carriers
    • G06F7/08Sorting, i.e. grouping record carriers in numerical or other ordered sequence according to the classification of at least some of the information they carry
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F7/00Methods or arrangements for processing data by operating upon the order or content of the data handled
    • G06F7/22Arrangements for sorting or merging computer data on continuous record carriers, e.g. tape, drum, disc
    • G06F7/24Sorting, i.e. extracting data from one or more carriers, rearranging the data in numerical or other ordered sequence, and rerecording the sorted data on the original carrier or on a different carrier or set of carriers sorting methods in general
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/04Inference or reasoning models
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0639Item locations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0641Shopping interfaces
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/24Aligning, centring, orientation detection or correction of the image
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/764Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/774Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/778Active pattern-learning, e.g. online learning of image or video features
    • G06V10/7784Active pattern-learning, e.g. online learning of image or video features based on feedback from supervisors
    • G06V10/7788Active pattern-learning, e.g. online learning of image or video features based on feedback from supervisors the supervisor being a human, e.g. interactive learning with a human teacher
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/84Arrangements for image or video recognition or understanding using pattern recognition or machine learning using probabilistic graphical models from image or video features, e.g. Markov models or Bayesian networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V2201/00Indexing scheme relating to image or video recognition or understanding
    • G06V2201/06Recognition of objects for industrial automation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V2201/00Indexing scheme relating to image or video recognition or understanding
    • G06V2201/10Recognition assisted with metadata

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Computing Systems (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Medical Informatics (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Multimedia (AREA)
  • Economics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Development Economics (AREA)
  • Strategic Management (AREA)
  • Mathematical Physics (AREA)
  • Quality & Reliability (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Computational Linguistics (AREA)
  • Human Resources & Organizations (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Tourism & Hospitality (AREA)
  • Operations Research (AREA)
  • Probability & Statistics with Applications (AREA)
  • Computer Hardware Design (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本發明提供使用AI對產品進行分類的系統及方法。一種 方法包括:檢索包含與一或多個類別相關聯的產品的初始訓練資料;預處理初始訓練資料以產生合成訓練資料;使用合成訓練資料來產生階層式模型,階層式模型含有根節點下方的至少兩層節點;接收與第一未分類產品相關聯的資訊;以及接收預測具有最高N個總機率得分的N個類別的集合的請求。方法可更包括:使用階層式模型藉由以下操作預測第一未分類產品的N個類別:計算總機率得分,及判定具有最高N個總機率得分的N個類別;將第一未分類產品分選至與來自第一層及第二層的具有最高總機率得分的節點相關聯的N個類別中;以及在與使用者相關聯的使用者裝置上顯示分選的第一未分類產品及其相關聯的N個類別。

Description

基於人工智慧的將產品分類的電腦實行系統以 及使用人工智慧對產品進行分類的方法
本揭露內容大體上是關於使用人工智慧將產品分類的電腦化系統及方法。特定而言,本揭露內容的實施例是關於發明性及非習知系統,所述發明性及非習知系統是關於接收與一或多個類別相關聯的訓練資料、預處理接收到的訓練資料、訓練用於將產品分類的一或多個模型,以及使用自賣方接收到的與未分類產品相關聯的資訊來預測未分類產品且將未分類產品分選至正確類別中。
消費者常常經由電腦及智慧型裝置線上採購及購買各種物件。此等線上採購者常常依賴於在產品類別中搜尋來找到要購買的產品。然而,不正確地分類的產品阻礙正常的線上購物體驗。
每天數百萬產品由賣方線上登記。賣家在線上登記其產品用於銷售時,需要選擇其產品所屬的正確類別。然而,許多賣方在登記其產品時並未選擇正確的類別。舉例而言,賣方可能在登記 屬於「嬰兒」類別中的嬰兒連體服時不正確地選擇「兒童時尚」類別。不正確的產品分類可能因延長消費者的產品搜尋且因降低線上平台的推薦品質而嚴重降低消費者的使用者體驗。另外,手動校正產品的分類常常是困難且耗時的,此是由於可能存在超過17,000種不同的類別。若線上平台將產品自動分類至其正確類別中,則消費者的使用者體驗將顯著改善。
因此,需要將產品分類的改良的方法及系統,使得消費者可在線上購物時快速找到及購買產品。
本揭露內容的一個態樣是針對一種基於AI的將產品分類的電腦實行系統。所述系統可包括:至少一個處理器;以及至少一個非暫時性儲存媒體,包括在由所述至少一個處理器執行時使得所述至少一個處理器進行步驟的指令。所述步驟可包括:檢索包含與一或多個類別相關聯的產品的初始訓練資料;預處理所述初始訓練資料以產生合成訓練資料;使用所述合成訓練資料來產生階層式模型,所述階層式模型含有根節點下方的至少兩層節點;接收與第一未分類產品相關聯的資訊;以及接收預測具有最高N個總機率得分的N個類別的集合的請求。所述步驟可更包括:使用所述階層式模型藉由以下操作預測所述第一未分類產品的N個類別:計算所述第一未分類產品的所述第一層上的每一節點的機率得分,判定所述第一層上的具有最高n個機率得分的n個節點的集合,計算所述第二層上的節點集合的機率得分,所述節點集合在具有所述最高n個得分的所判定n個節點的集合下方,判定所述 第二層上的具有最高m個得分的m個節點的集合,基於具有所述最高m個得分的所述m個節點及所述第一層中的各別n個節點的所述機率得分來計算總機率得分,以及判定具有所述最高N個總機率得分的所述N個類別;將所述第一未分類產品分選至與來自所述第一層及所述第二層的具有所述最高總機率得分的所述節點相關聯的所述N個類別中;以及在與使用者相關聯的使用者裝置上顯示分選的第一未分類產品及其相關聯的N個類別。
本揭露內容的另一態樣是針對一種使用AI對產品進行分類的方法。所述方法可包括:檢索包含與一或多個類別相關聯的產品的初始訓練資料;預處理所述初始訓練資料以產生合成訓練資料;使用所述合成訓練資料來產生階層式模型,所述階層式模型含有根節點下方的至少兩層節點;接收與第一未分類產品相關聯的資訊;以及接收預測具有最高N個總機率得分的N個類別的集合的請求。所述方法可更包括:使用所述階層式模型藉由以下操作預測所述第一未分類產品的N個類別:計算所述第一未分類產品的所述第一層上的每一節點的機率得分,判定所述第一層上的具有最高n個機率得分的n個節點的集合,計算所述第二層上的節點集合的機率得分,所述節點集合在具有所述最高n個得分的所判定n個節點的集合下方,判定所述第二層上的具有最高m個得分的m個節點的集合,基於具有所述最高m個得分的所述m個節點及所述第一層中的各別n個節點的所述機率得分來計算總機率得分,以及判定具有所述最高N個總機率得分的所述N個類別;以及將所述第一未分類產品分選至與來自所述第一層及所述第二層的具有所述最高總機率得分的所述節點相關聯的所述N個類別 中。
本揭露內容的又一態樣是針對一種基於AI的將產品分類的電腦實行系統。所述系統可包括:至少一個處理器;以及至少一個非暫時性儲存媒體,包括在由所述至少一個處理器執行時使得所述至少一個處理器進行步驟的指令。所述步驟可包括:檢索包含與一或多個類別相關聯的產品及影像的初始訓練資料;預處理所述初始訓練資料以產生合成訓練資料;使用所述合成訓練資料來產生階層式模型,所述階層式模型含有根節點下方的至少兩層節點;使用所述合成訓練資料來產生影像模型;接收與第一未分類產品相關聯的資訊;以及接收預測具有最高N個總機率得分的N個類別的集合的請求及預測具有最高M個總機率得分的M個類別的集合的請求。所述步驟可更包括:使用所述階層式模型藉由以下操作預測所述第一未分類產品的N個類別:計算所述第一未分類產品的所述第一層上的每一節點的機率得分,判定所述第一層上的具有最高n個機率得分的n個節點的集合,計算所述第二層上的節點集合的機率得分,所述節點集合在具有所述最高n個得分的所判定n個節點的集合下方,判定所述第二層上的具有最高m個得分的m個節點的集合,基於具有所述最高m個得分的所述m個節點及所述第一層中的各別n個節點的所述機率得分來計算總機率得分,以及判定具有所述最高N個總機率得分的所述N個類別。所述步驟可更包括:使用所述影像模型藉由以下操作預測所述第一未分類產品的M個類別:計算所述第一未分類產品的機率得分,以及判定具有所述最高M個總機率得分的所述M個類別。所述步驟可更包括:對所述N個類別與所述M個類別的所述總機率 得分求平均;將所述第一未分類產品分選至具有最高平均化總機率得分的所述N個類別或所述M個類別中的類別中;以及在與使用者相關聯的使用者裝置上顯示分選的第一未分類產品及其相關聯的N個類別或M個類別。
本文中亦論述其他系統、方法以及電腦可讀媒體。
100、300、500:系統
101:運送授權技術系統
102A、107A、107B、107C、119A、119B、119C:行動裝置
102B:電腦
103:外部前端系統
105:內部前端系統
107:運輸系統
109:賣方入口網站
111:運送及訂單追蹤系統
113:履行最佳化系統
115:履行通信報閘道
117:供應鏈管理系統
119:倉庫管理系統
121A、121B、121C:第3方履行系統
123:履行中心授權系統
125:勞動管理系統
200:履行中心
201、222:卡車
202A、202B、208:物件
203:入站區
205:緩衝區
206:叉車
207:卸貨區
209:揀貨區
210:儲存單元
211:包裝區
213:樞紐區
214:運輸機構
215:營地區
216:牆
218、220:包裹
224A、224B:遞送工作者
226:汽車
310:訓練資料系統
312、322、332、342、522:處理器
314、324、334、344、524:記憶體
316、326、336、346、526:資料庫
320:預處理系統
330:階層式模型訓練器系統
340:影像模型訓練器系統
350、550:網路
360、560:使用者裝置
360A、560A:使用者
400:樣本訓練資料
410:產品識別號
412:高級別類別
414:子類別
416:產品名稱
418:品牌
420:產品影像URL
510:輸入資料
520:產品類別預測器
600:階層式模型
601:根節點
610:第一層
611、621、631:節點
620:第二層
630:第三層
701、703、705、707、709、711、713、715:步驟
圖1A為與所揭露實施例一致的示出包括用於實現運送、運輸以及物流操作的通信的電腦化系統的網路的例示性實施例的示意性方塊圖。
圖1B描繪與所揭露實施例一致的包含滿足搜尋請求的一或多個搜尋結果以及交互式使用者介面元素的樣本搜尋結果頁(Search Result Page;SRP)。
圖1C描繪與所揭露實施例一致的包含產品及關於所述產品的資訊以及交互式使用者介面元素的樣本單一顯示頁(Single Display Page;SDP)。
圖1D描繪與所揭露實施例一致的包含虛擬購物車中的物件以及交互式使用者介面元素的樣本購物車頁。
圖1E描繪與所揭露實施例一致的包含來自虛擬購物車的物件以及關於購買及運送的資訊以及交互式使用者介面元素的樣本訂單頁。
圖2為與所揭露實施例一致的經組態以利用所揭露電腦化系統的例示性履行中心的圖解圖示。
圖3為與所揭露實施例一致的示出包括用於訓練用於將產品分類的一或多個模型的電腦化系統的網路的例示性實施例的示意性方塊圖。
圖4描繪與所揭露實施例一致的用於將產品分類的樣本訓練資料。
圖5為與所揭露實施例一致的示出包括用於使用一或多個模型將產品分類的電腦化系統的網路的例示性實施例的示意性方塊圖。
圖6描繪與所揭露實施例一致的用於將產品分類的樣本階層式模型。
圖7描繪與所揭露實施例一致的用於將產品分類的過程。
以下詳細描述參考隨附圖式。只要可能,即在圖式及以下描述中使用相同附圖標號來指代相同或類似部分。儘管本文中描述若干示出性實施例,但修改、調適以及其他實施方案是可能的。舉例而言,可對圖式中所示出的組件及步驟進行替代、添加或修改,且可藉由取代、重新排序、移除步驟或將步驟添加至所揭露方法來修改本文中所描述的示出性方法。因此,以下詳細描述不限於所揭露實施例及實例。實情為,本發明的正確範圍由隨附申請專利範圍界定。
本揭露內容的實施例是針對經組態用於使用人工智慧將產品分類的系統及方法。所揭露實施例有利地能夠自動產生用於訓練機器學習模型(「模型」)的訓練資料、產生模型,且使用模型 正確地對賣方的產品進行分類。舉例而言,訓練資料系統可自動產生包含與一或多個類別相關聯的產品的初始訓練資料。初始訓練資料可包含自動產生的虛擬產品資料、自動產生的映射指南關鍵字資料,或實況產品的自動選擇。在一些實施例中,初始訓練資料可包含由內部使用者(例如,雇員)提供的人類標記資料。
在一個實施方案中,預處理系統可預處理自訓練資料系統接收到的初始訓練資料以產生合成訓練資料。舉例而言,可使用方法的任何組合來預處理基於文字的初始訓練資料,包含停止字消除、關鍵字符記化、關鍵字的去重以及初始訓練資料的擴增,且可使用影像擴增技術(例如,PyTorch)來預處理基於影像的初始訓練資料。階層式模型訓練器系統可接收由預處理系統產生的基於文字的合成訓練資料,且影像模型訓練器系統可接收由預處理系統產生的基於影像的合成訓練資料。階層式模型訓練器系統及影像模型訓練器可使用接收到的用於將產品分類的合成資料分別產生及訓練至少一個階層式模型及至少一個影像模型。
在一些實施例中,產品類別預測器可接收與第一未分類產品相關聯的資訊。舉例而言,當試圖登記產品時,可提示賣方輸入包含產品名稱、屬性值、製造商、品牌以及型號的序連文字串。產品類別預測器可接收預測具有最高總機率得分的數個類別的請求。產品類別預測器可使用階層式模型藉由遞回地計算潛在類別及子類別的機率得分來預測第一未分類產品的最相關類別。產品類別預測器可隨後將未分類產品分選至具有最高總機率得分的類別中的一或多者中。
參考圖1A,繪示示出包括用於實現運送、運輸以及物流 操作的通信的電腦化系統的系統的例示性實施例的示意性方塊圖100。如圖1A中所示出,系統100可包含各種系統,所述系統中的每一者可經由一或多個網路彼此連接。所述系統亦可經由直接連接(例如,使用電纜)彼此連接。所描繪系統包含運送授權技術(shipment authority technology;SAT)系統101、外部前端系統103、內部前端系統105、運輸系統107、行動裝置107A、行動裝置107B以及行動裝置107C、賣方入口網站109、運送及訂單追蹤(shipment and order tracking;SOT)系統111、履行最佳化(fulfillment optimization;FO)系統113、履行通信報閘道(fulfillment messaging gateway;FMG)115、供應鏈管理(supply chain management;SCM)系統117、倉庫管理系統119、行動裝置119A、行動裝置119B以及行動裝置119C(描繪為位於履行中心(fulfillment center;FC)200內部)、第3方履行系統121A、第3方履行系統121B以及第3方履行系統121C、履行中心授權系統(fulfillment center authorization;FC Auth)123以及勞動管理系統(labor management system;LMS)125。
在一些實施例中,SAT系統101可實行為監視訂單狀態及遞送狀態的電腦系統。舉例而言,SAT系統101可判定訂單是否超過其承諾遞送日期(PDD)且可採取適當的動作,包含發起新訂單、對未遞送訂單中的物件進行重新運送、取消未遞送訂單、發起與訂購客戶的連絡,或類似者。SAT系統101亦可監視其他資料,包含輸出(諸如在特定時間段期間運送的包裹的數目)及輸入(諸如接收到的用於運送的空紙板盒的數目)。SAT系統101亦可充當系統100中的不同裝置之間的閘道,從而(例如,使用儲存及 轉發或其他技術)實現諸如外部前端系統103及FO系統113的裝置之間的通信。
在一些實施例中,外部前端系統103可實行為使得外部使用者能夠與系統100中的一或多個系統交互的電腦系統。舉例而言,在系統100使得系統的呈現能夠允許使用者針對物件下訂單的實施例中,外部前端系統103可實行為接收搜尋請求、呈現物件頁以及索求支付資訊的網頁伺服器。舉例而言,外部前端系統103可實行為電腦或電腦運行軟體,諸如阿帕奇(Apache)HTTP伺服器、微軟網際網路資訊服務(Internet Information Service;IIS)、NGINX,或類似者。在其他實施例中,外部前端系統103可運行經設計以接收及處理來自外部裝置(例如,行動裝置102A或電腦102B)的請求、基於彼等請求自資料庫及其他資料儲存庫獲取資訊,以及基於所獲取的資訊將回應提供至接收到的請求的定製網頁伺服器軟體。
在一些實施例中,外部前端系統103可包含網頁快取系統、資料庫、搜尋系統或支付系統中的一或多者。在一個態樣中,外部前端系統103可包括此等系統中的一或多者,而在另一態樣中,外部前端系統103可包括連接至此等系統中的一或多者的介面(例如,伺服器至伺服器、資料庫至資料庫,或其他網路連接)。
藉由圖1B、圖1C、圖1D以及圖1E所示出的例示性步驟集合將有助於描述外部前端系統103的一些操作。外部前端系統103可自系統100中的系統或裝置接收資訊以供呈現及/或顯示。舉例而言,外部前端系統103可代管或提供一或多個網頁,包含搜尋結果頁(SRP)(例如,圖1B)、單一詳情頁(Single Detail Page;SDP)(例如,圖1C)、購物車頁(例如,圖1D),或訂單頁(例如,圖1E)。(例如,使用行動裝置102A或電腦102B的)使用者裝置可導航至外部前端系統103且藉由將資訊輸入至搜尋方塊中來請求搜尋。外部前端系統103可向系統100中的一或多個系統請求資訊。舉例而言,外部前端系統103可向FO系統113請求滿足搜尋請求的資訊。外部前端系統103亦可(自FO系統113)請求及接收包含於搜尋結果中的每一產品的承諾遞送日期或「PDD」。在一些實施例中,PDD可表示在特定時間段內(例如,在一天結束(下午11:59)前)訂購的情況下對含有產品的包裹將何時抵達使用者的所要位置或承諾將產品遞送至使用者的所要位置處的日期的估計。(PDD在下文相對於FO系統113進一步論述。)
外部前端系統103可基於資訊來準備SRP(例如,圖1B)。SRP可包含滿足搜尋請求的資訊。舉例而言,此可包含滿足搜尋請求的產品的圖像。SRP亦可包含每一產品的各別價格,或與每一產品的增強遞送選項、PDD、重量、大小、報價、折扣或類似者相關的資訊。外部前端系統103可(例如,經由網路)將SRP發送至請求使用者裝置。
使用者裝置可接著例如藉由點選或輕觸使用者介面或使用另一輸入裝置自SRP選擇產品,以選擇表示於SRP上的產品。使用者裝置可製訂對關於所選產品的資訊的請求且將其發送至外部前端系統103。作為回應,外部前端系統103可請求與所選產品相關的資訊。舉例而言,資訊可包含除針對各別SRP上的產品呈現的資訊以外的額外資訊。此可包含例如保存期限、原產國、重 量、大小、包裹中的物件的數目、處置說明,或關於產品的其他資訊。資訊亦可包含類似產品的推薦(基於例如巨量資料及/或對購買此產品及至少一個其他產品的客戶的機器學習分析)、頻繁詢問的問題的答案、來自客戶的評論、製造商資訊、圖像,或類似者。
外部前端系統103可基於接收到的產品資訊來準備SDP(單一詳情頁)(例如,圖1C)。SDP亦可包含其他交互式元素,諸如「現在購買」按鈕、「添加至購物車」按鈕、數量欄、物件的圖像,或類似者。SDP可更包含提供產品的賣方的列表。可基於每一賣方提供的價格來對列表進行排序,使得可在頂部處列出提供以最低價格出售產品的賣方。亦可基於賣方排名來對列表進行排序,使得可在頂部處列出排名最高的賣方。可基於多個因素來製訂賣方排名,所述因素包含例如賣方的符合承諾PDD的過去的追蹤記錄。外部前端系統103可(例如,經由網路)將SDP遞送至請求使用者裝置。
請求使用者裝置可接收列出產品資訊的SDP。在接收到SDP後,使用者裝置可接著與SDP交互。舉例而言,請求使用者裝置的使用者可點選或以其他方式與SDP上的「放在購物車中」按鈕交互。此將產品添加至與使用者相關聯的購物車。使用者裝置可將把產品添加至購物車的此請求傳輸至外部前端系統103。
外部前端系統103可產生購物車頁(例如,圖1D)。在一些實施例中,購物車頁列出使用者已添加至虛擬「購物車」的產品。使用者裝置可藉由在SRP、SDP或其他頁上的圖標上點選或以其他方式與所述圖標交互來請求購物車頁。在一些實施例中,購物車頁可列出使用者已添加至購物車的所有產品,以及關於購物 車中的產品的資訊(諸如每一產品的數量、每一產品每物件的價格、每一產品基於相關聯數量的價格)、關於PDD的資訊、遞送方法、運送成本、用於修改購物車中的產品(例如,刪除或修改數量)的使用者介面元素、用於訂購其他產品或設置產品的定期遞送的選項、用於設置利息支付的選項、用於前進至購買的使用者介面元素,或類似者。使用者裝置處的使用者可在使用者介面元素(例如,寫著「現在購買」的按鈕)上點選或以其他方式與所述使用者介面元素交互,以發起對購物車中的產品的購買。在如此做後,使用者裝置可將發起購買的此請求傳輸至外部前端系統103。
外部前端系統103可回應於接收到發起購買的請求而產生訂單頁(例如,圖1E)。在一些實施例中,訂單頁重新列出來自購物車的物件且請求支付及運送資訊的輸入。舉例而言,訂單頁可包含請求關於購物車中的物件的購買者的資訊(例如,姓名、地址、電子郵件地址、電話號碼)、關於接收者的資訊(例如,姓名、地址、電話號碼、遞送資訊)、運送資訊(例如,遞送及/或揀貨的速度/方法)、支付資訊(例如,信用卡、銀行轉賬、支票、儲存的積分)的部分、請求現金收據(例如,出於稅務目的)的使用者介面元素,或類似者。外部前端系統103可將訂單頁發送至使用者裝置。
使用者裝置可輸入關於訂單頁的資訊,且點選或以其他方式與將資訊發送至外部前端系統103的使用者介面元素交互。自此處,外部前端系統103可將資訊發送至系統100中的不同系統,以使得能夠創建及處理具有購物車中的產品的新訂單。
在一些實施例中,外部前端系統103可進一步經組態以 使得賣方能夠傳輸及接收與訂單相關的資訊。
在一些實施例中,內部前端系統105可實行為使得內部使用者(例如,擁有、操作或租用系統100的組織的雇員)能夠與系統100中的一或多個系統交互的電腦系統。舉例而言,在系統100使得系統的呈現能夠允許使用者針對物件下訂單的實施例中,內部前端系統105可實行為使得內部使用者能夠查看關於訂單的診斷及統計資訊、修改物件資訊或審查與訂單相關的統計的網頁伺服器。舉例而言,內部前端系統105可實行為電腦或電腦運行軟體,諸如阿帕奇HTTP伺服器、微軟網際網路資訊服務(IIS)、NGINX,或類似者。在其他實施例中,內部前端系統105可運行經設計以接收及處理來自系統100中所描繪的系統或裝置(以及未描繪的其他裝置)的請求、基於彼等請求自資料庫及其他資料儲存庫獲取資訊,以及基於所獲取的資訊來將回應提供至接收到的請求的定製網頁伺服器軟體。
在一些實施例中,內部前端系統105可包含網頁快取系統、資料庫、搜尋系統、支付系統、分析系統、訂單監視系統或類似者中的一或多者。在一個態樣中,內部前端系統105可包括此等系統中的一或多者,而在另一態樣中,內部前端系統105可包括連接至此等系統中的一或多者的介面(例如,伺服器至伺服器、資料庫至資料庫,或其他網路連接)。
在一些實施例中,運輸系統107可實行為實現系統100中的系統或裝置與行動裝置107A至行動裝置107C之間的通信的電腦系統。在一些實施例中,運輸系統107可自一或多個行動裝置107A至行動裝置107C(例如,行動電話、智慧型手機、PDA, 或類似者)接收資訊。舉例而言,在一些實施例中,行動裝置107A至行動裝置107C可包括由遞送工作者操作的裝置。遞送工作者(其可為永久雇員、暫時雇員或輪班雇員)可利用行動裝置107A至行動裝置107C來實現對含有由使用者訂購的產品的包裹的遞送。舉例而言,為遞送包裹,遞送工作者可在行動裝置上接收指示遞送哪一包裹及將所述包裹遞送到何處的通知。在抵達遞送位置後,遞送工作者可(例如,在卡車的後部中或在包裹的條板箱中)定位包裹、使用行動裝置掃描或以其他方式擷取與包裹上的識別符(例如,條碼、影像、文字串、RFID標籤,或類似者)相關聯的資料,且遞送包裹(例如,藉由將其留在前門處、將其留給警衛、將其交給接收者,或類似者)。在一些實施例中,遞送工作者可使用行動裝置擷取包裹的相片及/或可獲得簽名。行動裝置可將資訊發送至運輸系統107,所述資訊包含關於遞送的資訊,包含例如時間、日期、GPS位置、相片、與遞送工作者相關聯的識別符、與行動裝置相關聯的識別符,或類似者。運輸系統107可在資料庫(未描繪)中儲存此資訊以用於由系統100中的其他系統訪問。在一些實施例中,運輸系統107可使用此資訊來準備追蹤資料且將所述追蹤資料發送至其他系統,從而指示特定包裹的位置。
在一些實施例中,某些使用者可使用一個種類的行動裝置(例如,永久工作者可使用具有定製硬體(諸如條碼掃描器、尖筆以及其他裝置)的專用PDA),而其他使用者可使用其他類型的行動裝置(例如,暫時工作者或輪班工作者可利用現成的行動電話及/或智慧型手機)。
在一些實施例中,運輸系統107可使使用者與每一裝置 相關聯。舉例而言,運輸系統107可儲存使用者(由例如使用者識別符、雇員識別符或電話號碼表示)與行動裝置(由例如國際行動設備身分(International Mobile Equipment Identity;IMEI)、國際行動訂用識別符(International Mobile Subscription Identifier;IMSI)、電話號碼、通用唯一識別符(Universal Unique Identifier;UUID)或全球唯一識別符(Globally Unique Identifier;GUID)表示)之間的關聯。運輸系統107可結合在遞送時接收到的資料使用此關聯來分析儲存於資料庫中的資料,以便尤其判定工作者的位置、工作者的效率,或工作者的速度。
在一些實施例中,賣方入口網站109可實行為使得賣方或其他外部實體能夠與系統100中的一或多個系統電子地通信的電腦系統。舉例而言,賣方可利用電腦系統(未描繪)來上載或提供賣方希望經由使用賣方入口網站109的系統100來出售的產品的產品資訊、訂單資訊、連絡資訊或類似者。
在一些實施例中,運送及訂單追蹤系統111可實行為接收、儲存以及轉送關於含有由客戶(例如,由使用裝置102A至裝置102B的使用者)訂購的產品的包裹的位置的資訊的電腦系統。在一些實施例中,運送及訂單追蹤系統111可請求或儲存來自由遞送含有由客戶訂購的產品的包裹的運送公司操作的網頁伺服器(未描繪)的資訊。
在一些實施例中,運送及訂單追蹤系統111可請求及儲存來自在系統100中描繪的系統的資訊。舉例而言,運送及訂單追蹤系統111可請求來自運輸系統107的資訊。如上文所論述,運輸系統107可自與使用者(例如,遞送工作者)或車輛(例如, 遞送卡車)中的一或多者相關聯的一或多個行動裝置107A至行動裝置107C(例如,行動電話、智慧型手機、PDA或類似者)接收資訊。在一些實施例中,運送及訂單追蹤系統111亦可向倉庫管理系統(warehouse management system;WMS)119請求資訊以判定個別產品在履行中心(例如,履行中心200)內部的位置。運送及訂單追蹤系統111可向運輸系統107或WMS 119中的一或多者請求資料,在請求後處理所述資料,且將所述資料呈現給裝置(例如,使用者裝置102A及使用者裝置102B)。
在一些實施例中,履行最佳化(FO)系統113可實行為儲存來自其他系統(例如,外部前端系統103及/或運送及訂單追蹤系統111)的客戶訂單的資訊的電腦系統。FO系統113亦可儲存描述特定物件保存或儲存於何處的資訊。舉例而言,某些物件可能僅儲存於一個履行中心中,而某些其他物件可能儲存於多個履行中心中。在再其他實施例中,某些履行中心可經設計以僅儲存特定物件集合(例如,新鮮農產品或冷凍產品)。FO系統113儲存此資訊以及相關聯資訊(例如,數量、大小、接收日期、過期日期等)。
FO系統113亦可計算每一產品的對應PDD(承諾遞送日期)。在一些實施例中,PDD可以基於一或多個因素。舉例而言,FO系統113可基於下述者來計算產品的PDD:對產品的過去需求(例如,在一段時間期間訂購了多少次所述產品)、對產品的預期需求(例如,預測在即將到來的一段時間期間多少客戶將訂購所述產品)、指示在一段時間期間訂購了多少產品的全網路過去需求、指示預期在即將到來的一段時間期間將訂購多少產品的全網路預期需求、儲存於每一履行中心200中的產品的一或多個計數、哪一 履行中心儲存每一產品、產品的預期或當前訂單,或類似者。
在一些實施例中,FO系統113可定期(例如,每小時)判定每一產品的PDD且將其儲存於資料庫中以供檢索或發送至其他系統(例如,外部前端系統103、SAT系統101、運送及訂單追蹤系統111)。在其他實施例中,FO系統113可自一或多個系統(例如,外部前端系統103、SAT系統101、運送及訂單追蹤系統111)接收電子請求且按需求計算PDD。
在一些實施例中,履行通信報閘道(FMG)115可實行為自系統100中的一或多個系統(諸如FO系統113)接收呈一種格式或協定的請求或回應、將其轉換為另一格式或協定且將其以轉換後的格式或協定轉發至其他系統(諸如WMS 119或第3方履行系統121A、第3方履行系統121B或第3方履行系統121C)且反之亦然的電腦系統。
在一些實施例中,供應鏈管理(SCM)系統117可實行為進行預測功能的電腦系統。舉例而言,SCM系統117可基於例如下述者來預測對特定產品的需求水平:對產品的過去需求、對產品的預期需求、全網路過去需求、全網路預期需求、儲存於每一履行中心200中的計數產品、每一產品的預期或當前訂單,或類似者。回應於此預測水平及所有履行中心中的每一產品的量,SCM系統117可產生一或多個購買訂單以購買及儲備足夠數量,以滿足對特定產品的預測需求。
在一些實施例中,倉庫管理系統(WMS)119可實行為監視工作流程的電腦系統。舉例而言,WMS 119可自個別裝置(例如,裝置107A至裝置107C或裝置119A至裝置119C)接收指示 離散事件的事件資料。舉例而言,WMS 119可接收指示此等裝置中的一者的使用掃描包裹的事件資料。如下文相對於履行中心200及圖2所論述,在履行過程期間,可藉由特定階段處的機器(例如,自動式或手持式條碼掃描器、RFID讀取器、高速攝影機、諸如平板電腦119A、行動裝置/PDA 119B、電腦119C的裝置或類似者)掃描或讀取包裹識別符(例如,條碼或RFID標籤資料)。WMS 119可將指示掃描或包裹識別符的讀取的每一事件以及包裹識別符、時間、日期、位置、使用者識別符或其他資訊儲存於對應資料庫(未描繪)中,且可將此資訊提供至其他系統(例如,運送及訂單追蹤系統111)。
在一些實施例中,WMS 119可儲存使一或多個裝置(例如,裝置107A至裝置107C或裝置119A至裝置119C)與一或多個使用者(所述一或多個使用者與系統100相關聯)相關聯的資訊。舉例而言,在一些情形下,使用者(諸如兼職雇員或全職雇員)可與行動裝置相關聯,此是由於使用者擁有行動裝置(例如,行動裝置為智慧型手機)。在其他情形下,使用者可與行動裝置相關聯,此是由於使用者暫時保管行動裝置(例如,使用者在一天開始時拿到行動裝置,將在一天期間使用所述行動裝置,且將在一天結束時退還所述行動裝置)。
在一些實施例中,WMS 119可維護與系統100相關聯的每一使用者的工作日志。舉例而言,WMS 119可儲存與每一雇員相關聯的資訊,包含任何指定的過程(例如,自卡車卸載、自揀貨區揀取物件、合流牆(rebin wall)工作、包裝物件)、使用者識別符、位置(例如,履行中心200中的樓層或區)、藉由雇員經由系 統移動的單位數目(例如,所揀取物件的數目、所包裝物件的數目)、與裝置(例如,裝置119A至裝置119C)相關聯的識別符,或類似者。在一些實施例中,WMS 119可自計時系統接收登記及登出資訊,所述計時系統諸如在裝置119A至裝置119C上操作的計時系統。
在一些實施例中,第3方履行(3rd party fulfillment;3PL)系統121A至第3方履行系統121C表示與物流及產品的第三方提供商相關聯的電腦系統。舉例而言,儘管一些產品儲存於履行中心200中(如下文相對於圖2所論述),但其他產品可儲存於場外、可按需求生產,或可以其他方式不可供用於儲存於履行中心200中。3PL系統121A至3PL系統121C可經組態以(例如,經由FMG 115)自FO系統113接收訂單,且可直接為客戶提供產品及/或服務(例如,遞送或安裝)。在一些實施例中,3PL系統121A至3PL系統121C中的一或多者可為系統100的部分,而在其他實施例中,3PL系統121A至3PL系統121C中的一或多者可在系統100外部(例如,由第三方提供商擁有或操作)。
在一些實施例中,履行中心Auth系統(FC Auth)123可實行為具有各種功能的電腦系統。舉例而言,在一些實施例中,FC Auth 123可充當系統100中的一或多個其他系統的單一簽入(single-sign on;SSO)服務。舉例而言,FC Auth 123可使得使用者能夠經由內部前端系統105登入、判定使用者具有訪問運送及訂單追蹤系統111處的資源的類似特權,且使得使用者能夠在不需要第二登入過程的情況下取得彼等特權。在其他實施例中,FC Auth 123可使得使用者(例如,雇員)能夠使自身與特定任務相關 聯。舉例而言,一些雇員可能不具有電子裝置(諸如裝置119A至裝置119C),且實際上可能在一天的過程期間在履行中心200內自任務至任務以及自區至區移動。FC Auth 123可經組態以使得彼等雇員能夠在一天的不同時間指示其正進行何任務以及其位於何區。
在一些實施例中,勞動管理系統(LMS)125可實行為儲存雇員(包含全職雇員及兼職雇員)的出勤及超時資訊的電腦系統。舉例而言,LMS 125可自FC Auth 123、WMS 119、裝置119A至裝置119C、運輸系統107及/或裝置107A至裝置107C接收資訊。
圖1A中所描繪的特定組態僅為實例。舉例而言,儘管圖1A描繪連接至FO系統113的FC Auth系統123,但並非所有實施例均要求此特定組態。實際上,在一些實施例中,系統100中的系統可經由一或多個公用或私用網路彼此連接,所述網路包含網際網路、企業內部網路、廣域網路(Wide-Area Network;WAN)、都會區域網路(Metropolitan-Area Network;MAN)、順應IEEE 802.11a/b/g/n標準的無線網路、租用線,或類似者。在一些實施例中,系統100中的系統中的一或多者可實行為在資料中心、伺服器群或類似者處實行的一或多個虛擬伺服器。
圖2描繪履行中心200。履行中心200為儲存用於在訂購時運送至客戶的物件的實體位置的實例。可將履行中心(FC)200劃分成多個區,所述區中的每一者描繪於圖2中。在一些實施例中,可認為此等「區」為接收物件、儲存物件、檢索物件以及運送物件的過程的不同階段之間的虛擬劃分。因此,儘管在圖2中描 繪「區」,但其他區劃分為可能的,且在一些實施例中可省略、複製或修改圖2中的區。
入站區203表示FC 200的自希望使用來自圖1A的系統100出售產品的賣方接收到物件的區域。舉例而言,賣方可使用卡車201來遞送物件202A及物件202B。物件202A可表示足夠大以佔據其自身運送托板的單一物件,而物件202B可表示在同一托板上堆疊在一起以節省空間的物件集合。
工作者將在入站區203中接收物件,且可使用電腦系統(未描繪)來視情況檢查物件的損壞及正確性。舉例而言,工作者可使用電腦系統來比較物件202A及物件202B的數量與物件的所訂購數量。若數量不匹配,則工作者可拒絕物件202A或物件202B中的一或多者。若數量的確匹配,則工作者可(使用例如台車、手推平車、叉車或手動地)將彼等物件移動至緩衝區205。緩衝區205可為當前(例如由於揀貨區中存在足夠高數量的物件以滿足預測需求而)無需處於揀貨區中的所述物件的暫時儲存區域。在一些實施例中,叉車206操作以圍繞緩衝區205及在入站區203與卸貨區207之間移動物件。若(例如,由於預測需求而)需要揀貨區中的物件202A或物件202B,則叉車可將物件202A或物件202B移動至卸貨區207。
卸貨區207可為FC 200的在將物件移動至揀貨區209之前儲存所述物件的區域。指定給揀貨任務的工作者(「揀貨員」)可靠近揀貨區中的物件202A及物件202B,使用行動裝置(例如,裝置119B)來掃描揀貨區的條碼,且掃描與物件202A及物件202B相關聯的條碼。揀貨員可接著(例如,藉由將物件置放於推車上或 攜帶所述物件)將所述物件取至揀貨區209。
揀貨區209可為FC 200的將物件208儲存於儲存單元210上的區域。在一些實施例中,儲存單元210可包括實體擱架、書架、盒、手提包、冰箱、冷凍機、冷儲存區或類似者中的一或多者。在一些實施例中,揀貨區209可組織成多個樓層。在一些實施例中,工作者或機器可以多種方式將物件移動至揀貨區209中,包含例如叉車、電梯、傳送帶、推車、手推平車、台車、自動化機器人或裝置,或手動地移動。舉例而言,揀貨員可在卸貨區207中將物件202A及物件202B置放於手推平車或推車上,且將物件202A及物件202B步移至揀貨區209。
揀貨員可接收將物件置放(或「堆裝」)於揀貨區209中的特定點(諸如儲存單元210上的特定空間)的指令。舉例而言,揀貨員可使用行動裝置(例如,裝置119B)來掃描物件202A。裝置可例如使用指示走道、貨架以及位置的系統來指示揀貨員應將物件202A堆裝於何處。裝置可接著提示揀貨員在將物件202A堆裝於所述位置之前掃描所述位置處的條碼。裝置可(例如,經由無線網路)將資料發送至諸如圖1A中的WMS 119的電腦系統,從而指示已由使用裝置119B的使用者將物件202A堆裝於所述位置處。
一旦使用者下訂單,揀貨員即可在裝置119B上接收自儲存單元210檢索一或多個物件208的指令。揀貨員可檢索物件208、掃描物件208上的條碼,且將所述物件208置放於運輸機構214上。儘管將運輸機構214表示為滑動件,但在一些實施例中,運輸機構可實行為傳送帶、電梯、推車、叉車、手推平車、台車或類似 者中的一或多者。物件208可接著抵達包裝區211。
包裝區211可為FC 200的自揀貨區209接收到物件且將所述物件包裝至盒或包中以用於最終運送至客戶的區域。在包裝區211中,指定給接收物件的工作者(「合流工作者」)將自揀貨區209接收物件208且判定所述物件208對應於哪一訂單。舉例而言,合流工作者可使用諸如電腦119C的裝置來掃描物件208上的條碼。電腦119C可在視覺上指示物件208與哪一訂單相關聯。此可包含例如對應於訂單的牆216上的空間或「單元格」。一旦訂單完成(例如,由於單元格含有所述訂單的所有物件),合流工作者即可指示包裝工作者(或「包裝員」)訂單完成。包裝員可自單元格檢索物件且將所述物件置放於盒或包中以用於運送。包裝員可接著例如經由叉車、推車、台車、手推平車、傳送帶、手動地或以其他方式將盒或包發送至樞紐區(hub zone)213。
樞紐區213可為FC 200的自包裝區211接收所有盒或包(「包裹」)的區域。樞紐區213中的工作者及/或機器可檢索包裹218且判定每一包裹預期去至遞送區域的哪一部分,且將包裹投送至適當的營地區(camp zone)215。舉例而言,若遞送區域具有兩個更小子區域,則包裹將去至兩個營地區215中的一者。在一些實施例中,工作者或機器可(例如,使用裝置119A至裝置119C中的一者)掃描包裹以判定其最終目的地。將包裹投送至營地區215可包括例如(例如,基於郵遞碼)判定包裹去往的地理區域的一部分,以及判定與地理區域的所述部分相關聯的營地區215。
在一些實施例中,營地區215可包括一或多個建築物、一或多個實體空間或一或多個區域,其中自樞紐區213接收包裹 以用於分選至路線及/或子路線中。在一些實施例中,營地區215與FC 200實體地分開,而在其他實施例中,營地區215可形成FC 200的一部分。
營地區215中的工作者及/或機器可例如基於下述者來判定包裹220應與哪一路線及/或子路線相關聯:目的地與現有路線及/或子路線的比較、對每一路線及/或子路線的工作負荷的計算、時刻、運送方法、運送包裹220的成本、與包裹220中的物件相關聯的PDD,或類似者。在一些實施例中,工作者或機器可(例如,使用裝置119A至裝置119C中的一者)掃描包裹以判定其最終目的地。一旦將包裹220指定給特定路線及/或子路線,工作者及/或機器即可移動待運送的包裹220。在例示性圖2中,營地區215包含卡車222、汽車226以及遞送工作者224A及遞送工作者224B。在一些實施例中,卡車222可由遞送工作者224A駕駛,其中遞送工作者224A為遞送FC 200的包裹的全職雇員,且卡車222由擁有、租用或操作FC 200的同一公司擁有、租用或操作。在一些實施例中,汽車226可由遞送工作者224B駕駛,其中遞送工作者224B為在視需要基礎上(例如,季節性地)遞送的「靈活」或臨時工作者。汽車226可由遞送工作者224B擁有、租用或操作。
參考圖3,繪示示出包括用於訓練用於將產品分類的一或多個模型的電腦化系統的網路的例示性實施例的示意性方塊圖。如圖3中所示出,系統300可包含訓練資料系統310、預處理系統320、階層式模型訓練器系統330以及影像模型訓練器系統340,其中的每一者可經由網路350與使用者裝置360通信,所述使用者裝置360與使用者360A相關聯。在一些實施例中,訓練資料系 統310、預處理系統320、階層式模型訓練器系統330以及影像模型訓練器系統340可經由直接連接(例如,使用電纜)彼此通信且與系統300的其他組件通信。在一些其他實施例中,系統300可為圖1A的系統100的一部分,且可經由網路350或經由直接連接(例如,使用電纜)與系統100的其他組件(例如,外部前端系統103或內部前端系統105)通信。訓練資料系統310、預處理系統320、階層式模型訓練器系統330以及影像模型訓練器系統340可各自包括單一電腦或可各自經組態為分散式電腦系統,所述分散式電腦系統包含交互操作以進行與所揭露實例相關聯的過程及功能性中的一或多者的多個電腦。
如圖3中所繪示,訓練資料系統310可包括處理器312、記憶體314以及資料庫316。預處理系統320可包括處理器322、記憶體324以及資料庫326。階層式模型訓練器系統330可包括處理器332、記憶體334以及資料庫336。影像模型訓練器系統340可包括處理器342、記憶體344以及資料庫346。處理器312、處理器322、處理器332以及處理器342可為一或多個已知處理裝置,諸如來自由英特爾TM(IntelTM)製造的奔騰TM(PentiumTM)系列或由AMDTM製造的炫龍TM(TurionTM)系列的微處理器。處理器312、處理器322、處理器332以及處理器342可構成單核心處理器或同時執行並行程序的多核心處理器。舉例而言,處理器312、處理器322、處理器332以及處理器342可使用邏輯處理器來同時執行及控制多個程序。處理器312、處理器322、處理器332以及處理器342可實行虛擬機技術或其他已知技術以提供執行、控制、運行、操控、儲存等多個軟體程序、應用程式、程式等的能 力。在另一實例中,處理器312、處理器322、處理器332以及處理器342可包含多核心處理器配置,所述多核心處理器配置經組態以提供並行處理功能性以允許訓練資料系統310、預處理系統320、階層式模型訓練器系統330以及影像模型訓練器系統340以同時執行多個程序。所屬技術領域中具有通常知識者應瞭解,可實行提供本文中所揭露的能力的其他類型的處理器配置。
記憶體314、記憶體324、記憶體334以及記憶體344可儲存當分別由處理器312、處理器322、處理器332以及處理器342執行時進行已知作業系統功能的一或多個作業系統。作為實例,作業系統可包含微軟視窗(Microsoft Windows)、Unix、Linux、安卓(Android)、Mac OS、iOS或其他類型的作業系統。因此,所揭露發明的實例可用運行任何類型的作業系統的電腦系統操作及運作。記憶體314、記憶體324、記憶體334以及記憶體344可為揮發性或非揮發性、磁性、半導體、磁帶、光學、可移除、不可移除或其他類型的儲存裝置或有形電腦可讀媒體。
資料庫316、資料庫326、資料庫336以及資料庫346可包含例如甲骨文TM(OracleTM)資料庫、賽貝斯TM(SybaseTM)資料庫或其他關連式資料庫或非關連式資料庫,諸如HadoopTM順序檔案、HBaseTM或CassandraTM。資料庫316、資料庫326、資料庫336以及資料庫346可包含計算組件(例如,資料庫管理系統、資料庫伺服器等),所述計算組件經組態以接收及處理對儲存於資料庫的記憶體裝置中的資料的請求及自資料庫提供資料。資料庫316、資料庫326、資料庫336以及資料庫346可包含NoSQL資料庫,諸如HBase、MongoDBTM或CassandraTM。替代地,資料庫316、 資料庫326、資料庫336以及資料庫346可包含諸如甲骨文、MySQL以及微軟SQL伺服器的關連式資料庫。在一些實施例中,資料庫316、資料庫326、資料庫336以及資料庫346可呈伺服器、通用電腦、大型主機電腦或此等組件的任何組合的形式。
資料庫316、資料庫326、資料庫336以及資料庫346可儲存資料,所述資料可分別由處理器312、處理器322、處理器332以及處理器342用於進行與所揭露實例相關聯的方法及過程。資料庫316、資料庫326、資料庫336以及資料庫346可分別位於訓練資料系統310、預處理系統320、階層式模型訓練器系統330以及影像模型訓練器系統340中,如圖3中所繪示,或替代地,其可在位於訓練資料系統310、預處理系統320、階層式模型訓練器系統330以及影像模型訓練器系統340外部的外部儲存裝置中。儲存於316中的資料可包含與產品相關聯的任何合適的初始訓練資料(例如,產品識別號、最高類別級別、類別子級別、產品名稱、產品影像、產品品牌、產品描述等),儲存於326中的資料可包含與預處理的訓練資料相關聯的任何合適的資料,儲存於336中的資料可包含與訓練階層式模型相關聯的任何合適的資料,且儲存於346中的資料可包含與訓練影像模型相關聯的任何合適的資料。
使用者裝置360可為平板電腦、行動裝置、電腦或類似者。使用者裝置360可包含顯示器。顯示器可包含例如液晶顯示器(liquid crystal display;LCD)、發光二極體螢幕(light emitting diode;LED)、有機發光二極體螢幕(organic light emitting diode;OLED)、觸控螢幕以及其他已知顯示裝置。顯示器可向使用者展示各種資訊。舉例而言,其可顯示用於輸入或產生訓練資料的線上 平台,包含供內部使用者(例如,擁有、操作或租用系統100的組織的雇員)或外部使用者輸入訓練資料的輸入文字方塊,所述訓練資料包含產品資訊(例如,產品識別號、最高類別級別、類別子級別、產品名稱、產品影像、產品品牌、產品描述等)。使用者裝置360可包含一或多個輸入/輸出(input/output;I/O)裝置。I/O裝置可包含允許使用者裝置360發送來自使用者360A或另一裝置的資訊及自使用者360A或另一裝置接收資訊的一或多個裝置。I/O裝置可包含各種輸入/輸出裝置、攝影機、麥克風、鍵盤、滑鼠型裝置、手勢感測器、動作感測器、實體按鈕、口頭輸入等。I/O裝置亦可包含一或多個通信模組(未繪示),所述一或多個通信模組用於藉由例如在使用者裝置360與網路350之間建立有線或無線連接性來發送及接收來自訓練資料系統310、預處理系統320、階層式模型訓練器系統330或影像模型訓練器系統340的資訊。
訓練資料系統310可接收包含與一或多個類別相關聯的產品的初始訓練資料。訓練資料系統310可使用不同方法的組合來收集訓練資料。訓練資料收集方法可包含人類標記資料、虛擬產品資料、映射指南關鍵字資料或實況產品的選擇。舉例而言,訓練資料系統310可經由內部前端系統105自內部使用者(例如,擁有、操作或租用系統100的組織的雇員)接收初始訓練資料。
人類標記資料可包含使用者360A手動輸入針對至少一個訓練資料點的每一訓練資料點的產品資訊(例如,產品識別號、最高類別級別、類別子級別、產品名稱、產品影像、產品品牌、產品描述等)。
虛擬產品資料可包含使用現有類別來自動產生擴增的訓 練資料。舉例而言,訓練資料系統310可使用自現有類別及子類別(例如,時尚、女性時尚、女性服裝、褲裝、短褲)獲得的關鍵字來自動產生包含產品名稱(例如,女性短褲)的至少一個訓練資料點。產生虛擬產品資料可改良待訓練的模型的強健性,此是由於產品名稱自關鍵字顯而易見且不應錯誤分類。
映射指南關鍵字資料可包含使用實況產品來自動產生擴增的訓練資料。舉例而言,訓練資料系統310可藉由在資料庫316中搜尋映射至至少一個關鍵字的實況產品來自動產生至少一個訓練資料點。若實況產品已映射至產品識別號且在其相關聯類別中的一者中含有至少一個關鍵字,則訓練資料系統310認為將所述實況產品正確地分類且產生作為實況產品的重複的新的訓練資料點。產生映射指南關鍵字資料可改良待訓練的模型的強健性,此是由於其增加了待饋送至待訓練的模型中的正確分類的訓練資料的量。
實況產品的選擇可包含藉由自實況產品列表及其相關聯類別隨機收集最多十個產品來自動產生擴增的訓練資料。舉例而言,訓練資料系統310可判定一些類別並不具有任何相關聯訓練資料。訓練資料系統310可藉由隨機收集用不具有任何相關聯訓練資料的類別標記的最多十個實況產品來自動產生訓練資料,且產生作為所收集的實況產品的重複的新的訓練資料點。實況產品的選擇可藉由提供更完整的訓練資料集來改良待訓練的模型的品質。
預處理系統320可接收由訓練資料系統310收集的初始訓練資料,且藉由預處理初始訓練資料來產生合成訓練資料。可使 用方法的任何組合來預處理基於文字的初始訓練資料,所述方法包含停止字消除、關鍵字符記化、關鍵字的去重以及初始訓練資料的擴增,且可使用影像擴增技術(例如,PyTorch)來預處理基於影像的初始訓練資料。
預處理系統320可藉由參考儲存於資料庫326中的停止字的字典來消除停止字。停止字可包含與訓練資料相關聯的字,所述字與產品特性無關,且因此不是將產品分類所必需的。舉例而言,停止字可包含「銷售」、「折扣」或「免費遞送」。停止字消除可藉由自訓練資料集移除減慢模型訓練過程的多餘字來提高待訓練的模型的強健性。
預處理系統320可藉由參考儲存於資料庫326中的符記字典及實行Aho-Corasick演算法以判定是否將關鍵字拆分成多個關鍵字來使關鍵字符記化。舉例而言,可將以某些語言(諸如韓語)書寫的關鍵字儲存為無空格的單一文字串。(流利的說話者應瞭解,可將此文字串拆分成字的各種組合。)預處理系統320可實行Aho-Corasick演算法,其為在輸入文字內定位有限串集合(例如,「字典」)的元素的字典匹配演算法。演算法同時匹配所有串,使得預處理系統320可藉由收集輸入文字的實際關鍵字同時移除未在所儲存的字典中列出的「拆分」字來產生合成訓練資料。關鍵字符記化可藉由自訓練資料集移除減慢模型訓練過程的多餘字來提高待訓練的模型的強健性。
預處理系統320可藉由識別訓練集中的關鍵字及移除現有關鍵字的任何重複來對關鍵字進行去重。關鍵字去重可藉由移除重複的關鍵字來增加產品分類結果的平衡。
預處理系統320可藉由複製一些訓練資料及自複製的資料移除無關的文數字字元或自複製的資料隨機移除關鍵字來擴增初始訓練資料。舉例而言,當訓練資料及產品類別主要以韓語書寫時,預處理系統320可複製初始訓練資料且自複製的訓練資料移除英語及數值字元。預處理系統320接著可將此擴增資料添加至訓練資料集以加強韓語字元的增加的模型學習。預處理系統320亦可複製初始訓練資料且自複製的訓練資料隨機移除關鍵字。預處理系統320接著可將此擴增資料添加至訓練資料集,以藉由降低過度擬合模型的似然來提高待訓練的模型的強健性。
預處理系統320可藉由旋轉影像、使影像移位、翻轉影像、向影像添加雜訊、使影像模糊等來擴增基於影像的初始訓練資料。舉例而言,預處理系統320可多次複製初始訓練資料集的每一影像且在各種定向上旋轉複製的影像。預處理系統320可藉由將旋轉的複製影像添加至訓練資料集來提高待訓練的模型的強健性。
在另一實例中,預處理系統320可多次複製初始訓練資料集的每一影像且在各種偏心方位中使複製的影像移位。預處理系統320可藉由將移位的複製影像添加至訓練資料集來提高待訓練的模型的強健性及一般化。
在另一實例中,預處理系統320可多次複製初始訓練資料集的每一影像且在各種定向上翻轉複製的影像。預處理系統320可藉由將翻轉的複製影像添加至訓練資料集來提高待訓練的模型的一般化。
在另一實例中,預處理系統320可多次複製初始訓練資 料集的每一影像且向複製的影像添加隨機雜訊。預處理系統320可藉由將具有雜訊的複製影像添加至訓練資料集來幫助模型學習將信號與影像中的雜訊分離,從而提高待訓練的模型的強健性。
在另一實例中,預處理系統320可多次複製初始訓練資料集的每一影像且以各種量使複製的影像模糊(例如,改變複製的影像的品質)。預處理系統320可藉由將模糊的複製影像添加至訓練資料集來提高待訓練的模型的強健性。
階層式模型訓練器系統330可接收由預處理系統320產生的基於文字的合成訓練資料,且影像模型訓練器系統340可接收由預處理系統320產生的基於影像的合成訓練資料。階層式模型訓練器系統330及影像模型訓練器340可使用接收到的用於將產品分類的合成資料分別產生及訓練至少一個階層式模型及至少一個影像模型。
參考圖4,繪示用於將產品分類的樣本訓練資料400。如圖4中所示出,訓練資料可包含與單一產品相關聯的多個單元。舉例而言,訓練資料可包含產品識別號410、高級別類別412、一或多個子類別414、產品名稱416、品牌418或產品影像URL420。訓練資料可使用本文中所揭露的實施例中的任一者獲得。
參考圖5,繪示示出包括用於使用一或多個模型將產品分類的電腦化系統的網路的例示性實施例的示意性方塊圖。如圖5中所示出,系統500可包含產品類別預測器系統520,所述產品類別預測器系統520可經由網路550與使用者裝置560(其可與圖3的使用者裝置360相同)通信,所述使用者裝置560與使用者560A(其可為圖3的相同使用者360A)相關聯。在一些實施例中,產品 類別預測器520可經由直接連接(例如,使用電纜)與系統500的其他組件通信。在一些其他實施例中,系統500可為圖1A的系統100或圖3的系統300的一部分,且可經由網路550或經由直接連接(例如,使用電纜)與系統100或系統300的其他組件通信。產品類別預測器520可包括單一電腦或可經組態為分散式電腦系統,所述分散式電腦系統包含交互操作以進行與所揭露實例相關聯的過程及功能性中的一或多者的多個電腦。
如圖5中所繪示,產品類別預測器520可包括處理器522、記憶體524以及資料庫526。處理器522可為一或多個已知處理裝置,諸如來自由英特爾TM製造的奔騰TM系列或由AMDTM製造的炫龍TM系列的微處理器。處理器522可構成單核心處理器或同時執行並行程序的多核心處理器。舉例而言,處理器522可使用邏輯處理器來同時執行及控制多個程序。處理器522可實行虛擬機技術或其他已知技術以提供執行、控制、運行、操控、儲存等多個軟體程序、應用程式、程式等的能力。在另一實例中,處理器522可包含經組態以提供並行處理功能性以允許產品類別預測器520同時執行多個程序的多核心處理器配置。所屬技術領域中具有通常知識者應瞭解,可實行提供本文中所揭露的能力的其他類型的處理器配置。
記憶體524可儲存當分別由處理器522執行時進行已知作業系統功能的一或多個作業系統。作為實例,作業系統可包含微軟視窗、Unix、Linux、安卓、Mac OS、iOS或其他類型的作業系統。因此,所揭露發明的實例可用運行任何類型的作業系統的電腦系統操作及運作。記憶體524可為揮發性或非揮發性、磁性、半導 體、磁帶、光學、可移除、不可移除或其他類型的儲存裝置或有形電腦可讀媒體。
資料庫526可包含例如甲骨文TM資料庫、賽貝斯TM資料庫或其他關連式資料庫或非關連式資料庫,諸如HadoopTM順序檔案、HBaseTM或CassandraTM。資料庫526可包含計算組件(例如,資料庫管理系統、資料庫伺服器等),所述計算組件經組態以接收及處理對儲存於資料庫的記憶體裝置中的資料的請求及自資料庫提供資料。資料庫526可包含NoSQL資料庫,諸如HBase、MongoDBTM或CassandraTM。替代地,資料庫526可包含諸如甲骨文、MySQL以及微軟SQL伺服器的關連式資料庫。在一些實施例中,資料庫526可呈伺服器、通用電腦、大型主機電腦或此等組件的任何組合的形式。
資料庫526可儲存可由處理器522用於進行與所揭露實例相關聯的方法及過程的資料。資料庫526可位於產品類別預測器520中,如圖5中所繪示,或替代地,其可在位於產品類別預測器520外部的外部儲存裝置中。儲存於526中的資料可包含與由賣方提供的產品相關聯的任何資訊(例如,產品名稱、屬性值、製造商、品牌、型號等)。
使用者裝置560可為平板電腦、行動裝置、電腦或類似者。使用者裝置560可包含顯示器。顯示器可包含例如液晶顯示器(LCD)、發光二極體螢幕(LED)、有機發光二極體螢幕(OLED)、觸控螢幕以及其他已知顯示裝置。顯示器可向使用者展示各種資訊。舉例而言,其可顯示用於輸入產品資訊的線上平台,包含供賣方輸入產品資訊(例如,產品名稱、屬性值、製造商、品牌、型號 等)的輸入文字方塊。使用者裝置560可包含一或多個輸入/輸出(I/O)裝置。I/O裝置可包含允許使用者裝置560發送來自使用者560A或另一裝置的資訊及自使用者560A或另一裝置接收資訊的一或多個裝置。I/O裝置可包含各種輸入/輸出裝置、攝影機、麥克風、鍵盤、滑鼠型裝置、手勢感測器、動作感測器、實體按鈕、口頭輸入等。I/O裝置亦可包含一或多個通信模組(未繪示),所述一或多個通信模組用於藉由例如在使用者裝置560與網路550之間建立有線或無線連接性來發送及接收來自產品類別預測器520的資訊。
產品類別預測器520可經由網路550自使用者560A(例如,賣方)接收輸入資料510。舉例而言,使用者560A可使用使用者裝置560與賣方入口網站109通信且登記至少一個產品。可提示使用者560A輸入包含產品名稱、屬性值、製造商、品牌以及型號的序連文字串。亦可提示使用者560A輸入產品類別預測器520可針對給定產品預測的數個類別N及數個類別M。包含序連文字串以及數個類別N及類別M的輸入510可為僅有的輸入資料。
產品類別預測器520可自輸入510識別關鍵字且使用庫(例如,快文字(fastText))將所述關鍵字變換成向量表示。產品類別預測器520可使用庫來學習每一關鍵字的字元n元語法(n-gram)的表示。每一關鍵字接著可表示為一包字元n元語法,且總字嵌入為字元n元語法的總和。舉例而言,內部使用者或外部使用者(例如,使用者560A)可手動設定或產品類別預測器520可自動設定n元語法為3,在此情況下,字「其中」的向量將由三 元語法的總和表示:<wh,whe,her,ere,re>,其中括號<、>為標示字的開始及結束的邊界符號。在將每一字表示為n元語法的總和之後,導出潛在文字嵌入作為字嵌入的平均值,此時文字嵌入可由產品類別預測器520用以預測標記。此過程可有利於識別稀少關鍵字或未包含於訓練資料集中的關鍵字。
產品類別預測器520可使用經過訓練的階層式模型(例如,圖3的階層式模型訓練器系統330)來預測與由使用者560A提供的產品資訊相關聯的類別。在一些實施例中,產品資訊可指示產品不正確地分類,在此情況下產品類別預測器520可預測所述產品的正確類別。階層式模型可使用輸入510藉由首先計算未分類產品的第一層上的每一節點的機率得分來預測未分類產品的N個類別。機率得分指示未分類產品屬於相關聯類別的機率。階層式模型接著可判定第一層(例如,圖6的層610)上的具有最高n個機率得分的n個節點的集合。舉例而言,頂層可包含五個類別,且在n=3的情況下,階層式模型可判定第一層上的具有三個最高機率得分的三個節點(或類別)。
階層式模型接著可計算第二層(例如,圖6的第二層620)上的節點集合的機率得分,其中第二層上的節點集合為具有最高n個機率得分的n個節點(或類別)的子類別。階層式模型接著可判定第二層上的具有最高m個得分的m個節點的集合。舉例而言,在m=3的情況下,階層式模型可判定第二層上的具有三個最高得分的三個節點(或類別)。階層式模型可針對任何數目個類別遞回地繼續此過程。若最終層(例如,圖6的層630)中的節點具有超出最終層的更多節點,則階層式模型可使所述節點的結構變平, 使得可計算出最終的總機率得分。
階層式模型可基於每一層中的節點的機率得分來計算總機率。舉例而言,若階層式模型具有基於每一前一層的最高三個機率得分的三個層,則階層式模型在第三層中具有27個最終類別候選以供選擇(層1的前3個‧層2的前3個‧層3的前3個=27個候選)。27個候選中的每一者(例如,圖6的節點631)的總機率得分可藉由將其在每一層中的機率得分相乘來計算出(例如,層1得分‧層2得分‧層3得分=一個節點的總機率得分)。階層式模型接著可判定具有最高N個總機率得分的N個類別。
產品類別預測器520可使用經過訓練的影像模型(例如,圖3的影像模型訓練器340)來預測第一未分類產品的M個類別。產品類別預測器520可使用經過訓練的影像模型來計算每一類別的機率得分,且判定具有最高M個機率得分的最高M個類別。
產品類別預測器520可將N個類別的總機率得分與對應M個類別的總機率得分進行平均。舉例而言,對於特定類別,將藉由用於所述類別的階層式模型判定的總機率得分與藉由用於所述相同類別的影像模型判定的總機率得分進行平均。N及M可以不必為相同數目的類別。舉例而言,若階層式模型判定N個類別中的一者的得分,且影像模型不具有針對所述相同類別的得分,則來自影像模型的針對所述類別的總機率得分為零。產品類別預測器520可判定具有最高平均得分的類別為未分類產品的最相關類別,且隨後將未分類產品分選至具有最高平均化總機率得分的N個或M個類別中的一或多者中。
參考圖6,繪示用於將產品分類的樣本階層式模型600。 舉例而言,階層式模型600可包含根節點601及第一層610,所述第一層610包含表示不同產品類別的多個節點611。階層式模型600亦可包含第二層620,所述第二層620包含表示節點611的不同產品子類別的多個節點621。階層式模型600亦可包含第三層630,所述第三層630包含表示節點621的不同產品子類別的多個節點631。階層式模型600可包含任何數目個層及節點且不限於所描繪的實施例。
參考圖7,繪示用於將產品分類的過程。儘管在一些實施例中,圖3及圖5中所描繪的系統中的一或多者可進行本文中所描述的步驟中的若干者,但其他實施方案為可能的。舉例而言,本文中所描述及示出的系統及組件中的任一者(例如,系統100等)可進行本揭露內容中所描述的步驟。
在步驟701中,訓練資料系統310可經由網路350自使用者360A接收包含與一或多個類別相關聯的產品的初始訓練資料(例如,圖4的產品識別410、高級別類別412、子類別414、產品名稱416、品牌418或產品影像URL 420)。舉例而言,初始訓練資料可包含人類標記資料、自動產生的虛擬產品資料、自動產生的映射指南關鍵字資料或實況產品的自動選擇的任何組合。訓練資料系統310可經由內部前端系統105自內部使用者(例如,擁有、操作或租用系統100的組織的雇員)接收初始訓練資料。
在步驟703中,預處理系統320可預處理自訓練資料系統310接收到的初始訓練資料以產生合成訓練資料。舉例而言,可使用方法的任何組合來預處理基於文字的初始訓練資料,所述方法包含停止字消除、關鍵字符記化、關鍵字的去重以及初始訓練 資料的擴增,且可使用影像擴增技術(例如,PyTorch)來預處理基於影像的初始訓練資料。
在步驟705中,階層式模型訓練器系統330可接收由預處理系統320產生的基於文字的合成訓練資料,且影像模型訓練器系統340可接收由預處理系統320產生的基於影像的合成訓練資料。階層式模型訓練器系統330及影像模型訓練器340可使用接收到的用於將產品分類的合成資料分別產生及訓練至少一個階層式模型及至少一個影像模型。返回例示性圖6,階層式模型可含有根節點601下方的至少兩層(層610及層620)節點(節點611及節點621)。
在步驟707中,產品類別預測器520可接收與第一未分類產品相關聯的資訊。舉例而言,使用者560A可使用使用者裝置560與賣方入口網站109通信且登記至少一個產品。可提示使用者560A輸入包含產品名稱、屬性值、製造商、品牌以及型號的序連文字串。
在步驟709中,產品類別預測器520可接收預測具有最高N個總機率得分的N個類別的集合的請求。舉例而言,可提示使用者560A輸入產品類別預測器520可針對給定產品預測的數個類別N。
在步驟711中,產品類別預測器520可使用階層式模型藉由首先計算未分類產品的第一層上的每一節點的機率得分來預測第一未分類產品的N個類別。機率得分指示未分類產品屬於相關聯類別的機率。階層式模型接著可判定第一層(例如,圖6的層610)上的具有最高n個機率得分的n個節點的集合。舉例而言, 頂層可包含五個類別,且在n=3的情況下,階層式模型可判定第一層上的具有三個最高機率得分的三個節點(或類別)。階層式模型接著可計算第二層(例如,圖6的第二層620)上的節點集合的機率得分,其中第二層上的節點集合為具有最高n個機率得分的n個節點(或類別)的子類別。階層式模型接著可判定第二層上的具有最高m個得分的m個節點的集合。舉例而言,在m=3的情況下,階層式模型可判定第二層上的具有三個最高得分的三個節點(或類別)。階層式模型可針對任何數目個類別遞回地繼續此過程。階層式模型可基於具有最高m個得分的m個節點及第一層中的各別n個節點的機率得分來計算總機率得分。階層式模型接著可判定具有最高N個總機率得分的N個類別。
在步驟713中,產品類別預測器520可隨後將未分類產品分選至與來自第一層及第二層的具有最高總機率得分的節點相關聯的N個類別中的一或多者中。
在步驟715中,產品類別預測器520可在與使用者(例如,使用者560A)相關聯的使用者裝置(例如,使用者裝置560)上顯示分選的第一未分類產品及其相關聯的N個類別。舉例而言,產品類別預測器520可準備或修改網頁以包含與第一未分類產品及一或多個相關聯類別相關聯的資料。
儘管已參考本揭露內容的特定實施例繪示及描述本揭露內容,但應理解,可在不修改的情況下在其他環境中實踐本揭露內容。已出於示出的目的呈現前述描述。前述描述並不詳盡且不限於所揭露的精確形式或實施例。修改及調適對所屬技術領域中具有通常知識者將自本說明書的考量及所揭露實施例的實踐顯而易 見。另外,儘管將所揭露實施例的態樣描述為儲存於記憶體中,但所屬技術領域中具有通常知識者應瞭解,此等態樣亦可儲存於其他類型的電腦可讀媒體上,諸如次級儲存裝置,例如硬碟或CD ROM,或其他形式的RAM或ROM、USB媒體、DVD、藍光,或其他光碟機媒體。
基於書面描述及所揭露方法的電腦程式在有經驗開發者的技能內。各種程式或程式模組可使用所屬技術領域中具有通常知識者已知的技術中的任一者來創建或可結合現有軟體來設計。舉例而言,程式區段或程式模組可以或藉助於.Net框架(.Net Framework)、.Net緊密框架(.Net Compact Framework)(及相關語言,諸如視覺培基(Visual Basic)、C等)、爪哇(Java)、C++、目標-C(Objective-C)、HTML、HTML/AJAX組合、XML或包含爪哇小程式的HTML來設計。
此外,儘管本文中已描述示出性實施例,但所屬技術領域中具有通常知識者將基於本揭露內容瞭解具有等效元件、修改、省略、(例如,各種實施例中的態樣的)組合、調適及/或更改的任何及所有實施例的範圍。申請專利範圍中的限制應基於申請專利範圍中所採用的語言來廣泛地解釋,且不限於本說明書中所描述或在本申請案的審查期間的實例。實例應視為非排他性的。另外,所揭露方法的步驟可以包含藉由對步驟重新排序及/或插入或刪除步驟的任何方式修改。因此,希望僅將本說明書及實例視為示出性的,其中藉由以下申請專利範圍及其等效物的完整範圍指示真實範圍及精神。
701、703、705、707、709、711、713、715:步驟

Claims (20)

  1. 一種基於人工智慧的將產品分類的電腦實行系統,所述系統包括:記憶體,儲存指令;以及至少一個處理器,經組態以執行所述指令以:檢索包含與一或多個類別相關聯的產品的初始訓練資料;預處理所述初始訓練資料以產生合成訓練資料;使用所述合成訓練資料來產生階層式模型,所述階層式模型含有根節點下方的至少兩層節點;接收與第一未分類產品相關聯的資訊;接收預測具有最高N個總機率得分的N個類別的集合的請求;使用所述階層式模型藉由以下操作預測所述第一未分類產品的N個類別:計算所述第一未分類產品的第一層上的每一節點的機率得分,判定所述第一層上的具有最高n個機率得分的n個節點的集合,計算第二層上的節點集合的機率得分,所述節點集合在具有所述最高n個機率得分的所判定的所述n個節點的集合下方,判定所述第二層上的具有最高m個機率得分的m個節點的集合,基於具有所述最高m個機率得分的所述m個節點及所述第一層中的各別n個節點的所述機率得分來計算總機率得分,以及 判定具有所述最高N個總機率得分的所述N個類別;將所述第一未分類產品分選至與來自所述第一層及所述第二層的具有所述最高總機率得分的所述節點相關聯的所述N個類別中;在與使用者相關聯的使用者裝置上顯示分選的所述第一未分類產品及其相關聯的N個類別。
  2. 如請求項1所述的系統,其中所述初始訓練資料包含與一或多個類別相關聯的影像。
  3. 如請求項2所述的系統,其中所述指令進一步使得所述處理器使用所述合成訓練資料來產生影像模型。
  4. 如請求項1所述的系統,其中所述初始訓練資料包括人類標記資料、虛擬產品資料、映射指南關鍵字資料或實況產品的選擇中的至少一者。
  5. 如請求項1所述的系統,其中預處理所述初始訓練資料包括自所述初始訓練資料移除停止字。
  6. 如請求項1所述的系統,其中預處理所述初始訓練資料包括使所述初始訓練資料符記化。
  7. 如請求項1所述的系統,其中預處理所述初始訓練資料包括對所述初始訓練資料進行去重。
  8. 如請求項1所述的系統,其中預處理所述初始訓練資料包括複製所述初始訓練資料以及自經複製的所述初始訓練資料移除無關文數字字元。
  9. 如請求項1所述的系統,其中預處理所述初始訓練資料包括複製所述初始訓練資料以及自經複製的所述初始訓練資 料隨機移除關鍵字。
  10. 如請求項1所述的系統,其中與所述第一未分類產品相關聯的接收到的所述資訊指示將所述第一未分類產品不正確地分類。
  11. 一種使用人工智慧對產品進行分類的方法,所述方法包括:檢索包含與一或多個類別相關聯的產品的初始訓練資料;預處理所述初始訓練資料以產生合成訓練資料;使用所述合成訓練資料來產生階層式模型,所述階層式模型含有根節點下方的至少兩層節點;接收與第一未分類產品相關聯的資訊;接收預測具有最高N個總機率得分的N個類別的集合的請求;使用所述階層式模型藉由以下操作預測所述第一未分類產品的N個類別:計算所述第一未分類產品的第一層上的每一節點的機率得分,判定所述第一層上的具有最高n個機率得分的n個節點的集合,計算第二層上的節點集合的機率得分,所述節點集合在具有所述最高n個機率得分的所判定的所述n個節點的集合下方,判定所述第二層上的具有最高m個機率得分的m個節點的集合,基於具有所述最高m個機率得分的所述m個節點及所述第 一層中的各別n個節點的所述機率得分來計算總機率得分,以及判定具有所述最高N個總機率得分的所述N個類別;以及將所述第一未分類產品分選至與來自所述第一層及所述第二層的具有所述最高總機率得分的所述節點相關聯的所述N個類別中。
  12. 如請求項11所述的方法,其中所述初始訓練資料包含與一或多個類別相關聯的影像。
  13. 如請求項12所述的方法,其中所述方法更包括使用所述合成訓練資料來產生影像模型。
  14. 如請求項11所述的方法,其中所述初始訓練資料包括人類標記資料、虛擬產品資料、映射指南關鍵字資料或實況產品的選擇中的至少一者。
  15. 如請求項11所述的方法,其中預處理所述初始訓練資料包括自所述初始訓練資料移除停止字。
  16. 如請求項11所述的方法,其中預處理所述初始訓練資料包括使所述初始訓練資料符記化。
  17. 如請求項11所述的方法,其中預處理所述初始訓練資料包括對所述初始訓練資料進行去重。
  18. 如請求項11所述的方法,其中預處理所述初始訓練資料包括複製所述初始訓練資料以及自經複製的所述初始訓練資料移除無關文數字字元。
  19. 如請求項11所述的方法,其中預處理所述初始訓練資料包括複製所述初始訓練資料以及自經複製的所述初始訓練資料隨機移除關鍵字。
  20. 一種基於人工智慧的將產品分類的電腦實行系統,所述系統包括:記憶體,儲存指令;以及至少一個處理器,經組態以執行所述指令以:檢索包含與一或多個類別相關聯的產品及影像的初始訓練資料;預處理所述初始訓練資料以產生合成訓練資料;使用所述合成訓練資料來產生階層式模型,所述階層式模型含有根節點下方的至少兩層節點;使用所述合成訓練資料來產生影像模型;接收與第一未分類產品相關聯的資訊;接收預測具有最高N個總機率得分的N個類別的集合的請求及預測具有最高M個總機率得分的M個類別的集合的請求;使用所述階層式模型藉由以下操作預測所述第一未分類產品的N個類別:計算所述第一未分類產品的第一層上的每一節點的機率得分,判定所述第一層上的具有最高n個機率得分的n個節點的集合,計算第二層上的節點集合的機率得分,所述節點集合在具有所述最高n個機率得分的所判定的所述n個節點的集合下方,判定所述第二層上的具有最高m個機率得分的m個節點的集合,基於具有所述最高m個機率得分的所述m個節點及所述第 一層中的各別n個節點的所述機率得分來計算總機率得分,以及判定具有所述最高N個總機率得分的所述N個類別;使用所述影像模型藉由以下操作預測所述第一未分類產品的M個類別:計算所述第一未分類產品的機率得分,以及判定具有所述最高M個總機率得分的所述M個類別;對所述N個類別與所述M個類別的所述總機率得分求平均;將所述第一未分類產品分選至具有最高平均化總機率得分的所述N個類別或所述M個類別中的類別中;以及在與使用者相關聯的使用者裝置上顯示分選的第一未分類產品及其相關聯的N個類別或M個類別。
TW109145276A 2020-02-18 2020-12-21 基於人工智慧的將產品分類的電腦實行系統以及使用人工智慧對產品進行分類的方法 TWI747674B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US16/793,536 US11023814B1 (en) 2020-02-18 2020-02-18 Computerized systems and methods for product categorization using artificial intelligence
US16/793,536 2020-02-18

Publications (2)

Publication Number Publication Date
TW202133066A TW202133066A (zh) 2021-09-01
TWI747674B true TWI747674B (zh) 2021-11-21

Family

ID=76094705

Family Applications (1)

Application Number Title Priority Date Filing Date
TW109145276A TWI747674B (zh) 2020-02-18 2020-12-21 基於人工智慧的將產品分類的電腦實行系統以及使用人工智慧對產品進行分類的方法

Country Status (5)

Country Link
US (2) US11023814B1 (zh)
KR (2) KR102350982B1 (zh)
SG (1) SG11202104604QA (zh)
TW (1) TWI747674B (zh)
WO (1) WO2021165738A1 (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11500970B2 (en) * 2019-08-02 2022-11-15 Nxp B.V. Machine learning model and method for determining if the machine learning model has been copied
US11475128B2 (en) * 2019-08-16 2022-10-18 Mandiant, Inc. System and method for heterogeneous transferred learning for enhanced cybersecurity threat detection
US11657332B2 (en) * 2020-06-12 2023-05-23 Baidu Usa Llc Method for AI model transferring with layer randomization
KR102486487B1 (ko) * 2022-05-18 2023-01-10 신지수 사용자를 위한 상품 제공 방법
KR102456012B1 (ko) * 2022-06-10 2022-10-18 주식회사 애자일소다 인공지능 기반의 분류 모델링 장치 및 방법
CN117195081B (zh) * 2023-11-07 2024-02-27 广东工业大学 基于文本挖掘的餐饮外卖包装废弃物核算方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160378770A1 (en) * 2013-04-30 2016-12-29 Wal-Mart Stores, Inc. Training a classification model to predict categories
US20180121533A1 (en) * 2016-10-31 2018-05-03 Wal-Mart Stores, Inc. Systems, method, and non-transitory computer-readable storage media for multi-modal product classification
TWI665566B (zh) * 2017-09-04 2019-07-11 優愛德股份有限公司 產品分類系統與方法
CN110597995A (zh) * 2019-09-20 2019-12-20 税友软件集团股份有限公司 一种商品名称分类方法、装置、设备及可读存储介质

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6742003B2 (en) * 2001-04-30 2004-05-25 Microsoft Corporation Apparatus and accompanying methods for visualizing clusters of data and hierarchical cluster classifications
US8296330B2 (en) * 2009-06-02 2012-10-23 Microsoft Corporation Hierarchical classification
US20130159209A1 (en) * 2010-08-18 2013-06-20 Yong Zhao Product information
US10528907B2 (en) * 2012-12-19 2020-01-07 Oath Inc. Automated categorization of products in a merchant catalog
US10963810B2 (en) * 2014-06-30 2021-03-30 Amazon Technologies, Inc. Efficient duplicate detection for machine learning data sets
EP3151131A1 (en) * 2015-09-30 2017-04-05 Hitachi, Ltd. Apparatus and method for executing an automated analysis of data, in particular social media data, for product failure detection
US10339470B1 (en) * 2015-12-11 2019-07-02 Amazon Technologies, Inc. Techniques for generating machine learning training data
US20190065589A1 (en) * 2016-03-25 2019-02-28 Quad Analytix Llc Systems and methods for multi-modal automated categorization
WO2018212822A1 (en) * 2017-05-16 2018-11-22 Google Inc. Suggested actions for images
JP6890720B2 (ja) * 2017-06-16 2021-06-18 マーカブル インコーポレイテッドMarkable,Inc. 画像処理システム
KR101939209B1 (ko) * 2017-06-16 2019-01-16 (주)이스트소프트 신경망 기반의 텍스트의 카테고리를 분류하기 위한 장치, 이를 위한 방법 및 이 방법을 수행하기 위한 프로그램이 기록된 컴퓨터 판독 가능한 기록매체
KR101998399B1 (ko) * 2017-08-01 2019-07-09 (주)레드테이블 빅데이터를 이용한 모바일 커머스 시스템 및 서비스 방법
JP6884116B2 (ja) * 2018-03-19 2021-06-09 ヤフー株式会社 情報処理装置、情報処理方法、およびプログラム
KR102108460B1 (ko) * 2018-04-17 2020-05-07 (주)레몬클라우드 상품 벡터를 이용한 상품 분류 방법 및 장치
US11776036B2 (en) * 2018-04-19 2023-10-03 Adobe Inc. Generating and utilizing classification and query-specific models to generate digital responses to queries from client device
US10726300B2 (en) * 2018-05-01 2020-07-28 Scribe Fusion, LLC System and method for generating and processing training data
JP2023514282A (ja) * 2020-02-17 2023-04-05 データロボット, インコーポレイテッド 非表形式データのための自動データ分析方法、関連するシステム及び装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160378770A1 (en) * 2013-04-30 2016-12-29 Wal-Mart Stores, Inc. Training a classification model to predict categories
US20180121533A1 (en) * 2016-10-31 2018-05-03 Wal-Mart Stores, Inc. Systems, method, and non-transitory computer-readable storage media for multi-modal product classification
TWI665566B (zh) * 2017-09-04 2019-07-11 優愛德股份有限公司 產品分類系統與方法
CN110597995A (zh) * 2019-09-20 2019-12-20 税友软件集团股份有限公司 一种商品名称分类方法、装置、设备及可读存储介质

Also Published As

Publication number Publication date
SG11202104604QA (en) 2021-09-29
KR20220012369A (ko) 2022-02-03
TW202133066A (zh) 2021-09-01
US20210295185A1 (en) 2021-09-23
US11023814B1 (en) 2021-06-01
WO2021165738A1 (en) 2021-08-26
KR20210105269A (ko) 2021-08-26
KR102350982B1 (ko) 2022-01-13

Similar Documents

Publication Publication Date Title
TWI747674B (zh) 基於人工智慧的將產品分類的電腦實行系統以及使用人工智慧對產品進行分類的方法
KR102354395B1 (ko) 인공 지능을 이용한 제품 통합 및 중복제거를 위한 컴퓨터 시스템 및 방법
TW202115671A (zh) 用於自動包裝決定的電腦化系統以及方法
US20220215452A1 (en) Systems and method for generating machine searchable keywords
TW202143150A (zh) 基於競爭神經字元語言模式斷詞之系統以及方法
TW202143062A (zh) 降低資料庫查詢延遲之系統以及方法
KR102419908B1 (ko) 동적 커뮤니티를 추적하기 위한 컴퓨터화된 시스템 및 방법
US11386478B1 (en) Computerized systems and methods for using artificial intelligence to generate product recommendations
TWI793585B (zh) 用於基於影像過濾產品的系統與方法以及用於基於影像過濾物件的系統
WO2023180799A1 (en) Systems and methods for identifying top alternative products based on a deterministic or inferential approach
TW202111650A (zh) 電腦實行的系統以及方法
TWI760043B (zh) 詐欺偵測與使用者帳號去除重複之電腦化系統以及方法
US12039624B2 (en) Computerized systems and methods for fraud detection and user account deduplication
TW202133004A (zh) 用於偵測產品品名中的不準確的電腦實行系統以及方法
TW202131245A (zh) 判定物件分群以用於包裝的電腦化系統及電腦實行方法
TW202247061A (zh) 自產品名稱萃取數量之電腦實施的系統以及方法
TW202232340A (zh) 自產品名稱萃取屬性之電腦實施的系統及電腦實施的方法