TW202318312A - 用於使用機器學習辨識網頁上之訂單相關資料的系統、方法及電腦程式 - Google Patents

用於使用機器學習辨識網頁上之訂單相關資料的系統、方法及電腦程式 Download PDF

Info

Publication number
TW202318312A
TW202318312A TW111130405A TW111130405A TW202318312A TW 202318312 A TW202318312 A TW 202318312A TW 111130405 A TW111130405 A TW 111130405A TW 111130405 A TW111130405 A TW 111130405A TW 202318312 A TW202318312 A TW 202318312A
Authority
TW
Taiwan
Prior art keywords
order
html
tags
related data
machine
Prior art date
Application number
TW111130405A
Other languages
English (en)
Inventor
逢 謝
載 鄭
亞當 洛斯
慕塔巴 赫辛
詹姆士 西摩勒克
Original Assignee
日商樂天集團股份有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 日商樂天集團股份有限公司 filed Critical 日商樂天集團股份有限公司
Publication of TW202318312A publication Critical patent/TW202318312A/zh

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0631Item recommendations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0641Shopping interfaces
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • G06N3/0442Recurrent networks, e.g. Hopfield networks characterised by memory or gating, e.g. long short-term memory [LSTM] or gated recurrent units [GRU]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0633Lists, e.g. purchase orders, compilation or processing

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Artificial Intelligence (AREA)
  • Molecular Biology (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本發明係關於用於使用機器學習來辨識一網頁上之訂單相關資料的一種系統、方法及電腦程式。該系統辨識一網頁上之用於進一步處理的一或多個HTML塊,其中各HTML塊包含一或多個HTML標籤,該等HTML標籤之各者係與元資料及一值相關聯。該系統將該等HTML標籤之各者轉換為一向量表示。該系統將一神經網路模型應用至該等向量表示之各者,以產生另一向量表示,該向量表示被轉換為用於各標籤之一機器產生標記預測,其中該神經網路模型被訓練以預測對應於HTML標籤之包含訂單相關標記的標記。該系統根據用於該等HTML標籤及該等對應標籤值之該等機器產生標記預測來辨識該網頁上之訂單相關資料。該系統輸出該經辨識之訂單相關資料。

Description

用於使用機器學習辨識網頁上之訂單相關資料的系統、方法及電腦程式
本發明大體上係關於網站管理,且更具體而言係關於使用機器學習辨識一網頁上之訂單相關資料之一種系統及方法。
期望理解一網頁上之訂單相關資料。此類資料有複數種用途。例如,基於使用者購買之金額向一使用者提供回饋或點數之購物入口網站可使用訂單相關資料向使用者提供即時回饋估計。一購物入口網站亦可需要瞭解結帳購物車資料,以便辨識自動填充欄位,諸如優惠券編碼欄位。訂單相關資料亦可用於分析及報告。例如,更好地瞭解何時作廢購物車中的產品可能很有用。
依賴於規則表達式之一基於規則之方法,通常用於辨識網頁上之訂單相關資料。然而,對於購物入口網站及其他必須辨識許多不同商家網頁上之訂單相關資料之系統,此可為很麻煩且難以擴充。電子商務網站及結帳頁面經常變化,且各商家之網站都不同。一基於規則之方法通常需要為各商家網站進行客製化,然後必須監控各商家網站之變化。因此,需要一種更好、更可擴充之方法以辨識各種商家網站上之訂單相關資料。更具體而言,需要一種機器學習方法以辨識商家網站上之訂單相關資料。
本發明描述用於使用機器學習辨識一網頁上之訂單相關資料之一種系統、方法及電腦程式。該方法藉由包含伺服器、儲存系統、網路、操作系統及資料庫之一電腦系統執行。
本發明使用機器學習辨識訂單相關資料,諸如購物車資料及訂單確認資料。本發明可用於判定一使用者購買什麼,抑或一使用者將購物車中的什麼作廢(即,放置在一購物車內但未購買)。傳統方法使用規則及規則表達式(即文字模式匹配)辨識結帳頁面及訂單確認頁面。然而,此通常需要為各商家客製化,若商家更改結帳、購物車或訂單確認頁面之佈局,則通常會失敗。此外,雖然根據傳統方法為幾百家商家進行客製化係可行的,但擴充至數千或數萬家商家係非常困難的。此外,辨識訂單確認頁面且提取訂單相關資料之此一機器學習方法可用於藉由在一購買後實質上即時地向客戶提供估計消費返現資訊以改良使用者體驗。
在一個實施例中,一種使用機器學習辨識在一網頁上之訂單相關資料之方法包括以下步驟: 辨識一網頁上之用於進一步處理之一或多個HTML塊,其中各HTML塊包含一或多個HTML標籤,該等HTML標籤之各者與元資料及一值相關聯; 為該等HTML標籤之各者創建一向量表示; 將一神經網路模型應用至該等HTML標籤之各者以獲得用於各標籤之一標記預測,其中該神經網路模型被訓練以預測對應於HTML標籤之包含訂單相關標記之標記; 根據用於該等HTML標籤及該等對應標籤值之該等機器產生標記預測辨識該網頁上之訂單相關資料;及 輸出該經辨識之訂單相關資料。
本發明描述一種用於使用機器學習辨識一網頁上之訂單相關資料之系統、方法及電腦程式。該方法藉由包含伺服器、儲存系統、網路、操作系統及資料庫(「系統」)之一電腦系統執行。電腦系統可為一個使用者運算裝置(例如,一使用者之行動電話或平板電腦)或一起工作之客戶端及服務運算裝置。
與使用規則及規則表達式(即,文字模式匹配)辨識結帳頁面及訂單確認頁面之傳統方法不同,本發明使用一機器學習方法,其具有能夠擴充至幾百個以上商家之優點,儘管商家網站經常變化,其仍為穩健的,且可用於數個應用,包含在一購買之後實質上即時地向客戶提供估計消費返現資訊。
相對於圖1至圖4更詳細地描述方法之實例實施方案。 1. 使用機器學習辨識 網頁上 訂單相關資料 方法
圖1繪示使用機器學習辨識在一網頁上之訂單相關資料之一方法。如本文所使用,一網頁包含在一行動應用或行動瀏覽器中之網頁內容及在一網路瀏覽器中顯示之一網頁。系統辨識一網頁上之用於進一步處理之一或多個HTML塊(步驟110)。一HTML塊包含一或多個HTML標籤,該等標籤之各者與元資料(例如,標籤ID、標籤名稱、標籤類別、標籤類型、標籤之內部文字等)及一值相關聯。一HTML塊保留原始HTML結構,包含親子關係及同輩關係。一HTML塊通常基於相關HTML標籤進行分組。例如,對於具有一購物車之一網頁,可存在具有與購物車相關聯之所有標籤之一HTML塊。在某些實施例中,若一欄位為空白,則該值可為空值。
辨識一網頁上之用於進一步處理之一或多個HTML塊係關於對該網頁是否具有訂單相關資訊進行一初步判定(例如,判定該網頁係具有一購物車之一結帳頁面抑或係一訂單確認頁面)。在一個實施例中,進行一初步判定包含購物車抓取器,其藉由使用URL及網頁上之元件之兩者偵測其是否在一結帳頁面上,以查看任一者是否匹配來自一定義清單之一關鍵字。例如,若URL含有關鍵字「購物車」或「結帳」,則系統判定該網頁係一結帳頁面。若網頁上之一元件具有關鍵字「結帳」或「總價」,系統將同樣判定該網頁係一結帳頁面。除此肯定關鍵字標識外,系統亦使用否定關鍵字之一清單(例如主頁)。若URL或網頁上之一元件含有一否定關鍵字,則系統判定該網頁非一結帳頁面(即使存在一肯定關鍵字標識)。
系統將HTML標籤之各者轉換成一向量表示(步驟120)。系統將一神經網路模型應用至向量表示之各者,以產生另一向量表示,該向量表示被轉換為用於各標籤之一機器產生標記預測(即,標籤類型之一預測)(步驟130)。在某些實施例中,神經網路模型係一雙向長期短期記憶(即,雙向LSTM)神經網路。神經網路模型被訓練以預測對應於HTML標籤之標記,其包含訂單相關標記。訂單相關標記之實例包含:產品名稱、產品URL、產品影像、數量、項目價格、小計價格、運輸成本、稅金、總價等。系統根據用於HTML標籤及對應標籤值之機器產生標記預測來辨識網頁上之訂單相關資料(步驟140)。系統輸出經辨識之訂單相關資料(步驟150),其用於數個應用。
在某些實施例中,辨識訂單相關資料包括使用機器產生標記預測來辨識網頁上之一購物車。如本文所使用,一購物車包含在結帳程序中使用之一結帳購物車。在某些實施例中,辨識一購物車包含判定網頁上之用於HTML標籤的機器產生標記預測是否滿足購物車資格,及回應於判定網頁上之用於HTML標籤的機器產生標記預測滿足購物車資格,而得出結論,即網頁包含一購物車。必須滿足之購物車資格的實例包含經預測之標記,其具有:(1)至少一個產品名稱、產品URL或影像、(2)一數量,及(3)一總價。與關於網頁是否具有訂單相關資訊之初步判定的情況一樣,購物車資格亦可指定不能出現之經預測的標記,以便得出結論,即網頁包含一購物車。在一交替實施例中,經預測之標記可被輸入進一第二神經網路中,其被訓練以基於標記預測對購物車及/或訂單確認頁面來進行分類。
在某些實施例中,辨識訂單相關資料包含使用機器產生標記預測以辨識一購物車小計、一購物車總計及一或多個(若干)行項目,及各行項目之一行總計、一產品URL及一影像URL。在某些實施例中,辨識訂單相關資料進一步包含辨識在一購物車中作廢的產品。
在某些實施例中,訂單相關資料被輸出呈鍵值對之形式,包含:(1)用於HTML標籤之機器產生標記預測,及(2)與HTML標籤相關聯之值。各鍵為一經預測之標記,且各對應值為預測標記之HTML標籤之值。在某些實施例中,鍵值對被發送至一客戶端應用,客戶端應用使用鍵值對計算一使用者之一回饋。
在某些實施例中,經輸出之訂單相關資料被發送至一推薦系統,該推薦系統使用經辨識之訂單相關資料向使用者推薦其他產品。在某些實施例中,該方法進一步包含根據機器產生標記預測判定網頁為一訂單確認頁面。
在某些實施例中,辨識訂單相關資訊包含辨識一總購買金額。在某些實施例中,總購買金額係不包含稅金及運費之所購買商品或服務之成本。在其他實施例中,總購買金額可包含稅金及運費。在某些實施例中,該方法進一步包含使用經辨識之總購買金額向一使用者提供一估計回饋,其中該估計回饋可依據總購買金額。在某些實施例中,估計回饋係一估計消費返現回饋。在某些實施例中,估計回饋係一估計點數奬勵。在某些實施例中,實質上即時地辨識總購買金額,且實質上即時地向使用者提供估計回饋。
在某些實施例中,將HTML標籤之各者轉換為一向量表示包含串接HTML標籤之元資料及內部文字以形成具有複數個字詞之一字串。對於字串中之各字詞,系統檢索一預訓練word2vec模型中之一字詞嵌入(即,固定長度之數值之一向量)。然後,系統根據字詞嵌入創建一句子嵌入。在某些實施例中,藉由平均化字詞嵌入創建句子嵌入。句子嵌入係用於標籤之向量表示。 2. 實例實施例
圖2繪示圖1中所繪示之方法之一實例實施例,其包含一客戶端應用202及寄存於一伺服器上之一機器學習(ML)模組204。客戶端應用202將HTML塊發送至ML模組204(步驟205)。在某些實施例中,客戶端應用202將HTML塊發送至用於ML模組204之一API。在某些實施例中,ML模組204接受JSON格式之抓取請求及HTML塊,其中抓取請求包含與請求ID、辨識行動裝置之使用者ID、URL資訊及時間戳相關之資訊。
ML模組204在四個階段中處理HTML塊:預處理、HTML標籤特徵提取(句子嵌入)、HTML標籤標記預測,及後處理。在預處理階段,ML模組204清除HTML塊(即,移除重音及小寫字母)(步驟210)。在HTML標籤特徵提取階段,ML模組204串接標籤資料以形成一字串(步驟215),在一預訓練word2vec模型225中查找其字詞嵌入(步驟220),且使用字詞嵌入創建句子嵌入(步驟230)。
在HTML標籤標記預測階段,ML模組204將一深度神經網路235應用至句子嵌入(步驟240),且獲得用於標籤之標記預測(步驟245)。在某些實施例中,用於標籤之標記預測與一置信分數一起輸出。在後處理階段,ML模組204組合來自所有塊之結果(步驟250),解決HTML塊內及跨HTML塊之任何衝突(步驟255),驗證提取結果(步驟260),且輸出用於標籤之鍵值對(步驟270)。
作為解決相對於一結帳購物車頁面之一衝突的一個實例,產品名稱及行總計應是一對一對應。若有兩個產品名稱標記及三個行總計標記,則系統可藉由僅保留具有較高置信分數之兩個行總計來解決此衝突。作為驗證提取結果之一個實例,系統判定產品價格是否為一合理數值,及行總計之和是否等於小計金額。在某些實施例中,鍵值對將被標旗以指示提取是否通過一品質評估。在某些實施例中,提取結果被儲存於一資料庫中,且根據需要發送回客戶端應用。 3. 用於使用機器學習預測計算 估計使用者回饋 方法
圖3繪示用於使用機器學習預測來計算一估計使用者回饋之一種方法。客戶端應用辨識可具有一總購買金額之一網頁(例如,一潛在訂單確認頁面或具有一購物車之一結帳頁面)(步驟310)。客戶端應用將包含HTML標籤之HTML塊從網頁發送至機器學習(ML)模組(步驟320)。ML模組創建HTML塊中用於HTML標籤之各者之一向量表示(步驟330)。ML模組將一神經網路模型應用至標籤向量表示之各者,以獲得HTML塊中用於HTML標籤之各者之一機器產生標記預測(步驟340)。ML模組使用機器產生標記預測來判定網頁是否包含一總購買金額(步驟350)。若辨識出一總購買金額,則ML模組將總購買金額提供給客戶端應用(步驟360)。客戶端應用可根據總購買金額計算一回饋金額(例如,一消費返現回饋或點數回饋) (步驟370)。客戶端應用實質上即時地在一使用者介面中顯示估計回饋(步驟380)。 4. 實例系統架構
圖4繪示用於執行本文所描述之方法之一系統之一實例架構。然而,可在其他系統中實施本文所描述之方法,且不限於所繪示系統。該系統包含一客戶端應用及一伺服器430。客戶端應用可呈一行動裝置上之一行動應用405或一桌上型電腦之一網路瀏覽器420的形式。在一行動應用405之情況下,一或多個(若干)行動頁面抓取器410將HTML塊發送至伺服器430上之機器學習(ML)模組440。ML模組440將文字訂單相關鍵值對發送回行動應用405中之客戶端抓取器管理應用415。在網路瀏覽器420之情況下,一瀏覽器擴充功能425將HTML塊發送至ML模組440。ML模組440將訂單相關鍵值對發送回網路瀏覽器420中之瀏覽器擴充功能425。 5. 概述
相對於圖1至圖4中所描述之方法體現於軟體中,且藉由執行軟體之一電腦系統(包括一或多個運算裝置)執行。熟習此項技術者將理解,一電腦系統具有用於儲存軟體指令之一或多個記憶體單元、磁碟或其他實體電腦可讀儲存媒體,及用於執行軟體指令之一或多個處理器。
如熟習此項技術者將理解,本發明可以其他特定形式體現,而不偏離本發明之精神或基本特性。因此,上述發明旨在為闡釋性但不限制本發明之範疇,其在隨附發明申請專利範圍中闡述。
110:步驟 120:步驟 130:步驟 140:步驟 150:步驟 202:客戶端 204:機器學習模組(伺服器) 205:發送HTML塊至ML模組 210:清除HTML塊 215:串接標籤資料以形成字串 220:查找字詞嵌入 225:預訓練W2V模型 230:創建句子嵌入 235:深度神經網路 240:將深度神經網路應用至句子嵌入 245:獲得用於標籤之標記預測 250:組合來自所有塊之結果 255:解決衝突 260:驗證提取結果 270:輸出用於標籤之鍵值對 310:步驟 320:步驟 330:步驟 340:步驟 350:步驟 360:步驟 370:步驟 380:步驟 405:行動應用 410:(若干)行動頁面抓取器 415:客戶端抓取器管理應用 420:網路瀏覽器 425:瀏覽器擴充功能 430:伺服器 440:機器學習模組
圖1係繪示根據一個實施例之用於使用機器學習辨識在一網頁上之訂單相關資料之一方法之一流程圖。
圖2係繪示圖1中所繪示之方法之一實例實施例之一流程圖。
圖3係繪示根據一個實施例之用於使用機器學習預測計算一估計使用者回饋之一方法之一流程圖。
圖4係繪示根據一個實施例之一實例軟體架構之一方塊圖。
110:步驟
120:步驟
130:步驟
140:步驟
150:步驟

Claims (20)

  1. 一種藉由一電腦系統執行之方法,用於使用機器學習來辨識一網頁上之訂單相關資料,該方法包括: 辨識一網頁上之用於進一步處理的一或多個HTML塊,其中各HTML塊包含一或多個HTML標籤,其中該等HTML標籤之各者係與元資料及一值相關聯; 將該等HTML標籤之各者轉換成一向量表示; 將一神經網路模型應用至該等向量表示之各者,以產生另一向量表示,該向量表示被轉換為用於各標籤之一機器產生標記預測,其中該神經網路模型被訓練以預測對應於HTML標籤之包含訂單相關標記的標記; 根據用於該等HTML標籤及該等對應標籤值之該等機器產生標記預測來辨識該網頁上之訂單相關資料;及 輸出該經辨識之訂單相關資料。
  2. 如請求項1之方法,其中辨識訂單相關資料包括使用該等機器產生標記預測來辨識該網頁上之一購物車。
  3. 如請求項2之方法,其中辨識一購物車包括: 判定該網頁上之用於該等HTML標籤之該等機器產生標記預測是否滿足購物車資格;及 回應於判定該網頁上之用於該等HTML標籤之該等機器產生標記預測滿足購物車資格,而得出結論,即該網頁包含一購物車。
  4. 如請求項2之方法,其中辨識該訂單相關資料包括使用該等機器產生標記預測來辨識一購物車小計、一購物車總計及一或多個(若干)行項目,及各行項目之一行總計、一產品URL及一影像URL。
  5. 如請求項2之方法,其中辨識訂單相關資料進一步包括辨識在購物車中作廢的產品。
  6. 如請求項1之方法,其中該訂單相關資料被輸出呈鍵值對形式,包括:(1)用於該等HTML標籤之該等機器產生標記預測,及(2)與該等HTML標籤相關聯之該等值。
  7. 如請求項6之方法,其中該等鍵值對被發送至一客戶端應用,該客戶端應用使用該等鍵值對來計算用於一使用者之一回饋。
  8. 如請求項1之方法,其中該經輸出之訂單相關資料被發送至一推薦系統,該推薦系統使用該經辨識之訂單相關資料向該使用者推薦其他產品。
  9. 如請求項1之方法,進一步包括根據該等機器產生標記預測來判定該網頁係一訂單確認頁面。
  10. 如請求項1之方法,其中辨識訂單相關資訊包括辨識一總購買金額。
  11. 如請求項10之方法,進一步包括使用該經辨識之總購買金額向一使用者提供一估計回饋,其中該估計回饋可依據該總購買金額。
  12. 如請求項11之方法,其中該估計之回饋係一估計消費返現回饋。
  13. 如請求項11之方法,其中該估計之回饋係一估計點數奬勵。
  14. 如請求項10之方法,其中該總購買金額實質上即時地被辨識,且該估計回饋實質上即時地被提供至該使用者。
  15. 如請求項1之方法,其中將該等HTML標籤之各者轉換為一向量表示包括: 串接該HTML標籤之元資料及內部文字以形成具有複數個字詞之一字串; 對於該字串中各字詞,檢索一預訓練word2vec模型中之一字詞嵌入;及 根據該等字詞嵌入來創建一句子嵌入。
  16. 如請求項15之方法,其中藉由平均化該等字詞嵌入來創建該句子嵌入。
  17. 一種非暫時性電腦可讀媒體,其包括一電腦程式,當藉由一電腦系統執行時,該電腦程式使該電腦系統執行用於使用機器學習辨識一網頁之訂單相關資料的以下步驟,該步驟包括: 辨識一網頁上之用於進一步處理的一或多個HTML塊,其中各HTML塊包含一或多個HTML標籤,該等HTML標籤係與元資料及一值相關聯; 將該等HTML標籤之各者轉換為一向量表示; 將一神經網路模型應用至該等向量表示之各者,以產生另一向量表示,該向量表示被轉換為用於各標籤之一機器產生標記預測,其中該神經網路模型被訓練以預測對應於HTML標籤之包含訂單相關標記的標記; 根據用於該等HTML標籤及該等對應標籤值之該等機器產生標記預測來辨識該網頁上之訂單相關資料;及 輸出該經辨識之訂單相關資料。
  18. 如請求項17之非暫時性電腦可讀媒體,其中辨識訂單相關資料包括使用該等機器產生標記預測來辨識該網頁上之一購物車。
  19. 一種用於使用機器學習辨識一網頁上之訂單相關資料之電腦系統,該系統包括: 一或多個處理器; 一或多個記憶體單元,其等經耦合至該一或多個處理器,其中該一或多個記憶體單元儲存指令,當藉由該一或多個處理器執行時,該等指令使得該系統執行以下操作: 辨識一網頁上之用於進一步處理的一或多個HTML塊,其中各HTML塊包含一或多個HTML標籤,該等HTML標籤之各者係與元資料及一值相關聯; 將該等HTML標籤之各者轉換成一向量表示; 將一神經網路模型應用至該等向量表示之各者,以產生另一向量表示,該向量表示被轉換為用於各標籤之一機器產生標記預測,其中該神經網路模型被訓練以預測對應於HTML標籤之包含訂單相關標記的標記; 根據用於該等HTML標籤及該等對應標籤值之該等機器產生標記預測來辨識該網頁上之訂單相關資料;及 輸出該經辨識之訂單相關資料。
  20. 如請求項19之電腦系統,其中辨識訂單相關資料包括使用該等機器產生標記預測來辨識該網頁上之一購物車。
TW111130405A 2021-09-29 2022-08-12 用於使用機器學習辨識網頁上之訂單相關資料的系統、方法及電腦程式 TW202318312A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US17/489,678 2021-09-29
US17/489,678 US20230095226A1 (en) 2021-09-29 2021-09-29 System, method, and computer program for identifying order-related data on a webpage using machine learning

Publications (1)

Publication Number Publication Date
TW202318312A true TW202318312A (zh) 2023-05-01

Family

ID=85706388

Family Applications (1)

Application Number Title Priority Date Filing Date
TW111130405A TW202318312A (zh) 2021-09-29 2022-08-12 用於使用機器學習辨識網頁上之訂單相關資料的系統、方法及電腦程式

Country Status (3)

Country Link
US (1) US20230095226A1 (zh)
JP (1) JP7460709B2 (zh)
TW (1) TW202318312A (zh)

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7536641B2 (en) * 2005-04-29 2009-05-19 Google Inc. Web page authoring tool for structured documents
US8112317B1 (en) * 2008-01-15 2012-02-07 SciQuest Inc. Providing substitute items when ordered item is unavailable
US8682977B1 (en) * 2008-03-25 2014-03-25 Egain Communications Corporation Communication associated with a webpage
US20100191594A1 (en) * 2009-01-28 2010-07-29 Brigette White Systems and methods for reward transaction matching and settlement
US20110137717A1 (en) * 2009-12-04 2011-06-09 Reuthe Eric System for Providing Digital Incentives Including a Digital Incentives Switch for Matching Transactions and Incentives
US10311499B1 (en) * 2015-03-23 2019-06-04 Amazon Technologies, Inc. Clustering interactions for user missions
GB2537934A (en) * 2015-05-01 2016-11-02 Salesoptimize Ltd Computer-implemented methods of website analysis
CA3039539C (en) 2016-10-13 2023-06-13 Ebates Inc. Wish list user interface within a web browser that alerts users to changes in prices
US10755174B2 (en) * 2017-04-11 2020-08-25 Sap Se Unsupervised neural attention model for aspect extraction
US11271718B2 (en) * 2018-09-12 2022-03-08 Bitclave Pte. Ltd. Systems and methods for linking anonymized user activities while preserving strong privacy guarantees
EP3853802A4 (en) * 2018-09-17 2022-06-01 Piggy LLC SYSTEMS, METHODS AND COMPUTER PROGRAMS FOR PROVIDING MAXIMUM BENEFITS TO ELECTRONIC COMMERCIAL USERS
US10949661B2 (en) * 2018-11-21 2021-03-16 Amazon Technologies, Inc. Layout-agnostic complex document processing system
US10984066B2 (en) * 2019-01-02 2021-04-20 Zyte Group Limited System and method for a web scraping tool and classification engine
US10824794B2 (en) * 2019-04-08 2020-11-03 Paypal, Inc. Process for creating a fixed length representation of a variable length input
US11328313B2 (en) * 2019-05-08 2022-05-10 Retailmenot, Inc. Predictive bounding of combinatorial optimizations that are based on data sets acquired post-prediction through high-latency, heterogenous interfaces
JP7204605B2 (ja) 2019-07-19 2023-01-16 ヤフー株式会社 提供装置、提供方法及び提供プログラム
US11140451B2 (en) * 2019-08-07 2021-10-05 Hulu, LLC Representation of content based on content-level features
US11144979B1 (en) * 2020-04-01 2021-10-12 Paypal, Inc. Method, medium, and system for automatic data extraction from web pages and analysis thereof

Also Published As

Publication number Publication date
JP2023055629A (ja) 2023-04-18
US20230095226A1 (en) 2023-03-30
JP7460709B2 (ja) 2024-04-02

Similar Documents

Publication Publication Date Title
US20210256574A1 (en) Method and system for programmatic analysis of consumer reviews
CN111626832B (zh) 产品推荐方法、装置及计算机设备
US11361339B2 (en) System, method, and computer program for providing notification of a cashback reward from a shopping portal using online screen and email analysis
US11392631B2 (en) System and method for programmatic generation of attribute descriptors
CN115605896A (zh) 产品推荐和集成语言建模的系统和方法
Wang et al. Webpage depth viewability prediction using deep sequential neural networks
US11544333B2 (en) Analytics system onboarding of web content
JP7460709B2 (ja) 機械学習によりウェブページ上の注文関連データを特定するためのシステム、方法及びコンピュータプログラム
TW202333098A (zh) 用於在行動應用程式中自動填入票券代碼之系統、方法及電腦程式
US10353929B2 (en) System and method for computing critical data of an entity using cognitive analysis of emergent data
Latha et al. Product recommendation using enhanced convolutional neural network for e-commerce platform
Lau et al. An empirical study of online consumer review spam: A design science approach
CN113807920A (zh) 基于人工智能的产品推荐方法、装置、设备及存储介质
Gollagi et al. Recursive Feature Elimination based Multi-variate Naïve Bayes Classification for Product Recommendation
Sakhare et al. E-commerce Product Price Monitoring and Comparison using Sentiment Analysis
Thai-Nghe et al. Recommendations in e-commerce systems based on deep matrix factorization
US11797961B2 (en) Vectorization of transactions
Kuzmin Item2vec-based approach to a recommender system
KR102653187B1 (ko) 웹크롤링 기반 학습용 데이터 전처리 전자 장치 및 그 방법
JP7044821B2 (ja) 情報処理システム、および情報処理方法
CA3080704C (en) System and method for providing notification of a cashback reward from a shopping portal
Aldhaheri et al. An Event Detection Platform to Detect Gender Using Deep Learning
Mangaonkar et al. Offline Voice Commerce Shopper Tracker Using NLP Analytics
Ajmeera et al. Hamiltonian deep neural network fostered sentiment analysis approach on product reviews
Pradeep et al. Summarization of User Reviews on E-Commerce Websites Using Hidden Markov Model