TW202407531A - 媒體項目及產品配對 - Google Patents
媒體項目及產品配對 Download PDFInfo
- Publication number
- TW202407531A TW202407531A TW112128792A TW112128792A TW202407531A TW 202407531 A TW202407531 A TW 202407531A TW 112128792 A TW112128792 A TW 112128792A TW 112128792 A TW112128792 A TW 112128792A TW 202407531 A TW202407531 A TW 202407531A
- Authority
- TW
- Taiwan
- Prior art keywords
- product
- content item
- products
- content
- user
- Prior art date
Links
- 238000000034 method Methods 0.000 claims abstract description 86
- 230000000007 visual effect Effects 0.000 claims abstract description 59
- 238000010801 machine learning Methods 0.000 claims description 105
- 238000012545 processing Methods 0.000 claims description 78
- 230000004044 response Effects 0.000 claims description 66
- 230000003993 interaction Effects 0.000 claims description 22
- 238000009877 rendering Methods 0.000 claims description 6
- 230000001960 triggered effect Effects 0.000 claims 2
- 230000000977 initiatory effect Effects 0.000 abstract 1
- 239000000047 product Substances 0.000 description 798
- 238000012549 training Methods 0.000 description 107
- 238000012360 testing method Methods 0.000 description 60
- 230000004927 fusion Effects 0.000 description 47
- 238000012795 verification Methods 0.000 description 31
- 238000001514 detection method Methods 0.000 description 29
- 238000010200 validation analysis Methods 0.000 description 29
- 230000009471 action Effects 0.000 description 22
- 238000013528 artificial neural network Methods 0.000 description 22
- 238000004891 communication Methods 0.000 description 18
- 230000006870 function Effects 0.000 description 17
- 238000012937 correction Methods 0.000 description 16
- 238000013500 data storage Methods 0.000 description 15
- 230000015654 memory Effects 0.000 description 13
- 238000004458 analytical method Methods 0.000 description 11
- 238000010586 diagram Methods 0.000 description 9
- 238000000605 extraction Methods 0.000 description 9
- 238000012552 review Methods 0.000 description 9
- 230000000694 effects Effects 0.000 description 8
- 238000010191 image analysis Methods 0.000 description 8
- 238000013507 mapping Methods 0.000 description 8
- 230000008569 process Effects 0.000 description 8
- 230000009467 reduction Effects 0.000 description 8
- 239000013598 vector Substances 0.000 description 8
- 230000004048 modification Effects 0.000 description 6
- 238000012986 modification Methods 0.000 description 6
- 230000015572 biosynthetic process Effects 0.000 description 5
- 230000006855 networking Effects 0.000 description 5
- 210000002569 neuron Anatomy 0.000 description 5
- 238000003786 synthesis reaction Methods 0.000 description 5
- 230000007704 transition Effects 0.000 description 5
- 230000008859 change Effects 0.000 description 4
- 238000004590 computer program Methods 0.000 description 4
- 238000013135 deep learning Methods 0.000 description 4
- 230000000306 recurrent effect Effects 0.000 description 4
- 238000013459 approach Methods 0.000 description 3
- 239000006227 byproduct Substances 0.000 description 3
- 238000004422 calculation algorithm Methods 0.000 description 3
- 238000013461 design Methods 0.000 description 3
- 230000002085 persistent effect Effects 0.000 description 3
- 238000005070 sampling Methods 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 230000001413 cellular effect Effects 0.000 description 2
- 239000002131 composite material Substances 0.000 description 2
- 238000013527 convolutional neural network Methods 0.000 description 2
- 238000002372 labelling Methods 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 230000001737 promoting effect Effects 0.000 description 2
- 230000011218 segmentation Effects 0.000 description 2
- 238000012706 support-vector machine Methods 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 241001465754 Metazoa Species 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000001364 causal effect Effects 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 235000019800 disodium phosphate Nutrition 0.000 description 1
- 230000037406 food intake Effects 0.000 description 1
- 230000007274 generation of a signal involved in cell-cell signaling Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 238000011176 pooling Methods 0.000 description 1
- 238000007637 random forest analysis Methods 0.000 description 1
- 230000000284 resting effect Effects 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
- 230000001502 supplementing effect Effects 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/47—End-user applications
- H04N21/478—Supplemental services, e.g. displaying phone caller identification, shopping application
- H04N21/47815—Electronic shopping
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/70—Information retrieval; Database structures therefor; File system structures therefor of video data
- G06F16/74—Browsing; Visualisation therefor
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/048—Interaction techniques based on graphical user interfaces [GUI]
- G06F3/0481—Interaction techniques based on graphical user interfaces [GUI] based on specific properties of the displayed interaction object or a metaphor-based environment, e.g. interaction with desktop elements like windows or icons, or assisted by a cursor's changing behaviour or appearance
- G06F3/0482—Interaction with lists of selectable items, e.g. menus
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/45—Management operations performed by the client for facilitating the reception of or the interaction with the content or administrating data related to the end-user or to the client device itself, e.g. learning user preferences for recommending movies, resolving scheduling conflicts
- H04N21/4508—Management of client data or end-user data
- H04N21/4532—Management of client data or end-user data involving end-user characteristics, e.g. viewer profile, preferences
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Signal Processing (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
Abstract
本發明揭示一種方法,其包含呈現包含一或多個視訊之一或多個圖形表示之一使用者介面(UI)。一各自視訊之各圖形表示可經選擇以引發該各自視訊播放。一圖形表示用呈一收合狀態之一UI元件顯示。該UI元件包含辨識由該各自視訊涉及之複數個產品之資訊。該方法進一步包含將該UI元件之一呈現自該收合狀態修改為一展開狀態。呈該展開狀態之該UI元件包含各與該複數個產品之一者相關聯之數個視覺組件。該方法進一步包含在使用者選擇該複數個視覺組件之一者之後引發該視訊呈現。
Description
本發明之態樣及實施方案係關於用於促進媒體項目及相關聯物件配對之方法及系統,且更具體言之,係關於用於促進媒體項目及產品配對之系統。
一平台(例如一內容共享平台)可將媒體項目傳輸(例如,串流傳輸)至經由一網路連接至平台之用戶端裝置。不同類型之用戶端裝置可針對不同任務最佳化,由一使用者針對不同任務優選,等等。媒體項目可含有一或多個產品之參考。
以下概要係本發明之一簡化概要以提供本發明之一些態樣之一基本理解。此概要不是本發明之一廣泛概述。其既不意欲辨識本發明之關鍵或重要元件,又不意欲限定本發明之特定實施方案之任何範疇或申請專利範圍之任何範疇。其僅用於依一簡化形式呈現本發明之一些概念作為稍後將呈現之更詳細描述之一序言。
揭示用於促進使用者參加與一媒體項目之一或多個產品相關聯之一或多個參與活動之系統及方法。在一些實施方案中,一種方法包含呈現包含一或多個視訊之一或多個圖形表示之一使用者介面(UI)。一各自視訊之各圖形表示可經選擇以引發該各自視訊播放且用呈一收合狀態之一UI元件顯示。呈該收合狀態之該UI元件包含辨識由該各自視訊涉及之複數個產品之資訊。該方法進一步包含繼續呈現該各自視訊之一圖形表示,同時將該UI元件之一呈現自該收合狀態修改為一展開狀態。回應於一使用者與呈該收合狀態之該UI元件互動而執行該UI元件之該呈現之該修改。呈該展開狀態之該UI元件包含各與該複數個產品之一者相關聯之複數個視覺組件。該方法進一步包含回應於一使用者選擇呈該展開狀態之該UI元件之該複數個視覺組件之一各自者而引發涉及與一選定視覺組件相關聯之一產品之一視訊播放。
在一些實施例中,該UI元件之呈現可經修改為一產品聚焦狀態。該產品聚焦狀態可包含關於與一內容項目相關聯之一或多個產品之詳細資訊。可回應於使用者選擇一UI元件或UI元件組件而將該UI元件之該呈現修改為一產品聚焦狀態。可回應於使用者選擇呈一展開狀態之該UI元件之複數個視覺組件之一者而將該UI元件之該呈現修改為一產品聚焦狀態。
在一些實施例中,可回應於一使用者裝置請求顯示內容項目之一主頁饋入而執行該UI元件及該等圖形表示之呈現。可回應於該使用者裝置之搜尋查詢而執行該UI元件及該等圖形表示之呈現。可回應於一使用者請求觀看一內容項目而執行該UI元件及該等圖形表示之呈現。
呈該展開狀態之該UI元件可包含一或多個標籤。一第一標籤可與複數個產品相關聯。一第二標籤可與該各自內容項目之複數個部分(例如章節)相關聯。該第一標籤可預設呈現。
在一些實施例中,該UI元件之呈現可經修改為一交易狀態。可回應於一使用者選擇一UI元件或一UI元件之組件而執行修改為一交易狀態。呈該交易狀態之該UI元件可促進與該複數個產品之一者相關聯之一交易。
一或多個UI元件可重疊。一UI元件可重疊於正在呈現之一內容項目上。一UI元件可重疊於一內容項目之一圖形表示上。使用者與一UI元件互動可包含停留於該UI元件上。
在另一態樣中,一種方法包含將一或多個內容項目之一或多個圖形表示提供至一裝置用於由該裝置之一UI顯示。一各自內容項目之各圖形表示可經選擇以引發該各自內容項目呈現。該方法進一步包含將指令提供至該裝置以用一第一內容項目之一第一圖形表示顯示呈一收合狀態之一UI元件。該UI元件可包含辨識由該第一內容項目涉及之複數個產品之資訊。該方法進一步包含將指令提供至該裝置以修改該UI元件之一呈現。可回應於接收一使用者與該UI元件互動之一指示而提供該等指令。該等指令可促進該UI元件自一收合狀態轉變為一展開狀態。呈該展開狀態之該UI元件包含複數個視覺組件。該等視覺組件之各者與該複數個產品之一者相關聯。該方法進一步包含將指令提供至該裝置以促進該內容項目呈現。可回應於接收一使用者選擇呈該展開狀態之該UI元件之該複數個視覺組件之一者之一指示而提供促進該內容項目呈現之該等指令。
在一些實施例中,該方法包含將指令提供至該裝置以促進該UI元件之該呈現自該展開狀態修改為一產品聚焦狀態。可回應於接收一使用者選擇呈該展開狀態之該UI元件之該複數個視覺組件之該一者之一指示而執行該UI元件之該修改。呈該產品聚焦狀態之該UI元件可包含關於與選定視覺組件相關聯之該產品之詳細資訊。
在一些實施例中,該方法包含自一經訓練機器學習模型獲得由該第一內容項目涉及之該複數個產品之辨識符作為輸出。該經訓練機器學習模型接收與該第一內容項目相關聯之資料作為輸入。
在一些實施例中,該方法包含將指令提供至該裝置以促進該UI元件之該呈現修改為一交易狀態。該交易狀態包含一或多個組件促進與一內容項目相關聯之該複數個產品之一者相關聯之一交易。可回應於一使用者選擇與一產品相關聯之該UI元件之一組件而提供促進該UI元件之該呈現修改為一交易狀態之該等指令。
在一些實施例中,促進一內容項目呈現之指令可包含呈現該內容項目之一部分之一指示。該內容項目之該部分可涉及與該複數個視覺組件之該一者相關聯之該複數個產品之該一者。在一些實施例中,可回應於獲得該使用者之一歷史而將一或多個指令提供至該裝置。該使用者之該歷史可包含與產品相關聯之內容項目之一或多個互動。在一些實施例中,該內容項目係一現場直播視訊。在一些實施例中,該內容項目係一短視頻。
在另一態樣中,一種非暫時性機器可讀儲存媒體儲存指令,該等指令在被執行時引起一處理裝置執行包含呈現一UI之操作。該UI包含一或多個視訊之一或多個圖形表示。一各自視訊之各圖形表示可經選擇以引發該各自視訊播放且用呈一收合狀態之一UI元件顯示。該UI元件包含辨識由該各自視訊涉及之複數個產品之資訊。該等操作進一步包含繼續呈現該各自視訊之一圖形表示,同時將該UI元件之一呈現自該收合狀態修改為一展開狀態。可回應於一使用者與呈該收合狀態之該UI元件互動而執行該修改。呈該展開狀態之該UI元件可包含複數個視覺組件。各視覺組件可與該複數個產品之一者相關聯。該等操作進一步包含引發涉及與該選定視覺組件相關聯之一產品之該各自視訊播放。可回應於一使用者選擇該複數個視覺組件之一個選定視覺組件而執行引發播放。
在一些實施例中,該等操作包含將該UI元件之該呈現自該展開狀態修改為一產品聚焦狀態。可回應於一使用者選擇呈該展開狀態之該UI元件之該複數個視覺組件之一者而執行該修改。呈該產品聚焦狀態之該UI元件可包含關於與該選定視覺組件相關聯之該產品之詳細資訊。
在一些實施例中,該等操作進一步包含將該UI元件之該呈現修改為一交易狀態。可回應於一使用者選擇與一產品相關聯之該UI元件之一組件而執行修改該UI元件之該呈現。呈該交易狀態之該UI元件促進與該產品相關聯之一交易。
在一些實施例中,該UI元件可包含標籤。該UI元件可包含與該複數個產品相關聯之一第一標籤。該UI元件可包含與該各自視訊之複數個部分相關聯之一第二標籤。該第一標籤之內容可預設呈現。在一些實施例中,引發該各自視訊播放包含呈現描繪一產品之該視訊之一部分。該產品可與該UI元件之一選定視覺組件相關聯。
一個態樣之選用特徵可視情況與其他態樣組合。
本發明之態樣係關於用於促進媒體項目(例如內容項目、內容等等)及相關聯產品配對之方法及系統。一平台(例如一內容共享平台等等)可使一使用者能夠(例如,經由連接至平台之一用戶端裝置)存取由平台代管之一媒體項目(例如一視訊項目、一音訊項目等等)。平台可向使用者之一用戶端裝置提供經由一網路(例如網際網路)存取媒體項目(例如,藉由將媒體項目傳輸至使用者之用戶端裝置等等)。一媒體/內容項目可具有加深一使用者參與內容項目之一或多個額外相關聯活動。例如,參與活動可包含內容項目之一評論區、與內容項目相關聯之一線上聊天等等。一些內容項目可與一或多個產品相關。例如,產品可顯示為一內容項目之部分,產品可在一內容項目中評審,一內容項目可與一或多個產品相關聯(例如,由連接至一或多個產品之一公司贊助),等等。
在習知系統中,辨識與一內容項目相關聯之產品可能較困難、不方便、耗時等等。一內容平台(例如提供向使用者呈現之內容之一平台)可能難以辨識與一內容項目相關聯之產品。在一些系統中,一內容創作者可辨識與一內容項目、內容頻道、內容項目列表或其類似者相關聯之一或多個產品。在一些系統中,一內容創作者可包含關於內容項目中之一或多個產品之資訊,例如項目之照片、在一視訊中出現之項目等等。在一些系統中,一內容創作者可包含關於與內容項目相關聯之一或多個欄位中之一或多個產品之資訊,例如內容項目標題、內容項目描述、內容項目評論(例如一置頂評論)等等。
在習知系統中,一使用者無法容易地確定一內容項目是否具有一或多個相關聯產品。一內容項目可能沒有相關聯產品之一指示符。需要向一使用者呈現內容項目(例如,觀看一視訊)以確定內容項目是否具有一或多個相關聯產品。
在習知系統中,一使用者可能難以辨識與一內容項目相關聯之產品。可能不存在一內容項目具有相關聯產品之直接指示(例如,當選擇一內容項目來消費、觀看等等時)。產品資訊可能難以找到,例如散佈於諸如內容項目標題、內容項目描述、一評論區等等之不同欄位之間。產品資訊可包含於內容項目中,例如,一視訊可包含描述一或多個產品之音訊,一影像項目可包含一或多個產品之一影像,等等。自內容項目提取此資訊可能較困難、耗時、易錯等等。
在習知系統中,接收關於特徵化於一內容項目中之一產品之額外資訊可能較困難、耗時等等。在一些系統中,一產品可出現於一內容項目中(例如,可出現於一視訊中)。一使用者不會被給予額外資訊(例如產品名稱、商家姓名等等)且要執行獨立於內容平台之搜尋以獲悉關於產品之更多資訊。可提供與一產品相關聯之一名稱及/或商家(例如,在一內容項目之描述或標題中)。一使用者要執行一搜尋(例如,獨立於內容平台)以獲悉關於產品之更多資訊,諸如產品變動、相關產品、可供量及價格或其類似者。可提供促進獲悉關於一產品之更多資訊之指導(例如指導一使用者、依至一商家網站之一鏈接之形式指導一處理裝置等等)。使用者可獨立於內容平台而自一單獨源(例如網站)接收額外資訊。
在習知系統中,關於包含於一內容項目中之一產品之資訊會變過時。例如,在一內容項目或一相關欄位(例如內容項目標題、內容項目描述、內容項目評論等等)內,一內容創作者可包含關於一或多個產品之額外資訊,諸如價格資訊、商家資訊、可供量資訊、替代版本或變動資訊等等。包含於內容項目或相關聯欄位中之一些資訊不會隨著此資訊改變而更新,要依賴內容創作者更新,等等。
在習知系統中,可能存在引起一使用者購買與一內容項目相關聯之一或多個項目困難、耗時、麻煩等等之障礙。一使用者要搜尋產品、搜尋備有或銷售產品之商家等等。在一些實施例中,一內容項目或一相關聯欄位可包含購買一項目之指示(例如,一內容項目之一描述可包含至與內容項目相關聯之產品之一或多個鏈接)。使用者可經導引至獨立於內容平台之另一平台以完成一或多個產品之一購買。
一使用者要花費大量時間及運算資源來找到關於由一內容項目涉及之產品之資訊。例如,一視訊可能較長且可能快到最後才出現一關注產品。使用者要花費大量時間來觀看視訊以獲得關於關注產品之準確資訊,藉此導致用戶端裝置之運算資源之使用增加。另外,使使用者能夠觀看媒體項目之用戶端裝置之運算資源無法用於其他程序,其會降低用戶端裝置之整體效率且增加整體延時。
本發明之態樣可解決習知方法之此等缺點之一或多者。在一些實施例中,本發明之態樣能夠自動辨識特徵化及/或包含於一內容項目中之產品。在一些實施例中,本發明之態樣能夠使用一模型自與一內容項目相關聯之文字辨識產品。文字可包含內容項目之一標題、一內容項目之一描述、與內容項目相關聯之字幕等等。字幕可為機器產生字幕,例如由一語音轉文字模型針對一視訊或音訊內容項目產生。模型可為一機器學習模型。模型可輸出指示內容項目包含一產品之一可能性之一置信值。
在一些實施例中,本發明之態樣能夠使用一模型自一內容項目之影像辨識產品。內容項目可為或包含一圖片。內容項目可為或包含一視訊。可將內容項目之一或多個影像可提供至經組態以自影像辨識產品之一模型。模型可降低一影像之維度。模型可搜尋與產品相關聯之類似影像。模型可在一降維空間中搜尋類似降維影像。模型可為一機器學習模型。模型可輸出指示內容項目包含一產品之一可能性之一置信值。
在一些實施例中,本發明之態樣能夠使用一模型(例如一融合模型)來確定一產品是否包含於一內容項目中。融合模型可接收藉由一模型接收與一內容項目相關聯之文字來偵測到之一或多個產品之指示作為輸入。融合模型可接收一或多個產品包含於文字中之置信值之指示。融合模型可接收藉由一模型接收內容項目之影像來偵測到之一或多個產品之指示作為輸入。融合模型可接收一或多個產品包含於影像中之置信值之指示。融合模型可判定一或多個產品出現於內容項目及相關聯資料(例如標題、描述等等)中之一置信度。融合模型可為一機器學習模型。
在一些實施例中,產品偵測可用於改良內容或相關聯資訊(例如描述、字幕)。一模型可被提供與一內容項目相關聯之資料。例如,一模型可被提供一內容項目之機器產生字幕。模型可辨識可為產品名稱之不實陳述之一或多個字幕(例如,機器產生字幕可包含等效於一語音產品名稱之一最接近英語)。一模型可被提供內容項目之一或多個影像。模型可判定一或多個產品包含於影像中之一可能性。與內容項目相關聯之資訊(例如元資料、描述、字幕等等)可鑑於一或多個偵測到之產品而更新。
在一些實施例中,本發明之態樣實現具有一或多個相關聯產品之一內容項目之一指示符。一內容項目列表可包含列表中之內容項目之一或多者包含相關聯產品之一或多個指示符。一指示符可包含一視覺指示符(例如指示一或多個產品與內容項目相關聯顯示之一「購物」符號或文字)、一額外欄位(例如包含產品資訊之一畫面)或其類似者。在一些實施例中,可經由一使用者介面(UI)向一使用者呈現一內容項目列表。UI元件可與內容平台相關聯(例如,可經由與內容提供平台相關聯之一應用程式呈現)。UI可包含指示一內容項目與一或多個產品相關聯之一元件。在一些實施例中,使用者與UI元件互動可引起具有額外資訊(例如與內容項目相關聯之一產品列表)之一額外UI元件呈現。
在一些實施例中,本發明之態樣實現由一使用者辨識與一內容項目相關聯之產品。在一些實施例中,用於向一使用者呈現之一內容項目列表可包含與一或多個內容項目相關聯之一產品列表。例如,可經由一UI向一使用者顯示一內容項目列表。UI可包含向使用者呈現與一內容項目相關聯之一或多個產品之一或多個UI元件。可經由與內容項目之內容提供平台相關聯之一應用程式提供UI元件。在一些實施例中,可回應於偵測到一使用者與指示一內容項目具有相關聯產品之一UI元件互動而呈現列舉與一內容項目相關聯之產品之UI元件。在一些實施例中,使用者與一產品列表之一產品互動可引起UI向使用者呈現額外資訊。
在一些實施例中,本發明之態樣能夠向一使用者提供關於與一內容項目相關聯之一或多個產品之額外資訊。可向使用者提供一UI元件,UI元件提供關於一產品之額外資訊。UI元件可提供諸如產品變動(例如色彩變動、大小變動等等)、相關產品、可供量及/或價格(例如,與一或多個商家相關聯)等等之資訊。可經由與內容項目、一內容提供平台等等相關聯之一應用程式提供UI元件。可回應於一使用者與另一UI元件互動(例如,選擇內容項目來觀看、選擇指示一或多個相關聯產品之一UI元件等等)而呈現顯示額外產品資訊之UI元件。在一些實施例中,在使用者與UI元件互動之後,可提供另一UI元件以(例如)促進購買產品。
在一些實施例中,本發明之態樣能夠自動更新連接至與一內容項目相關聯之一或多個產品之資訊。在一些實施例中,與內容項目相關聯之內容提供平台可包含包含產品資料之一或多個記憶體裝置、與該一或多個記憶體裝置通信、連接至該一或多個記憶體裝置等等。例如,一內容平台可維持及更新與產品相關聯之資訊之一資料庫且對資料庫作出之改變可反映於向一使用者呈現之一UI元件中。
在一些實施例中,本發明之態樣實現一使用者之一簡化購買程序。在接收一使用者意欲購買一產品之一指示之後(例如,在一使用者與產品相關聯之一UI元件互動之後),可向使用者呈現一UI元件以促進購買產品。在一些實施例中,一使用者可經由與內容項目、內容提供平台等等相關聯之一應用程式購買產品。在一些實施例中,可將一使用者導引至一或多個外部商家(例如商家應用程式、商家網頁等等)以購買產品。
在一些實施例中,可回應於一應用程式(例如與一內容平台相關聯之一應用程式)之各種操作而提供與產品相關聯之UI元件。與產品相關聯之一UI元件可經提供為適合於一使用者(例如,適合於與使用者相關聯之一使用者帳號)之一內容項目列表之部分。與產品相關聯之一UI元件可經提供為與一先前呈現內容項目相關之一內容項目列表之部分,例如,一觀看下一列表、一推薦視訊列表等等。與產品相關聯之一UI元件可經提供為回應於一使用者搜尋而產生之一內容項目列表之部分。與產品相關聯之一UI元件可經提供為一產品特定列表之部分,例如與一內容平台相關聯之一應用程式之一購物區。可基於數個度量來包含與產品相關聯之一UI元件、與產品相關聯之一內容項目、與產品相關聯呈現之UI元件或內容項目之數目等等。度量可包含使用者觀看歷史、使用者搜尋歷史等等。
在一些實施例中,本發明之態樣能夠快速存取與一產品相關之一內容項目之一或多個部分。例如,一UI元件可包含與一內容項目相關聯之一產品列表。產品列表之一或多者可與內容項目之一部分(例如一視訊內容項目之一時戳)相關聯。在與一產品相關之UI元件之部分互動之後,內容項目可呈現內容項目之相關部分(例如,一視訊可開始播放與內容項目相關聯之視訊之一部分)。在一些實施例中,可在呈現一內容項目時更新與內容項目相關聯之一產品列表。例如,與一視訊相關聯之一產品列表可在播放視訊時重新配置。例如,當前由視訊突顯之一產品可在一產品列表之頂部上,當前在螢幕上之產品可一起分組於一產品呈現UI元件中,等等。
本發明之態樣可提供相較於先前解決方案之技術優點。本發明之態樣可實現內容項目中之自動產品偵測。此可藉由使一或多個產品與一內容項目自動相關聯(例如,自創作者移除使產品與內容項目相關聯之負擔)來改良一內容創作者之體驗。自動產生之產品相關聯性可歸因於使用多個源(例如產品之文字及影像搜尋)、一融合模型等等而提高準確度。基於模型之產品偵測可用於改良一內容項目、相關聯資料等等,例如,利用物件偵測可改良內容項目之機器產生字幕或描述。更準確字幕可改良一使用者在觀看一內容項目時之體驗。此等改良可減少一內容創作者產生準確內容所需之時間,可減少一使用者發現使用者感興趣之內容項目及/或產品所花之時間,可提高與一內容項目相關聯之機器產生資訊之準確度,等等。因此,與內容創作者、內容觀看者及/或平台相關聯之一用戶端裝置處之運算資源減少且可用於其他程序,其提高系統之一整體效率且減少一整體延時。
本發明之態樣可改良一使用者在搜尋內容項目、觀看內容項目、滾動瀏覽一內容項目列表等等時之體驗。一使用者能夠(例如)在不被呈現內容項目之情況下自一內容項目列表辨識具有相關聯產品之內容項目。可向一使用者提供用於增加參與與一內容項目相關聯之產品之一無縫方法,例如,與指示存在與一內容項目相關聯之產品之一UI元件互動可引起具有關於一或多個產品之更多資訊之一內容項目呈現,進一步互動可促進購買一或多個產品,等等。呈現一或多個UI元件可簡化一使用者之體驗。一使用者能夠(例如)在與內容平台及/或內容項目相關聯之一應用程式內容易地擷取額外資訊。一使用者能夠更容易地購買與一內容項目相關聯之一產品。可基於表達對與一內容項目相關聯之一產品感興趣來將一使用者導引至內容項目之一相關部分。一使用者能夠在一單一應用程式之背景內容易地查看價格資訊、可供量資訊、產品變動、相關產品等等。此等實施方案可節省一使用者時間及免受挫折,可簡化一購物及/或購買程序,可簡化一產品搜尋、評審及/或選擇程序,等等。
圖1繪示根據一些實施例之用於提供內容及相關聯產品資訊之一實例性系統架構100。系統架構100包含用戶端裝置110、一或多個網路105、內容平台系統102及產品辨識系統175。內容平台系統102包含一或多個伺服器機器106、一或多個資料儲存器140且可包含旨在執行任務(例如與內容傳送相關聯之任務)之各種平台。內容平台系統102之平台可由一或多個伺服器機器106代管。內容平台系統102之平台可包含及/或代管於一或多個運算裝置(諸如一機架式伺服器、一路由器電腦、一伺服器電腦、一個人電腦、一主機電腦、一膝上型電腦、一平板電腦、一桌上型電腦等等)及一或多個資料儲存器(例如硬碟、記憶體及資料庫)且可經耦合至一或多個網路105。在一些實施例中,內容平台系統102之組件(例如伺服器機器106、資料儲存器140、與一或多個平台相關聯之硬體等等)可經直接連接至一或多個網路105。在一些實施例中,內容平台系統102之一或多個組件可經由另一裝置(例如一集線器、交換機等等)存取網路105。在一些實施例中,內容平台系統102之一或多個組件可與圖1中所描繪之其他組件(例如產品辨識系統175之組件,諸如伺服器機器170及/或180)直接通信。資料儲存器140可包含於一或多個伺服器機器106中,包含外部資料儲存器,等等。內容平台系統102之平台可包含廣告平台165、社交網路平台160、推薦平台157、搜尋平台145及內容提供平台120。產品辨識系統175包含伺服器機器170、伺服器機器180及一組模型190。產品辨識系統175可包含另外裝置,例如資料儲存器、另外伺服器等等。產品辨識系統175之多個操作可由一第一實體或虛擬裝置執行。
一或多個網路105可包含一或多個公用網路(例如網際網路)、一或多個私人網路(例如一區域網路(LAN)、一廣域網路(WAN))、一或多個有線網路(例如乙太網路)、一或多個無線網路(例如一802.11網路)、一或多個蜂巢式網路(例如一長期演進(LTE)網路)、路由器、集線器、交換機、伺服器電腦及/或其等之一組合。在一個實施方案中,架構100之一些組件彼此不直接連接。在一個實施方案中,系統架構100包含單獨網路105。
一或多個資料儲存器140可駐留於記憶體(例如隨機存取記憶體)、快取記憶體、碟機(例如硬碟)、快閃碟等等中且可為一或多個資料庫系統、一或多個檔案系統或能夠儲存資料之另一類型之組件或裝置之部分。一或多個資料儲存器140可包含亦可跨越多個運算裝置(例如多個伺服器電腦)之多個儲存組件(例如多個碟機或多個資料庫)。資料儲存器可為能夠儲存資料之持久儲存器。一持久儲存器可為一本端儲存單元或一遠端儲存單元、電子儲存單元(例如主記憶體)或一類似儲存單元。持久儲存器可為一單片裝置或一組分布式裝置。
內容項目121A至121C (例如媒體內容項目)可儲存於一或多個資料儲存器上。資料儲存器可為一或多個平台之部分。一內容項目121之實例可包含(且不限於)數位視訊、數位電影、動畫影像、數位照片、數位音樂、數位音訊、數位視訊遊戲、協作媒體內容呈現、網站內容、社交媒體更新、電子書、電子期刊、數位音訊書、部落格、軟體應用程式等等。內容項目121A至121C亦可指稱媒體項目。內容項目121A至121C可經預錄或現場直播。為簡潔及簡單起見,一視訊在本發明中可用作一內容項目121 (例如內容項目121A)之一實例。視訊可包含一預錄視訊、一現場直播視訊、一短視頻等等。
內容項目121A至121C可由內容提供者提供。一內容提供者可為一使用者、一公司、一組織等等。一內容提供者可提供為一視訊之一內容項目121 (例如內容項目121A)。一內容提供者可提供包括現場直播內容之內容項目121,例如,內容項目121可包含現場直播視訊、與視訊相關聯之一線上聊天等等。
用戶端裝置110可包含諸如電視、智慧型電話、個人數位助理、可攜式媒體播放器、膝上型電腦、電子書閱讀器、平板電腦、桌上型電腦、遊戲機、視訊轉換器或其類似者之裝置。
一用戶端裝置110可包含一通信應用程式115。一內容項目121 (例如內容項目121A)可由一使用者經由通信應用程式115觀看。例如,通信應用程式115可經由用戶端裝置110之硬體存取一或多個網路105 (例如網際網路)以向使用者提供內容項目121。如本文中所使用,「媒體」、「媒體項目」、「在線媒體項目」、「數位媒體」、「數位媒體項目」、「內容」、「媒體內容項目」及「內容項目」可包含可使用經組態以呈現一內容項目之軟體、韌體及/或硬體來執行或載入之一電子檔案。在一個實施方案中,通信應用程式115可為允許使用者透過一平台(例如內容提供平台120、推薦平台157、社交網路平台160及/或搜尋平台145)及/或平台及/或網路之一組合來創作、發送及接收內容項目121 (例如視訊)之一應用程式。
在一些實施例中,通信應用程式115可為一社交網路應用程式、視訊共享應用程式、視訊串流應用程式、視訊遊戲串流應用程式、照片共享應用程式、聊天應用程式或此等應用程式之一組合(或包含其態樣)。與用戶端裝置110相關聯之通信應用程式115可向一或多個使用者顯現、顯示、呈現及/或播放一或多個內容項目121。例如,通信應用程式115可提供顯示於端點裝置110上之使用者介面116 (例如一圖形使用者介面)用於接收及/或播放視訊內容。在一些實施例中,通信應用程式115與內容平台102或內容提供平台120相關聯(且由其管理)。
在一些實施例中,通信應用程式115可包含內容觀看器113及相關產品組件114。使用者介面116 (UI)可顯示內容觀看器113及相關產品組件114。相關產品組件114可用於顯示一UI元件,其顯示關於一或多個產品(例如與一內容項目相關聯之一或多個產品)之資訊。相關產品組件114可顯示一UI元件以通知一使用者一內容項目具有一或多個相關聯產品(例如,相關產品組件114可引起一「購物」符號之顯示接近內容觀看器113顯示,相關產品組件114可引起一元件接近用於自一內容項目列表選擇內容項目用於呈現之一元件顯示且指示內容項目具有一或多個相關聯產品,等等)。相關產品組件114可引起UI顯示關於與一內容項目相關聯之一或多個產品之資訊(例如,相關產品組件114可引起一UI顯示,其可包含與內容項目相關聯之一產品列表,可包含與內容項目相關聯之產品之影像,可包含價格資訊或將產品連接至內容項目之資訊(諸如與產品相關之一視訊之一部分之一時戳),等等)。相關產品組件114可引起一UI元件顯示關於一或多個產品之額外資訊,例如產品變動(例如色彩變動、大小變動等等)、相關產品、推薦產品等等。相關產品組件114可引起一UI元件顯示用於購買一或多個產品之一或多個選項。在一些實施例中,一使用者能夠在由相關產品組件114提供之不同視圖之間導覽。可結合圖4A至圖4E找到與一內容項目相關之產品相關聯之實例性UI元件之進一步描述。在一些實施例中,相關產品組件114可引起顯示一個以上UI元件,例如,若顯示具有相關聯產品之一個以上內容項目。在一些實施例中,相關產品組件114可(例如)基於使用者設定、使用者偏好、使用者歷史等等來引起不顯示指示相關產品之一UI元件。在一些實施例中,多個內容觀看器113及/或相關產品組件114可與一個使用者介面、通信應用程式、用戶端裝置等等相關聯。例如,多個內容項目可向一使用者一次性顯示。在一些實施方案中,通信應用程式115係可存取、擷取、呈現及/或導覽內容(例如網頁(諸如超文字標記語言(HTML)頁面)、數位媒體項目等等)之一網頁瀏覽器且可包含相關產品組件114及內容觀看器113,其可為嵌入於由內容提供平台120提供之使用者介面116 (例如與觀看內容相關聯之一網頁)中之一嵌入式媒體播放器。替代地,應用程式115不是一網頁瀏覽器而是一獨立應用程式(例如行動應用程式、桌上型應用程式、遊戲機應用程式、電視應用程式等等),其自一平台(例如內容提供平台120、推薦平台157、社交網路平台160或搜尋平台145)下載或預安裝於用戶端裝置110上。獨立應用程式115可提供包含內容觀看器113 (例如嵌入式媒體播放器)及相關產品組件114之使用者介面116。
在一些實施例中,內容平台系統102可包含產品資訊平台161 (例如,由伺服器機器106代管)。產品資訊平台161可儲存、擷取、提供、接收等等與一或多個內容項目相關聯之一或多個產品相關之資料。內容平台系統102可將資料提供至用戶端裝置110之相關產品組件114。產品資訊平台161可包含由一內容創作者提供之資訊,例如,一內容創作者可提供與內容創作者提供至內容平台系統102之一內容項目相關聯之一產品列表。產品資訊平台161可包含由一或多個使用者提供之資訊,例如,一或多個使用者可(例如)回應於向其呈現一內容項目而辨識與內容項目相關聯之產品。產品資訊平台161可包含由產品辨識系統175提供之資訊,例如,一或多個機器學習模型可用於辨識特徵化於一內容項目中之產品且將相關聯產品及內容項目之指示提供至產品資訊平台161。
在一些實施例中,安裝於用戶端裝置110上之通信應用程式115可與一使用者帳號相關聯,例如,一使用者可在用戶端裝置110上登錄一帳號。在一些實施例中,多個用戶端裝置110可與相同用戶端帳號相關聯。在一些實施例中,提供關於產品與一或多個內容項目之(若干)相關聯性之資訊可依據使用者帳號(例如帳號設定、帳號歷史(例如,參與包含相關聯產品資訊之UI元件之歷史)等等)來執行。
在一些實施例中,用戶端裝置110可包含一或多個資料儲存器。資料儲存器可包含顯現一UI (例如使用者介面116)之命令(例如在由一處理裝置執行時引起操作之指令)。指令可包含顯現一互動組件之指令,例如一使用者可與其互動以呈現關於與一內容項目相關聯之一或多個產品之額外資訊之一UI元件。在一些實施例中,指令可引起一處理裝置顯現一UI元件,其呈現關於與一或多個內容項目相關聯之一或多個產品之資訊(例如,可用一UI元件呈現評審使用者感興趣之一產品之數個視訊以呈現關於產品之更多資訊)。
在一些實施例中,一或多個伺服器機器106可包含運算裝置(諸如機架式伺服器、路由器電腦、伺服器電腦、個人電腦、主機電腦、膝上型電腦、平板電腦、桌上型電腦等等)且可經耦合至一或多個網路105。伺服器機器106可為獨立裝置或平台(例如內容提供平台120、社交網路平台160等等)之任何者之部分。
社交網路平台160可提供一線上社交網路服務。社交網路平台160可提供一通信應用程式115用於使用者創建設定檔且用其設定檔來執行活動。活動可包含更新設定檔,與其他使用者交換訊息,評估(例如,喜歡、評論、共享、推薦)狀態更新、照片、視訊等等,及接收與其他使用者之活動相關聯之通知。在一些實施例中,額外產品資訊(例如由產品資訊平台161所提供)可由一使用者經由社交網路平台160與一或多個額外使用者共享。
推薦平台157可用於產生及提供內容推薦(例如文章、視訊、貼文、新聞、遊戲等等)。推薦可基於搜尋歷史、內容觀看歷史、追隨/訂閱頻道內容、鏈接設定檔(例如朋友列表)、熱門內容等等。推薦平台157可用於產生(例如)一使用者主頁饋入、一使用者觀看列表、一使用者播放列表等等。指示相關聯產品、顯示一相關聯產品列表、呈現產品資訊、呈現一或多個選項來購買一產品等等之一或多個UI元件可呈現為與一主頁饋入、一觀看列表、一播放列表、一觀看下一列表等等組合、作為其部分、與其相關聯、可自其存取等等。可基於一使用者歷史、使用者設定、指示一使用者之偏好之資料(例如人口統計資料)等等來執行一或多個UI元件之呈現。
搜尋平台145可用於允許使用者查詢一或多個資料儲存器140及/或一或多個平台且接收查詢結果。搜尋平台145可由一使用者用於搜尋一內容項目、搜尋一話題或其類似者。例如,搜尋平台145可由一使用者用於搜尋具有一或多個相關聯產品之一內容項目。搜尋平台145可用於搜尋與一類型之產品相關之內容項目(例如耳機評審視訊)。搜尋平台145可用於搜尋與一特定產品(例如一特定牌子及/或型號之耳機)相關之內容項目。可回應於接收一搜尋查詢而向一使用者顯示一或多個UI元件。所顯示UI元件之類型、樣式等等可基於使用者搜尋之內容。例如,回應於搜尋與一類型之產品(例如耳機)相關之內容,可顯示一UI元件來指示鑑於搜尋所建議之一內容項目具有一或多個相關聯產品。作為另一實例,回應於搜尋與一更具體產品(例如「最佳播客耳機」)相關之一內容項目,可顯示一不同UI元件來提供關於與一內容項目相關聯之產品之資訊。作為另一實例,回應於搜尋與一具體產品(例如一特定牌子及/或型號)相關之一內容項目,可顯示一不同UI元件來提供關於搜尋產品之具體資訊以指示產品與鑑於搜尋所推薦之一內容項目相關聯。
內容提供平台120可用於向一或多個使用者提供存取內容項目121及/或向一或多個使用者提供內容項目121。例如,內容提供平台120可允許使用者觀看、上傳、下載及/或搜尋內容項目121。在另一實例中,內容提供平台120可允許使用者評估內容項目121,諸如讚成(「喜歡」)、不讚成、推薦、共享、評分及/或評論內容項目121。在另一實例中,內容提供平台120可允許使用者編輯內容項目121。內容提供平台120亦可包含可用於向一或多個使用者提供存取內容項目121之一網站(例如一或多個網頁)及/或一或多個應用程式(例如通信應用程式115)。例如,通信應用程式115可由用戶端裝置110用於存取內容項目121。內容提供平台120可包含提供存取內容項目121之任何類型之內容傳送網路。
內容提供平台120可包含多個頻道(例如頻道A 125、頻道B 126等等)。一頻道可為可自一共同源取得之一內容集合、具有一共同話題或主題之一內容集合等等。資料內容可為由一使用者選擇之數位內容、由一使用者使用之數位內容、由一使用者上傳之數位內容、由一內容提供者選擇之數位內容、由一廣播員選擇之數位內容等等。例如,頻道A 125可包含兩個視訊(例如內容項目121A至121B)。一頻道可與一擁有者相關聯,擁有者可為可對頻道執行動作之一使用者。內容可為一或多個內容項目121。頻道之資料內容可為預錄內容、直播內容等等,但頻道經描述為一內容提供平台之一個實施方案,本發明之實施方案不限於經由一頻道模型提供內容項目121之內容共享平台。
產品辨識系統175、伺服器機器170及伺服器機器180可各包含一或多個運算裝置,諸如一機架式伺服器、一路由器電腦、一伺服器電腦、一個人電腦、一主機電腦、一膝上型電腦、一平板電腦、一桌上型電腦、圖形處理單元(GPU)、加速器專用積體電路(ASIC)(例如張量處理單元(TPU))等等。預測伺服器112、伺服器機器170、伺服器機器180、資料儲存器140等等之操作可由一雲端運算服務、雲端資料儲存服務等等執行。
產品辨識系統175可包含一或多個模型190。包含於產品辨識系統175中之模型190可執行與自內容項目辨識一或多個產品相關之任務。模型190之一或多個模型可為經訓練機器學習模型。結合圖3A及圖5C來描述產生一經訓練機器學習模型之操作,包含訓練、驗證及測試模型。
模型190可包含一或多個文字剖析模型191。文字剖析模型191可經組態以接收輸入文字且產生與文字相關聯之產品之一或多個指示作為輸出。例如,文字剖析模型191之一第一模型可經組態以自一內容項目之一標題預測相關聯產品,文字剖析模型191之一第二模型可經組態以自一內容項目之一(例如書面)描述預測相關聯產品,一第三模型可經組態以自一內容項目之字幕(例如自動產生字幕、機器產生字幕、使用者提供字幕等等)預測相關聯產品,等等。在一些實施例中,文字剖析模型191之所有操作可由一單一模型執行。在一些實施例中,文字剖析模型191之一模型可經組態以產生產品背景資訊(例如指示一內容項目與一或多個產品相關聯之一資訊)作為輸出。例如,產品背景資訊可指示一內容項目包含產品之種類,例如不同產品之一群組(例如產品之類型、產品之品牌、產品之一種類(諸如「電子類」)或其類似者)。
模型190可包含一或多個影像剖析模型192。影像剖析模型192可經組態以自一或多個影像辨識產品。影像剖析模型192可包含旨在辨識一影像包含產品之一或多個模型、經組態以隔離一產品影像與一內容項目影像(例如,移除背景元素等等)之模型、經組態以判定一內容項目影像中之一產品之身分之模型等等。影像剖析模型192之操作可由一單一模型執行。影像剖析模型192可包含經組態以將影像提供至產品辨識模型之一或多個模型。例如,影像剖析模型192可包含經組態以提取一內容項目之一靜態影像之一部分之模型、經組態以提取一視訊內容項目之一或多個圖框之模型等等。影像剖析模型192之一模型可被提供一視訊之一或多個圖框、一視訊之一或多個圖框之一或多個部分等等且產生一或多個產品及與一或多個產品相關聯之一或多個置信值作為輸出。例如,影像剖析模型192之一模型可接收一視訊內容項目之一或多個圖框作為輸入且產生具有指示產品包含於內容項目之影像中之一可能性之置信值之一產品列表作為輸出。影像剖析模型192可包含判定自一內容項目利用哪些影像之一或多個模型。例如,影像剖析模型192可包含自一視訊內容項目選擇圖框用於影像辨識之一或多個模型。
影像剖析模型192可包含經組態以降低一影像之維度之一或多個模型。例如,可將一影像降低至一值向量。在一些實施例中,影像剖析模型192之一或多個模型可經組態以依使得可在降維之後類似地(例如,藉由類似向量)表示類似影像(例如相同產品之影像)之一方式降低一影像之維度。影像剖析模型192之一或多個模型可經組態以比較來自一內容項目之一降維影像(例如自一內容項目視訊之一或多個圖框產生之一值向量)與一已知產品之一降維影像(例如,經由產品資訊平台161)。
模型190可包含文字校正模型193。文字校正模型193可經組態以提供與一內容項目相關聯之文字之校正。文字校正模型193可經組態以將與一內容項目相關聯之文字調整為包含內容項目中所涉及之一或多個產品。文字校正模型193之一或多個模型可經組態以調整與一內容項目相關聯之電腦產生、機器產生、自動產生等等文字。文字校正模型193之一或多個模型可經組態以將一視訊之字幕(例如不正確字幕)更新為包含一或多個產品。在一些實施例中,與一內容項目相關聯之機器產生文字(例如字幕)可能不正確。例如,可在產生字幕時用一近似表示替換一產品之名稱(例如,產品之名稱可能不是字幕語言之一用語,一產品之名稱可為不同於字幕語言之一語言中之一用語,等等)。文字校正模型193之模型可經組態以辨識可能不正確之文字之部分且推薦校正、執行校正、警示一使用者或另一系統等等。例如,文字校正模型193之一模型可接收一視訊之機器產生字幕,辨識可能不正確地替代一產品名稱之字幕語言中之一用語之字幕之一部分,且將指示可能不正確文字之資料提供至另一模型、系統、使用者等等。
模型190可包含融合模型194。融合模型194可接收與一內容項目相關聯之產品之一或多個指示作為輸入。在一些實施例中,融合模型194接收來自一或多個其他模型(例如文字剖析模型191、影像剖析模型192等等)之輸出作為輸入。融合模型194可接收與一內容項目相關聯之產品之一或多個指示及置信值之一或多個指示。例如,融合模型194可接收在一內容項目之一標題中偵測到之一或多個產品及與一或多個產品相關聯之置信值之一指示。融合模型194可進一步接收在一內容項目之一描述中偵測到之一或多個產品及與一或多個產品相關聯之置信值之一指示。融合模型194可進一步接收在一內容項目之字幕中偵測到之一或多個產品及與一或多個產品相關聯之置信值之一指示。融合模型194可進一步接收在一內容項目之影像中偵測到之一或多個產品及與一或多個產品相關聯之置信值之一指示。融合模型194可產生與一內容項目相關聯偵測到之一或多個產品作為輸出。融合模型194可進一步產生與一產品出現於內容項目中之一置信度相關聯之一置信值,與內容項目相關聯,等等。可基於融合模型194之輸出(例如產品辨識資訊及置信值)來執行進一步操作(例如,可呈現描述與內容項目相關聯之產品之一UI元件)。
可用於執行一些或所有上述任務之一種類型之機器學習模型係一人工神經網路,諸如一深度神經網路。人工神經網路一般包含具有將特徵映射至一所要輸出空間之一分類器或回歸層之一特徵表示組件。例如,一卷積神經網路(CNN)代管卷積濾波器之多個層。在較低層處執行池化且可解決非線性度,在較低層之頂部上通常附加一多層感知器以將由卷積層提取之頂層特徵映射至決策(例如分類輸出)。
一遞歸神經網路(RNN)係另一類型之機器學習模型。一遞歸神經網路模型經設計以解譯其中輸入彼此內在相關之一系列輸入,例如時間追跡資料、循序資料等等。一RNN之一感知器之輸出作為輸入回饋至感知器中以產生下一輸出。
深度學習係使用非線性處理單元之多個層之一級聯來進行特徵提取及變換之一類機器學習演算法。各連續層使用來自前一層之輸出作為輸入。深度神經網路可依一監督式(例如分類)及/或無監督(例如模式分析)方式學習。深度神經網路包含層之一階層,其中不同層學習對應於不同抽象層級之不同表示層級。在深度學習中,各層級學習將其輸入資料變換成一略微更抽象及複合表示。例如,在一影像識別應用中,原始輸入可為一像素矩陣;第一表示層可抽取像素且編碼邊緣;第二層可組合及編碼邊緣之配置;第三層可編碼更高階形狀(例如牙齒、嘴唇、牙齦等等);且第四層可識別一掃描作用。應注意,一深度學習程序可自我學習哪些特徵最佳地放置於哪一層級中。「深度學習」中之「深度」係指透過其變換資料之層之數目。更精確言之,深度學習系統具有一實質信用分配路徑(CAP)深度。CAP係自輸入至輸出之變換鏈。CAP描述輸入與輸出之間的可能因果連接。針對一前饋神經網路,CAP之深度可為網路之深度且可為隱藏層數+1。針對其中一信號可傳播通過一層一次以上之遞歸神經網路,CAP深度可能為無限的。
在一些實施例中,產品辨識系統175進一步包含伺服器機器170及伺服器機器180。伺服器機器170包含能夠產生資料組(例如一組資料輸入及一組目標輸出)來訓練、驗證及/或測試(若干)模型190 (包含一或多個機器學習模型)之一資料組產生器172。下文將相對於圖2及圖5A詳細描述資料組產生器172之一些操作。在一些實施例中,資料組產生器172可將歷史資料(例如預存內容項目資料、具有一或多個指定相關聯產品之內容項目、具有由一或多個使用者提供之產品分配之內容項目等等)分割成一訓練組(例如歷史資料之60%)、一驗證組(例如歷史資料之20%)及一測試組(例如歷史資料之20%)。
在一些實施例中,產品辨識系統175之組件可產生多組特徵。例如,一特徵可為輸入資料之一重新配置、輸入資料之一組合、輸入資料之一降維、輸入資料之一子集或其類似者。可基於輸入資料之一或多個特徵來產生一或多個資料組。
伺服器機器180包含一訓練引擎182、一驗證引擎184、選擇引擎185及/或一測試引擎186。一引擎(例如訓練引擎182、一驗證引擎184、選擇引擎185及一測試引擎186)可係指硬體(例如電路系統、專用邏輯、可程式化邏輯、微碼、處理裝置等等)、軟體(諸如運行於一處理裝置、一通用電腦系統或一專用機器上之指令)、韌體、微碼或其等之一組合。訓練引擎182能夠使用與來自資料組產生器172之訓練組相關聯之一或多組特徵來訓練一或多個模型190。訓練引擎182可產生多個經訓練模型190,其中各經訓練模型190對應於訓練組之一組不同特徵。資料組產生器172可接收一經訓練模型之輸出(例如,可基於文字剖析模型191及/或影像剖析模型192之輸出來訓練融合模型194),將該資料收集成訓練、驗證及測試資料組,且使用資料組來訓練一第二模型(例如融合模型194)。
驗證引擎184能夠使用來自資料組產生器172之驗證組之一組對應特徵來驗證一經訓練模型190。例如,可使用驗證組之第一組特徵來驗證使用訓練組之一第一組特徵訓練之一第一經訓練機器學習模型190。驗證引擎184可基於驗證組之對應組特徵來判定經訓練模型190之各者之一準確度。驗證引擎184可捨棄具有不滿足一臨限準確度之一準確度之經訓練模型190。在一些實施例中,選擇引擎185能夠選擇具有滿足一臨限準確度之一準確度之一或多個經訓練模型190。在一些實施例中,選擇引擎185能夠選擇具有經訓練模型190之最高準確度之經訓練模型190。
測試引擎186能夠使用來自資料組產生器172之一測試組之一組對應特徵來測試一經訓練模型190。例如,可使用測試組之第一組特徵來測試使用訓練組之一第一組特徵訓練之一第一經訓練機器學習模型190。測試引擎186可基於測試組來判定具有所有經訓練模型之最高準確度之一經訓練模型190。
就一機器學習模型而言,模型190可係指由訓練引擎182使用包含資料輸入及對應目標輸出(各自訓練輸入之正確答案)之一訓練組產生之模型假影。可在資料組中找到將資料輸入映射至目標輸出(正確答案)之模式,且向機器學習模型190提供捕獲此等模式之映射。機器學習模型190可使用支援向量機(SVM)、徑向基函數(RBF)、叢集、監督式機器學習、半監督式機器學習、無監督機器學習、k近鄰演算法(k-NN)、線性回歸、隨機森林、決策森林、神經網路(例如人工神經網路、遞歸神經網路)、線性模型、基於函數之模型(例如NG3模型)等等之一或多者。合成資料產生器174可包含一或多個機器學習模型,其等可包含相同類型之模型(例如人工神經網路)之一或多者。
自內容項目及相關聯資料自動(例如,基於模型)偵測產品提供相較於其他方法之顯著技術優點。在一些實施例中,特徵化一產品之一內容項目(例如評審產品之一產品評審視訊)可在無需內容創作者之關注、動作、時間等等之情況下變成與產品鏈接或相關聯(例如,資料可產生將產品鏈接至內容項目)。在一些實施例中,廣告一產品之一內容項目(例如,一內容項目可受贊助或可促銷一或多個產品)可與產品鏈接或相關聯。在內容項目中基於模型偵測產品可針對未在一內容項目中具體特徵化但存在於內容項目中之產品產生產品相關聯性(例如,一使用者可有興趣購買之一產品可在一視訊內容項目中之螢幕上)。在一內容項目中基於模型偵測產品可針對在一內容項目中廣告之產品產生產品相關聯性。可基於基於模型之偵測藉由向一使用者提供一UI元件(例如,指示一產品與一內容項目相關聯)來將使用者導向存在於內容項目中之一產品。
一或多個模型190可基於輸入來運行以產生一或多個輸出。一模型可自輸出判定(例如,提取)指示模型之輸出係一內容項目之一準確描述之一置信度位準之置信度資料。例如,一模型可判定一第一產品與一內容項目相關聯且判定第一產品已由內容項目中之模型正確發現之一置信度。產品辨識系統175之一或多個組件可使用置信度資料來決定是否更新與內容項目相關聯之資料,例如是否使一或多個產品與內容項目相關聯、是否更新內容項目之一或多個字幕等等。
置信度資料可包含或指示模型之輸出(例如一或多個產品)係與內容項目相關聯之產品之一準確指示之一置信度位準。例如,由模型輸出之置信度位準(例如,與在一內容項目中辨識之一個產品相關聯)可為0至1 (含0及1)之間的一實數。0可指示預測產品與內容項目相關聯不可信,且1可指示預測產品與內容項目相關聯絕對可信。回應於置信度資料指示一置信度位準低於預定數目個例項之一臨限位準(例如例項之百分比、例項之頻率、例項之總數等等),產品辨識系統175可引起一或多個經訓練模型190再訓練(例如,基於用於訓練、驗證、測試等等之更新及/或新資料)。再訓練可包含產生一或多個資料組(例如,經由資料組產生器172)。
為了說明而非限制,本發明之態樣描述使用歷史資料來訓練一或多個機器學習模型190及將當前資料(例如新更新內容項目、先前與產品不相關聯之內容項目等等)輸入至一或多個經訓練機器學習模型中以判定指示內容項目-產品相關聯性之輸出。在其他實施例中,一啟發式模型、基於物理之模型或基於規則之模型用於判定一或多個產品與一內容項目相關聯(例如,不使用一經訓練機器學習模型)。在一些實施例中,此等模型可使用歷史資料來訓練。在一些實施例中,此等模型可利用一歷史資料來再訓練。相對於圖2之資料輸入210所描述之資訊之任何者可經監測或否則用於啟發式、基於物理或基於規則之模型中。
在一些實施例中,用戶端裝置110、產品辨識系統175、內容平台系統102、伺服器機器170及伺服器機器180、伺服器機器106之功能可由更少機器提供。例如,在一些實施例中,伺服器機器170及180可整合成一單一機器,而在一些其他實施例中,伺服器機器170、伺服器機器180及伺服器機器106可整合成一單一機器。在一些實施例中,用戶端裝置110及伺服器機器106可整合成一單一機器。在一些實施例中,用戶端裝置110、伺服器機器106、伺服器機器170、伺服器機器180及資料儲存器140之功能可由一雲端服務執行。
一般而言,在一個實施例中描述為由用戶端裝置110、伺服器機器106、伺服器機器170及伺服器機器180執行之功能亦可在其他實施例中視情況在伺服器機器106上執行。另外,歸於一特定組件之功能可由一起操作之不同或多個組件執行。例如,在一些實施例中,產品辨識系統175可判定產品與內容項目之間的相關聯性。在另一實例中,內容平台系統102可判定內容項目與一或多個產品之間的相關聯性。
另外,一特定組件之功能可由一起操作之不同或多個組件執行。伺服器機器106、伺服器機器170或伺服器機器180之一或多者可存取為透過適當應用程式設計介面(API)提供至其他系統或裝置之一服務。
在本發明之實施方案中,一「使用者」可表示為一單一個體。然而,本發明之其他實施方案涵蓋一「使用者」係由一組使用者及/或一自動化源控制之一實體。例如,在一社交網路中結盟為一社區之一組個別使用者可被視為一「使用者」。在另一實例中,一自動化消費者可為一或多個平台、一或多個內容項目等等之一自動化攝取管線(諸如一話題頻道)。除上文描述之外,可向一使用者提供控制以允許使用者選擇本文中所描述之系統、程式或特徵是否及何時能夠收集使用者資訊(例如關於一使用者之社交網路、社交動作或活動、職業、一使用者之偏好或一使用者之當前位置之資訊)及是否自一伺服器向使用者發送內容或通信。另外,特定資料可在其儲存或使用之前依一或多個方式處理以移除個人可辨識資訊。例如,一使用者之身分可經處理以無法判定使用者之個人可辨識資訊,或可在獲得位置資訊時泛化一使用者之地理位置(諸如泛化至一城市、郵編或州級)以無法判定一使用者之一特定位置。因此,使用者可控制關於使用者之收集資訊內容、如何使用該資訊及向使用者提供什麼資訊。
圖2係根據一些實施例之包含用於創建一或多個模型之資料組之資料組產生器272之一系統200之一方塊圖。資料組產生器272可使用歷史資料來創建資料組(例如資料輸入210、目標輸出220)。類似於資料組產生器272之一資料組產生器可用於訓練一無監督機器學習模型,例如,目標輸出220可不由資料組產生器272產生。類似於資料組產生器272之一資料組產生器可用於訓練一半監督式機器學習模型,例如,對應於資料輸入210之一子集之目標輸出220可由資料組產生器272產生。
資料組產生器272可產生資料組來訓練、測試及驗證一模型。資料組產生器272可產生一機器學習模型之資料組。系統200可產生資料組用於訓練、測試及/或驗證一融合模型,例如用於判定一或多個產品出現於一內容項目中之一可能性。類似於系統200之一系統可產生資料組用於訓練、測試及/或驗證具有一不同功能之一模型,其中輸入資料及/或輸出資料之對應改變包含於資料組中。用於剖析文字(例如,自與內容項目相關聯之文字提取產品之一或多個參考)、剖析影像(例如,自與內容項目相關聯之影像提取產品之一或多個參考)、校正文字(例如,將產品之一或多個參考包含於與一內容項目相關聯之機器產生文字中)等等之模型可具有由類似於資料組產生器272之一資料組產生器產生之用於訓練、測試及/或驗證模型之資料組。
在一些實施例中,一資料組產生器(諸如資料組產生器272)可與兩個或更多個單獨模型相關聯(例如,資料組可用於訓練一集成模型)。例如,輸入資料組可經提供至一第一模型,第一模型之輸出可經提供至一第二模型,且目標輸出可經提供至第二模型以訓練、測試及/或驗證第一及第二模型(例如集成模型)。
資料組產生器272可(例如)在訓練、驗證及/或測試操作期間產生一或多個資料組來提供至一模型。一機器學習模型可被提供歷史資料組。一機器學習模型(例如一融合模型)可被提供歷史文字剖析資料組264A至264Z作為資料輸入。文字剖析資料可由一機器學習模型提供,例如,可包含由一機器學習模型在與一內容項目相關聯之文字中辨識之一或多個產品及置信值。一機器學習模型可被提供歷史影像剖析資料組265A至265Z作為資料輸入。影像剖析資料可由一經訓練機器學習模型提供,例如,可包含由一機器學習模型在與一內容項目相關聯之一或多個影像中辨識之一或多個產品及置信值。
在一些實施例中,資料組產生器272可經組態以產生資料組用於訓練、測試、驗證等等一融合模型。類似於資料組產生器272之一資料組產生器可產生文字資料組(例如內容項目標題文字、內容項目描述文字、內容項目字幕文字等等)作為資料輸入以訓練一機器學習模型判定與一內容項目相關聯之一或多個產品。類似於資料組產生器272之一資料組產生器可產生影像資料組(例如來自一視訊內容項目之一或多個圖框、來自一視訊內容項目之一或多個圖框之部分等等)作為資料輸入以訓練一機器學習模型判定與一內容項目相關聯之一或多個產品。
在一些實施例中,資料組產生器272產生包含一或多個資料輸入210 (例如訓練輸入、驗證輸入、測試輸入)之一資料組(例如訓練組、驗證組、測試組)。資料輸入210可經提供至圖1之訓練引擎182、驗證引擎184或測試引擎186。資料組可用於訓練、驗證或測試模型(例如一融合模型、一文字剖析模型、一影像剖析模型等等)。資料組產生器272可產生包含一或多個資料輸入210之一資料組(例如訓練組、驗證組、測試組)。資料輸入210可指稱「特徵」、「屬性」、「向量」或「資訊」。
在一些實施例中,資料組產生器272可產生對應於一第一組歷史文字剖析資料264A及/或一第一組歷史影像剖析資料265A之一第一資料輸入來訓練、驗證或測試一第一機器學習模型。資料組產生器272可產生對應於一第二組歷史度量資料264B及/或一第二組設計規則資料265B之一第二資料輸入來訓練、驗證或測試一第二機器學習模型。相對於圖5A來進一步描述產生一訓練組、測試組、驗證組等等之一些實施例。
在一些實施例中,資料組產生器272可產生目標輸出220來提供訓練、測試、驗證等等一或多個機器學習模型。資料組產生器272可產生產品相關聯資料268作為目標輸出220。產品相關聯資料268可包含與一內容項目相關聯之一或多個產品之辨識符(例如一人類標記產品相關聯性)。產品相關聯資料268可包含輸入-輸出映射,例如,一組歷史文字剖析資料264A可與一第一組產品相關聯資料268相關聯,等等。可藉由提供輸入資料、產生一輸出及比較其與一提供目標輸出(例如「正確答案」)來更新(例如,訓練)一機器學習模型。接著更新模型之各種權重、偏差等等以使模型與訓練資料更好對準。此程序可重複多次以產生提供所提供輸入之一臨限部分之準確輸出之一模型。目標輸出220可共享資料輸入210之一或多個特徵,例如,可將目標輸出220組織成屬性或向量,可將目標輸出220組織成組A至Z,等等。
在一些實施例中,類似於資料組產生器272之一資料組產生器可結合一文字剖析模型利用,經組態以判定與一內容項目相關聯之一或多個產品。產品相關聯性可包含背景相關聯性,諸如產品之品牌、產品之類型、產品之類別等等。一資料組產生器可產生與一內容項目相關聯、與一內容項目之文字相關聯等等之一產品列表、產品類型、產品品牌或其類似者作為目標輸出。類似於資料組產生器272之一資料組產生器可結合一影像剖析模型利用,經組態以判定與一內容項目相關聯之一或多個產品。資料組產生器可產生與影像輸入相關聯之一產品列表、產品類別、產品種類等等作為目標輸出。類似於資料組產生器272之一資料組產生器可結合一文字校正模型利用。一文字校正模型可經組態以識別在一目標語言中不正確提供一或多個用語來代替一產品名稱之機器產生文字。一文字校正模型可被提供一或多組機器產生文字作為輸入資料及與文字相關聯之產品(例如由文字之機器產生不正確捕獲之產品)作為目標輸出。
在一些實施例中,在產生一資料組且使用資料組來訓練、驗證或測試一機器學習模型之後,可進一步訓練、驗證或測試或調整模型(例如,調整與模型之輸入資料相關聯之權重或參數,諸如一神經網路中之連接權重)。可基於不同於原始訓練操作之資料(例如在訓練、驗證及/或測試模型之後產生之資料)來調整及/或再訓練模型。
圖3A係繪示根據一些實施例之用於產生輸出資料(例如產品/內容項目相關聯資料)之系統300A的一方塊圖。系統300A可結合一融合模型使用以基於由其他模型(例如在與內容項目相關聯之文字中偵測產品之基於文字之模型、在與內容項目相關聯之影像中偵測產品之基於影像之模型)產生之潛在產品/內容項目相關聯性來產生產品/內容項目相關聯資料及置信度資料。類似於系統300A之一系統可用於自其他類型之模型(例如一文字剖析模型、一影像剖析模型、一文字校正模型等等)產生輸出資料。
在區塊310處,系統300A (例如圖1之產品辨識系統175之組件)執行用於訓練、驗證及/或測試一機器學習模型之資料之資料分割(例如,經由圖2之資料組產生器272)。在一些實施例中,訓練資料364包含歷史資料,諸如基於文字之產品與內容項目之間的歷史相關聯性、基於影像之產品與內容項目之間的歷史相關聯性等等。在一些實施例中,例如,當系統300A旨在自一融合模型產生輸出時,訓練資料364可包含由一或多個經訓練機器學習模型(例如經組態以在與一內容項目相關聯之文字或影像中偵測產品之模型)產生之資料。訓練資料364可在區塊310處經歷資料分割以產生訓練組302、驗證組304及測試組306。例如,訓練組可為訓練資料之60%,驗證組可為訓練資料之20%,且測試組可為訓練資料之20%。
訓練組302、驗證組304及測試組306之產生可適應一特定應用。例如,訓練組可為訓練資料之60%,驗證組可為訓練資料之20%,且測試組可為訓練資料之20%。系統300A可針對訓練組、驗證組及測試組之各者產生複數組特徵。例如,若訓練資料364包含自來自一個以上文字源(例如與一內容項目相關聯之一標題及與一內容項目相關聯之一描述)之文字資料提取之產品相關聯性,則可將輸入訓練資料分成包含自來自一第一源之文字辨識之產品之一第一組特徵及包含在來自一第二源之文字中辨識之產品之一第二組特徵。可將目標輸入、目標輸出、兩者分組或兩者都不分組。多個模型可基於不同資料組訓練。
在區塊312處,系統300A使用訓練組302來執行模型訓練(例如,經由圖1之訓練引擎182)。一機器學習模型之訓練可依一監督式學習方式達成,其涉及透過模型提供包含標記輸入之一訓練資料組、觀察其輸出、界定一誤差(藉由量測輸出與標記值之間的差)及使用諸如深梯度下降及反向傳播之技術來調諧模型之權重以最小化誤差。在諸多應用中,跨訓練資料組中之諸多標記輸入重複此程序產生可在呈現有不同於存在於訓練資料組中之輸入之輸入時產生正確輸出之一模型。在一些實施例中,一機器學習模型之訓練可依一無監督方式達成,例如,在訓練期間可不供應標記或分類。一無監督模型可經組態以執行異常偵測、結果叢集等等。
針對訓練資料組中之各訓練資料項目,可將訓練資料項目輸入至模型中(例如,輸入至機器學習模型中)。接著,模型可處理輸入訓練資料項目(例如結合一內容項目偵測到之一或多個產品及相關聯置信值等等之一指示)以產生一輸出。輸出可包含(例如)可與內容項目及對應置信值相關聯之一產品列表。可比較輸出與訓練資料項目之一標記(例如與內容項目相關聯之一人類標記產品組)。
接著,處理邏輯可比較所產生輸出(例如預測產品/內容項目相關聯性)與包含於訓練資料項目中之標記(例如產品/內容項目相關聯性之一人類產生列表)。處理邏輯基於輸出與(若干)標記之間的差來判定一誤差(即,一分類誤差)。處理邏輯基於誤差來調整模型之一或多個權重及/或值。
就訓練一神經網路而言,可針對人工神經網路中之各節點判定一誤差項或Δ。基於此誤差,人工神經網路調整其節點之一或多者之其參數之一或多者(一節點之一或多個輸入之權重)。可依一反向傳播方式更新參數,使得一最高層處之節點先更新,接著更新下一層處之節點,等等。一人工神經網路含有「神經元」之多個層,其中各層自前一層處之神經元接收輸入值。各神經元之參數包含與自前一層處之神經元之各者接收之值相關聯之權重。因此,調整參數可包含調整賦予人工神經網路中之一或多個層處之一或多個神經元之輸入之各者之權重。
系統300A可使用訓練組302之多組特徵(例如訓練組302之一第一組特徵、訓練組302之一第二組特徵等等)來訓練多個模型。例如,系統300A可訓練一模型使用訓練組中之第一組特徵(例如訓練組364之一子集,諸如僅與經組態以產生產品/內容項目相關聯性之模型之一子集相關聯之資料等等)來產生一第一經訓練模型及使用訓練組中之第二組特徵來產生一第二經訓練模型。在一些實施例中,第一經訓練模型及第二經訓練模型可經組合以形成一第三經訓練模型(例如,其可比第一或第二經訓練模型本身更好)。在一些實施例中,用於比較模型之特徵組可重疊(例如,第一組特徵係基於內容項目標題、描述及一些影像之產品,且第二組特徵係基於內容項目描述、內容項目之一組不同影像及內容項目之所偵測背景(例如與一內容項目相關聯之產品類型)來偵測之產品)。在一些實施例中,可產生數百個模型,包含具有各種特徵排列之模型及模型之組合。
在區塊314處,系統300A使用驗證組304來執行模型驗證(例如,經由圖1之驗證引擎184)。系統300A可使用驗證組304之一組對應特徵來驗證經訓練模型之各者。例如,系統300A可使用驗證組中之第一組特徵來驗證第一經訓練模型及使用驗證組中之第二組特徵來驗證第二經訓練模型。在一些實施例中,系統300A可驗證在區塊312處產生之數百個模型(例如具有各種特徵排列之模型、模型之組合等等)。在區塊314處,系統300A可判定一或多個經訓練模型之各者之一準確度(例如,經由模型驗證)且可判定經訓練模型之一或多者是否具有滿足一臨限準確度之一準確度。回應於判定經訓練模型不具有滿足一臨限準確度之一準確度,流程返回至區塊312,其中系統300A使用訓練組之不同組特徵、由一資料組產生器提供之一更新或擴展訓練組或其類似者來執行模型訓練。回應於判定經訓練模型之一或多者具有滿足一臨限準確度之一準確度,流程繼續至區塊316。系統300A可捨棄具有低於臨限準確度之一準確度之經訓練模型(例如,基於驗證組)。
在區塊316處,系統300A執行模型選擇(例如,經由圖1之選擇引擎185)以判定滿足臨限準確度之一或多個經訓練模型之哪個具有最高準確度(例如選定模型308,基於區塊314之驗證)。回應於判定滿足臨限準確度之經訓練模型之兩者或更多者具有相同準確度,流程可返回至區塊312,其中系統300A使用對應於進一步改進特徵組之進一步改進訓練組來執行模型訓練以判定具有最高準確度之一經訓練模型。
在區塊318處,系統300A使用測試組306來執行模型測試(例如,經由圖1之測試引擎186)以測試選定模型308。系統300A可使用測試組中之第一組特徵來測試第一經訓練模型以判定第一經訓練模型滿足一臨限準確度(例如,基於測試組306之第一組特徵)。回應於選定模型308之準確度不滿足臨限準確度(例如,選定模型308與訓練組302及/或驗證組304過度擬合且不適用於諸如測試組306之其他資料組),流程繼續至區塊312,其中系統300A使用對應於不同特徵組、不同內容項目或其類似者之不同訓練組來執行模型訓練(例如,再訓練)。回應於基於測試組306來判定選定模型308具有滿足一臨限準確度之一準確度,流程繼續至區塊320。在至少區塊312中,模型可學習訓練資料中之模式以作出預測,且在區塊318中,系統300A可應用剩餘資料(例如測試組306)上之模型來測試預測。
在區塊320中,系統300A使用經訓練模型(例如選定模型308)來接收當前資料322 (例如新上傳內容項目、新創建內容項目、不包含於選定模型308之訓練、測試或驗證組中之內容項目等等)且自經訓練模型之輸出判定(例如,提取)輸出資料324 (例如產品/內容項目相關聯性及對應置信值)。可鑑於輸出資料324來執行與內容項目及/或相關聯資料相關聯之一校正動作。例如,可更新指令以包含呈現一UI元件及指定內容項目包含一或多個相關聯產品之一內容項目,可更新指令以包含呈現一UI元件及含有關於相關聯產品之額外資訊之內容項目,等等。指令可取決於內容項目(例如一搜尋頁面、一主頁等等)之額外因數(例如使用者偏好、呈現環境)或其類似者。在一些實施例中,當前資料322可對應於用於訓練機器學習模型之歷史資料中之相同類型之特徵。在一些實施例中,當前資料322對應於用於訓練選定模型308之歷史資料中之特徵之類型之一子集(例如,一機器學習模型可使用來自若干源(諸如基於文字及影像之源)之產品相關聯性及/或背景資訊及置信值來訓練且被提供此資料之一子集作為當前資料322)。
在一些實施例中,可隨時間調整、改良及/或更新機器學習模型(例如選定模型308)之效能。例如,可將額外訓練資料提供至模型以提高模型正確分類產品與一內容項目之相關聯性之能力。在一些實施例中,可提供當前資料322之一些部分來再訓練模型(例如,經由圖1之訓練引擎182)。當前資料322之部分可經標記(例如,人類標記),且可提供標記來再訓練模型(例如,作為當前目標輸出資料346)。當前資料322及當前目標輸出資料346可用於週期性、連續等等更新及/或改良選定模型308。
在一些實施例中,動作310至320之一或多者可依各種順序發生及/或具有本文中未呈現及描述之其他動作。在一些實施例中,可不執行動作310至320之一或多者。例如,在一些實施例中,可不執行區塊310之資料分割、區塊314之模型驗證、區塊316之模型選擇或區塊318之模型測試之一或多者。
已相對於一融合模型來描述系統300A。融合模型接受與一內容項目相關聯偵測到之產品(例如來自與內容項目相關聯之文字、來自與內容項目相關聯之影像等等)及置信值(例如一產品確實在內容項目中提及之置信度)之一或多個指示且基於多個輸入來產生一產品在內容項目中提及之一整體可能性作為一輸出。類似於系統300A之系統可用於執行其他基於機器學習之任務(例如文字或影像剖析模型,其輸出經提供為融合模型之輸入),可依類似於結合系統300A所描述之方式之一方式操作,其中適當替代輸入資料、輸出資料等等。
圖3B係根據一些實施例之用於產生一內容項目與一或多個產品之間的相關聯性之一實例性系統300B之一方塊圖。系統300B可包含多個模組,例如影像辨識330、影像核實340、文字辨識350、融合360等等。在一些實施例中,系統300B之多個模組可一起操作以自內容項目辨識產品。例如,在一內容項目之影像及一內容項目之元資料(例如標題、描述、字幕等等)中偵測到之產品可經提供至一融合模型以基於多個輸入頻道來判定一或多個產品與內容項目相關聯之一可能性。可回應於由融合模型判定之一產品出現於內容項目中之可能性而採取動作(例如,更新內容項目之元資料以包含產品之一指示)。
影像辨識模組330可用於自與一模型相關聯之影像辨識一或多個產品,例如,可比較來自一內容項目之影像與一產品資料庫(例如數千個影像)中之影像以辨識存在於一視訊中之產品。所存在之產品可包含內容項目之具體主體(例如在內容項目中評審之產品)、包含於內容項目中之產品(例如偶然出現之產品、未具體突顯出現之產品等等)或其類似者。文字辨識模組350可自與一內容項目相關聯之元資料/文字資料(例如,自包括內容項目之一標題、內容項目之一描述、與內容項目相關聯之字幕等等之文字)辨識與內容項目相關聯之一或多個產品。影像核實模組340可使用一或多個影像來核實在一內容項目中辨識之產品。例如,影像核實模組340可類似於影像辨識模組330般工作,但可用於確認由一單獨模組辨識之一或多個產品之存在(例如,藉由比較潛在產品之影像與由另一模組提供之一更有限範圍之產品影像)。融合模組360可接收包含於一內容項目中之候選產品及相關聯置信值且基於各種輸入來判定一或多個產品出現於內容項目中之可能性。
影像辨識330可用於判定與具有一視覺組件(例如一視訊)之一內容項目相關聯之產品。影像辨識330可包含圖框選擇332。圖框選擇332可用於選擇一視訊之一或多個圖框以搜尋產品之影像。圖框選擇332可經由隨機取樣、週期性取樣、智慧型取樣方法等等來發生。例如,可將一內容項目(例如視訊)提供至一機器學習模型,且機器學習模型可經訓練以預測可能包含一或多個產品之一視訊之圖框。
可將一或多個圖框提供至物件偵測模型334。物件偵測334可自一或多個圖框提取預測物件。例如,物件偵測334可隔離潛在產品與一內容項目之影像資料之人、動物、背景等等。物件偵測334可為或包含一機器學習模型。
可將偵測到之物件之影像供應至嵌入336。嵌入336可包含將一或多個影像轉換成較低維度。嵌入336可包含將一或多個影像提供至一降維模型。降維模型可為一機器學習模型。降維模型可經組態以依一類似方式降低類似影像之維度。例如,嵌入336可接收一影像作為輸入且產生一值向量作為輸出。嵌入336可經組態、訓練等等使得在降維向量空間中類似表示(例如藉由笛卡爾(Cartesian)距離、藉由餘弦距離、藉由另一距離度量等等)類似影像(例如相同或類似產品之影像)。嵌入336可產生降維資料。
可將降維影像資料提供至產品辨識338。產品辨識338可辨識與由嵌入336提供之降維表示相關聯之一或多個產品。產品辨識338可比較降維影像資料(例如,由嵌入336提供)與包含於產品影像索引339中之產品之降維影像資料(例如,由嵌入336使用之相同機器學習模型自產品之影像產生)。產品影像索引339可儲存為一資料儲存器之部分。產品影像索引339可包含(例如)諸多產品(例如數百個產品、數千個產品或更多)。產品影像索引339可包含儲存影像資料(例如降維影像資料)與產品辨識符、產品指示符等等之間的相關聯性。產品影像索引339可經分段,例如,所儲存之降維資料可經分類成一或多個種類、類別等等。例如,產品辨識338可比較自嵌入336接收之資料與一特定種類、類型、分類等等之產品。在一些實施例中,種類、類型、分類等等可由一或多個使用者、一或多個內容創作者提供,可經自動偵測(例如,藉由一或多個機器學習模型),等等。一內容項目或與一內容項目相關聯之一或多個產品可與一種類(例如一般種類(諸如電子類)、更有限種類(諸如螢幕裝置)、諸如平板電腦之產品之一分類、牌子或品牌、型號或其類似者)相關聯。產品辨識338可產生在內容項目之影像中偵測到之產品之一或多個指示(例如可匹配在產品影像索引339中表示之產品之一產品列表)及置信值之一或多個指示(例如準確偵測產品列表之各者之一置信度)。影像辨識330之輸出可用於更新一內容項目之元資料(例如包含與一或多個產品之相關聯性、包含一或多個產品辨識符或指示符等等)。影像辨識330之輸出可經提供至影像核實340以(例如)核實由影像辨識330辨識之影像在內容項目中之存在。影像辨識330之輸出可經提供至融合360以(例如)經由融合模型366產生包含於內容項目中之產品之一整體及/或多輸入判定。影像辨識330之輸出可經提供至文字辨識350 (未展示)以(例如)限制由文字辨識模組350查詢、搜尋、比較等等之產品之空間。在一些實施例中,影像辨識330用於辨識在一視訊內容項目之一或多個圖框中找到之產品。例如,影像辨識模組330可經組態以產生在任何選定圖框中偵測到之所有產品之一列表且提供各選定圖框中之各產品之置信值。影像辨識模組330可產生基於影像之產品資料,例如產品之一或多個辨識符,產品基於一內容項目之影像辨識。
影像核實模組340可經組態以使用內容項目之一或多個影像來核實一內容項目之辨識產品之存在。例如,影像核實模組340可包含經組態以確認由其他模型辨識之產品之存在之模型。影像核實模組340可包含二次辨識345。二次辨識345可包含類似於影像辨識330之組件。在一些實施例中,影像辨識模組330可與產品候選影像索引344直接通信,替代或外加二次辨識345與產品候選影像索引344通信。在一些實施例中,二次辨識345可扮演類似於影像辨識330之角色,但可包含不同模型、使用不同訓練資料訓練之模型、經組態以選擇不同圖框或偵測物件之模型等等。
影像核實340可包含合成模型341。合成模型341可接收由影像辨識模組330、文字辨識模組350、二次辨識345 (資料流未展示)等等辨識之產品之指示。合成模型341可選擇將資料提供至之一物件偵測模型342 (例如針對產品之一種類或分類所具體組態之一物件偵測模型)。合成模型341可包含影像選擇,例如,合成模型341可將一或多個影像提供至物件偵測342,可選擇一或多個圖框來提供至物件偵測334,等等。例如,合成模型341可基於自影像辨識330及文字辨識350接收之資料來將可能包含一產品之一或多個圖框提供至物件偵測342。物件偵測模型342可執行類似於物件偵測模型334之功能,例如,由合成模型341之函數修改。嵌入343可執行類似於嵌入336之功能以(例如)降低偵測到之產品之影像之維度。在一些實施例中,產品候選影像索引344可包含由其他模組(例如影像辨識330、文字辨識350等等)偵測到之降維影像資料(例如值向量)。二次辨識345可比較降維影像資料(例如嵌入影像資料)與產品候選影像索引344之候選資料(例如由除影像核實模組340之外的一模組辨識之產品)以核實產品在一內容項目中之存在。
文字辨識350可經組態以自與一內容項目相關聯之文字資料(例如元資料)辨識一或多個產品。文字辨識350可產生基於元資料之產品資料,例如基於一內容項目之元資料之一或多個產品辨識符。文字辨識350可產生基於文字之產品資料,例如基於與一內容項目相關聯之文字資料之一或多個產品辨識符。文字辨識350可自一內容項目標題、一內容項目描述、與一內容項目相關聯之字幕(例如機器產生字幕)、與內容項目相關聯之評論及/或內容項目之其他文字資料或元資料之一或多者辨識產品。與一內容項目相關聯之文字資料(例如元資料)可提供至文字剖析模型352。文字剖析模型352可為一機器學習模型。文字剖析模型352可經組態以自與一內容項目相關聯之文字資料偵測或預測產品。文字剖析模型352可經組態以用儲存於產品辨識符354中之產品辨識符來偵測一或多個產品。文字剖析模型352可將輸出(例如偵測到之一候選產品列表、相關聯置信值等等)提供至影像核實模組340。文字剖析模型352可將輸出提供至合成模型341。文字剖析模型352可提供影響影像核實之產品之輸出,例如,文字剖析模型352之輸出可引起由文字辨識模組350偵測到之產品添加至產品候選影像索引344。影像核實模組340可查詢包含由其他模組(例如影像辨識模組330、文字辨識模組350等等)偵測到之產品之一索引(例如產品候選影像索引344)。
融合模型360可自一或多個源(例如影像辨識模組330、影像核實模組340、文字辨識模組350等等)接收輸出資料(例如偵測到之產品、相關聯置信值)。融合模型360可進一步自其他源(例如背景項提取362或額外特徵提取363)接收資料。背景項提取362可(例如)將背景提供至一內容項目之潛在產品,例如,可偵測與一些產品相關聯之種類或主體。背景項提取362可由一或多個機器學習模型執行。背景項提取362可自與一內容項目相關聯之文字、與一內容項目相關聯之元資料等等偵測背景資訊。額外特徵提取363可提供可用於判定一或多個產品是否出現於一內容項目中之額外細節。額外特徵可包含視訊嵌入。額外特徵可包含內容項目之其他元資料,例如,內容項目上傳至一內容提供平台之日期(例如,與一產品之一出廠日期比較)、內容項目之分類(例如,一購物或產品評審視訊可比另一類型之視訊更可能包含產品)等等。
可將來自多個源之資料提供至融合模型366。融合模型366可經組態以接收資料(例如,包含具有置信值之一或多個產品)且判定具有指示產品出現於一內容項目中之一可能性之置信值之一或多個產品。在一些實施例中,內容項目可為一視訊。在一些實施例中,內容項目可為一現場直播饋入,例如一現場直播視訊饋入(例如一產品評審直播、一開箱直播等等)。內容項目可為一短視頻。
圖4A至圖4E描繪根據一些實施例之包含指示相關聯產品之UI元件之呈現於一使用者裝置上之實例性UI。圖4A至圖4E可包含提供為裝置400A至400E之應用程式(例如網頁瀏覽器應用程式、與一內容平台相關聯/由一內容平台提供之行動應用程式等等)之部分之UI。使用者與圖4A至圖4E之UI之各種元件互動可引起所呈現之UI元件改變。例如,與指示一內容項目具有相關聯產品之一UI元件互動可引起一第二UI元件顯示(例如替換第一UI元件、展開第一UI元件等等)以呈現額外資訊(例如,關於相關聯產品)。一UI元件可包含在互動時引起UI顯示關於相關聯產品之更少資訊(例如,收合描述一或多個相關聯產品之一畫面)之一元件。與一或多個產品相關聯之一UI元件互動可引起不同效應,例如轉變為用於呈現一內容項目之一UI環境。新UI環境可包含與內容項目之一或多個產品相關聯之一或多個UI元件。與一產品相關聯之一UI元件互動可引起促進產品之一交易(例如購買)之一UI元件顯示。圖4A至圖4E中所呈現之UI與UI元件之間的各種互動係可行的(例如,與一第一UI佈局之一元件互動可引起轉變為一第二UI佈局),且樣本UI、類似UI之間的任何轉變、包含類似UI元件等等係在本發明之範疇內。圖4A至圖4E結合視訊內容項目來描述,其他類型之內容項目(例如影像內容、文字內容、音訊內容等等)可呈現於類似UI中。與圖4A至圖4E之一或多者相關呈現之任何選用特徵、元件等等可視情況包含於類似於此等圖之另一者之系統中。
圖4A描繪根據一些實施例之呈現包含指示一或多個相關聯產品之一UI元件404之一實例性UI 402之一裝置400A。包含UI 402之元件及/或類似UI元件之一UI可由裝置400A呈現為呈現一或多個內容項目供使用者選擇之操作之一部分。UI元件404在圖4A中描繪為呈一收合狀態,例如一收合預設狀態。
UI 402包含第一內容項目選擇器406 (例如一視訊縮略圖)及第二內容項目選擇器408。在一些實施例中,可選擇更多或更少內容項目,可滾動UI 402以查看額外內容項目。UI元件404與由內容項目選擇器406指示之內容項目相關聯。UI元件404 (及與產品相關之圖4A至圖4D之其他UI元件)可在與UI元件404相關聯之一內容項目或一內容項目之內容項目選擇器上方、在其近旁、與其重疊、在其內、在其下方等等呈現。在一些實施例中,產品資訊(例如產品/內容項目相關聯性)可由內容創作者提供。產品資訊可由一或多個使用者提供。產品資訊可由一管理者提供。產品資訊可(例如)經由一或多個機器學習模型、經由一系統(諸如系統300B)或其類似者自一內容項目擷取。
在一些實施例中,一使用者可與UI元件404互動以呈現有一替換UI元件、一更新UI元件等等。例如,一使用者可與展開元件410互動以顯示關於與一內容項目相關聯之產品之更多資訊。在一些實施例中,展開UI元件404可打開包含關於與一內容項目相關聯之一或多個產品之額外資訊之一畫面。展開UI元件404、與UI元件404互動等等可將UI 402之呈現調整為(例如)包含圖4B至圖4D中所描繪之元件。
UI元件404可包含(例如)展開元件410、相關聯產品之一指示(例如多少產品與一內容項目相關聯)、產品之一視覺指示412 (例如一交易或購買可用、至一產品之一商家之一鏈接可用等等之一視覺指示)或其類似者。使用者與UI元件404之一或多個組件互動可引起裝置400A修改UI元件404之一呈現,例如,使用者選擇展開元件410可引起UI元件404之呈現修改為一展開狀態。
包含UI元件404之一UI可回應於裝置400A將對內容項目之一請求發送至一內容提供平台(例如圖1之內容提供平台120)而呈現。UI元件404可呈現於一主頁饋入(例如一使用者或使用者帳號之一建議內容項目列表)中。UI元件404可呈現於一建議饋入(例如基於一或多個最近呈現之內容項目之一建議內容項目列表)中。UI元件404可呈現為一播放列表(例如,使用者填入、創作者填入等等之待呈現之一內容項目列表)之部分。UI元件404可呈現於一搜尋饋入中(例如,回應於一使用者產生之搜尋查詢由裝置400A發送至一內容提供平台)。例如,可基於一產品、產品種類、產品品牌等等包含於一搜尋查詢中來呈現與一或多個產品相關聯之一UI元件。UI元件404可呈現於一產品聚焦饋入(例如一購物內容饋入)中。UI元件404可回應一使用者選擇一內容項目,例如,可在使用者選擇觀看一相關聯視訊之後顯示、呈現有一相關聯內容項目等等。UI元件404可基於偵測到一使用者感興趣之一內容項目來呈現。例如,一使用者可停留於一視訊之一縮略圖上(例如,一使用者可將一游標放在縮略圖上,一使用者可在縮略圖呈現時暫停滾動,等等)。在一停留滿足一或多個條件(例如持續時間條件、縮略圖條件之位置等等)之後,可呈現UI元件404。UI元件404可回應於額外資料(例如使用者帳號歷史、使用者設定、使用者偏好等等)而呈現。UI元件404可與待呈現之一內容項目列表一起呈現,UI元件404可在呈現一內容項目時(例如,在播放與UI元件404之產品相關聯之一視訊時)呈現。
圖4B描繪根據一些實施例之呈現包含指示相關聯產品之一UI元件422之一實例性UI 420之一裝置400B。UI元件422包含關於與一內容項目相關聯之一或多個產品之資訊。UI元件422在圖4B中呈現為呈一展開狀態。UI元件422可包含數個組件。例如,一第一組件可包含關於一第一產品之資訊(例如一圖片、產品名稱、價格、時戳等等),一第二組件可包含關於一第二產品之資訊,等等。在一些實施例中,UI元件422可滾動以(例如)存取關於額外產品之資訊。UI元件422可包含多個標籤(例如,UI元件422可與產品資訊及一或多個其他類型之資訊相關聯)。例如,UI元件422可包含產品標籤424及章節標籤426。在一些實施例中,產品標籤424可預設打開(例如,產品標籤424之內容可預設呈現)。在一些實施例中,章節標籤426可預設打開(例如,章節標籤426之內容可預設呈現)。在一些實施例中,另一標籤可預設打開。例如,除具有相關聯產品之內容項目之外,章節標籤426可預設打開,預設打開之一標籤可基於使用者歷史(例如,與章節標籤、產品標籤等等之元件互動)、基於一搜尋查詢(例如包含一產品名稱、一相關術語或片語(諸如「產品評審」)等等之一搜尋)或其類似者來選擇。UI元件422可包含額外元件,例如一使用者可用於控制UI 420、UI元件422等等之呈現之元件。例如,UI元件422可包含用於呈現沒有UI元件422之UI 420之一「關閉」元件,可包含用於顯示更少資訊之一「收合」元件(例如,將畫面收合為類似於圖4A之UI元件404,將UI元件422之呈現修改為一收合狀態,等等)、用於顯示更多資訊之一或多個元件(例如,一或多個所列產品、所列產品圖標等等可經選擇以呈現關於產品之額外資訊、促進產品購買或其類似者)等等。
UI元件422之產品標籤424可包含產品之一或多個圖片、關於產品之資訊(例如產品之名稱、產品之描述等等)、一或多個產品之一價格、與產品相關之內容項目之一時戳等等。在一些實施例中,產品資訊可由一內容創作者、一或多個使用者、一系統管理者或其類似者提供。在一些實施例中,產品資訊可由一或多個模型(例如機器學習模型)擷取。例如,一產品在一內容項目中之存在、一產品在一內容項目中之相關聯性、一產品出現於一內容項目中之一時戳或位置或其類似者可由一或多個機器學習模型判定。諸如圖3B之系統300B之一系統可用於判定與一內容項目(例如一視訊)相關聯之一或多個產品。與一內容項目相關之內容項目之一部分(例如一時戳)可(例如)經由與產品相關聯之字幕之一時序、包含產品之一視訊之一影像或圖框之顯示時序或其類似者來判定。在一些實施例中,選擇一產品可引起與產品相關聯之一內容項目之一部分呈現,可引起在由與產品相關聯之一時戳指示之一時間開始呈現一內容項目,等等。
在一些實施例中,與一特定產品相關聯之UI元件422之部分(例如視覺組件)可預設顯示、不同顯示(例如突顯)等等。例如,在自一使用者接收包含一產品之名稱之一搜尋查詢之後,可顯示UI元件422,包含與搜尋產品相關聯之一顯示。
在一些實施例中,一內容項目與產品之間的一或多個相關聯性可經儲存為(例如)與內容項目相關聯之元資料(與一內容項目相關聯之元資料可進一步包含內容項目標題、描述、呈現歷史、與內容項目相關聯之字幕等等)。回應於一裝置(例如裝置400B)執行指令以顯示用於呈現之一內容項目列表、向一使用者呈現一內容項目、呈現包含關於一或多個產品之資訊之一UI元件(例如UI元件422)等等,裝置可基於使一產品與一內容項目相關聯之元資料來擷取關於產品之資訊。關於產品之資訊(例如影像、相關聯產品(諸如色彩變體)、可供量、價格等等)可自一資料儲存器擷取。資料儲存器可包含關於產品之資訊且可經更新,例如,當諸如一產品之價格之資訊改變時,UI可擷取更新資訊且基於內容項目/產品相關聯性來顯示更新資訊。
UI元件422可經呈現為一主頁饋入(例如一使用者或使用者帳號之一建議內容項目列表)、一建議饋入(例如基於一或多個最近呈現之內容項目之一建議內容項目列表)、一播放列表、一搜尋結果列表、一購物內容頁面等等之部分。可在選擇一內容項目用於呈現之後、在呈現一內容項目之後等等呈現UI元件422。UI元件422可停留呈現(例如暫停滾動一內容縮略圖、暫停滾動一不太詳細元件(諸如圖4A之UI元件404)等等)。在一些實施例中,UI元件422可在使用者動作之後(例如,在滾動之後)移除或替換,UI元件422可收合至類似於UI元件404 (例如促進自內容項目列表選擇一內容項目、簡化滾動瀏覽一內容項目列表等等)。可在呈現一內容項目列表時、在呈現一單一內容項目時(例如,在播放與UI元件422之產品相關聯之一視訊時)等等顯示UI元件422。
圖4C描繪根據一些實施例之呈現包含呈現一內容項目之一UI元件432及呈現關於相關聯產品之資訊之UI元件434之一實例性UI 430之一裝置400C。UI元件434可包含比圖4B之UI元件422更詳細之關於與一內容項目相關聯之產品之資訊。UI元件434可產品聚焦,例如,可用於向一使用者顯示產品資訊。UI元件434可包含一或多個組件,例如與一第一產品相關聯之一組件、與一第二產品相關聯之一組件等等。在一些實施例中,UI元件434可包含與一內容項目相關聯之一產品列表。UI元件434可導覽、可滾動等等。UI元件434可包含一或多個控制元件,例如用於返回至前一視圖之一返回按鈕、用於關閉UI元件434且觀看一組不同UI元件(例如,與產品不相關)之一關閉按鈕等等。在一些實施例中,UI元件434可回應於另一使用者動作(例如一使用者滾動通過一相關聯內容項目)而自UI 430移除。在一些實施例中,使用者選擇經由UI 434呈現之一產品可提示呈現促進產品購買之一UI元件。在一些實施例中,UI元件434可回應於判定使用者對與一內容項目相關聯之一或多個產品感興趣而顯示(例如基於使用者歷史、基於一使用者搜尋查詢中之一或多個項、基於一使用者選擇瀏覽及/或被呈現購物內容項目、基於一使用者選擇一產品或與一產品相關聯之一UI元件等等)。
UI元件434可包含關於與一內容項目(例如經由UI元件432呈現之內容項目)相關聯之一或多個產品之一或多個圖片及/或額外資訊。圖片及/或資訊可由一內容創作者、一或多個使用者提供,自一資料庫擷取(例如,基於產品/內容項目相關聯元資料),等等。在一些實施例中,UI元件432可自動滾動。例如,UI元件432可在呈現一內容項目時滾動,(例如)使得與當前正在呈現之一內容項目之一部分相關聯之一產品可見。UI元件432可回應於使用者選擇待呈現之一內容項目而呈現。UI元件432可回應於其他因數(例如使用者歷史)而呈現。UI元件432可在一使用者停留於一相關聯內容項目、一相關聯UI元件等等上之後呈現。
在一些實施例中,UI元件434可呈現關於一單一產品(例如由一使用者選擇之一產品(例如,經由圖4B之UI元件422))之資訊。UI元件434可產品聚焦,可聚焦於一單一產品,可顯示產品變動(例如結合圖4D之UI元件444所描述),或可包含相對於本文中所描述之其他UI元件所描述之其他元件、組件及/或資訊。
圖4D描繪根據一些實施例之呈現包含呈現一內容項目之一UI元件442及促進與一產品相關聯之一交易之一UI元件444之一實例性UI 440之一裝置400D。UI元件444可提供與一使用者進行一交易(例如,購買一產品)相關聯之一或多個欄位。例如,UI元件444可包含替代產品畫面446,可包含關於替代產品(例如與內容項目相關聯之一或多個產品相關之產品(諸如產品之色彩變動、大小變動、捆綁變動)、相關產品(諸如另一品牌之類似產品)等等)之資訊、圖片、價格等等。
UI元件444可包含交易元件448。在一些實施例中,交易元件448可促進提供UI 440之應用程式內之一交易(例如購買)。在一些實施例中,交易元件448可促進經由另一應用程式、另一網站或其類似者之一交易,例如,與交易元件448互動可將一使用者導引至一商家網站,可將裝置400D導引至打開與購買產品相關聯之一應用程式,等等。
UI元件444可導覽、可滾動等等。UI元件444可包含一或多個控制元件,例如用於返回至前一視圖之一返回按鈕、用於關閉UI元件444且經由UI 440顯示一組不同UI元件之一關閉按鈕等等。在一些實施例中,UI元件444可顯示為用於使用者選擇之一內容項目列表之部分、呈現一內容項目之一UI 440之部分等等。可回應於判定使用者對與包含於一內容項目中之一或多個產品相關聯之一交易(例如購買)感興趣(例如自一UI元件(諸如圖4C之UI元件434)選擇一產品、選擇一內容項目、停留於一內容項目上、一產品或產品相關項包含於一搜尋查詢中、一使用者導覽至一購物聚焦內容項目列表等等)而顯示UI元件444。UI元件444可(例如)基於使一內容項目與一或多個產品相關聯之元資料而自一資料庫接收關於一或多個產品之資訊。
圖4A至圖4D中所描繪之UI元件可依各種組態整合。例如,可在使用者與UI元件404互動之後呈現諸如UI元件404之一UI元件,可在使用者與UI元件422互動之後呈現諸如UI元件422之一元件,可在使用者與UI元件434互動之後呈現UI元件434,可呈現UI元件444,等等。一或多個UI元件可包含用於指示一裝置顯示一不同UI元件之導覽元件,例如,與展開元件410互動可引起諸如UI元件422之一UI元件呈現,及與UI元件404之一不同元件互動可引起諸如UI元件434、UI元件444或其類似者之一UI元件呈現。
UI元件之間的其他連接係可行的,例如,與諸如UI元件404之一UI元件互動可引起諸如UI元件422、諸如UI元件434、諸如UI元件444等等之一UI元件顯示。與諸如UI元件422之一UI元件或其一部分互動可引起諸如UI元件404、諸如UI元件434、諸如UI元件444等等之一UI元件呈現。使用者與諸如UI元件434之一UI元件或其一部分互動可引起諸如UI元件404、UI元件422、諸如UI元件444等等之一UI元件呈現。使用者與諸如UI元件444之一UI元件或其一部分互動可引起諸如UI元件404、諸如UI元件434、諸如UI元件444等等之UI元件顯示。所呈現之一預設UI元件可取決於其中呈現UI元件之環境(例如:回應於一搜尋、主頁饋入、購物饋入、觀看饋入等等而呈現之一內容項目列表;包含正在呈現之一內容項目之一環境;或其類似者)。例如,選擇一UI元件之形式可基於諸多因數。在一些實施例中,將一產品名稱、種類或其類似者包含於一搜尋查詢中可更改一預設UI元件,例如可引起一UI預設展現包含關於產品之資訊之一UI元件、包含產品之購買選項之一UI元件或其類似者。判定待顯示之一UI元件之形式可基於使用者歷史、使用者帳號歷史、一使用者動作(例如打開一主頁饋入、呈現一觀看饋入、傳輸一搜尋查詢、選擇一購物饋入等等)。與產品相關聯之UI元件之形式之間的轉變可由類似於用於判定所呈現之一UI元件之形式之資料之額外資料判定。
圖4E描繪根據一些實施例之具有重疊於內容呈現元件452上之UI元件之一實例性裝置400E。裝置400E包含UI 450。UI 450可由一應用程式(例如與一內容提供平台相關聯之一應用程式)提供。呈現元件452可呈現一內容項目(例如一視訊)。UI 450可呈現一額外內容項目列表、與一呈現內容項目相關聯之額外資訊(例如標題、描述、評論、一在線聊天等等)、與產品相關聯之額外UI元件(例如UI元件,諸如UI元件404、422、434、444或變動)等等。
呈現元件452可與一或多個UI元件重疊。UI元件454可指示一產品包含於一內容項目中(例如,展示於一視訊中)。UI元件454可執行類似於圖4A至圖4D之其他UI元件之功能,例如可呈現關於一產品之資訊、能夠顯示關於產品之更多資訊、促進購買產品等等。放置重疊元件可由一或多個使用者、內容創作者、模型(例如,經組態以偵測一影像中之產品或物件之機器學習模型可用於避免一內容項目顯示區域包含物件)等等判定。UI元件454可包含一或多個相關產品定位於內容項目中何處(例如在一視訊中何處)之一視覺指示符。可在呈現一內容項目期間(例如,在播放一視訊時)呈現UI元件454。UI元件454可回應於相關產品存在於內容項目中而顯示及/或移除,例如可在內容項目在視訊中時顯示。UI元件454可指示多個產品,可辨識產品(例如,可確定一或多個產品之名稱),可顯示關於產品之資訊,等等。多個UI元件(諸如UI元件454)可(例如)在一視訊之一縮略圖上顯示,在一視訊之整個呈現中顯示,在一視訊期間同時顯示,等等。
重疊UI元件(諸如UI元件454)可與產品相關聯之其他UI元件組合呈現,例如,UI元件456可打開包含關於與內容項目相關聯之多個產品之資訊之一畫面,UI元件454可引起包含關於圖片產品之資訊之一UI元件顯示,等等。
重疊UI元件454可顯示於一內容項目之一視覺表示上(例如,在其前面、具有相較於其之視覺優先級等等)。例如,UI元件454可重疊於一視訊縮略圖上。UI元件454可顯示於一內容項目上。例如,UI元件454可重疊於正在播放之一視訊上。可回應於使用者動作而執行UI元件454之呈現。例如,在判定一使用者對一或多個產品感興趣(例如經由一搜尋查詢、經由與產品相關UI元件互動、經由使用者歷史等等)之後,UI元件454可重疊顯示於另一UI元件上。在一些實施例中,內容項目可為一現場直播視訊。在一些實施例中,內容項目可為一短視頻。
在一些實施例中,UI元件454可類似於UI元件404之執行之描述般執行,例如可通知一使用者一或多個產品與一內容項目相關聯。UI元件454可類似於UI元件404般回應來自一使用者之互動,例如,可打開或展開包含產品資訊之一畫面,可將UI元件404之呈現修改為顯示更多或不同資訊,可將UI元件展開為包含更多資訊,可引發內容項目呈現,等等。UI元件454可類似於UI元件434般回應來自一使用者之互動,例如可打開或展開促進一交易之一畫面。
圖5A至圖5F係根據一些實施例之與具有相關聯產品之內容項目相關之方法500A至500F之流程圖。方法500A至500F可由處理邏輯執行,處理邏輯可包含硬體(例如電路系統、專用邏輯、可程式化邏輯、微碼、處理裝置等等)、軟體(諸如運行於一處理裝置、一通用電腦系統或一專用機器上之指令)、韌體、微碼或其等之一組合。在一些實施例中,方法500A至500F可部分由圖1之內容平台系統102、產品辨識系統175及/或用戶端裝置110執行。方法500A可部分由產品辨識系統175 (例如圖1之伺服器機器170及資料組產生器172、圖2之資料組產生器272)執行。根據本發明之實施例,產品辨識系統175可使用方法500A來產生一資料組用於訓練、驗證或測試一機器學習模型之至少一者。方法500B至500D可由產品辨識系統175 (例如圖3B之系統300B)及/或伺服器機器180執行(例如,訓練、驗證及測試操作可由伺服器機器180執行)。方法500E可由用戶端裝置110執行。方法500E可由用戶端裝置110用於顯示與產品相關聯之一或多個UI元件,例如促進使用者辨識包含於內容項目中之產品。方法500F可由內容平台系統102執行,例如可由內容提供平台120之處理邏輯執行以促進由用戶端裝置110呈現與產品相關聯之一或多個UI元件。在一些實施例中,一非暫時性機器可讀儲存媒體儲存指令,指令在由一處理裝置(例如產品辨識系統175、伺服器機器180等等之處理裝置)執行時引起處理裝置執行方法500A至500F之一或多者。
為簡單說明,方法500A至500F描繪及描述為一系列操作。然而,根據本發明之操作可依各種順序及/或同時發生且具有本文中未呈現及描述之其他操作。此外,並非要執行所有繪示操作來實施根據本發明之方法500A至500F。另外,熟習技術者應理解及瞭解,方法500A至500F可替代地經由一狀態圖或事件表示為一系列相互關聯狀態。
圖5A係根據一些實施例之用於產生一機器學習模型之一資料組之一方法500A之一流程圖。參考圖5A,在一些實施例中,在區塊501處,實施方法500A之處理邏輯將一訓練組T初始化為一空集。
在區塊502處,處理邏輯產生可包含產品資料、影像資料、元資料、文字資料、置信度資料等等之一或多者之第一資料輸入(例如第一訓練輸入、第一驗證輸入)。在一些實施例中,第一資料輸入可包含資料類型之一第一組特徵且一第二資料輸入可包含資料類型之一第二組特徵(例如相對於圖3A所描述)。在一些實施例中,輸入資料可包含歷史資料。
在一些實施例中,在區塊503處,處理邏輯視情況針對資料輸入之一或多者(例如第一資料輸入)產生一第一目標輸出。在一些實施例中,輸入包含在一內容項目中偵測到之一或多個預測產品及相關聯置信區間,且目標輸出可包含內容項目中所包含之產品之標記。在一些實施例中,輸入包含與一內容項目相關聯之一或多組資料(例如影像資料(諸如一視訊之圖框或一視訊之圖框之部分)、元資料(諸如標題文字或字幕文字)等等)且目標輸出係包含於內容項目中之一產品列表。在一些實施例中,第一目標輸出係預測資料。在一些實施例中,針對經組態以藉由包含產品資訊來校正字幕之一機器學習模型,輸入資料可呈字幕文字資料之形式且目標輸出可為字幕之一可能校正列表以包含產品名稱/參考。在一些實施例中,不產生目標輸出(例如,一無監督機器學習模型能夠分組或找出輸入資料之相關性,而非需要提供目標輸出)。
在區塊504處,處理邏輯視情況產生指示一輸入/輸出映射之映射資料。輸入/輸出映射(或映射資料)可係指資料輸入(例如本文中所描述之資料輸入之一或多者)、資料輸入之目標輸出及(若干)資料輸入與目標輸出之間的一相關聯性。在諸如與其中未提供目標輸出之機器學習模型相關聯之一些實施例中,可不執行區塊504。
在區塊505處,在一些實施例中,處理邏輯將在區塊504處產生之映射資料添加至資料組T。
在區塊506處,處理邏輯基於資料組T是否足以用於訓練、驗證及/或測試一機器學習模型(諸如圖1之模型190之一者)之至少一者來分支。若足夠,則執行進行至區塊507,否則執行繼續返回至區塊502。應注意,在一些實施例中,可僅基於資料組中輸入(在一些實施例中映射至輸出)之數目來判定資料組T之充足性,而在一些其他實施例中,要基於一或多個其他準則(例如資料實例之多樣性、準確度等等之一量測)外加或替代輸入之數目來判定資料組T之充足性。
在區塊507處,處理邏輯提供資料組T (例如,至圖1之伺服器機器180)以訓練、驗證及/或測試機器學習模型190。在一些實施例中,資料組T係一訓練組且經提供至伺服器機器180之訓練引擎182以執行訓練。在一些實施例中,資料組T係一驗證組且經提供至伺服器機器180之驗證引擎184以執行驗證。在一些實施例中,資料組T係一測試組且經提供至伺服器機器180之測試引擎186以執行測試。例如,就一神經網路而言,一給定輸入/輸出映射之輸入值(例如與資料輸入210相關聯之數值)經輸入至神經網路,且輸入/輸出映射之輸出值(例如與目標輸出220相關聯之數值)經儲存於神經網路之輸出節點中。接著,根據一學習演算法(例如反向傳播等等)來調整神經網路中之連接權重,且針對資料組T中之其他輸入/輸出映射重複程序。在區塊507之後,一模型(例如模型190)可進行使用伺服器機器180之訓練引擎182來訓練、使用伺服器機器180之驗證引擎184來驗證或使用伺服器機器180之測試引擎186來測試之至少一者。經訓練模型可由產品辨識系統175實施以產生輸出資料以(例如)由產品資訊平台161用於向一使用者提供產品資料、提供至一融合模型、用於更新一內容項目之元資料以包含一或多個產品相關聯性等等。
圖5B係根據一些實施例之用於更新一內容項目之元資料之一方法500B之一流程圖。在區塊510處,處理邏輯(例如一處理裝置、一電腦處理器等等)接收第一資料。第一資料包含基於一內容項目之元資料與內容項目相關聯判定之一第一產品之一第一辨識符(例如指示符、進一步資料之一指標、辨識一產品之一碼等等)。內容項目可為或包含視覺內容、音訊內容、文字內容、視訊內容等等。第一產品可已藉由將內容項目之元資料提供至一或多個經訓練機器學習模型(例如圖3B之文字辨識模組350)來判定。元資料可包含文字資料,例如內容項目標題、描述、字幕、評論、線上聊天等等。第一資料可進一步包含與第一產品及內容項目相關聯之一第一置信值。第一置信值可指示第一產品與第一內容項目相關聯(例如,第一產品出現或提及於內容項目之元資料中)之一可能性。第一資料可進一步包含一第二產品之一辨識符及與第二產品相關聯之一第二置信值。第一資料可包含一產品列表及相關聯置信值。
在區塊512處,處理邏輯接收包含第一產品之一第二辨識符之第二資料。第二辨識符基於內容項目之影像資料(例如一視訊之一或多個圖框、一或多個影像之部分等等)與內容項目相關聯判定。第二資料亦包含與第一產品及內容項目相關聯之一第二置信值。置信值及辨識符可由一或多個機器學習模型(例如圖3B之影像辨識模組330)產生。機器學習模型可包含經組態以降低影像資料之維度之系統。一或多個候選產品影像可降維(例如,影像經由一經訓練機器學習模型轉換成一值向量)。機器學習模型可執行包含比較來自內容項目之降維影像資料與一資料儲存器之降維產品影像之操作以(例如)判定一影像包含一產品之一可能性。第二資料可包含一產品列表(例如產品辨識符)及一置信值列表,包含至少第一產品。置信值可指示相關聯產品出現於內容項目中、由內容項目提及等等之一可能性。
在一些實施例中,一內容項目之一或多個影像針對包含於其中之潛在產品來分析。潛在產品之存在可(例如)藉由提供內容項目之影像用於進一步產品影像偵測分析(例如一視訊內容項目之不同圖框、額外圖框等等)、藉由文字或元資料核實等等來核實。例如,可在找到候選產品之後進行旨在核實候選產品之進一步分析,例如,可實施搜尋所辨識產品之其他證據。在一些實施例中,與一內容項目相關聯之文字資料及/或元資料可針對潛在/候選產品來分析。潛在產品之存在可(例如)藉由基於影像之核實、文字核實等等來核實。
在一些實施例中,處理邏輯可進一步被提供一或多個時戳,例如具有偵測到之候選產品之一視訊之圖框之時戳、與其中出現偵測到之候選產品之視訊或音訊內容相關聯之字幕之時戳等等。處理邏輯可利用時戳來進一步分析以調整內容項目之元資料、產生與內容項目之呈現相關聯之UI元件等等。
在區塊514處,處理邏輯將第一資料及第二資料提供至一經訓練機器學習模型。經訓練機器學習模型可為一融合模型。經訓練機器學習模型可被提供具有相關聯置信值之一或多個產品列表。
在區塊516處,處理邏輯自經訓練機器學習模型接收與第一產品相關聯之一第三置信值。在一些實施例中,處理邏輯可接收與包含第一產品之一產品列表相關聯之一置信值列表。
在區塊518處,處理邏輯鑑於第三置信值來調整與內容項目相關聯之元資料。在一些實施例中,調整元資料可包含將內容項目與一產品之間的一或多個連接添加至元資料。例如,調整元資料可包含添加一特定產品與內容項目相關聯、特徵化於內容項目中、包含於內容項目中、由內容項目廣告等等之一指示。調整元資料可包含將一內容項目之字幕調整為(例如)包含在字幕產生期間不正確轉錄之產品之一或多個參考。
圖5C係根據一些實施例之用於訓練與內容項目產品配對相關聯之一機器學習模型之一方法500C之一流程圖。在一些實施例中,使用方法500C訓練之機器學習模型可為一融合模型。一類似方法可用於訓練連接至媒體項目產品配對之不同模型,例如影像辨識模型、影像核實模型、文字辨識模型、字幕更新模型等等。
在區塊520處,處理邏輯接收與複數個內容項目相關聯之產品影像資料。產品影像資料可包含使產品與內容項目相關聯之資料,相關聯性可自一或多個影像(例如一視訊之圖框)導出。產品影像資料包括在一影像中偵測到(例如,判定)之一或多個產品(例如潛在產品、候選產品)及一或多個產品影像置信值之一指示。
在區塊522處,處理邏輯接收與複數個內容項目相關聯之產品文字資料。產品文字資料可包含使產品與內容項目相關聯之資料。相關聯性可自與內容項目相關聯之文字(例如與內容項目相關聯之元資料)導出。產品文字資料包括在文字(與內容項目相關聯)中偵測到之一或多個產品及一或多個產品文字置信值之一指示。
由處理邏輯在區塊520及522處接收(或在一些實施例中,獲得)之資料可用作訓練一融合模型之訓練輸入。訓練機器學習模型執行不同功能可包含處理邏輯接收不同資料作為訓練輸入。
在區塊524處,處理邏輯接收指示產品包含於複數個內容項目中之資料。例如,用於訓練模型之複數個內容項目之各者(例如,與內容項目相關聯之資料可用於訓練模型)可包含(例如)由一或多個使用者標記、由一內容創作者標記等等之一相關聯產品列表。由處理邏輯在區塊524處接收之資料可用作用於訓練一融合模型之目標輸出。訓練機器學習模型執行不同功能可包含處理邏輯接收不同資料作為目標輸出。
在區塊526處,處理邏輯將產品影像資料及產品文字資料提供至機器學習模型作為訓練輸入。處理邏輯可提供不同類型之資料來訓練不同機器學習模型。在一些實施例中,可藉由將一視訊之圖框提供至模型作為訓練輸入來訓練用於圖框選擇之一機器學習模型。在一些實施例中,可藉由將影像(可能包含產品)提供至一機器學習模型作為訓練輸入來訓練用於物件偵測之一機器學習模型。可藉由將物件(例如產品)之一或多個影像提供至一模型作為訓練輸入來訓練用於嵌入之一機器學習模型。在一些實施例中,可藉由提供與一內容項目相關聯之文字(例如元資料)作為訓練輸入來訓練一文字剖析模型。在一些實施例中,經組態以校正字幕之一模型可被提供機器產生字幕作為訓練輸入。
在區塊528處,處理邏輯將指示產品包含於複數個內容項目中(例如,一產品列表包含於複數個內容項目之各內容項目中)之資料提供至機器學習模型作為目標輸出。處理邏輯可提供不同類型之資料來訓練不同機器學習模型。在一些實施例中,可藉由提供指示一或多個視訊之哪些圖框包含產品之資料作為目標輸出來訓練用於圖框選擇之一機器學習模型。在一些實施例中,可藉由提供經提供至模型之影像中之物件之標記作為目標輸出來訓練用於物件偵測之一機器學習模型。在一些實施例中,可藉由提供由一內容項目之文字提及之內容項目作為目標輸出來訓練一文字剖析模型。在一些實施例中,經組態以校正字幕之一模型可被提供校正字幕(例如,包含一或多個產品)作為目標輸出。在一些實施例中,不提供目標輸出來訓練一機器學習模型(例如一無監督機器學習模型)。
圖5D係根據一些實施例之用於調整與一內容項目相關聯之元資料之一方法500D之一流程圖。在區塊530處,處理邏輯獲得與一內容項目相關聯之第一元資料。元資料可包含文字資料。元資料可包含一內容項目標題、描述、字幕、評論、線上聊天等等。在區塊531處,處理邏輯將第一元資料提供至一第一模型。在一些實施例中,模型係一經訓練機器學習模型。在一些實施例中,模型係一產品偵測模型,例如,模型經組態以接收元資料且產生與內容項目相關聯之產品之一指示(例如,鑑於元資料)。
在區塊532處,處理邏輯獲得基於第一元資料之一第一產品辨識符及與第一產品辨識符相關聯之一第一置信值作為第一模型之輸出。產品辨識符可為一ID號、一指示符、一產品名稱或(唯一)區分一產品之任何資料。第一產品辨識符可辨識一第一產品。在一些實施例中,處理邏輯可獲得一產品列表(例如候選產品、潛在產品)及相關聯置信值。
在區塊533處,處理邏輯獲得內容項目之影像資料。在一些實施例中,影像資料可包含或提取自一視訊之一或多個圖框。在一些實施例中,影像資料可自一物件偵測模型獲得。在一些實施例中,影像資料可包含與內容項目相關聯之一或多個產品。
在區塊534處,處理邏輯將影像資料提供至一第二模型。在一些實施例中,第二模型係一機器學習模型。在一些實施例中,第二模型係經組態以自影像辨識產品之一模型。在一些實施例中,第二模型係經組態以自影像核實所辨識產品之存在之一模型。在一些實施例中,第二模型可降低所提供影像資料之維度。在一些實施例中,第二模型可比較降維影像資料與第二降維影像資料(例如自一資料儲存器擷取、由一機器學習模型輸出等等)。
在區塊535處,處理邏輯獲得基於影像資料之一第二產品辨識符及與第二產品辨識符相關聯之一第二置信值作為第二模型之輸出。在一些實施例中,第二產品辨識符指示一第二產品。在一些實施例中,第二產品相同於第一產品。在一些實施例中,處理邏輯可獲得一產品列表及相關聯置信值。
在區塊536處,處理邏輯提供包含第一產品辨識符、第一置信值、第二產品辨識符及第二置信值之資料作為一第三模型之輸入。第三模型可為一融合模型。
在區塊537處,處理邏輯獲得一第三產品辨識符及一第三置信值作為第三模型之輸出。在一些實施例中,第三置信值可指示由第三產品辨識符指示之一產品與內容項目相關聯(例如,存在於內容項目中)之一可能性。在一些實施例中,第三模型可輸出一產品列表及相關聯置信值。在一些實施例中,第三產品辨識符辨識一第三產品。在一些實施例中,第三產品相同於第二產品。在一些實施例中,第三產品相同於第一產品。在一些實施例中,第一、第二及第三產品全部係相同產品。
在區塊538處,處理邏輯鑑於第三產品辨識符及第三置信值來調整與內容項目相關聯之第二元資料。調整元資料可包含用一或多個產品相關聯性(例如相關聯產品之指示)補充元資料。調整元資料可包含將字幕更新為(例如)包含可能未經正確轉錄(例如,由一機器產生字幕模型不正確轉錄)之產品。在一些實施例中,處理邏輯可進一步接收與內容項目及一或多個產品相關聯之一或多個時戳(例如在一視訊之一影像中偵測到一產品之視訊之一時間)。更新元資料可包含將在內容項目中找到一產品之一時間之一指示添加至元資料。
圖5E係根據一些實施例之用於呈現與一或多個產品相關聯之一UI元件之一方法500E之一流程圖。在區塊540處,處理邏輯(例如一使用者裝置、一用戶端裝置等等之處理邏輯)呈現一UI。UI包含一或多個內容項目(例如視訊)之一或多個圖形表示。內容項目之圖形表示(例如視訊縮略圖)可經選擇以引發相關聯內容項目呈現。內容項目之一或多個圖形表示可用與一或多個產品相關聯之一UI元件顯示。一各自內容項目之各圖形表示可用與一或多個產品相關聯之一UI元件顯示。(若干) UI元件可以一收合狀態(例如一收合預設狀態)呈現/顯示。UI元件包含辨識由各自內容項目涉及之複數個產品之資訊。UI元件可辨識一或多個產品與內容項目相關聯。UI元件可辨識與內容項目相關聯(例如,在一視訊中涉及)之一或多個產品(例如,經由名稱、圖片等等)。
UI可呈現內容項目之可選圖形表示。所表示之內容項目可為一主頁饋入之部分,回應於一搜尋而提供,可為一觀看列表之部分,可為一播放列表之部分,可為一購物饋入之部分,等等。在一些實施例中,UI元件可重疊於UI之一或多個其他元件之頂部上及/或前面。例如,UI元件(例如,呈收合狀態)可重疊於內容項目之圖形表示上,可重疊於內容項目上(例如,當內容項目正在呈現時),等等。
在區塊542處,回應於一使用者與呈收合狀態之UI元件互動,處理邏輯繼續促進各自視訊之一圖形表示呈現,同時將UI元件之一呈現自收合狀態修改為一展開狀態。與UI元件互動可包含選擇UI元件。與UI元件互動可包含停留於UI元件上(例如將一游標放置於UI元件上、滾動至UI元件及暫停滾動等等)。呈展開狀態之UI元件可包含複數個視覺組件。各視覺組件可與複數個產品之一者相關聯。視覺組件可包含與各種產品相關聯之圖片、描述、價格、時戳等等。
在一些實施例中,UI元件(例如,呈展開狀態)可包含多個標籤。例如,UI元件可包含產品之一標籤、內容項目之章節或部分之一標籤等等。UI元件可預設顯示/打開具有相關聯產品之內容項目之產品之標籤。UI元件可回應於使用者動作及/或歷史而預設顯示產品之標籤。
在區塊544處,回應於一使用者選擇呈展開狀態之UI元件之複數個視覺組件之一者,處理邏輯引發涉及與選定視覺組件相關聯之一產品之各自內容項目呈現。處理邏輯可引發涉及與選定視覺組件相關聯之產品之一視訊播放。處理邏輯可引發與選定視覺組件之產品相關聯之一內容項目之一部分呈現(例如,引發一視訊之一部分播放)。
在一些實施例中,與一UI元件互動可引起UI元件修改為一產品聚焦狀態。一產品聚焦狀態可呈現關於一或多個產品之額外資訊、詳細資訊等等。與呈收合狀態之UI元件互動可引起將UI元件修改為產品聚焦狀態。與呈展開狀態之UI元件互動(例如,與一產品相關聯之UI元件之一視覺組件互動)可引起UI元件修改為產品聚焦狀態。
在一些實施例中,與一UI元件互動可引起UI元件之呈現修改為一交易狀態。與呈收合狀態之UI元件互動可引起將UI元件之呈現修改為交易狀態。與呈展開狀態之UI元件互動(例如,選擇與一產品相關聯之一組件)可引起UI元件之呈現修改為交易狀態。與呈產品聚焦狀態之UI元件互動可引起UI元件之呈現修改為交易狀態。可基於使用者歷史、使用者偏好、內容項目、內容項目饋入(例如搜尋結果、觀看饋入等等)或其類似者來執行判定一UI元件、UI元件組件或其類似者之選擇或互動是否引起轉變為交易狀態。
在一些實施例中,一UI元件可重疊於一呈現內容項目上。例如,辨識一或多個產品之一UI元件可在一視訊正在播放時、在視訊正在展示一或多個產品時等等重疊顯示於視訊上。選擇重疊UI元件可引起一額外UI元件顯示,可引起重疊UI元件修改為一不同狀態,可引起一單獨UI元件修改為一不同狀態,等等。重疊UI元件可呈一收合狀態、展開狀態、產品聚焦狀態、交易狀態等等。一重疊UI元件之存在及/或位置可由一或多個經訓練機器學習模型(例如經組態以偵測產品之一或多個模型)判定。
圖5F係根據一些實施例之用於指示一裝置呈現與產品相關聯之一或多個UI元件之一方法500F之一流程圖。在區塊550處,處理邏輯將包含一或多個內容項目之一或多個圖形表示之一UI提供至一裝置。圖形表示經提供用於由裝置之一UI顯示/呈現。一各自內容項目之各圖形表示可經選擇以引發各自內容項目呈現。內容項目可包含視訊。內容項目可包含現場直播視訊。可回應於裝置之一請求而提供圖形表示。圖形表示可包括一主頁饋入、一觀看饋入、一播放列表、一搜尋結果列表、一購物饋入等等。發送至裝置之指令(例如,包含與方法500F之任何步驟相關聯之指令)、發送至裝置之一UI、發送至裝置之UI元件等等可基於獲得使用者之一歷史來判定/選擇。使用者之歷史可包含內容項目(包含具有相關聯產品之內容項目)之歷史互動及/或選擇。使用者之歷史可包含與產品相關聯之UI元件或UI元件之組件之歷史互動及/或選擇。使用者之歷史可包含使用者之一或多個搜尋,例如包含產品名稱之搜尋。可回應於處理邏輯接收使用者之一歷史而將指令提供至裝置。
用呈一收合狀態之一UI元件顯示內容項目之圖形表示之一或多者。在一些實施例中,用呈一收合狀態之一UI元件顯示各圖形表示。在一些實施例中,用呈一收合狀態之UI元件顯示圖形表示之一子集。用一第一內容項目之一第一圖形表示呈現/顯示呈收合狀態之UI元件。UI元件包含辨識由第一內容項目涉及之複數個產品之資訊。UI元件可辨識多少產品與內容項目相關聯,可藉由名稱來辨識一或多個產品,可辨識由內容項目涉及之產品之一種類或分類,等等。在一些實施例中,自一或多個經訓練機器學習模型獲得複數個產品作為輸出。經訓練機器學習模型可類似於結合圖3B所描述之經訓練機器學習模型。
在區塊554處,回應於接收一使用者與呈收合狀態之UI元件互動之一指示,處理邏輯引起裝置修改UI元件之一呈現。UI元件之呈現可自一收合狀態修改為一展開狀態。呈展開狀態之UI元件可包含各與複數個產品之一者相關聯之複數個視覺組件。視覺組件可包含圖片、名稱、描述、價格、時戳等等。
在區塊556處,回應於接收一使用者選擇呈展開狀態之UI元件之複數個視覺組件之一者之一指示,處理邏輯促進一第一內容項目呈現。處理邏輯可提供促進與一第一產品(例如與複數個視覺組件之一者相關聯之產品)相關聯之第一內容項目之一部分呈現之指令。處理邏輯可提供指令以顯示與產品相關聯之一視訊之一部分(例如,基於與產品相關聯之一時戳來自視訊中之一選定點開始播放視訊)。
在一些實施例中,處理邏輯可進一步將指令提供至裝置以將UI元件之一呈現修改為一產品聚焦狀態。例如,在選擇呈展開狀態之UI元件之一視覺組件之後,可將UI元件修改為一產品聚焦狀態。產品聚焦狀態可包含關於由一內容項目涉及、包含於一內容項目中、與一內容項目相關聯等等之一或多個產品之額外細節。
在一些實施例中,處理邏輯可進一步將指令提供至裝置以將UI元件之一呈現修改為一交易狀態。交易狀態可促進一使用者引發與產品相關聯之一交易(例如,購買產品)。交易狀態可回應於一使用者動作、使用者歷史、使用者選擇一或多個UI元件等等而呈現。呈交易狀態之UI元件可包含促進與一或多個產品相關聯之一交易之一或多個組件。
圖6係繪示根據一些實施例之一電腦系統600的一方塊圖。在一些實施例中,電腦系統600可經連接(例如,經由一網路,諸如一區域網路(LAN)、一內部網路、一外部網路或網際網路)至其他電腦系統。電腦系統600可在一用戶端-伺服器環境中充當一伺服器或一用戶端電腦或在一對等或分布式網路環境中充當一對等電腦。電腦系統600可由以下各者提供:一個人電腦(PC)、一平板PC、一視訊轉換器(STB)、一個人數位助理(PDA)、一蜂巢式電話、一網路設備、一伺服器、一網路路由器、交換機或橋接器或能夠執行指定由裝置採取之動作之一組指令(循序或依其他方式)之任何裝置。此外,術語「電腦」應包含個別或共同執行一組(或多組)指令以執行本文中所描述之方法之任何一或多者之任何電腦集合。
在另一態樣中,電腦系統600可包含一處理裝置602、一揮發性記憶體604 (例如隨機存取記憶體(RAM))、一非揮發性記憶體606 (例如唯讀記憶體(ROM)或電可擦除可程式化ROM (EEPROM))及一資料儲存裝置618,其等可經由一匯流排608彼此通信。
處理裝置602可由一或多個處理器提供,諸如一通用處理器(諸如(例如)一複雜指令組運算(CISC)微處理器、一精簡指令組運算(RISC)微處理器、一超長指令字(VLIW)微處理器、實施其他類型之指令組之一微處理器或實施指令組類型之一組合之一微處理器)或一專用處理器(諸如(例如)一專用積體電路(ASIC)、一場可程式化閘陣列(FPGA)、一數位信號處理器(DSP)或一網路處理器)。
電腦系統600可進一步包含一網路介面裝置622 (例如,經耦合至網路674)。電腦系統600亦可包含一視訊顯示單元610 (例如一LCD)、一字母數字輸入裝置612 (例如一鍵盤)、一游標控制裝置614 (例如一滑鼠)及一信號產生裝置620。
在一些實施例中,資料儲存裝置618可包含其上可儲存對本文中所描述之方法或功能之一或多者編碼之指令626之一非暫時性電腦可讀儲存媒體624 (例如非暫時性機器可讀媒體),指令包含對圖1之組件(例如內容提供平台120、內容平台系統102之其他平台、通信應用程式115、模型190等等)編碼且用於實施本文中所描述之方法之指令。
指令626亦可在其由電腦系統600執行期間完全或部分駐留於揮發性記憶體604及/或處理裝置602內,因此,揮發性記憶體604及處理裝置602亦可構成機器可讀儲存媒體。
儘管電腦可讀儲存媒體624在說明性實例中展示為一單一媒體,但術語「電腦可讀儲存媒體」應包含儲存一或多組可執行指令之一單一媒體或多個媒體(例如一集中式或分布式資料庫及/或相關聯快取記憶體及伺服器)。術語「電腦可讀儲存媒體」亦應包含能夠儲存或編碼用於由一電腦執行以引起電腦執行本文中所描述之方法之任何一或多者之一組指令之任何有形媒體。術語「電腦可讀儲存媒體」應包含(但不限於)固態記憶體、光學媒體及磁性媒體。
本文中所描述之方法、組件及特徵可由離散硬體組件實施或可整合於其他硬體組件(諸如ASIC、FPGA、DSP或類似裝置)之功能中。另外,方法、組件及特徵可由硬體裝置內之韌體模組或功能電路系統實施。此外,方法、組件及特徵可實施於硬體裝置及電腦程式組件之任何組合或電腦程式中。
除非另有明確說明,否則諸如「接收」、「執行」、「提供」、「獲得」、「引起」、「存取」、「判定」、「添加」、「使用」、「訓練」、「降低」、「產生」、「校正」或其類似者之術語係指由電腦系統執行或實施之動作及程序,電腦系統將表示為電腦系統暫存器及記憶體內之物理(電子)量之資料調處及變換成類似地表示為電腦系統記憶體或暫存器或其他此等資訊儲存、傳輸或顯示裝置內之物理量之其他資料。此外,本文中所使用之術語「第一」、「第二」、「第三」、「第四」等等意謂用於區分不同元件之標記且可不具有根據其數字名稱之一序數含義。
本文中所描述之實例亦係關於一種用於執行本文中所描述之方法之設備。此設備可經專門建構用於執行本文中所描述之方法,或其可包含由儲存於電腦系統中之一電腦程式選擇性程式化之一通用電腦系統。此一電腦程式可儲存於一電腦可讀有形儲存媒體中。
本文中所描述之方法及說明性實例不與任何特定電腦或其他設備內在相關。各種通用系統可根據本文中所描述之教示來使用,或可證明建構更專用設備來執行本文中所描述之方法及/或其個別功能、常式、子常式或操作之各者係方便的。以上描述中闡釋各種此等系統之結構之實例。
以上描述意在說明而非限制。儘管已參考具體說明性實例及實施例來描述本發明,但應認識到,本發明不限於所描述之實例及實施例。應參考以下申請專利範圍及申請專利範圍授權之等效物之全範疇來判定本發明之範疇。
本說明書中參考「一個實施方案」或「一實施方案」意謂結合實施方案所描述之一特定特徵、結構或特性包含於至少一個實施方案中。因此,在本說明書之各種位置中出現片語「在一個實施方案中」或「在一實施方案中」可(但未必)參考相同實施方案,取決於情境。此外,特定特徵、結構或特性在一或多個實施方案中可依任何適合方式組合。
就在[實施方式]或申請專利範圍中使用術語「包含」、「具有」、「含有」、其變體及其他類似用語而言,此等術語意欲依類似於術語「包括」作為不排除任何額外或其他元件之一開放性過渡用語之一方式具包含性。
如本申請案中所使用,術語「組件」、「模組」、「系統」或其類似者一般意欲係指一電腦相關實體,硬體(例如一電路)、軟體、硬體及軟體之一組合或與具有一或多個具體功能之一操作機器相關之一實體。例如,一組件可為(但不限於為)運行於一處理器(例如數位信號處理器)上之一程序、一處理器、一物件、一可執行檔、一執行緒、一程式及/或一電腦。舉例說明,運行於一控制器上之一應用程式及控制器兩者可為一組件。一或多個組件可駐留於一程序及/或執行緖內且一組件可定位於一個電腦上及/或分布於兩個或更多個電腦之間。此外,一「裝置」可呈以下形式:專門設計硬體;藉由在其上執行使硬體能夠執行具體功能(例如產生關注點及/或描述符)之軟體來專門化之通用硬體;一電腦可讀媒體上之軟體;或其等之一組合。
已相對於若干組件及/或區塊之間的互動來描述上述系統、電路、模組等等。應瞭解,此等系統、電路、組件、區塊等等可包含該等組件或指定子組件、指定組件或子組件之若干者及/或額外組件且根據上述之各種排列及組合。子組件亦可實施為通信耦合至其他組件而非包含於上級組件(階層)內之組件。另外,應注意,一或多個組件可組合成提供聚合功能之一單一組件或分成若干單獨子組件,且任何一或多個中間層(諸如一管理層)可經提供以通信耦合至此等子組件以提供整合功能。本文中所描述之任何組件亦可與本文中未具體描述但熟習技術者已知之一或多個其他組件互動。
此外,用語「實例性」或「例示性」在本文中用於意謂充當一實例、例項或說明。在本文中描述為「例示性」之任何態樣或設計未必被解釋為好於或優於其他態樣或設計。確切言之,用語「實例性」或「例示性」之使用意欲依一具體形式呈現概念。如本申請案中所使用,術語「或」意欲意謂一包含性「或」而非一排他性「或」。即,除非另有說明或自內文明白,否則「X採用A或B」意欲意謂自然包含排列之任何者。即,若X採用A、X採用B或X採用A及B兩者,則「X採用A或B」滿足任何上述例項。另外,除非另有說明或自內文明白指向一單數形式,否則本申請案及隨附申請專利範圍中所使用之冠詞「一」一般應被解釋為意謂「一或多個」。
100:系統架構
102:內容平台系統
105:網路
106:伺服器機器
110:用戶端裝置
112:預測伺服器
113:內容觀看器
114:相關產品組件
115:通信應用程式
116:使用者介面(UI)
120:內容提供平台
121:內容項目
121A至121C:內容項目
125:頻道A
126:頻道B
140:資料儲存器
145:搜尋平台
157:推薦平台
160:社交網路平台
161:產品資訊平台
165:廣告平台
170:伺服器機器
172:資料組產生器
174:合成資料產生器
175:產品辨識系統
180:伺服器機器
182:訓練引擎
184:驗證引擎
185:選擇引擎
186:測試引擎
190:模型
191:文字剖析模型
192:影像剖析模型
193:文字校正模型
194:融合模型
200:系統
210:資料輸入
220:目標輸出
264A至264Z:歷史文字剖析資料組
265A至265Z:歷史影像剖析資料組
268:產品相關聯資料
272:資料組產生器
300A:系統
300B:系統
302:訓練組
304:驗證組
306:測試組
308:選定模型
310:區塊/動作
312:區塊/動作
314:區塊/動作
316:區塊/動作
318:區塊/動作
320:區塊/動作
322:當前資料
324:輸出資料
330:影像辨識模組
332:圖框選擇
334:物件偵測模型
336:嵌入
338:產品辨識
339:產品影像索引
340:影像核實模組
341:合成模型
342:物件偵測模型
343:嵌入
344:產品候選影像索引
345:二次辨識
346:當前目標輸出資料
350:文字辨識模組
352:文字剖析模型
354:產品辨識符
360:融合模型
362:背景項提取
363:額外特徵提取
364:訓練資料
366:融合模型
400A至400E:裝置
402:UI
404:UI元件
406:第一內容項目選擇器
408:第二內容項目選擇器
410:展開元件
412:產品之視覺指示
420:UI
422:UI元件
424:產品標籤
426:章節標籤
430:UI
432:UI元件
434:UI元件
440:UI
442:UI元件
444:UI元件
446:替代產品畫面
448:交易元件
450:UI
452:內容呈現元件
454:UI元件
456:UI元件
500A至500F:方法
501:區塊
502:區塊
503:區塊
504:區塊
505:區塊
506:區塊
507:區塊
510:區塊
512:區塊
514:區塊
516:區塊
518:區塊
520:區塊
522:區塊
524:區塊
526:區塊
528:區塊
530:區塊
531:區塊
532:區塊
533:區塊
534:區塊
535:區塊
536:區塊
537:區塊
538:區塊
540:區塊
542:區塊
544:區塊
550:區塊
554:區塊
556:區塊
600:電腦系統
602:處理裝置
604:揮發性記憶體
606:非揮發性記憶體
608:匯流排
610:視訊顯示單元
612:字母數字輸入裝置
614:游標控制裝置
618:資料儲存裝置
620:信號產生裝置
622:網路介面裝置
624:非暫時性電腦可讀儲存媒體
626:指令
674:網路
將自下文給出之詳細描述及本發明之各種態樣及實施方案之附圖更完全理解本發明之態樣及實施方案,然而,其不應被視為將本發明限制於具體態樣或實施方案,而是僅供用於說明及理解。
圖1繪示根據一些實施例之用於提供相關及相關聯產品資訊之一實例性系統架構。
圖2係根據一些實施例之包含用於創作一或多個模型之資料組之一資料組產生器之一系統200之一方塊圖。
圖3A係繪示根據一些實施例之用於產生諸如產品與內容項目之間的相關聯性之輸出資料之一系統的一方塊圖。
圖3B係根據一些實施例之用於產生描述一內容項目與一或多個產品之間的相關聯性之資料之一實例性系統之一方塊圖。
圖4A描繪根據一些實施例之呈現包含指示與一內容項目相關聯之產品之一使用者介面(UI)元件之一實例性UI之一裝置。
圖4B描繪根據一些實施例之呈現包含指示與一內容項目相關聯之產品之一UI元件之一實例性UI之一裝置。
圖4C描繪根據一些實施例之呈現包含呈現一內容項目之一UI元件及呈現關於與內容項目相關聯之產品之資訊之UI元件之一實例性UI之一裝置。
圖4D描繪根據一些實施例之呈現包含呈現一內容項目之一UI元件及促進與一產品相關聯之一交易之一UI元件之一實例性UI之一裝置。
圖4E描繪根據一些實施例之具有重疊於一內容呈現元件上之UI元件之一實例性裝置。
圖5A係根據一些實施例之用於產生一機器學習模型之一資料組之一方法之一流程圖。
圖5B係根據一些實施例之用於更新一內容項目之元資料之一方法之一流程圖。
圖5C係根據一些實施例之用於訓練與內容項目及產品配對相關聯之一機器學習模型之一方法之一流程圖。
圖5D係根據一些實施例之用於調整與一內容項目相關聯之元資料之一方法之一流程圖。
圖5E係根據一些實施例之用於呈現與一或多個產品相關聯之一UI元件之一方法之一流程圖。
圖5F係根據一些實施例之用於指示一裝置呈現與產品相關聯之一或多個UI元件之一方法之一流程圖。
圖6係繪示根據本發明之實施方案之一例示性電腦系統的一方塊圖。
500E:方法
540:區塊
542:區塊
544:區塊
Claims (20)
- 一種方法,其包括: 呈現包括一或多個視訊之一或多個圖形表示之一使用者介面(UI),其中一各自視訊之各圖形表示可經選擇以引發該各自視訊播放且用呈一收合狀態之一UI元件顯示,該UI元件包括辨識與該各自視訊相關之複數個產品之資訊; 回應於一使用者與呈該收合狀態之該UI元件互動而繼續呈現該各自視訊之一圖形表示,同時將該UI元件之一呈現自該收合狀態修改為一展開狀態,其中呈該展開狀態之該UI元件包括各與該複數個產品之一者相關聯之複數個視覺組件;及 回應於一使用者選擇呈該展開狀態之該UI元件之該複數個視覺組件之一者而引發涉及與該選定視覺組件相關聯之一產品之該各自視訊播放。
- 如請求項1之方法,其進一步包括回應於該使用者選擇呈該展開狀態之該UI元件之該複數個視覺組件之該一者而將該UI元件之該呈現自該展開狀態修改為一產品聚焦狀態,呈該產品聚焦狀態之該UI元件包括關於與該選定視覺組件相關聯之該產品之詳細資訊。
- 如請求項1之方法,其進一步包括: 將一搜尋查詢提供至一內容平台;及 自該內容平台接收該一或多個視訊之該一或多個圖形表示。
- 如請求項1之方法,其進一步包括: 將呈現一第一視訊之一使用者請求提供至一內容平台;及 自該內容平台接收該一或多個視訊之該一或多個圖形表示作為與該第一視訊相關聯之推薦視訊。
- 如請求項1之方法,其中呈該展開狀態之該UI元件進一步包括: 一第一標籤,其與該複數個產品相關聯;及 一第二標籤,其與該各自視訊之複數個部分相關聯,其中該第一標籤之內容經預設呈現。
- 如請求項1之方法,其進一步包括回應於一使用者選擇與該複數個產品之該一者相關聯之該UI元件之一組件而將該UI元件之該呈現修改為一交易狀態,其中呈該交易狀態之該UI元件促進與該複數個產品之該一者相關聯之一交易。
- 如請求項1之方法,其中呈該收合狀態之該UI元件重疊於該各自視訊之該圖形表示或該各自視訊之一或多者上。
- 如請求項1之方法,其中該使用者與呈該收合狀態之該UI元件互動包括停留於呈該收合狀態之該UI元件上。
- 一種方法,其包括: 提供包括一或多個內容項目之一或多個圖形表示之一使用者介面(UI)用於呈現於一使用者裝置上,其中一各自內容項目之各圖形表示可經選擇以引發該各自內容項目呈現目且用呈一收合狀態之一UI元件顯示,該UI元件包括辨識與該各自視訊相關之複數個產品之資訊; 回應於接收一使用者與呈該收合狀態之該UI元件互動之一指示而引起該UI元件之一呈現自該收合狀態修改為一展開狀態,其中呈該展開狀態之該UI元件包括各與該複數個產品之一者相關聯之複數個視覺組件;及 回應於接收一使用者選擇呈該展開狀態之該UI元件之該複數個視覺組件之一者之一指示而促進一第一內容項目呈現。
- 如請求項9之方法,其進一步包括回應於接收該使用者選擇呈該展開狀態之該UI元件之該複數個視覺組件之該一者之該指示而將指令提供至該裝置以促進該UI元件之該呈現自該展開狀態修改為一產品聚焦狀態,呈該產品聚焦狀態之該UI元件包括關於與該選定視覺組件相關聯之該產品之詳細資訊。
- 如請求項9之方法,其中獲得與該第一內容項目相關之該複數個產品之辨識符作為來自一經訓練機器學習模型之輸出,其中該經訓練機器學習模型經組態以接收與該第一內容項目相關聯之資料作為輸入。
- 如請求項9之方法,其進一步包括回應於一使用者選擇與該複數個產品之一者相關聯之該UI元件之一組件而將指令提供至該裝置以促進該UI元件之該呈現修改為一交易狀態,其中呈該交易狀態之該UI元件包括促進與該複數個產品之該一者相關聯之一交易之一或多個組件。
- 如請求項9之方法,其中促進該第一內容項目呈現之該等指令包括待呈現之該第一內容項目之一部分之一指示,該第一內容項目之該部分涉及與該複數個視覺組件之該一者相關聯之該複數個產品之一者。
- 如請求項9之方法,其進一步包括獲得一使用者之一歷史,該使用者之該歷史包括與具有相關聯產品之內容項目之一或多個互動,其中回應於獲得該使用者之該歷史而執行提供用於顯示該UI元件之一指令。
- 如請求項9之方法,其中該第一內容項目包括一現場直播視訊。
- 一種非暫時性機器可讀儲存媒體,其儲存指令,該等指令在被執行時引起一處理裝置執行包括以下各者之操作: 呈現包括一或多個視訊之一或多個圖形表示之一使用者介面(UI),其中一各自視訊之各圖形表示可經選擇以引發該各自視訊播放且用呈一收合狀態之一UI元件顯示,該UI元件包括辨識與該各自視訊相關之複數個產品之資訊; 回應於一使用者與呈該收合狀態之該UI元件互動而繼續呈現該各自視訊之一圖形表示,同時將該UI元件之一呈現自該收合狀態修改為一展開狀態,其中呈該展開狀態之該UI元件包括各與該複數個產品之一者相關聯之複數個視覺組件;及 回應於一使用者選擇呈該展開狀態之該UI元件之該複數個視覺組件之一個選定視覺組件而引發涉及與該選定視覺組件相關聯之一產品之該各自視訊播放。
- 如請求項16之非暫時性機器可讀儲存媒體,其中該等操作進一步包括回應於該使用者選擇呈該展開狀態之該UI元件之該複數個視覺組件之該一者而將該UI元件之該呈現自該展開狀態修改為一產品聚焦狀態,呈該產品聚焦狀態之該UI元件包括關於與該選定視覺組件相關聯之該產品之詳細資訊。
- 如請求項16之非暫時性機器可讀儲存媒體,其中該等操作進一步包括回應於一使用者選擇與該複數個產品之該一者相關聯之該UI元件之一組件而將該UI元件之該呈現修改為一交易狀態,其中呈該交易狀態之該UI元件促進與該複數個產品之該一者相關聯之一交易。
- 如請求項16之非暫時性機器可讀儲存媒體,其中呈該展開狀態之該UI元件進一步包括: 一第一標籤,其與該複數個產品相關聯;及 一第二標籤,其與該各自視訊之複數個部分相關聯,其中該第一標籤之內容經預設呈現。
- 如請求項16之非暫時性機器可讀儲存媒體,其中引發該各自視訊播放包括呈現描繪與該選定視覺組件相關聯之該產品之該各自視訊之一部分。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US17/878,831 | 2022-08-01 | ||
US17/878,831 US20240040201A1 (en) | 2022-08-01 | 2022-08-01 | Media item and product pairing |
Publications (1)
Publication Number | Publication Date |
---|---|
TW202407531A true TW202407531A (zh) | 2024-02-16 |
Family
ID=87762500
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW112128792A TW202407531A (zh) | 2022-08-01 | 2023-08-01 | 媒體項目及產品配對 |
Country Status (3)
Country | Link |
---|---|
US (1) | US20240040201A1 (zh) |
TW (1) | TW202407531A (zh) |
WO (1) | WO2024030385A1 (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11961005B1 (en) * | 2023-12-18 | 2024-04-16 | Storytellers.ai LLC | System for automated data preparation, training, and tuning of machine learning models |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10620801B1 (en) * | 2014-06-25 | 2020-04-14 | Google Llc | Generation and presentation of interactive information cards for a video |
US9177225B1 (en) * | 2014-07-03 | 2015-11-03 | Oim Squared Inc. | Interactive content generation |
KR102483507B1 (ko) * | 2016-11-17 | 2022-12-30 | 페인티드 도그, 인크. | 비디오 컨텐츠의 기계-기반 객체 인식 |
US11816890B2 (en) * | 2021-01-12 | 2023-11-14 | Nvidia Corporation | Automatic content recognition and information in live streaming suitable for video games |
US20230334865A1 (en) * | 2022-04-15 | 2023-10-19 | Roku, Inc. | Dynamic Triggering and Processing of Purchase Based on Computer Detection of Media Object |
-
2022
- 2022-08-01 US US17/878,831 patent/US20240040201A1/en active Pending
-
2023
- 2023-07-31 WO PCT/US2023/029137 patent/WO2024030385A1/en unknown
- 2023-08-01 TW TW112128792A patent/TW202407531A/zh unknown
Also Published As
Publication number | Publication date |
---|---|
US20240040201A1 (en) | 2024-02-01 |
WO2024030385A1 (en) | 2024-02-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11995564B2 (en) | System and method for generating aspect-enhanced explainable description-based recommendations | |
Chan-Olmsted | A review of artificial intelligence adoptions in the media industry | |
US20240193913A1 (en) | Systems and methods for automatic image generation and arrangement using a machine learning architecture | |
US10789610B2 (en) | Utilizing a machine learning model to predict performance and generate improved digital design assets | |
KR101921816B1 (ko) | 디지털 콘텐츠를 이용한 사용자 상호작용 | |
JP6756158B2 (ja) | 学習教材からの知識点及び関係の抽出 | |
US9892109B2 (en) | Automatically coding fact check results in a web page | |
US20240037145A1 (en) | Product identification in media items | |
CA2825814C (en) | Method and system for searching, and monitoring assessment of, original content | |
CN102822815A (zh) | 用于利用浏览器历史进行动作建议的方法和系统 | |
US11763546B1 (en) | Systems and methods for managing computer memory for scoring images or videos using selective web crawling | |
US11625448B2 (en) | System for superimposed communication by object oriented resource manipulation on a data network | |
TW202407531A (zh) | 媒體項目及產品配對 | |
CN112384912A (zh) | 用户创建内容推荐和搜索 | |
CN113420166A (zh) | 商品挂载、检索、推荐、训练处理方法、装置及电子设备 | |
US20230205981A1 (en) | System for superimposed communication by object oriented resource manipulation on a data network | |
US12008033B2 (en) | Determining user affinities for content generation applications | |
TW202422365A (zh) | 媒體項目中之產品辨識 | |
US12020470B1 (en) | Systems and methods for using image scoring an improved search engine | |
US20230041978A1 (en) | Curating Narrative Experiences Through Automated Content Compilation | |
US12020281B2 (en) | Systems and methods for dynamic link redirection | |
US20240005362A1 (en) | Systems and methods for dynamic link redirection | |
Arvind et al. | Decoding OTT: Uncovering Global Insights for Film Industry Advancement and Cultural Exchange | |
Goh | User song preferences using preference learning in artificial intelligence | |
CN116521979A (zh) | 一种目标对象的展示方法、装置、电子设备及存储介质 |