TWI702844B

TWI702844B - 用戶特徵的生成方法、裝置、設備及儲存介質

Info

Publication number: TWI702844B
Application number: TW108119940A
Authority: TW
Inventors: 李雪松; 盧靚妮; 馮袁
Original assignee: 大陸商騰訊科技（深圳）有限公司
Priority date: 2018-07-04
Filing date: 2019-06-10
Publication date: 2020-08-21
Also published as: US20200374589A1; CN108921221A; US11122333B2; WO2020007164A1; EP3819821A4; CN108921221B; EP3819821A1; TW202007178A; EP3819821B1

Abstract

一種用戶特徵的生成方法、裝置、設備及儲存介質。所述方法包括：獲取n組目標視頻和用戶帳號之間的時序對應關係，得到詞嵌入矩陣；使用損失函數對所述詞嵌入矩陣進行訓練；將訓練完畢的所述詞嵌入矩陣中的所述用戶帳號對應的詞向量，確定為所述用戶帳號的用戶特徵。本申請是基於用戶觀看歷史和/或用戶搜索歷史來提取用戶特徵，只要用戶正常使用視頻系統就會不斷產生和更新這些資料，不需要依賴其它資料來源，因此能夠對使用視頻系統的用戶均能生成較為準確的用戶特徵。

Description

用戶特徵的生成方法、裝置、設備及儲存介質

本申請涉及視頻推薦領域，特別涉及一種用戶特徵的生成方法、裝置、設備及儲存介質。

視頻推薦系統是用於根據用戶的觀看歷史和/或搜索歷史向該用戶推薦其它可能感興趣視頻的系統。典型的視頻推薦系統包括：候選生成模型和排序模型。將某一用戶的觀看歷史和/或搜索歷史輸入候選生成模型後，得到M個推薦視頻；然後將M個推薦視頻輸入排序模型，排序模型會將M個推薦視頻按照用戶可能感興趣的程度進行排序後，輸出給該用戶。其中，M為正整數。

相關技術中的候選生成模型採用DNN(Deep Neural Networks，深度神經網路)來實現。該DNN的輸入量包括：用戶的用戶特徵、用戶的觀看歷史和/或用戶的搜索歷史，輸出量包括為該用戶推薦的M個推薦視頻。用戶的用戶特徵可以是將用戶的年齡、性別、地域、愛好標籤等屬性資訊進行向量化得到的。

由於很多用戶在視頻系統中不填寫屬性資訊或填寫不完整的屬性資訊，所以上述方法對很多用戶都無法生成用戶特徵。雖然也可以從用戶使用的社交聊天系統中提取到較多的屬性資訊，但由於用戶在視頻系統中會使用第一用戶帳號，而在社交聊天系統中會使用第二用戶帳號，對兩種帳號體系中的用戶帳號進行準確關聯是非常困難的，如果關聯錯誤也會導致最終生成的用戶特徵的錯誤。因此上述生成方法對屬性資訊為空或不完整或錯誤的用戶無法生成有效的用戶特徵。

本申請提供一種用戶特徵的生成方法、裝置、設備及儲存介質，可以用於解決相關技術中的生成方法對屬性資訊為空或不完整或錯誤的用戶無法生成有效的用戶特徵的問題。

所述技術方案如下：根據本申請實施例的一個方面，提供了一種用戶特徵的生成方法，所述方法包括：獲取n組目標視頻和用戶帳號之間的時序對應關係，每組所述時序對應關係包括查看過所述目標視頻的各個用戶帳號，且所述用戶帳號按照查看時間戳記進行排序，n為正整數；根據n組所述時序對應關係映射得到詞嵌入矩陣，所述詞嵌入矩陣包括每個所述用戶帳號對應的詞向量；使用損失函數對所述詞嵌入矩陣進行訓練，所述損失函數用於根據觀看歷史的相似程度挖掘各個所述用戶帳號之間的相似關係；將訓練完畢的所述詞嵌入矩陣中的所述用戶帳號對應的詞向量，確定為所述用戶帳號的用戶特徵。

根據本申請實施例的另一方面，提供了一種用戶特徵的生成裝置，所述裝置包括：獲取模組，用於獲取n組目標視頻和用戶帳號之間的時序對應關係，每組所述時序對應關係包括查看過所述目標視頻的各個用戶帳號，且所述用戶帳號按照查看時間戳記進行排序；映射模組，用於根據n組所述時序對應關係映射得到詞嵌入矩陣，所述詞嵌入矩陣包括每個所述用戶帳號對應的詞向量；訓練模組，用於使用損失函數對所述詞嵌入矩陣進行訓練，所述損失函數用於根據觀看歷史的相似程度挖掘各個所述用戶帳號之間的相似關係；確定模組，用於將訓練完畢的所述詞嵌入矩陣中的所述用戶帳號對應的詞向量，確定為所述用戶帳號的用戶特徵。

根據本申請實施例的另一方面，提供了一種電腦設備，所述電腦設備包括：處理器和記憶體，所述記憶體中儲存有至少一條指令、至少一段程式、代碼集或指令集，所述至少一條指令、所述至少一段程式、所述代碼集或指令集由所述處理器載入並執行以實現如上所述的用戶特徵的生成方法。

根據本申請實施例的另一方面，提供了一種電腦可讀儲存介質，所述可讀儲存介質中儲存有至少一條指令、至少一段程式、代碼集或指令集，所述至少一條指令、所述至少一段程式、所述代碼集或指令集由所述處理器載入並執行以實現如上所述的用戶特徵的生成方法。

本申請實施例提供的技術方案可以達到的有益效果至少包括：通過基於用戶觀看歷史和/或用戶搜索歷史來提取用戶特徵，而這些歷史資料均為視頻系統中自動產生的資料，只要用戶正常使用視頻系統就會不斷產生和更新這些資料，不需要依賴其它資料來源，因此能夠解決相關技術中的方法對屬性資訊為空或不完整或錯誤的用戶無法生成有效的用戶特徵的問題，能夠對使用視頻系統的用戶均能生成較為準確的用戶特徵，且該用戶特徵能夠充分體現出各個用戶帳號在視頻觀看角度的特點，適合作為與視頻推薦系統相關的神經網路模型的輸入參數。

應當理解的是，以上的一般描述和後文的細節描述僅是示例性的，並不能限制本申請。

120:終端

140:伺服器

142:候選生成模型

144:排序模型

201-204:步驟

301-307:步驟

41:資料庫

42:流水記錄

43:時序對應關係

44、45:詞嵌入矩陣

307a-307d:步驟

51:資料庫

52:時序模組

53:資料收集模組

54:用戶特徵樣本模組

55:用戶嵌入矩陣模組

56:視頻特徵樣本模組

57:視頻嵌入矩陣模組

58:NN召回樣本模組

59:NN召回模組

60:圖構建模組

61:模型保存/加載模組

62:張量展示面板

63:評估模組

65:收集用戶基礎屬性

66:用戶檢索歷史

67:其它特徵樣本

68:其它嵌入矩陣

820:獲取模組

840:映射模組

860:訓練模組

880:確定模組

822:記錄獲取模組

824:排序模組

892:視頻特徵獲取模組

894:候選生成模型訓練模組

896:評估模組

1100:伺服器

1101:中央處理單元

1102:隨機存取記憶體

1103:唯讀記憶體

1104:系統記憶體

1105:系統匯流排

1106:基本輸入/輸出系統

1107:大容量儲存設備

1108:顯示器

1109:輸入設備

1110:輸入輸出控制器

1113:作業系統

1114:應用程式

1115:其他程序模組

圖1是本申請一個示例性實施例提供的視頻推薦系統的方塊圖。

圖2是本申請一個示例性實施例提供的用戶特徵的生成方法的流程圖。

圖3是本申請一個示例性實施例提供的用戶特徵的生成方法的流程圖。

圖4是本申請另一個示例性實施例提供的用戶特徵的生成方法的原理示意圖。

圖5是本申請另一個示例性實施例提供的用戶特徵的生成方法的流程圖。

圖6是本申請另一個示例性實施例提供的用戶特徵的生成方法在實施過程中的介面示意圖。

圖7是本申請另一個示例性實施例提供的用戶特徵的生成方法與UCF推薦方法的效果對比圖。

圖8本申請一個示例性實施例提供的用戶特徵的生成裝置的方塊圖。

圖9本申請另一個示例性實施例提供的用戶特徵的生成裝置的方塊圖。

圖10申請一個示例性實施例提供的用戶特徵的生成裝置的方塊圖。

圖11申請一個示例性實施例提供的伺服器的方塊圖。

為了使本申請的目的、技術方案及優點更加清楚明白，以下結合附圖及實施例，對本申請進行進一步詳細說明。應當理解，此處所描述的具體實施例僅僅用以解釋本申請，並不用於限定本申請。

這裡將詳細地對示例性實施例進行說明，其示例表示在附圖中。下面的描述涉及附圖時，除非另有表示，不同附圖中的相同數字表示相同或相似的要素。以下示例性實施例中所描述的實施方式並不代表與本申請相一致的所有實施方式。相反，它們僅是與如所附請求項書中所詳述的、本申請的一些方面相一致的裝置和方法的例子。

本申請實施例提供了一種基於用戶的觀看歷史和/或搜索歷史來提取用戶特徵的技術方案。該技術方案可以用於視頻播放系統相關的神經網路模型的訓練過程以及使用過程。典型的，該用戶特徵可以用於視頻推薦系統中的候選生成模型的訓練及使用，或者，用於視頻推薦系統中的排序模型的訓練及使用。

典型的應用場景包括如下場景中的任意一種：

視頻推薦場景：

視頻推薦系統中設置有視頻庫，該視頻庫包括多個視頻，比如數以百萬計的視頻。對於某一個用戶帳號，需要基於該用戶帳號的興趣愛好從視頻庫中挑選出候選推薦集。示意性的，視頻推薦系統採用候選生成模型從視頻庫中挑選出候選推薦集。該候選生成模型可以是基於DNN(Deep Neural Networks，深度學習網路)的神經網路模型。本申請實施例提供的用戶特徵適合作為該候選生成模型的輸入量進行訓練和使用。

視頻排序場景：

在向用戶推薦候選推薦集中的多個視頻時，視頻推薦系統會按照用戶可能感興趣的機率由高到低的順序，將多個視頻依次推薦給用戶。示意性的，視頻推薦系統採用排序模型對候選推薦集中的多個視頻進行排序。該排序模型可以是基於DNN的神經網路模型。本申請實施例提供的用戶特徵適合作為該排序模型的輸入量進行訓練和使用。

圖1示出了本申請一個示例性實施例提供的視頻推薦系統100的結構方塊圖。該視頻推薦系統100包括：終端120和伺服器140。

終端120是用戶所使用的電子設備，該電子設備具有播放視頻的能力。該電子設備可以是智慧手機、平板電腦、MP3、MP4、掌上型電腦、筆記型電腦、臺式電腦中的任意一種。該電子設備上安裝或運行有應用程式，該應用程式具有播放視頻的功能。可選地，該應用程式是線上視頻用戶端、短視頻用戶端、視頻聚合用戶端、用戶分享視頻用戶端中的至少一種。該應用程式中登錄有用戶帳號，該用戶帳號用於在多個用戶中唯一識別某一個用戶。

終端120通過有線網路或無線網路與伺服器140相連。

伺服器140是一台伺服器、多台伺服器組成的伺服器集群、雲計算中心或虛擬化計算中心。該伺服器140可以是用於進行視頻推薦的伺服器。伺服器140用於獲取用戶帳號的個性特徵，根據用戶帳號的個性特徵分析用戶的觀看喜好，根據觀看喜好向用戶推薦可能感興趣的目標視頻。該伺服器140中運行有候選生成模型142和排序模型144。該候選生成模型142用於從大量的視頻集中篩選出數以百計的視頻候選集，排序模型144用於對視頻候選集進行個性化排序。

可選地，候選生成模型142可以是基於DNN的神經網路模型。當需要對某一個用戶帳號進行視頻推薦時，伺服器140用於將該用戶帳號對應的用戶特徵和視頻特徵輸入候選生成模型142，該候選生成模型142輸出該用戶帳號可能感興趣的n個目標視頻，以及每個目標視頻的觀看機率。該觀看機率是預測出的該用戶帳號點擊和觀看該目標視頻的可能性機率。

可選地，用戶特徵用於表示用戶本身的個性特徵。相關技術中採用用戶的年齡、性別、職業、愛好標籤等屬性特徵進行向量化得到。但在實際情況中，屬性特徵的收集存在兩方面的問題：一是在日活躍用戶很高的移動應用中，用戶量是巨大的，收集成本較高，而且離線任務有較高的延遲風險；二是收集播放序列時用到的用戶帳號和屬性資訊(來自另一個社交系統)中的用戶帳號可能不是同一套體系，這樣需要將一種用戶帳號關聯到另一種用戶帳號，如果要實現兩個帳號體系中的用戶帳號進行準確關聯是較為困難的。視頻播放系統內能夠獲取到的屬性特徵有限，導致用戶特徵的收集和生成需要耗費較多的時間和成本，本申請的一些實施例基於用戶的觀看歷史和/或搜索歷史，來生成用戶特徵，這些實施例中可以不使用或少使用類似年齡、性別、職業、愛好標籤之類的屬性特徵。

可選地，視頻特徵用於表示用戶觀看和/或搜索過的視頻的屬性特徵。在一些實施例中，將用戶帳號的歷史觀看過的視頻標識進行第一向量化，得到第一向量；將用戶帳號的歷史搜索過的視頻標識進行第二向量化，得到第二向量；將第一向量和第二向量進行疊加後，得到該用戶帳號的視頻特徵。本申請實施例中對視頻特徵的具體提取方式不加以限定。

需要說明的是，本實施環境僅為示意性說明，下述方法實施例也可以由其它伺服器來執行，並不限於上述伺服器140。

在本申請實施例中基於用戶歷史觀看/搜索的視頻序列，通過詞向量的方法把各個用戶映射到不同的詞向量上，進而將這些詞向量作為用戶特徵。此過程可以不使用到年齡、性別、職業、愛好標籤之類的屬性特徵即可生成用戶特徵。

圖2示出了本申請一個示例性實施例提供的用戶特徵生成方法的流程圖。本實施例以該方法由圖1所述的伺服器來執行。該方法包括：步驟201，獲取n組目標視頻和用戶帳號之間的時序對應關係，每組時序對應關係包括查看過目標視頻的各個用戶帳號，且用戶帳號按照查看時間戳記進行排序；查看過目標視頻包括：觀看過目標視頻，和/或，搜索過目標視頻。對應地，查看時間戳記包括：觀看時間戳記，和/或，搜索時間戳記。

伺服器的資料庫中儲存有各個用戶帳號所觀看過的視頻播放流水記錄，該視頻播放流水記錄中儲存有各個歷史觀看視頻的視頻標識以及每個視頻標識的觀看時間戳記。和/或，伺服器的資料庫中還儲存有各個用戶帳號所搜索過的視頻搜索流水記錄，該視頻搜索流水記錄中儲存有各個歷史搜索視頻的視頻標識以及每個視頻標識的搜索時間戳記。

以基於視頻觀看歷史為例，伺服器從視頻播放流水記錄中提取出item到user的時序對應關係，item是目標視頻的視頻標識，user是觀看過該目標視頻的用戶標識。每個時序對應關係對應一個目標視頻，以及觀看過該目標視頻的各個用戶帳號。同時，該對應關係中的各個用戶帳號按照各個用戶帳號觀看該目標視頻時的觀看時間戳記進行排序。

伺服器提取出多組item到user的時序對應關係。多組時序對應關係可視為一個“文件檔集”。

步驟202，根據n組時序對應關係映射得到詞嵌入矩陣，詞嵌入矩陣包括每個用戶帳號對應的詞向量；詞嵌入矩陣(Embedding)是將n組時序對應關係按照詞向量的映射方式所映射到的矩陣。詞向量中的每一行(或每一列)對應一個用戶帳號，每一個矩陣行中的取值形成該用戶帳號對應的詞向量。

步驟203，使用損失函數對詞嵌入矩陣進行訓練，損失函數用於根據觀看歷史的相似程度挖掘各個用戶帳號之間的隱含關係；對於任意兩個用戶帳號，當這兩個用戶帳號所觀看過的相同(或相似)視頻越多時，這兩個用戶帳號的相似程度越高。為了挖掘出各個用戶帳號之間的隱含關係，伺服器使用損失函數對詞嵌入矩陣進行訓練，該損失函數用於根據觀看歷史的相似程度挖掘出各個用戶帳號之間的相似關係。或者說，該損失函數用於根據觀看歷史的相似程度挖掘出各個用戶帳號之間的隱含相似關係。或者說，該損失函數用於根據觀看歷史的相似程度挖掘出各個用戶帳號之間的隱含關係。

可選地，該損失函數是雜訊對比估計損失函數(Noise-contrastive Estimation，NCE)。

步驟204，將訓練完畢的詞嵌入矩陣中的用戶帳號對應的詞向量，確定為用戶帳號的用戶特徵。

當利用損失函數將詞嵌入矩陣訓練完畢後，任意兩個用戶帳號對應的詞向量之間的餘弦向量越接近，則代表這兩個用戶帳號之間越相似。

伺服器將訓練完畢後的詞嵌入矩陣中的詞向量進行提取，每個詞向量確定為對應用戶帳號的用戶特徵。

綜上所述，本實施例提供的用戶特徵生成方法，通過獲取n組目標視頻和用戶帳號之間的時序對應關係，根據n組時序對應關係映射得到詞嵌入矩陣，使用損失函數對詞嵌入矩陣進行訓練後，將訓練完畢的詞嵌入矩陣中的用戶帳號對應的詞向量，確定為用戶帳號的用戶特徵。本申請是基於用戶觀看歷史和/或用戶搜索歷史來提取用戶特徵，而這些歷史資料均為視頻系統中自動產生的資料，只要用戶正常使用視頻系統就會不斷產生和更新這些資料，不需要依賴其它資料來源，因此能夠解決相關技術中的方法對屬性資訊為空或不完整或錯誤的用戶無法生成有效的用戶特徵的問題，能夠對使用視頻系統的用戶均能生成較為準確的用戶特徵，且該用戶特徵能夠充分體現出各個用戶帳號在視頻觀看角度的特點，適合作為與視頻推薦系統相關的神經網路模型的輸入參數。

同時，由於這些歷史資料均為視頻系統中自動產生的資料，不需要依賴其它資料來源，因此不需要對兩個不同帳號體系中的相應帳號進行關聯，也不存在如何將兩個帳號體系中的相應帳號進行準確關聯的問題，減少了資料處理步驟，節約了處理資源。

圖3示出了本申請一個示例性實施例提供的用戶特徵生成方法的流程圖。本實施例以該方法由圖1所述的伺服器執行來舉例說明。該方法包括：

步驟301，獲取m個用戶帳號的視頻查看歷史記錄，視頻查看歷史記錄包括用戶觀看過和/或搜索過的目標視頻的視頻標識以及查看時間戳記；伺服器的資料庫中儲存有各個用戶帳號的視頻查看歷史記錄。該視頻查看歷史記錄包括：視頻觀看流水記錄，和/或，視頻搜索流水記錄。視頻觀看流水記錄包括：每個用戶帳號在歷史時間段內觀看過的各個目標視頻的視頻標識，以及觀看時間戳記；視頻搜索流水記錄包括：每個用戶帳號在歷史時間段內搜索過的各個目標視頻的視頻標識，以及搜索時間戳記。

可選地，該歷史時間段是以最近一個時刻向前倒退預設時長所確定的時間段。比如，歷史時間段是最近一周、最近一個月、最近三個月、最近半年、最近一年或最近三年中的至少一個。

結合圖4，伺服器從資料庫41中獲取m個用戶帳號的視頻觀看流水記錄42，該視頻觀看流水記錄42包括：用戶帳號1、用戶帳號1觀看過的視頻1、用戶帳號1觀看視頻1時的觀看時間戳記；用戶帳號2、用戶帳號2觀看過的視頻2、用戶帳號2觀看視頻2時的觀看時間戳記；....，用戶帳號m、用戶帳號m觀看過的視頻m、用戶帳號m觀看視頻m時的觀看時間戳記。其中，m為正整數。

步驟302，對於視頻查看歷史記錄中的每個目標視頻，將查看過目標視頻的各個用戶帳號按照對應的查看時間戳記進行排序後，生成目標視頻和用戶帳號之間的時序對應關係；伺服器基於視頻查看歷史記錄生成item和user之間的時序對應關係。item是目標視頻的視頻標識，user是查看過該目標視頻的用戶標識。每組時序對應關係包括：一個目標視頻的視頻標識，以及查看過該目標視頻的各個用戶標識。在一些實施例中，一組時序對應關係中的多個用戶標識按照查看時間戳記由早到晚的順序進行排列；在另一些實施例中，一組時序對應關係中的多個用戶標識按照查看時間戳記由晚到早的順序進行排列。

結合圖4，對於同一個目標視頻：視頻i，將查看過視頻i的各個用戶帳號按照觀看時間戳記進行排序後，生成一組與視頻i對應的時序對應關係43。同理，對於每個目標視頻生成相應的時序對應關係，共生成n組時序對應關係。i為小於或等於n的整數。

在本申請實施例中，n組時序對應關係視為一個文件檔集，每組時序對應關係視為一個文件檔。對於每個文件檔中的上下文中，相鄰不遠的用戶標識之間的關聯度比相距很遠的用戶標識之間的關聯度高。

步驟303，將n組時序對應關係按照詞向量映射方式進行映射，得到詞嵌入矩陣，詞嵌入矩陣包括每個用戶帳號對應的詞向量；對n組時序對應關係按照詞向量映射方式進行映射，得到詞嵌入(Embedding)矩陣。示意性的，詞向量映射方式可以是word2vector映射方式。

可選地，word2vector採用神經網路語言模型來實現。該神經網路模型可以是CBOW(Continuous Bag-of-Words)模型或者Skip-Gram模型。本實施例以該word2vector採用CBOW模型來舉例說明。可選地，該CBOW模型是一個至少三層的神經網路結構，包括：輸入層、至少一個隱藏層和輸出層(Softmax層)。可選地，該輸出層採用雜訊對比估計損失函數(Noise-contrastive Estimation，NCE)來作為損失函數。伺服器將n組時序對應關係輸入至該神經網路模型後，得到詞嵌入矩陣。

該詞嵌入矩陣包括每個用戶帳號對應的詞向量。每個詞向量是x維向量，x維向量的維數小於目標視頻的個數m。可選地，x遠小於m。比如m為百萬級，而x為百級。

步驟304，使用雜訊對比估計損失函數對詞嵌入矩陣進行訓練；初始的詞嵌入矩陣並不一定能準確代表各個用戶帳號在觀看視頻角度的相似程度。因此，伺服器使用雜訊對比估計損失函數(Noise-contrastive Estimation，NCE)對詞嵌入矩陣進行訓練，該損失函數用於根據觀看歷史的相似程度挖掘各個用戶帳號之間的相似關係。

可選地，伺服器中儲存有第一結束閥值，該第一結束閥值是用於表示訓練詞嵌入矩陣時的結束臨界值。在第i輪反覆運算訓練後，伺服器計算NCE函數的函數值是否低於第一結束閥值。當NCE函數的函數值不低於第一結束閥值時，計算該函數值與第一結束閥值之間的誤差，然後根據誤差反向傳播演算法進行第i+1輪反覆運算訓練，依次類推，直至NCE函數的函數值低於結束閥值。

該NCE函數用於根據用戶的觀看歷史的相似程度，來挖掘各個用戶帳號在觀看視頻角度所隱含的相似程度。

步驟305，當雜訊對比估計損失函數的函數值低於第一結束閥值時，將詞嵌入矩陣中的用戶帳號對應的詞向量，確定為用戶帳號的用戶特徵；經過多次訓練後，當雜訊對比估計損失函數的函數低於結束閥值時，伺服器確定該詞嵌入矩陣訓練完畢。然後，伺服器將訓練完畢的詞嵌入矩陣中的每個用戶帳號對應的詞向量，確定為用戶帳號的用戶特徵。

至此，伺服器為n個用戶帳號中的每個用戶帳號生成用戶特徵。該用戶特徵可以用於訓練候選生成模型。

以下為候選生成模型的訓練階段：

步驟306，獲取用戶帳號的觀看歷史記錄和/或搜索歷史記錄中的視頻標識，根據該視頻標識生成視頻特徵；在候選生成模型的訓練階段中，訓練樣本包括輸入量包括：至少一組用戶帳號的用戶特徵和視頻特徵。對於某個用戶帳號，該用戶帳號的用戶特徵採用步驟301至306的方式進行生成；該用戶帳號的視頻特徵利用該用戶帳號的觀看歷史記錄和/或搜索歷史記錄中的視頻標識進行生成。

在一些實施例中，以根據用戶帳號的觀看歷史記錄生成視頻特徵為例，將用戶帳號按照時間順序所觀看的各個視頻標識排序後，形成一個由多個視頻標識所拼接得到的向量，將該向量確定為該用戶帳號的視頻特徵。

在另一些實施例中，伺服器採用類似於用戶特徵的方式來生成視頻特徵。也即，伺服器獲取各個用戶帳號的視頻查看歷史記錄，將各個用戶帳號的視頻查看歷史記錄通過詞向量映射方式映射得到詞嵌入矩陣，該詞嵌入矩陣包括各個目標視頻的詞向量；伺服器通過NCE損失函數對詞嵌入矩陣進行訓練，得到訓練後的詞嵌入矩陣；將訓練後的詞嵌入矩陣中的各個詞向量，確定為各個目標視頻的視頻特徵。

需要說明的是，本實施例不限定視頻特徵的具體生成方式。

步驟307，將用戶特徵和視頻特徵作為樣本特徵輸入候選生成模型中進行訓練，得到訓練後的候選生成模型；

伺服器將多個用戶帳號的用戶特徵和視頻特徵，作為樣本特徵輸入候選生成模型進行訓練，得到訓練後的候選生成模型。

其中，訓練後的候選生成模型用於根據輸入的用戶特徵輸出對視頻庫中各個視頻的觀看機率。

在視頻推薦階段中，也即候選生成模型的實際使用階段，伺服器利用步驟301至步驟305的方法提取待推薦的用戶帳號的用戶特徵。將用戶特徵輸入候選生成模型後，得到該用戶帳號對視頻庫中各個視頻的觀看機率。可選地，將排序在Top N的視頻確定為該用戶帳號可能感興趣的視頻，也即待推薦給該用戶帳號的視頻。

本實施例提供的用戶特徵生成方法，通過將n組時序對應關係利用詞向量映射方式進行映射得到詞嵌入矩陣，然後通過雜訊對比估計損失函數對詞嵌入矩陣進行訓練，能夠挖掘出喜歡觀看相同或相似視頻的用戶帳號之間的隱含關係，從而充分挖掘出各個用戶帳號在視頻觀看角度的隱含相似關係，提高作為候選生成模型的輸入量的準確性。

在基於圖3的可選實施例中，伺服器還提供了對訓練後的候選生成模型進行評估的評估機制。上述步驟307還替換實現成為如下步驟：

步驟307a，將用戶特徵和視頻特徵劃分為h+k組資料集，h+k資料集包括h組訓練集和k組評測集；當伺服器根據各個用戶帳號的視頻觀看歷史記錄，生成多組用戶特徵和視頻特徵後，將多組用戶特徵和視頻特徵劃分為h+k組資料集。其中，h、k均為正整數。可選地，伺服器選擇出h+k組資料集中的h組資料集作為訓練集，k組資料集作為評測集。

步驟307b，將h組訓練集中的用戶特徵和視頻特徵作為樣本特徵輸入候選生成模型中進行訓練，得到訓練後的候選生成模型；伺服器將h組訓練集中的用戶特徵和視頻特徵進行樣本特徵輸入候選生成模型，通過誤差反向傳播演算法對該候選生成模型進行多輪反覆運算訓練。當誤差小於模型結束閥值後，伺服器得到訓練後的候選生成模型。模型結束閥值是用於表示訓練候選生成模型時的結束臨界值。

比如，輸入用戶特徵後得到的預測視頻結果與實際的視頻特徵之間的匹配程度達到98%以上(誤差小於2%)時，確定得到訓練後的候選生成模型。

步驟307c，使用k組評測集評估訓練後的候選生成模型的召回率；在使用k組評測集對訓練後的候選生成模型進行評估時，用戶特徵和視頻特徵的生成方式與訓練過程完全相同。伺服器將用戶特徵輸入至訓練後的候選生成模型，由該候選生成模型輸出用戶對各個視頻的觀看機率(感興趣機率)，然後將觀看機率排列在Top n的視頻確定為候選推薦集，n為正整數。

然後，伺服器檢測候選推薦集中的各個視頻是否落入用戶帳號所觀看的歷史視頻集(也即該用戶帳號的視頻特徵中的視頻)；若落入該歷史視頻集中，則認為是成功召回；若未落入該歷史視頻集中，則未成功召回。伺服器統計評測集中所有用戶帳號的召回率，作為該候選生成模型的評估參數。

步驟307d，當訓練後的候選生成模型的召回率達到第三結束閥值時，將訓練後的候選生成模型確定為待使用的候選生成模型。

伺服器檢測該候選生成模型的召回率是否高於第三結束閥值；若召回率高於第三結束閥值，則將訓練後的候選生成模型確定為待使用的候選生成模型；若召回率低於第三結束閥值，則將訓練後的候選生成模型確定為不合格的候選生成模型，重新選取訓練集進行繼續訓練。

其中，第三結束閥值是用於表示評估候選生成模型是滿足上線使用條件的模型的臨界結束值。

綜上所述，本實施例提供的方法，通過利用k組評測集對訓練後的候選生成模型進行評估，當訓練後的候選生成模型的召回率高於第三結束閥值時，才將訓練後的候選生成模型確定為待使用的候選生成模型，從而保證訓練後的候選生成模型在上線至生產系統時的性能。

上述用戶特徵可以用於基於DNN的候選生成模型的訓練。在一個示意性的如圖6示的例子中，候選生成模型可採用機器學習架構TensorFlow來實現。時序模組52負責從資料庫51中提取出各個用戶帳號的視頻觀看流水記錄，該資料庫51可以是用於儲存視頻觀看流水記錄的資料庫，比如Boss日誌系統。資料收集模組53(Data Collect)從視頻觀看流水記錄中提取各個用戶帳號的視頻觀看記錄；一方面，資料收集模組53將各個用戶帳號的視頻觀看記錄交給用戶帳號樣本(user sample)模組54和用戶嵌入矩陣(user embedding)模組55去生成用戶特徵；另一方面，資料收集模組54將各個用戶帳號的視頻觀看記錄交給視頻特徵樣本(item sample)模組56和視頻嵌入矩陣(user embedding)模組57去生成視頻特徵，各個用戶帳號的用戶特徵和視頻特徵進一步給到NN(Nearest Neighbor)召回樣本(Recall Sample)模組58。NN召回模組58用於將各個用戶帳號的用戶特徵和視頻特徵進行拼接加工，比如，將同一個用戶帳號的用戶特徵和視頻特徵拼接為一組樣本特徵。多組樣本特徵構成用於輸入至NN召回模組(Recall Module)59提供的DNN中，訓練得到候選生成模型。

可選地，圖構建模組(Building Graph)60負責把DNN訓練過程中的中間結果上報到張量展示面板(Tensor Board)62，伺服器根據張量展示面板62所得到的中間結果將DNN訓練完畢。DNN訓練完畢後得到的模型即為候選生成模型，模型保存/加載模組61用於保存訓練後的候選生成模型，該候選生成模型用於模型評估成用戶候選集列表。

可選地，除了用戶特徵和視頻特徵之外，資料收集模組53還可以收集用戶基礎屬性65和用戶檢索歷史66等屬性特徵，將這些屬性特徵通過其它特徵樣本67和其它嵌入矩陣68來生成該用戶的其它維度的特徵，這些其它維度的特徵也作為用於訓練候選生成模型的參數之一，對候選生成模型進行訓練。

為了評估候選生成模型的準確性，本申請實施例針對候選生成模型設計了評估模組63。示意性的，將樣本特徵分為N+1個歷史分區，用前N個歷史分區資料訓練出候選生成模型，保存到訓練完畢的模型檔，用第N+1歷史分區資料來評估候選生成模型的準確性。需要注意的是，訓練和評測過程的用戶特徵生成過程以及視頻特徵生成過程需要完全一致。其中，N為正整數。

在一些實施例中，用召回率指標來衡量候選生成模型的召回能力，從第N+1個分區中隨機抽取出若干個用戶，將每個用戶的用戶特徵輸入到候選生成模型中，之後我們從候選生成模型的輸出層的輸出結果中取出top k個結果作為候選集合，如果用戶實際觀看的視頻落在top k的範圍中，則認為成功召回，否則未召回，匯總所有用戶的預測結果，最後得到總體的召回率。其中，k為正整數。

如下表一所示，其中訓練集的樣本分別有相應的用戶集和視頻集，若評測集中的用戶特徵集不在訓練集，則該用戶集看作“集外詞”(OOV)；若評測集中的視頻特徵集不在訓練集，則該視頻特徵集看作集外詞。通過實驗結果可以看出當減小K的大小時，召回率會有相應的降低，當增加訓練樣本資料時，召回率會有相應的升高。其中，絕對召回率是指全集上的召回率；相關召回率是指非“集外詞”集上的召回率。

在一個示意性的例子中，本申請提供的技術方案可以應用在視頻播放的新熱點頻道中，該頻道的推薦結果主要由演算法推薦和人工干預兩部分組成，演算法推薦部分由若干個演算法召回模組組成。本技術方案在原有的召回模組基礎上，增加了一路用戶到視頻(user to item，u2i)召回模組，該召回模組通過DNN模型針對每個用戶會生成一個視頻推薦清單。這樣在DNN召回模組和其它已有召回模型的推薦結果合併到一起，再經過個性化排序最終展示給用戶。該u2i召回模組的主要功能是應用深度學習的方法從海量的視頻中，找出數百個視頻，作為第一階段的候選推薦視頻。

本技術方案在深度學習得到的候選生成模型中，通過視頻播放流水記錄生成用戶特徵，降低了用戶特徵的生成成本。在A/B實驗中，發明人在實驗分桶中增加了該技術方案生成的u2i候選召回模組，並和基準分桶進行效果對比，實驗結果表明實驗桶整體效果要優於基準分桶，在曝光人均VV(Video View，播放數)效果上有大約1.25%的提升。在實驗分桶中，發明人對比了該實驗模組的效果和UCF(User Collaborative Filter，基於用戶的協同過濾)演算法模組的效果，通過對比發現，該演算法模組在曝光人均VV(Video View，播放數)指標上要明顯優於UCF演算法模組。

發明人在同一個實驗分桶中對比了本技術方案和UCF演算法模組的效果，結果如圖7所示，橫軸表示實驗上線天數，縱軸為模組的曝光人均VV指標，可看出本技術方案效果要好於UCF演算法模組。

以下為本申請的裝置實施例，對於裝置實施例中未詳細描述的技術細節，可以參考上述一一對應的方法實施例。

圖8示出了本申請一個示例性實施例提供的用戶特徵的生成裝置的方塊圖。該生成裝置可以通過軟體、硬體或者兩者的結合實現成為伺服器的全部或一部分。該裝置包括：獲取模組820，用於獲取n組目標視頻和用戶帳號之間的時序對應關係，每組所述時序對應關係包括查看過所述目標視頻的各個用戶帳號，且所述用戶帳號按照查看時間戳記進行排序，n為正整數；映射模組840，用於根據n組所述時序對應關係映射得到詞嵌入矩陣，所述詞嵌入矩陣包括每個所述用戶帳號對應的詞向量；訓練模組860，用於使用損失函數對所述詞嵌入矩陣進行訓練，所述損失函數用於根據觀看歷史的相似程度挖掘各個所述用戶帳號之間的相似關係；確定模組880，用於將訓練完畢的所述詞嵌入矩陣中的所述用戶帳號對應的詞向量，確定為所述用戶帳號的用戶特徵。

在一個可選的實施例中，訓練模組860，用於使用雜訊對比估計損失函數對所述詞嵌入矩陣進行訓練。

在一個可選的實施例中，確定模組880，用於當所述雜訊對比估計損失函數的函數值低於第一結束閥值時，將所述詞嵌入矩陣中的所述用戶帳號對應的詞向量，確定為所述用戶帳號的用戶特徵。

在一個可選的實施例中，映射模組840，用於將n組所述時序對應關係按照詞向量映射方式進行映射，得到所述詞嵌入矩陣。

在一個可選的實施例中，如圖9所示，所述獲取模組820包括：記錄獲取單元822和排序單元824；所述記錄獲取單元822，用於獲取m個用戶帳號的視頻查看歷史記錄，所述視頻查看歷史記錄包括所述用戶觀看過和/或搜索過的目標視頻的視頻標識以及查看時間戳記，m為正整數；所述排序單元824，用於對於所述視頻查看歷史記錄中的每個所述目標視頻，將查看過所述目標視頻的各個用戶帳號按照對應的查看時間戳記進行排序後，生成所述目標視頻和所述用戶帳號之間的時序對應關係。

在一個可選的實施例中，所述裝置還包括：視頻特徵獲取模組892和候選生成模型訓練模組894，如圖10所示。

視頻特徵獲取模組892，用於獲取所述用戶帳號的觀看歷史記錄和/或搜索歷史記錄中的視頻標識，根據所述視頻標識生成所述視頻特徵；候選生成模型訓練模組894，用於將所述用戶特徵和所述視頻特徵作為樣本特徵輸入候選生成模型中進行訓練，得到訓練後的候選生成模型；其中，所述訓練後的候選生成模型用於根據輸入的用戶特徵輸出對視頻庫中各個視頻的觀看機率。

在一個可選的實施例中，所述裝置還包括：評估模組896；所述候選生成模型訓練模組894，用於將所述用戶特徵和所述視頻特徵劃分為h+k組資料集，所述h+k資料集包括h組訓練集和k組評測集；將所述h組訓練集中的所述用戶特徵和所述視頻特徵作為樣本特徵輸入候選生成模型中進行訓練，得到所述訓練後的候選生成模型，h和k均為正整數；所述評估模組896，用於使用所述k組評測集評估所述訓練後的候選生成模型的召回率；當所述訓練後的候選生成模型的召回率達到第二結束閥值時，將所述訓練後的候選生成模型確定為待使用的候選生成模型。

圖11示出了本申請一個示例性實施例中提供的伺服器的方塊圖，該伺服器用於實施上述實施例中提供的關於伺服器側的用戶特徵的生成方法。具體來講：

所述伺服器1100包括中央處理單元(CPU)1101、包括隨機存取記憶體(RAM)1102和唯讀記憶體(ROM)1103的系統記憶體1104，以及連接系統記憶體1104和中央處理單元1101的系統匯流排1105。所述伺服器1100還包括說明電腦內的各個器件之間傳輸資訊的基本輸入/輸出系統(I/O系統)1106，和用於儲存作業系統1113、應用程式1114和其他程式模組1115的大容量儲存設備1107。

所述基本輸入/輸出系統1106包括有用於顯示資訊的顯示器1108和用於用戶輸入資訊的諸如滑鼠、鍵盤之類的輸入設備1109。其中所述顯示器1108和輸入設備1109都通過連接到系統匯流排1105的輸入輸出控制器1110連接到中央處理單元1101。所述基本輸入/輸出系統1106還可以包括輸入輸出控制器1110以用於接收和處理來自鍵盤、滑鼠、或電子觸控筆等多個其他設備的輸入。類似地，輸入輸出控制器1110還提供輸出到顯示幕、印表機或其他類型的輸出設備。

所述大容量儲存設備1107通過連接到系統匯流排1105的大型存放區控制器(未示出)連接到中央處理單元1101。所述大容量儲存設備1107及其相關聯的電腦可讀介質為伺服器1100提供非易失性儲存。也就是說，所述大容量儲存設備1107可以包括諸如硬碟或者CD-ROM驅動器之類的電腦可讀介質(未示出)。

不失一般性，所述電腦可讀介質可以包括電腦儲存介質和通信介質。電腦儲存介質包括以用於儲存諸如電腦可讀指令、資料結果、程式模組或其他資料等資訊的任何方法或技術實現的易失性和非易失性、可移動和不可移動介質。電腦儲存介質包括RAM、ROM、EPROM、EEPROM、快閃記憶體或其他固態儲存技術，CD-ROM、DVD或其他光學儲存、磁帶盒、磁帶、磁片儲存或其他磁性存放裝置。當然，本領域技術人員可知所述電腦儲存介質不局限於上述幾種。上述的系統記憶體1104和大容量儲存設備1107可以統稱為記憶體。

根據本發明的各種實施例，所述伺服器1100還可以通過諸如網際網路等網路連接到網路上的遠端電腦運行。也即伺服器1100可以通過連接在所述系統匯流排1105上的網路介面單元1111連接到網路1112，或者說，也可以使用網路介面單元1111來連接到其他類型的網路或遠端電腦系統(未示出)。

所述記憶體還包括一個或者一個以上的程式，所述一個或者一個以上程式儲存於記憶體中，且經配置以由一個或者一個以上處理器執行。上述一個或者一個以上套裝程式含用於執行上述用戶特徵的生成方法的指令。

以上所述實施例僅表達了本申請的幾種實施方式，其描述較為具體和詳細，但並不能因此而理解為對本申請專利範圍的限制。應當指出的是，對於本領域的普通技術人員來說，在不脫離本申請構思的前提下，還可以做出若干變形和改進，這些都屬於本申請的保護範圍。因此，本申請專利的保護範圍應以所附申請專利範圍為准。

201-204‧‧‧步驟

Claims

一種用戶特徵的生成方法，其包括：獲取n組目標視頻和用戶帳號之間的時序對應關係，每組所述時序對應關係包括查看過所述目標視頻的各個用戶帳號，且所述用戶帳號按照查看時間戳記進行排序，n為正整數；根據n組所述時序對應關係映射得到詞嵌入矩陣，所述詞嵌入矩陣包括每個所述用戶帳號對應的詞向量；使用雜訊對比估計損失函數對所述詞嵌入矩陣進行訓練，所述雜訊對比估計損失函數用於根據觀看歷史的相似程度挖掘各個所述用戶帳號之間的相似關係；將訓練完畢的所述詞嵌入矩陣中的所述用戶帳號對應的詞向量，確定為所述用戶帳號的用戶特徵。
根據請求項1所述的方法，其中所述將訓練完畢的所述詞嵌入矩陣中的所述用戶帳號對應的詞向量，確定為所述用戶帳號的用戶特徵，包括：當所述雜訊對比估計損失函數的函數值低於第一結束閥值時，將所述詞嵌入矩陣中的所述用戶帳號對應的詞向量，確定為所述用戶帳號的用戶特徵。
根據請求項1至2任一項所述的方法，其中所述根據n組所述時序對應關係映射得到詞嵌入矩陣，包括：將n組所述時序對應關係按照詞向量映射方式進行映射，得到所述詞嵌入矩陣。
根據請求項1至2任一項所述的方法，其中所述獲取n組目標視頻和用戶帳號之間的時序對應關係，包括：獲取m個用戶帳號的視頻查看歷史記錄，所述視頻查看歷史記錄包括所述用戶觀看過和/或搜索過的目標視頻的視頻標識以及查看時間戳記，m為正整數；對於所述視頻查看歷史記錄中的每個所述目標視頻，將查看過所述目標視頻的各個用戶帳號按照對應的查看時間戳記進行排序後，生成所述目標視頻和所述用戶帳號之間的時序對應關係。
根據請求項1至2任一項所述的方法，其還包括：獲取所述用戶帳號的觀看歷史記錄和/或搜索歷史記錄中的視頻標識，根據所述視頻標識生成視頻特徵；將所述用戶特徵和所述視頻特徵作為樣本特徵輸入候選生成模型中進行訓練，得到訓練後的候選生成模型；其中，所述訓練後的候選生成模型用於根據輸入的用戶特徵輸出對視頻庫中各個視頻的觀看機率。
根據請求項5所述的方法，其中所述將所述用戶特徵和所述視頻特徵作為樣本特徵輸入候選生成模型中進行訓練，得到訓練後的候選生成模型，包括：將所述用戶特徵和所述視頻特徵劃分為h+k組資料集，所述h+k資料集包括h組訓練集和k組評測集，h和k均為正整數；將所述h組訓練集中的所述用戶特徵和所述視頻特徵作為樣本特徵輸入候選生成模型中進行訓練，得到所述訓練後的候選生成模型；所述方法，還包括：使用所述k組評測集評估所述訓練後的候選生成模型的召回率；當所述訓練後的候選生成模型的召回率達到第二結束閥值時，將所述訓練後的候選生成模型確定為待使用的候選生成模型。
一種用戶特徵的生成裝置，其包括：獲取模組，用於獲取n組目標視頻和用戶帳號之間的時序對應關係，每組所述時序對應關係包括查看過所述目標視頻的各個用戶帳號，且所述用戶帳號按照查看時間戳記進行排序，n為正整數；映射模組，用於根據n組所述時序對應關係映射得到詞嵌入矩陣，所述詞嵌入矩陣包括每個所述用戶帳號對應的詞向量；訓練模組，用於使用雜訊對比估計損失函數對所述詞嵌入矩陣進行訓練，所述雜訊對比估計損失函數用於根據觀看歷史的相似程度挖掘各個所述用戶帳號之間的隱含關係；確定模組，用於將訓練完畢的所述詞嵌入矩陣中的所述用戶帳號對應的詞向量，確定為所述用戶帳號的用戶特徵。
根據請求項7所述的裝置，其中所述確定模組，用於當所述雜訊對比估計損失函數的函數值低於第一結束閥值時，將所述詞嵌入矩陣中的所述用戶帳號對應的詞向量，確定為所述用戶帳號的用戶特徵。
根據請求項7至8任一項所述的裝置，其中所述映射模組，用於將n組所述時序對應關係按照詞向量映射方式進行映射，得到所述詞嵌入矩陣。
根據請求項7至8任一項所述的裝置，其中所述獲取模組包括：記錄獲取單元，用於獲取m個用戶帳號的視頻查看歷史記錄，所述視頻查看歷史記錄包括所述用戶觀看過和/或搜索過的目標視頻的視頻標識以及查看時間戳記，m為正整數；排序單元，用於對於所述視頻查看歷史記錄中的每個所述目標視頻，將查看過所述目標視頻的各個用戶帳號按照對應的查看時間戳記進行排序後，生成所述目標視頻和所述用戶帳號之間的時序對應關係。
根據請求項7至8任一項所述的裝置，其還包括：視頻特徵獲取模組，用於獲取所述用戶帳號的觀看歷史記錄和/或搜索歷史記錄中的視頻標識，作為視頻特徵；候選生成模型訓練模組，用於將所述用戶特徵和所述視頻特徵作為樣本特徵輸入候選生成模型中進行訓練，得到訓練後的候選生成模型；其中，所述訓練後的候選生成模型用於根據輸入的用戶特徵輸出對視頻庫中各個視頻的觀看機率。
一種伺服器，其包括：處理器和記憶體，所述記憶體中儲存有至少一條指令、至少一段程式、代碼集或指令集，所述至少一條指令、所述至少一段程式、所述代碼集或指令集由所述處理器載入並執行以實現如請求項1至6任一項所述的用戶特徵的生成方法。
一種電腦可讀儲存介質，其儲存有至少一條指令、至少一段程式、代碼集或指令集，所述至少一條指令、所述至少一段程式、所述代碼集或指令集由所述處理器載入並執行以實現如請求項1至6任一項所述的用戶特徵的生成方法。