TW201503019A

TW201503019A - 使用者未知興趣之探索方法與系統

Info

Publication number: TW201503019A
Application number: TW103109366A
Authority: TW
Inventors: Jean-Marc Langlois; Scott Gaffney; Choon Hui Teo; Nathan Liu
Original assignee: Yahoo Inc
Priority date: 2013-03-15
Filing date: 2014-03-14
Publication date: 2015-01-16
Also published as: US9270767B2; WO2014149840A1; US20140280548A1; TWI533246B

Abstract

本發明揭示一種利用在該興趣空間內定義一距離度量，探測超越該當前已知使用者興趣的使用者興趣清單之方法及系統。該方法及系統的目標在於探測當前使用者興趣集合附近的興趣項目，藉此大幅改善該使用者可能喜歡該等探測項目之一者的機會。

Description

使用者未知興趣之探索方法與系統

【相關申請案交叉參照】

本申請案主張2013年3月15日提出的第13/835,745號美國臨時專利申請案之權利，其完整內容在此併入本文供參考。

本發明係關於提供內容的方法及系統，尤其是本發明係關於提供線上內容的方法及系統。

網際網路讓使用者可用電子方式，隨時隨地虛擬存取任何內容。在這資訊爆炸的時代，提供使用者相關的資訊而非只是一般資訊給使用者已經變成越來越重要。此外，隨著現今社會上的使用者依賴網際網路當成他們的資訊、娛樂及/或社交連結來源，例如新聞、社交互動、電影、音樂等等，所以提供對使用者來說有價值的資訊給使用者就是關鍵。

在此已經努力嘗試允許使用者迅速存取相關以及重點內容，例如，相較於一般內容收集系統，例如傳統搜尋引擎，主題入口網站已經發展成更為主題導向，範例主題入口網站包含財經、運動、新聞、氣象、購物、音樂、藝術、影片等等的入口網站。這種主題入口網站允許使用者存取有關這些入口網站所指向主題的資訊，使用者必須進入不同入口網站，以存取特定主題的內容，這不方便並且不以使用者為中心。

另一種努力嘗試讓使用者輕鬆存取相關內容的方式為透過個人化，其目標在於了解使用者的個人喜好/興趣/偏愛，如此可設定每一使用者的個性化使用者描述檔，並且可用來選擇符合使用者興趣的內容。因此，從內容消耗的觀點，本發明目標是要滿足使用者的心思。使用者描述檔傳統根據使用者宣告的興趣構成，及/或從例如使用者的個人屬性推論。另外也有根據觀察使用者與內容的互動，來識別使用者興趣的系統。這種使用者與內容互動的典型範例為點擊率(CTR，click through rate)。

這些傳統方式具有許多缺點。例如，不用任何參照基準線就可描述使用者的興趣，如此可更精確評估興趣的程度。使用者興趣在隔離的應用程式設定當中偵測，如此個別應用程式內的使用者描述無法擷取廣泛的使用者整體興趣。這種傳統使用者描述方式導致片段呈現使用者興趣，對於使用者的偏好沒有連貫了解。因為相同使用者獲自於不同應用程式設定的描述檔通常建立在特定應用程式上，同時也難以整合這些描述檔來產生更能夠呈現使用者興趣且更加一致的描述檔。

傳統上可觀察到引導至內容的使用者活動，並且用於評估或推論使用者的興趣，CTR是最常用的使用者興趣評估措施。不過，CTR已經不足以擷取使用者的興趣，特別是對於使用者會在不同種裝置上執行的不同種類活動也可反應或提示使用者興趣。此外，使用者對於內容的反應，通常代表使用者的短期興趣。如同傳統方式經常做的，當逐個獲取後，這種觀察的短期興趣只能傾向於被動而非主動服務使用者。雖然短期興趣重要，但是並不足以了解使用者的更持久長期興趣，這在使用者維持方面至關重要。大多數使用者與內容的互動代表使用者的短期興趣，如此依賴這種短期興趣行為使其難以擴展對於使用者興趣增加範圍的了解。當這與這種收集資料始終是過去的行為以及被動收集組合時，建立個人化篩選氣泡，除非使用者開始某些行動而揭露新興趣，否則難以，但並非不可能，發覺使用者的其他興趣。

允許使用者存取相關內容的另一種努力方式為：依照使用者的興趣，佇存使用者可能有興趣的內容。在這網際網路資訊爆炸的時代是不可能，即使可能的話，每當需要選擇與特定使用者相關的內容時，去評估可透過網際網路存取的所有內容。如此，在實際上是需要根據某些條件來識別網際網路內容子集或內容池，如此可從此內容池選擇內容，並且根據使用者的興趣推薦所要的內容。

傳統建立這種內容子集的方式以應用程式為中心，每一應用程式都以應用程式專屬方式刻畫出自己的內容子集，例如，Amazon.com具有內容池，其係關於根據與其擁有使用者相關的資訊及/或這些使用者在與Amazon.com互動時展現出來的興趣來建立/更新之產品及其相關資訊。Facebook也有自己的內容子集，以不僅是Facebook專屬方式，也根據使用者在Facebook上活動時展現出來的興趣來產生。隨著使用者在不同應用程式當中活動(例如Amazon.com及Facebook)並且使用每一應用程式，他們可能只展現出與應用程式天性連接的整體興趣當中一部分。如此，每一應用程式通常都了解(最佳狀態)使用者的一部分興趣，這使其難以發展出可用於服務使用者廣泛興趣範圍的內容子集。

另一種努力方式為針對個人化內容推薦，即是根據使用者的個人化描述檔從內容池當中選擇內容，並且將這種識別的內容推薦給使用者。傳統解決方案聚焦在關聯上，即是內容與使用者之間的關聯。雖然關聯相當重要，不過也有其他因素衝擊著應該如何選擇推薦內容，以便滿足使用者的興趣。大部分的內容推薦系統會在已識別推薦給使用者的內容之內插入廣告，用來識別插入廣告的某些傳統系統將含有廣告或使用者查詢(也含內容)的內容與廣告匹配，而不考慮根據使用者個人屬性與廣告主所定義目標觀眾特色之匹配。某些傳統系統將使用者描述檔與廣告主所定義目標觀眾的特定個人屬性匹配，但是不匹配要提供給使用者的內容與廣告，原因在於內容通常根據該內容所涵蓋主題區來分類，而廣告則根據所要的目標觀眾群來分類，這在選擇最相關廣告且插入推薦給特定使用者的內容時較無效率。

因此需要改良傳統方式，將內容推薦個人化。

本發明係關於提供個人化網頁配置之方法、系統及編程。在一具體實施例中，揭示一種用於識別一使用者的內容之方法，該方法係於一計算裝置上實施，該計算裝置具有至少一處理器、儲存裝置、及一通訊介面，其連接一網路。該方法包括：取得有關一使用者的使用者資訊，其中該資訊指示該使用者的一或多個興趣；識別該使用者的至少一興趣；決定關於該使用者的該至少一興趣之每一者的一或多個補充興趣，其中該等一或多個補充興趣不會重疊該使用者的該等一或多個興趣；及識別關於該使用者的該至少一興趣之每一者的該等一或多個補充興趣相關聯的補充內容，其中有關該等一或多個補充興趣的該補充內容用來探索該使用者的未知興趣。

在另一具體實施例中，該方法更包括：識別每一段該補充內容與其對應補充興趣之間的關聯性；根據該關聯性將每一段該補充內容排序；根據該排序選擇至少某些該補充內容；及輸出該選定的補充內容。

在另一具體實施例中，該方法更包括：從一內容池取得隨機內容；將該隨機內容加入該補充內容；選擇該隨機內容；及輸出該隨機內容。在仍舊另一具體實施例中，該方法更包括根據一條件篩選該已排序的補充內容。在仍舊另一具體實施例中，該條件為個人屬性。在一具體實施例中，揭示一種用於識別未知使用者內容的系統，該系統包括：一取得單元，其用於取得有關一使用者的使用者資訊，其中該資訊指示該使用者的一或多個興趣；一興趣分析器，用於識別該使用者的至少一興趣；一補充興趣識別器，用於決定關於該使用者的該至少一興趣之每一的一或多個補充興趣，其中該等一或多個補充興趣不會與該使用者的該等一或多個興趣重疊；及一補充內容識別器，用於識別與關於每一該使用者的該至少一興趣之該等一或多個補充興趣相關聯的補充內容，其中有關該等一或多個補充興趣的該補充內容用來探索該使用者的未知興趣。

在另一具體實施例中，該系統更包括：一補充加權單元，用於識別每一段該補充內容與其對應補充興趣之間的關聯性；一排序單元，用於根據該關聯性將每一段該補充內容排序；一選擇器，用於根據該排序選擇至少某些該補充內容；及一輸出，用於輸出該選定的補充內容。

在一具體實施例中，揭示一種其上記錄用於識別未知使用者興趣的資訊之非暫態電腦可讀取媒體。該媒體由一電腦讀取時，導致該電腦執行以下步驟：取得與一使用者有關的使用者資訊，其中該資訊指示該使用者的一或多個興趣；識別該使用者的至少一興趣；決定關於該使用者的該至少一興趣之每一者的一或多個補充興趣，其中該等一或多個補充興趣不會重疊該使用者的該等一或多個興趣；及識別與關於每一該使用者的該至少一興趣之該等一或多個補充興趣相關聯的補充內容，其中有關該等一或多個補充興趣的該補充內容用來探索該使用者的未知興趣。

在另一具體實施例中，該媒體由該電腦讀取時，進一步使該電腦執行以下步驟：識別每一段該補充內容與其對應補充興趣之間的關聯性；根據該關聯性將每一段該補充內容排序；根據該排序選擇至少某些該補充內容；及輸出該選定的補充內容。

10‧‧‧系統

100‧‧‧個人化內容推薦模組

105‧‧‧使用者

110‧‧‧內容來源

115‧‧‧知識資料庫

120‧‧‧第三方平台

125‧‧‧廣告商

126‧‧‧廣告資料庫

127‧‧‧廣告分類

130‧‧‧應用程式

135‧‧‧內容池

140‧‧‧內容池產生/更新單元

145‧‧‧概念/內容分析器

150‧‧‧內容爬取器

155‧‧‧使用者瞭解單元

160‧‧‧使用者描述檔

165‧‧‧內容分類法

170‧‧‧內容資訊分析器

175‧‧‧使用者事件分析器

180‧‧‧長期興趣識別器

185‧‧‧短期興趣識別器

190‧‧‧第三方興趣分析器

195‧‧‧社交媒體內容來源識別器

200‧‧‧廣告插入單元

205‧‧‧內容/廣告/分類關聯器

210‧‧‧內容排序單元

215‧‧‧未知興趣勘探器

410‧‧‧內容/概念分析控制單元

420‧‧‧內容效能評估器

430‧‧‧內容品質評估單元

440‧‧‧使用者活動分析器

450‧‧‧內容狀態評估單元

455‧‧‧頻率

460‧‧‧內容記錄

470‧‧‧內容描述紀錄

480‧‧‧內容選擇單元

490‧‧‧內容更新控制單元

710‧‧‧興趣描述紀錄基線產生器

720‧‧‧使用者描述檔產生器

740‧‧‧使用者企圖/興趣估計器

750‧‧‧短期興趣識別器

760‧‧‧長期興趣識別器

1010‧‧‧候選內容取得器

1020‧‧‧多相內容排序單元

1300‧‧‧高維度向量

1301‧‧‧向量

1400‧‧‧第一階輸入

1401‧‧‧政治

1402‧‧‧運動

1406‧‧‧選舉

1410‧‧‧第二階輸入

1411‧‧‧爵士

1420‧‧‧第三階輸入

1500‧‧‧類別

1600‧‧‧高維度向量

1605‧‧‧已識別的興趣

1610‧‧‧已識別的興趣

1615‧‧‧輸入

1620‧‧‧輸入

1705‧‧‧已知興趣識別器

1715‧‧‧補充興趣識別器

1720‧‧‧補充內容識別器

1725‧‧‧補充興趣池

1730‧‧‧補充內容池

1735‧‧‧隨機內容選擇器

1740‧‧‧本機型內容篩選

1745‧‧‧補充內容選擇器

1750‧‧‧未知興趣搜尋參數

1905‧‧‧已知興趣分析器

1910‧‧‧搜尋領域決定器

1915‧‧‧補充興趣搜尋器

1920‧‧‧補充興趣加權單元

1925‧‧‧補充興趣搜尋參數

2105‧‧‧補充內容候選分析器

2110‧‧‧內容相關活動分析器

2115‧‧‧近似度計算單元

2120‧‧‧確定性分數計算單元

2125‧‧‧補充內容選擇器

2300‧‧‧電腦

2302‧‧‧COM連接埠

2304‧‧‧中央處理單元

2306‧‧‧內部通訊匯流排

2308‧‧‧磁碟

2310‧‧‧唯讀記憶體

2312‧‧‧隨機存取記憶體

2314‧‧‧I/O組件

2316‧‧‧使用者介面元件

本說明書內揭示的該方法、系統及/或編程是從示範性具體實施例的觀點來描述，這些示範具體實施例將參閱該等圖式詳細描述，這些具體實施例為非限制的示範性具體實施例，其中在所有圖式當中相同的參考編號代表類似的結構，其中：第一圖描述根據本發明的一具體實施例之個人化內容推薦之示範系統圖；第二圖為根據本發明的一具體實施例之個人化內容推薦之示範處理流程圖；第三圖例示關聯資訊的示範類型；第四圖描述根據本發明的一具體實施例之一內容池產生/更新單元的示範圖；第五圖為根據本發明的一具體實施例之建立一內容池的示範處理流程圖；第六圖為根據本發明的一具體實施例之更新一內容池的示範處理流程圖；第七圖描述根據本發明的一具體實施例之一使用者了解單元的示範圖；第八圖為根據本發明的一具體實施例之產生一興趣描述檔基線的示範處理流程圖；第九圖為根據本發明的一具體實施例之產生一個人化使用者描述檔的示範處理流程圖；第十圖描述根據本發明的一具體實施例之一內容排序單元的示範系統圖；第十一圖為根據本發明的一具體實施例之該內容排序單元的示範處理流程圖；第十二圖為例示根據本發明的一具體實施例之用以找尋和傳遞有關一使用者未知興趣之內容的個人化系統之一部分的圖式；第十三圖為例示根據本發明另一具體實施例之使用者興趣的一高維度向量之圖式；第十四圖為例示根據本發明的一具體實施例之一典型結構內容分類法之圖式；第十五圖為例示根據本發明的一具體實施例之線上概念軟體或索引之圖式；第十六圖為例示根據本發明的一具體實施例之使用者興趣的一高維度向量映射至一內容分類法之圖式；第十六a圖為例示使用者興趣的一高維度向量映射至一內容分類法及指出潛在其他相關興趣之圖式；第十七圖為例示根據本發明的一具體實施例之一未知興趣探索的圖式；第十八圖為例示根據本發明的一具體實施例之實施一未知興趣探索的方法流程圖；第十九圖為例示根據本發明的一具體實施例之一補充興趣識別器的圖式；第二十圖為例示根據本發明的一具體實施例之實施一補充興趣識別器的方法流程圖；第二十一圖為例示根據本發明的一具體實施例之一補充內容識別器的圖式；第二十二圖為例示根據本發明的一具體實施例之實施一補充內容識別器的方法流程圖；及第二十三圖描述其上可實施本發明的一般電腦架構。

在下列詳細說明中，藉由範例公佈許多特定細節，以便對於本發明有通盤了解。不過，精通技術人士應瞭解，不用這些特定細節也可實施本發明。在其他實例中，已經以相對高階而非詳細描述已知的方法、程序、組件及/或電路，以免模糊本具體實施例的態樣。

本發明教導與對一使用者的個人化線上內容推薦有關。實際上，本發明教導與一種用於個人化內容推薦的系統、方法及/或程式有關，用以解決與傳統內容推薦方法於個人化、內容池建立與推薦個人化內容有關的缺點。

對於個人化而言，本發明教導辨識一使用者有關於一通用興趣空間的複數個興趣，該通用興趣空間則透過已知的概念資料庫達成，像是維基百科及/或內容分類法。使用所述的通用興趣空間，於多種不同應用程式及透過多種不同平台所呈現複數個使用者的複數個興趣，便可用於建立一般性的人口數據資料以做為基線，以此基線便可決定個別使用者的複數個興趣及興趣程度。例如，活躍在像是臉書或推特等第三方應用程式中的複數個使用者，及所述複數個使用者在這些第三方應用程式所呈現的該等興趣，都可被映射至該通用興趣空間，並接著用於計算該一般人口的興趣描述紀錄基線。具體來說，對於涵蓋某些題材或概念之每一文件所觀察到的每一使用者的複數個興趣，都可以被映射至例如維基百科或某種內容分類法。根據該通用興趣空間可以建構一高維度向量，其中該向量的每一屬性都對應於該通用興趣空間中的一概念，而該屬性數值可對應該使用者對此特定概念之興趣的評估。該一般性興趣描述紀錄基線可根據代表該人口的所有向量所推衍。代表一個體的每一向量都可對於該興趣描述紀錄基線進行正規化，因此可以決定該使用者對於該通用興趣空間中該等概念的興趣相對程度。這可達成對於該使用者相關於較一般性人口而言，於不同題材感興趣之程度的較佳瞭解，並能夠強化個人化的內容推薦。相較於像先前技術時常做的，只根據專有的內容分類法將複數個使用者的複數個興趣特徵化，本發明教導運用公共概念資料庫，像是維基百科或線上百科全書，定義一通用興趣空間，以一種更一致性的方法分析一使用者的複數個興趣。所述高維度向量捕捉每一使用者的完整興趣空間，以更有效果的方式對於個人複數個興趣進行人員對人員的比較。分析一使用者及此方法也達成有效率地辨識共享類似興趣的複數個使用者。此外，可於相同通用興趣空間中對內容進行特徵化，例如，可以建立關於該通用興趣空間中該等概念之一高維度向量，該向量中具有的複數個數值指示該內容是否涵蓋該通用興趣空間中該等概念的每一概念。藉由將使用者與內容以一致性方式於該相同空間特徵化的方式，可以透過例如代表該使用者之向量與代表該內容之向量的內積，決定一使用者與一內容片段之間的近似度。

本發明教導也運用複數個短期興趣，以較佳地瞭解複數個使用者的複數個長期興趣。短期興趣可透過使用者線上活動觀察，並用於線上內容推薦，一使用者較持續的長期興趣則有助於以一種更健全的方式改良內容推薦品質，並因此改善使用者保留率。本發明教導揭示長期興趣及短期興趣的發掘方法。

為了改良個人化，本發明教導也揭示根據各種使用者活動改進估計一使用者興趣之能力的方法。因為有意義的使用者活動時常在不同設定中於不同裝置上並於不同操作模式中發生，因此這特別有用。透過所述不同的使用者活動，可以測量使用者與內容的契合度，以推論使用者的複數個興趣。傳統上，已經使用點擊與點擊率(CTR)估計複數個使用者的企圖及推論複數個使用者的複數個興趣。CTR已不適合現今的世界。複數個使用者可能停留在該內容一特定部分，此停留情況可能是不同時間長度、複數個使用者可能沿著該內容捲動，並停留在該內容一具體部分某時間長度、複數個使用者可能以不同速度向下捲動、複數個使用者可能在靠近該內容某些部分時改變所述速度、複數個使用者可能跳過該內容某些部分等等。所有所述活動都有隱含複數個使用者與該內容之契合度。所述契合度可用於推論或估計一使用者複數個興趣。本發明教導運用可能在不同設定中跨及不同裝置形式發生的各種使用者活動，以達成對複數個使用者契合度的較佳估計，以利用一更可靠的方式強化捕捉一使用者複數個興趣的能力。

關於個人化的本發明教導另一態樣，為利用產生探測內容，勘探一使用者複數個未知興趣的能力。傳統上，使用者分析係根據使用者所提供的資訊(例如，所宣稱的複數個興趣)或被動觀察的過去資訊所進行，像是對於該使用者已經檢視的內容、對所述內容的反應等等。所述先前技術方案可能導致一個人化篩選氣泡罩，其中只有該使用者所顯露的複數個興趣可用於內容推薦。因為這樣，只有該等可被觀察到的使用者活動係被指向所述的已知興趣，阻礙了瞭解一使用者完整興趣的能力。這在複數個使用者時常在不同的應用程式設定中展現不同興趣(大複數個為部分的興趣)的事實下所考量。本發明教導揭示利用複數個概念產生探測內容的方法，該等概念目前係未被辨別成為該使用者複數個興趣之一，以勘探該使用者未知的複數個興趣。所述探測內容係經選擇並推薦給該使用者，而指至該探測內容的複數個使用者活動接著可經分析，以估計該使用者是否具有複數個其他興趣。所述探測內容的選擇可以一使用者目前已知的複數個興趣為基礎，例如，藉由外推該使用者目前複數個興趣的方式。例如，對於該使用者的某些已知興趣(例如，在當時的複數個短期興趣)而言，在該通用興趣空間中的某些探測概念，其為該使用者於過去中並未展現的複數個興趣，係可根據某些條件(例如，在一分類樹中與該使用者目前已知興趣相距一特定距離內)加以選擇，而接著與所述探測概念有關的內容可被選擇，並推薦給該使用者。另一種辨識探測概念(相應於該使用者的位置興趣)的方法則可透過該使用者的世代群組。例如，一使用者可以與他/她的世代群組共有某些興趣，但該群組圈裡的某些成員可能具有某些該使用者之前未曾展現過的某些興趣。所述與世代群組間未共有的興趣可被選擇做為該使用者的探測未知興趣，而接著與所述探測未知興趣有關的內容可被選擇做為推薦給該使用者的探測內容。在此方法中，本發明教導揭示一種方案，藉此方案可以連續探測並瞭解一使用者的複數個興趣，以改善個人化的品質。所述經管理的探測方式可與隨機選擇的探測內容組合，以發掘與該使用者目前複數個已知興趣相距甚遠的該使用者複數個未知興趣。

推薦品質個人化內容之一第二態樣，為建立具有品質內容之一內容池，該內容池涵蓋複數個使用者感到興趣的複數個題材。在該內容池中的內容可對於該內容本身的主題及/或效能給予評比。例如，可將內容對於其所揭示之複數個概念進行特徵化，而所述特徵可關於該通用興趣空間產生，例如，如以上討論透過像是內容分類法及/或維基百科及/或線上百科全書的概念資料庫所定義。例如，每一內容片段都可透過一高維度向量特徵化，該高維度向量每一屬性都與該通用興趣中一概念對應，而該屬性的數值指示該內容是否涵蓋該概念及/或該內容涵蓋該概念的程度。當一內容片段如對於使用者描述檔一般於該相同通用興趣空間中進行特徵化時，便可以有效率的決定該內容與一使用者描述檔之間的近似度。

該內容池中每一內容片段都可以各自對於複數個其他條件特徵化。例如，與效能相關的度量，像是該內容的流行性可以用於敘述該內容。與效能相關的內容特徵可用於選擇被整合至該內容池之中的內容，及用於選擇已經在該內容池中而為複數個特定使用者進行個人化內容推薦的內容。所述每一內容片段複數個效能導向的特徵可能隨時間改變，並可以根據複數個使用者複數個活動進行週期性估計及完成。內容池也根據各種理由隨時間改變，像是內容效能、複數個使用者複數個興趣的改變等等。在該內容池中內容特徵的效能動態改變也可以根據該內容的效能度量進行週期性或動態的評估，因此內容池可隨時間調整，也就是利用移除低效能內容片段、加入具有高效能的新內容，或是更新內容。

為了使該內容池成長，本發明的教導揭示將來自該等新內容來源的可存取、評估或整合至該內容池之中的興趣內容，連續發掘新內容與複數個新內容來源兩者的方式，。可透過存取來自複數個第三方應用程式的資訊，動態發掘新內容，複數個使用者係使用該等第三方應用程式並展現各種興趣。所述第三方應用程式的實例包含臉書、推特、Microblogs或YouTube。當根據某些(自然)事件的發生，產生或預測對於某些題材出現某些新的興趣或感興趣的增加程度時，也可以將新的內容加入該內容池。一實例為有關於Pope Benedict生命的內容，一般而言這對於大複數個使用者並非是感興趣的主題，但可能在Pope Benedict突然的辭職發佈時，造成大複數個使用者的興趣。所述對該內容池的動態調整目標在於涵蓋複數個使用者複數個興趣的一動態(或可能成長)範圍，包含那些由複數個使用者在不同設定或應用程式中所展現的那些，或按照上下文資訊進行的預測。接著在將所述新發掘的內容可被選擇加入至該內容池之前，可對該內容進行評估。

該內容池中的某些內容，例如日誌或新聞，則需要隨時間更新。傳統的方法通常根據一固定排程週期性更新所述內容。本發明教導揭示根據各種因子決定該內容池中內容更新步調的動態方案。內容更新可受到上下文資訊的影響。例如，一內容片段進行更新排程的頻率可能是每兩小時，但此頻率可根據例如像是地震的突發事件作動態調整。做為另一實例，一般而言來自臉書上專用於天主教信仰的社交群集內容可以每天進行更新。當Pope Benedict的辭職新聞發生時，來自該社交群集的內容可被每小時更新，因此有興趣的複數個使用者可以保持對於來自此社交群集複數個成員的討論追蹤。此外，不管在何時出現新辨識的內容來源時，都可以利用例如從該等新來源爬取該內容、處理該經爬取內容、評估該經爬取內容，及選擇被整合至該內容池之品質新內容新的方式，進行更新該內容池的排程。所述動態更新的內容池目標在於相容於該動態改變的複數個使用者複數個興趣而成長，以促成具品質的個人化內容推薦。

另一項品質個人化內容推薦的關鍵，為辨識符合一使用者該等興趣之品質內容以進行推薦的態樣。先前解決方法當選擇推薦內容時時常只強調該內容對於該使用者的相關性。此外，根據內容推薦的傳統相關性大多只以該使用者複數個短期興趣為基礎。這不只造成一內容推薦氣泡罩，就是已知複數個短期興趣造成推薦便受限於該等短期興趣，而對於所述短期興趣的反應則使該推薦循環集中回到開始該程序的該等短期興趣。此氣泡罩使其難以離開該循環，亦即難以推薦不但作為複數個使用者的該等整體興趣，也作為複數個使用者複數個長期興趣的內容。本發明教導結合相關性與該內容的效能，因此可在一多相排序系統中，對複數個使用者選擇及推薦不但具有相關係也具有品質的內容。

此外，為了辨識可作為一使用者廣泛興趣範圍的推薦內容，本發明教導係以該使用者的短期與長期興趣兩者為基礎，辨識使用者-內容的近似度，以選擇符合複數個使用者多處興趣的廣泛範圍，推薦給使用者的內容。

在內容推薦中，像是廣告的貨幣化內容通常也經選擇作為向一使用者推薦之內容的部分。傳統方法選擇廣告的方式，時常係以插入該廣告之內容為基礎。某些傳統方式也根據像是查詢的使用者輸入為基礎，以估計何者廣告可能使回收經濟效益最大。這些方法藉由比對該查詢分類法或根據該查詢所取得之內容與廣告內容分類法的方式選擇該廣告。然而，內容分類法普遍被認為不對應於廣告分類法，複數個廣告商係使用廣告分類法瞄準特定聽眾。因此，根據內容分類法選擇廣告並無法使插入至該內容並向複數個使用者推薦的廣告獲得最大的回收經濟效益。本發明教導揭示建立內容分類法與廣告分類法之間鏈結的方法與系統，因此可選擇不只與一使用者複數個興趣有關，也與複數個廣告商的興趣有關的廣告。在此方法中，推薦給使用者帶有廣告的內容不僅考慮了該使用者的複數個興趣，而在同時也允許該內容操作者透過廣告增強貨幣化效果。

而本發明教導之另一項個人化內容推薦的態樣與推薦探測內容有關，該探測內容係由外推目前已知的使用者複數個興趣以辨識。傳統方法以選擇目前已知使用者複數個興趣以外的隨機內容，或是具有像是高度點擊活動之特定效能的內容為基礎。隨機選擇探測內容為低機率的去發掘出一使用者複數個未知興趣。藉由選擇已被觀察到具有較高度活動之內容進行探測內容辨識也同樣具有問題，因為可能存在一使用者潛在有興趣的許多內容片段，但該等片段僅具有低度活動程度。本發明教導揭示藉由外推目前已知興趣的方式辨識探測內容的方法，其具有從該等目前已知興趣移開多遠的彈性。此方法也整合辨識品質探測內容的機制，因此對於發掘一使用者複數個未知興趣上具有強化的可能性。在任何時刻該等興趣的焦點都可做為一錨定興趣，根據該錨定興趣便可從該等錨定興趣外推複數個探測興趣(其非為該使用者目前被已知的興趣)，並可以根據該等探測興趣選擇探測內容，並與該等錨定興趣的內容一起推薦給該使用者。也可以根據其他考量決定探測興趣/內容，像是位置、時間或裝置型式。在此方式中，所揭示之個人化內容推薦系統可以連續勘探及發掘一使用者的複數個未知興趣，以對該使用者整體興趣更加瞭解，以擴展服務範圍。

在以下敘述中，將部分設定額外的新穎特徵，該等部分對於該領域技術人員在檢視下述與該等伴隨圖式之後將變的明確，並可藉由該等實例的製造與操作獲得學習。本發明教導之該等優點可透過實作或使用於以下討論該等詳細實例中所設定之方法論、手段與組合所實現及達成。

第一圖描繪根據本發明教導一具體實施例之一示例系統圖式10，以對一使用者105進行個人化內容推薦。系統10包括一個人化內容推薦模組100、複數個內容來源110、複數個知識資料庫115、複數個第三方平台120與複數個廣告商125，該等廣告商125具有廣告分類法127與廣告資料庫126，該個人化內容推薦模組100包括許多子模組。該等內容來源110可為任何線上內容來源，像是線上新聞、發佈文章、部落格、線上文摘、雜誌、音訊內容、圖片內容與視訊內容。其可為來自內提供者的內容，像是來自Yahoo！Finance、Yahoo！Sports、CNN與ESPN。其可為多媒體內容或文字或任何其他內容形式，包括網站內容、社交媒體內容，像是臉書、推特、Reddit等等，或其他的豐富內容提供器。其可為來自像是AP與Reuters之提供者的版權內容。其也可以是在網際網路上從各種來源所爬取及標記的內容。該等內容來源110提供龐大的內容陣列至該系統10該個人化內容推薦模組100。

該等知識資料庫115可為像是維基百科的線上百科全書或是線上字典的索引系統。該等線上概念資料庫115可用於其內容與其分類或索引系統。該等知識資料庫115提供擴充的分類系統，以協助該使用者105複數個偏好的分類與內容的分類兩方。該等知識概念資料庫，像是維基百科可能具有數十萬至數百萬的分類與子分類。分類可用於顯示該類型的階層。該等分類兩項主要目的。首先，該等分類協助該系統瞭解一類型與另一類型如何相關，第二，該等分類協助該系統於該階層較高階層之間的調遣，而不需要往上及往下移動至該等次類型。在該等知識資料庫115中所建立之該等類型或分類結構則用於多維度內容向量與多維度使用者描述檔向量，該等向量可由該個人化內容推薦模組100使用，以對一使用者105比對個人化內容。該等第三方平台120可為任何第三方平台，包含像是臉書、推特、LinkedIn、Google+的社交網站，但不限制於此。其可包含複數個第三方郵件伺服器，像是Gmail或Bing Search。該等第三方平台120提供內容來源與對於一使用者複數個個人化偏好及行為的瞭解兩方。

該等廣告商125可與該廣告內容資料庫126及廣告分類系統或該廣告分類法127連接，該廣告分類法127則為廣告內容分類法所用。該等廣告商125提供串流內容、靜態內容與贊助內容。廣告內容可放置於一個人化內容頁面任何位置上，並可呈現為策略上置在該內容串流中或繞著該內容串流放置之一內容串流之部分與一獨立廣告兩方。

該個人化內容推薦模組100包括複數個應用程式130、內容池135、內容池產生/更新單元140、概念/內容分析器145、內容爬取器150、未知興趣勘探器215、使用者瞭解單元155、複數個使用者描述檔160、內容分類法165、內容資訊分析器170、使用者事件分析器175、第三方興趣分析器190、社交媒體內容來源識別器195、廣告插入單元200及內容/廣告/分類法關聯器205。這些元件經連結以達成個人化、內容池建立及推薦個人化內容給一使用者。例如，一內容排序單元210與該內容資訊分析器170、未知興趣勘探器215及該廣告插入單元200一起工作，以產生推薦給一使用者之個人化內容，該個人化內容具有插入之個人化廣告或探測內容。為了達成個人化，該使用者瞭解單元155與各種元件聯合工作，以動態及連續地更新該等使用者描述檔160，包含該內容分類法165、該等知識資料庫115、該使用者事件分析器175與該第三方興趣分析器190。各種元件係經連結以維持一內容池，包含該內容池產生/更新單元140、該使用者事件分析器175、該社交媒體內容來源識別器195、概念/內容分析器145、內容爬取器150、內容分類法165與該等使用者描述檔160。

當該使用者105透過該等應用程式130加入該系統10時，便觸發該個人化內容推薦模組100。該等應用程式130可以透過某些計算裝置形式，從該使用者105接收具有使用者識別、餅乾文件、登錄資訊形式的資訊。該使用者105可以透過有線或無線裝置存取該系統10，並可以使用固定式或行動式的裝置。該使用者105可以在一平板、智慧手機、膝上電腦、桌上電腦或任何其他計算裝置上與該等應用程式130介接，該等應用程式可嵌入於像是手錶、眼鏡或汽車等的裝置之中。除了接收來自該使用者105有關於該使用者105可能對何種資訊有興趣的瞭解以外，該等應用程式130也以個人化內容串流的形式提供該使用者105資訊。使用者瞭解可為輸入至該系統的使用者搜尋項目、使用者宣稱之興趣、使用者於一特定文章或主題上的點擊、使用者於特定內容的停留時間與捲動、使用者對於某些內容跳過等等。使用者瞭解可為該使用者於一社交網站上所進行喜愛、分享或轉寄動作的使用者指示，像是在臉書上，或甚至像是列印或掃瞄某些內容的周邊設備活動。這些所有的使用者瞭解或事件都由該個人化內容推薦模組100使用，以設置並客製化對該使用者105呈現的內容。透過該等應用程式130所接收之該等使用者瞭解則用於更新代表該等使用者的個人化描述紀錄，可被儲存於該等使用者描述檔160中。該等使用者描述檔160可為一資料庫或一資料庫串列，以儲存個人化使用者資訊在該系統10的該等所有使用者中。該等使用者描述檔160可為一平坦或關聯式資料庫，並可儲存於一或多個位置中。所述使用者瞭解也用於決定如何動態更新該內容池135中之內容。

透過該等應用程式130所接收之一特定使用者事件則沿著該使用者事件分析器175通過，該使用者事件分析器175分析該使用者事件資訊，並將該分析結果與該事件資料饋入至該使用者瞭解單元155及/或該內容池產生/更新單元140。根據所述使用者事件資訊，該使用者瞭解單元155估計該使用者之複數個短期興趣及/或根據該使用者105在長時間或重複期間所展現的複數個行為，推論該使用者的複數個長期興趣。例如，一長期興趣可為關於運動的一般興趣，而一短期興趣可能與一特殊運動事件有關，像是在特定時間的超級盃。隨時間經過，可藉由分析複數個重複使用者事件的方式估計一使用者的長期興趣。一使用者在每次契合該系統10的期間規則地選擇與該股票市場相關的內容，都可以視為是對於財經具有一長期興趣。在此情況中，該系統10據此能夠為該使用者105決定該個人化內容應該包含與財經有關的內容。相對的，短期興趣可以根據在一短期內時常發生的複數個使用者事件，但並非為長期中該使用者105所感到有興趣的某些事物所決定。例如，一短期興趣可以反映一使用者的瞬間興趣，其可能因為該使用者看到該內容所觸發，但所述興趣並不隨時間持續存在。對於辨識符合該使用者105需求的內容而言，短期與長期興趣都很重要，但因為其本質上及影響該使用者的方式的差異，而需要被分別管理。

在某些具體實施例中，可分析一使用者的複數個短期興趣以預測該使用者的複數個長期興趣。為了維持住一使用者，重要的是瞭解該使用者的持續性或長期興趣。藉由辨識該使用者105短期興趣並提供他/她具品質的個人化經驗，該系統10可以將一偶發的使用者轉變成為一長期使用者。此外，短期興趣可能轉變成為長期興趣，反之亦然。該使用者瞭解單元155提供估計短期與長期興趣兩者的能力。

該使用者瞭解單元155從多重來源蒐集使用者資訊，包含該等所有使用者事件，並建立一或多個多維度個人化向量。在某些具體實施例中，該使用者瞭解單元155接收關於該使用者105根據該等使用者事件所推論的複數個特徵，像是他/她觀看的內容、自我宣稱之複數個興趣、屬性或特徵、複數個使用者活動及/或來自複數個第三方平台的複數個事件。在一具體實施例中，該使用者瞭解單元155從該社交媒體內容來源識別器195接收複數個輸入。該社交媒體內容來源識別器195以該使用者105的社交媒體內容為基礎，將該使用者描述檔個人化。藉由分析該使用者的社交媒體頁面、喜好、分享等等，該社交媒體內容來源識別器195提供資訊至該使用者瞭解單元155。該社交媒體內容來源識別器195能夠利用辨識例如在複數個社交媒體平台上具品質之數位策展員的方式，辨別複數個新的內容來源，該等社交媒體平台則像是推特、臉書或部落格，該社交媒體內容來源識別器195也能夠使該個人化內容推薦模組100發掘複數個新的內容來源，來自該等內容來源的品質內容則可加入至該內容池135。由該社交媒體內容來源識別器195所產生的資訊可傳送至該概念/內容分析器145，並接著根據內容分類法165及複數個知識資料庫115之一分類系統，映射至特定類型或分類。

該第三方興趣分析器190運用來自複數個其他第三方平台關於複數個使用者活躍在所述第三方平台上的資訊、複數個使用者興趣及這些第三方使用者的內容，強化該使用者瞭解單元155的效能。例如，當可以從一或多個第三方平台存取關於一大量使用人口的資訊時，該使用者瞭解單元155可以根據關於一大量人口的資料，建立一興趣描述紀錄基線，以進行複數個個別使用者更精準及更可靠的興趣估計，例如，藉由比較關於一特定使用者的興趣資料與該興趣描述紀錄基線的方式，將能高度確定性地捕捉該使用者複數個興趣。

當從該內容來源110或該等第三方平台120辨識新內容時，該內容係經處理，且其複數個概念係被分析。該等概念可映射至該內容分類法165與該等知識資料庫115中的一或多個類型。該內容分類法165是一種組織化的概念結構或概念類型，且其可以包含數千種分類的數百種分類。該等知識資料庫115可以提供百萬種概念，其可以或可以不利用與該內容分類法165相同的方式結構化。所述內容分類法與知識資料庫可以做為一通用興趣空間。從該內容所估計的複數個概念可被映射至一通用興趣空間，並可為每一內容片段建構一高維度向量，該高維度向量可用於將該內容特徵化。同樣的，對每一使用者而言，也可以建構一個人的興趣描述紀錄，其特徵化為複數個概念，並將該使用者複數個興趣映射至該通用興趣空間，因此可以建構利用該使用者複數個興趣程度所填入的一高維度向量。

該內容池135可為一般性內容池，其具備用於提供所有使用者的內容。該內容池135也可以建構為具有為每一使用者的個人化內容池。在此情況中，該內容中的內容係對於每一個別使用者所產生及保留。該內容池也可以被組織為一層狀系統，其具備該一般性內容池及為複數個不同使用者的複數個個人化個別內容池。例如，在一使用者之每一內容池中，該內容本身可以不實際存在，但可以透過鏈結、指標或索引操作，該等鏈結、指標或索引則提供指向該實際內容儲存於該一般性內容池何處的參考。

該內容池135係由該內容池產生/更新單元140動態更新。該內容池135中的內容來來去去，並根據該等使用者該動態資訊、該內容本身及其他資訊形式建立複數個決策。例如，當該內容效能退化時，例如該使用者展現低度興趣時，該內容池產生/更新單元140可以決定從該內容池去除該內容。當內容變的陳舊或過期時，也可以從該內容池移除該內容。當存在來自從一使用所偵測的較新興趣時，該內容池產生/更新單元140可以取得與該等新發掘興趣校準的新內容。該等使用者事件對於內容效能與使用者興趣動態而言，可能是一種建立觀測的重要來源。該等使用者活動係由該使用者事件分析器175分析，而所述資訊則傳送至該內容池產生/更新單元140。當取得新內容時，該內容池產生/更新單元140引動該內容爬取器150蒐集新內容，接著由該概念/內容分析器145分析，接著在決定該內容是否包含於該內容池中之前，由該內容池產生/更新單元140對該內容品質與效能進行評估。該內容可能因為其不再相關、因為複數個其他使用者不再認為其具有高品質，或因為其不再具有適時性而從該內容池135移除。如果該使用者105具備高品質、及時個人化內容的潛在來源，當該內容時常改變及更新時，該內容池135也時常改變及更新。

除了該內容以外，該個人化內容推薦模組100也用於從該廣告商125進行目標或個人化廣告內容。該廣告資料庫126包含欲被插入至一使用者內容串流中的廣告內容。來自該廣告資料庫126之廣告內容則透過該內容排序單元210插入至該內容串流之中。該廣告內容的個人化選擇可以該使用者描述檔為基礎。該內容/廣告/分類法關聯器205可以將一不同的廣告分類法127重新投影或映射至與該等使用者描述檔160關聯的分類法。該內容/廣告/分類法關聯器205可以對該重新投影應用一直接映射方式，或以應用某些智慧演算法，以根據類似或重疊的分類法類型，決定該等使用者哪些具有一相似或相關的興趣。

該內容排序單元210根據該使用者描述檔為基礎從該內容池135所選擇的內容，及由該廣告插入單元200選擇的廣告，產生欲對該使用者105推薦之該內容串流。欲推薦給該使用者105的內容也可以根據來自該內容資訊分析器170的資訊由該內容排序單元210決定。例如，如果一使用者目前位於不同於該使用者描述檔中郵遞區號的一海灘城鎮中時，便可以推論該使用者可在度假。在此情況中，與該使用者目前所在位置相關的資訊可以從該內容資訊分析器170傳遞給該內容排序單元210，因此可以選擇不但符合該使用者複數個興趣，也為該地區進行客製化的內容。其他上下文資訊包括日期、時間與裝置形式。該上下文資訊也可以包含在該使用者目前使用之裝置上所偵測的事件，像是釣魚專用網站的一瀏覽事件。根據所述一偵測事件，可以由該內容資訊分析器170估計該使用者的瞬間興趣，其接著可以引導該內容排序單元210蒐集在該使用者所在地區與釣魚適宜性相關的內容，以進行推薦。

該個人化內容推薦模組100也經配置以允許在推薦給該使用者105的內容中包含探測內容，即使該探測內容並不代表與該使用者目前複數個已知興趣相符的題材。所述探測內容可由該未知興趣勘探器215所選擇。一旦該探測內容整合至欲推薦給該使用者的內容中，便由該使用者事件分析器175蒐集並分析與指向該探測內容之複數個使用者活動有關的資訊(包含不進行動作)，接著將該分析結果傳遞至長期/短期興趣識別器180及185。如果對於指向該探測內容之複數個使用者的分析顯示該使用者對於該探測內容有興趣或沒興趣，那麼該使用者瞭解單元155可以據此更新與該經探測使用者相關的使用者描述檔。這是一種如何發掘複數個未知興趣的方法。在某些具體實施例中，根據該使用者目前的關注興趣(例如，短期興趣)，以外推該等目前關注興趣的方法，產生該探測內容。在某些具體實施例中，可從不管是來自該內容池135或來自該等內容來源110的一般性內容，透過一隨機選擇辨識該探測內容，因此可以執行一額外的探測，以發掘複數個未知興趣。

為了辨識向一使用者推薦的個人化內容，該內容排序單元210根據在一多相排序方法中該使用者描述檔向量與該內容向量的比較，採用所有這些輸入並辨識該內容。該選擇也可以使用上下文資訊加以過濾。接著，被插入之廣告及可能的探測內容，可以與該經選擇個人化內容合併。

第二圖為根據本發明教導一具體實施例，用於個人化內容推薦之一示例程序流程圖。在205處產生內容分類法。從複數個不同內容來源存取內容，並分析該內容，將該內容分類法為複數個不同可為預定之類型中。每一類型都給定某些標籤，接著將複數個不同類組織至某些結構中，例如，組織至一階層結構中。在210處產生一內容池。當建立該內容池時可以應用不同條件。所述條件的實例包含由該內容池中該內容所涵蓋的複數個主題、該內容池中該內容的效能等等。可獲得用以填入該內容池之內容的複數個來源包含該等內容來源110或該等第三方平台120，像是臉書、推特、部落格等等。第三圖提供根據本發明教導一具體實施例，與內容池建立有關的更詳細示例流程圖。在215處根據例如使用者資訊、複數個使用者活動、該使用者複數個經辨識的短期/長期興趣等等，產生複數個使用者描述檔。該等使用者描述檔可相關於一人口興趣描述紀錄基線產生，該人口興趣描述紀錄基線則以例如有關於第三方興趣、複數個知識資料庫與複數個內容分類法為基礎所建立。

一旦該等使用者描述檔與該內容池被建立之後，當該系統10在220處偵測一使用者的存在時，像是位置、日期、時間的上下文資訊便可於225處獲得及分析。第四圖描述上下文資訊之複數個示例形式。根據該經偵測使用者描述檔、選擇性的上下文資訊，便可辨識用於推薦的個人化內容。第五圖中呈現用於產生供推薦之個人化內容的高階示例流程。所述經蒐集的個人化內容可被排序及過濾，使用於推薦之內容總量達到合理的尺寸。選擇地(未圖示)，廣告與探測內容也可以整合於該個人化內容之中，所述內容接著在230處推薦給該使用者。

在235處監控對該經推薦內容的複數個使用者反應與活動，並於240處分析。所述事件或活動包含點擊、跳過、停留時間測量、捲動位置與速度、位置、時間、分享、轉遞、盤旋、像是搖晃的動作等等。要瞭解任何其他事件或活動是可以監控及分析的。例如，當該使用者移動該滑鼠游標在該內容上時，該內容的標題或摘要可能會被強調或被輕微的展開。在另一實例中，當一使用者利用她/他的指尖與一觸控螢幕互動時，可以偵測任何已知的觸控螢幕使用者手勢。仍在另一實例中，於該使用者裝置上的眼球追蹤可為另一種使用者活動，此活動與使用者行為相關，並可被偵測。所述使用者事件的分析包括評估該使用者的複數個長期興趣，及所述展現的複數個短期興趣是如何可能影響該系統對該使用者複數個長期興趣的瞭解。與所述評估有關的資訊接著被傳遞至該使用者瞭解單元155，以在255處引導如何更新該使用者描述檔。在同時間，根據該等使用者活動，於245處評估該等使用者呈現興趣之推薦內容的部分，而接著在250處使用該評估結果更新該內容池。例如，如果該使用者對於該建議的探測內容顯示有興趣，便可能適合更新該內容池，以確保新發掘出的該使用者興趣有關的內容將被包含於該內容池中。

第三圖描述多種不同上下文資訊形式，其可被偵測及使用，以協助向一使用者推薦之個人化內容。在此描述中，上下文資訊可以包含許多資料類型，該等資料類型包含但不限制於時間、空間、平台與網路條件。時間相關資訊可為該年的時間、(例如，從一特定月份可推論何季節)、該週的日數、該日的特定時間等等。所述資訊可以提供對於與一使用者關聯之何種特定興趣集合可能是最相關的瞭解。在特定時刻推論一使用者該等特定興趣，也可能與該使用者所處地區有關，而這可以在空間相關上下文資訊中反映，像是哪個國家、什麼地區(例如，觀光城鎮)、該使用者在哪個設施裡(例如，在雜貨店裡)，或甚至該使用者當時站在哪個景點(例如，該使用者可能正站在一雜貨店裡陳列穀類食品的走廊中)。其他上下文資訊形式包含與該使用者裝置有關的特定平台，例如，智慧手機、平板、膝上電腦、桌上電腦、該使用者裝置的頻寬/資料傳輸率，這將影響可以有效對該使用者呈現的內容形式。此外，像是該使用者裝置所連接之網路的狀態、於該條件下的可用頻寬等等的網路相關資訊，也可能影響應該推薦給該使用者的內容，因此該使用者可以以合理的品質接收或檢視該推薦內容。

第四圖描繪根據本發明教導一具體實施例，該內容池產生/更新單元140之一示例系統圖式。該內容池135可被初次產生，並接著根據該等使用者、該等內容及偵測需求的動態所維持。在此描述中，該內容池產生/更新單元140包括一內容/概念分析控制單元410、一內容效能估計器420、一內容品質評估單元430、一內容選擇單元480，該內容選擇單元480將選擇適當的內容以放置於該內容池135之中。此外，為了控制如何更新內容，該內容池產生/更新單元140也包含一使用者活動分析器440、一內容狀態評估單元450與一內容更新控制單元490。

該內容/概念分析控制單元410與該內容爬取器150(第一圖)介接，以獲得候選內容，該候選內容將被分析以決定是否將該新內容加入至該內容池。該內容/概念分析控制單元410也與該內容/概念分析器145(第一圖)介接，以獲得內容，該內容經分析以擷取由該內容涵蓋的複數個概念或主題。根據該新內容的分析，可以透過例如將從該內容擷取之該等概念映射至該通用興趣空間的方法，計算代表該內容描述紀錄的一高維度向量，該通用興趣空間則由例如透過維基百科或其他內容分類法所定義。所述內容描述紀錄向量可以與該等使用者描述檔160比較，以決定該內容是否引起該等使用者的興趣。此外，可由該內容效能估計器420根據例如第三方資訊對於該內容的效能進行評估，該第三方資訊則像是複數個使用者來自複數個第三方平台的複數個活動，因此該新活動雖然尚未由該系統複數個使用者所動作，仍可評估其效能。該內容效能資訊可以與和該內容主題相關的該內容高維度向量一起儲存於該內容描述紀錄470中。該效能評估也被傳送至該內容品質評估單元430，例如該內容品質評估單元430將以一種與該內容池中複數個其他內容片段一致的方式，一起進行該內容排序。根據所述排序，該內容選擇單元480接著決定該新內容是否要被整合至該內容池 135之中。

為了動態更新該內容池135，該內容池產生/更新單元140可以根據所有存在於該內容池中的內容保持一內容記錄460，並在接收更多與該內容效能有關的資訊時，動態更新該記錄。當該使用者活動分析器440接收與該等使用者事件有關的資訊時，可以在該內容記錄460中記錄所述事件，並執行分析以估計例如該相關內容之效能或流行性隨時間的任何改變。來自該使用者活動分析器440的結果也可以用於更新該等內容描述紀錄，例如，效能於何時發生改變。該內容狀態評估單元450監控該內容記錄460與該內容描述紀錄470，以動態決定該內容池135中每一內容片段係如何被更新。根據與一內容片段有關之狀態，如果該內容效能退化至一特定程度以下時，該內容狀態評估單元450可以決定捨棄該內容。也可以在該系統複數個使用者整體興趣程度下降至一特定程度以下時，決定捨棄該內容片段。對於需要更新的內容而言，例如新聞或日誌，該內容狀態評估單元450也可以根據其接收的動態資訊控制該等更新的頻率455。該內容更新控制單元490根據來自該內容狀態評估單元450的複數個決定及某些內容需要進行更新的頻率，進行該等更新工作。該內容更新控制單元490也可以在存在周邊資訊指示需求時決定加入新內容，例如出現突發事件而且在該內容池中關於該題材的內容並不適時的時候。在此情況中，該內容更新控制單元490分析該周邊資訊及是否需要新內容，接著該內容更新控制單元490傳送一控制訊號至該內容/概念分析控制單元410，因此該內容更新控制單元490可以與該內容爬取器150介接以獲得新內容。

第五圖為根據本發明教導一具體實施例，建立該內容池之一示例程序流程圖。在510處從複數個內容來源存取內容，包含來自像是Yahoo！之內容入口網站、來自像是網站或檔案傳送協定(FTP)站的一般性網際網路來源、來自像是推特的社交媒體平台或像是臉書之其他第三方平台的內容。於520處，對於像是效能、該內容所涵蓋之題材，及該內容如何滿足複數個使用者複數個興趣的各種考量評估所述經存取內容。根據所述評估，於530處選擇某些內容以產生該內容池135，該內容池135可用於該系統的一般人口，或可具有進一步的結構以建立複數個子內容池，根據該使用者複數個特定興趣，該每一個子內容池都可以專屬於一特定使用者。在540，決定是否建立複數個使用者特定內容池。如果否，在580處組織該一般性內容池135(例如，給予索引或分類)。如果打算為複數個個別使用者建立複數個個別內容池，於550處獲得複數個使用者描述檔，並對於每一使用者描述檔於560處選擇一個人化內容集合，接著於570處使用該個人化內容集合為每一使用者建立一子內容池。接著在580處組織該整體內容池與該等子內容池。

第六圖為根據本發明教導一具體實施例，用於更新該內容池135之一示例程序流程圖。於610處接收動態資訊，所述資訊包含複數個使用者活動、周邊資訊、使用者相關資訊等等。根據該接收動態資訊，於620處更新該內容記錄，並於630處分析該動態資訊。根據該接收動態資訊的分析，於640處對於由該動態資訊所涉及之內容，針對該內容的狀態改變進行評估。例如，如果接收資訊係與指向特定內容片段之複數個使用者活動有關，該內容片段的效能便需要被更新，以產生該內容片段的新狀態。接著在650處決定是否需要更新。例如，如果來自一外圍來源的動態資訊指示特定主題的內容可能在最近未來時具有高度需求，可以決定取得該主題的新內容，並將該內容加入至該內容池。在此情況中，於660處，便決定需要加入內容。此外，如果一內容片段的效能或流行性已經剛好下降至一可接受程度，該內容片段可能需要從該內容池135捨棄。在670處選擇欲被捨棄的內容。此外，如果該接收動態資訊指示需要對於像是日誌或新聞的規則性刷新內容進行更新時，進行該更新所依據的排程也可以被改變。這則在680處達成。

第七圖描繪根據本發明教導一具體實施例，該使用者瞭解單元155之一示例圖式。在此示例建構中，該使用者瞭解單元155包括一興趣描述紀錄基線產生器710、一使用者描述檔產生器720、一使用者企圖/興趣估計器740、一短期興趣識別器750與一長期興趣識別器760。操作上，該使用者瞭解單元155採用各種輸入並產生該等使用者描述檔160作為輸出。其輸入包含第三方資料，像是來自所述第三方平台的複數個使用者資訊及內容、所述使用者所存取及陳述之複數個興趣、於所述第三方資料中涵蓋的複數個概念、來自該通用興趣空間(例如，維基百科或內容分類法)的複數個概念、有關於準備建構之該等個人化描述紀錄之複數個使用者的資訊，及與所述使用者該等活動有關的資訊。來自欲被產生及更新之個人化描述紀錄之一使用者的資訊包含該使用者的個人屬性資料、該使用者宣稱的複數個興趣等等。與複數個使用者事件有關的資訊包括時間、日期、該使用者進行某些活動的位置，像是點擊一內容片段、在一內容片段上停留長時間、轉遞一內容片段給朋友等等。

操作上，該興趣描述紀錄基線產生器710存取有關大量使用者人口的資訊，包含複數個使用者的複數個興趣及來自一或多個第三方來源(例如，臉書)該等使用者有興趣的內容。來自所述來源的內容則由該概念/內容分析器145(第一圖)分析，該概念/內容分析器145從所述內容辨識該等概念。當由該興趣描述紀錄基線產生器710接收所述概念時，該興趣描述紀錄基線產生器710將所述概念映射至該等知識資料庫115與內容分類法165(第一圖)，並產生一或多個高維度向量，其代表該使用者人口之興趣描述紀錄基線。所述產生的興趣描述紀錄基線儲存於該使用者瞭解單元155中的730處。當存在來自額外第三方來源的類似資料時，該興趣描述紀錄基線730可被動態更新，以反映該成長人口的興趣程度基線。

一旦該興趣描述紀錄基線被建立，當該使用者描述檔產生器720接收使用者資訊或與估計該相同使用者短期與長期興趣有關的資訊時，該使用者描述檔產生器720接著可將該使用者複數個興趣映射至例如由該等知識資料庫或內容分類法所定義之該等概念，因此現在該使用者的複數個興趣便被映射至該相同空間，該空間則為建構該興趣描述紀錄基線的空間。該使用者描述檔產生器720接著比較該使用者關於每一概念的興趣程度與由該興趣描述紀錄基線730所表現一較大使用者人口的興趣程度，以決定該使用者關於該通用興趣空間中每一概念的興趣程度。這為每一使用者產出一高維度向量。在結合其他額外資訊下，像是結合使用者個人屬性資料等等，便可以產生一使用者描述檔並儲存於160中。

該等使用者描述檔160係根據新接收的動態資訊持續更新。例如，一使用者可以宣稱複數個其額外資訊，而所述資訊在由該使用者描述檔產生器720接收時，可用於更新該對應使用者描述檔。此外，該使用者可能在複數個不同應用程式中活躍，而所述活動可經觀察，而與這些有關的資訊可被蒐集，以決定這些活動如何影響該現有的使用者描述檔，並在需要時，根據所述新資訊更新該使用者描述檔。例如，與每一使用者有關之複數個事件可由該使用者企圖/興趣估計器740蒐集及接收。所述事件包含該使用者時常停留在特定主題某些內容上、該使用者最近去一海灘城鎮進行衝浪比賽，或是該使用者最近參與槍枝控管的討論等等。所述資訊可經分析，以推論該使用者複數個企圖/興趣。當該等使用者活動與在一使用者上線時對內容的反應有關時，所述資訊可由該短期興趣識別器750使用，以決定該使用者複數個短期興趣。同樣的，某些資訊可能與該使用者複數個長期興趣有關。例如，來自該使用者對於搜尋與飲食資訊有關之內容的請求數量，可以提供推論該使用者對於與飲食有關的內容有興趣的基礎。在某些情況中，估計長期興趣可由觀察該使用者存取某種形式資訊的頻率與規則進行。例如，如果該使用者重複且規則地存取與特定主題有關的內容，例如股票，所述使用者的重複性與規則性活動可用於推論他/她的複數個長期興趣。該短期興趣識別器750可以與該長期興趣識別器760連結工作，以使用複數個觀察短期興趣推論複數個長期興趣。所述估計之短期/長期興趣也傳送至該使用者描述檔產生器720，因此可隨該改變的動態去調整該個人化情形。

第八圖為根據本發明教導一具體實施例，用於根據與一大量使用者人口有關的資訊，產生一興趣描述紀錄基線之一示例程序流程圖，該第三方資訊，包含使用者興趣資訊與其感興趣之內容兩者，係於810與820處存取。於803處分析與該等第三方使用者興趣有關的內容，而來自所述內容之該等概念則於840與50處映射至複數個知識資料庫及/或內容分類法。為了建立一興趣描述紀錄基線，代表複數個第三方使用者的該等映射向量被總結以產生代表該人口之一興趣描述紀錄基線。可以存在各種方式，將該等向量總結，以產生關於其基層人口之一平均興趣描述紀錄。

第九圖為根據本發明教導一具體實施例，用於產生/更新一使用者描述檔之一示例程序流程圖。先於910處接收使用者資訊。所述資訊包含使用者個人屬性資料、使用者宣稱複數個興趣等等。在920處也接收與複數個使用者活動有關的資訊。在930處存取已知由該使用者感到興趣的複數個內容片段，其接著於950處分析，以擷取由該等內容片段所涵蓋之複數個概念。該等經擷取概念接著於960處映射至該通用興趣空間，並一個接著一個概念與該興趣描述紀錄基線比較，以在970處決定在已知該人口下該使用者的特定興趣程度。此外，根據已知或估計之複數個短期與長期興趣也可以辨識每一使用者的興趣程度，其分別在940與950處根據使用者活動或已知為使用者有興趣的內容所估計。接著在980處可以根據關於該通用興趣空間中的每一概念，產生一個人化使用者描述檔。

第十圖描繪根據本發明教導一具體實施例，該內容排序單元210之一示例系統圖。該內容排序單元210採用各種輸入並產生向一使用者推薦之個人化內容。對該內容排序單元210的輸入包含來自一使用者所介接之該等應用程式130的資訊、複數個使用者描述檔160、在該時候繞著該使用者的上下文資訊、來自該內容池135的內容、由該廣告插入單元200所選擇的廣告，及來自該未知興趣勘探器215的選擇性探測內容。該內容排序單元210包括一候選內容取得器1010與一多相內容排序單元1020。根據來自該等應用程式130之使用者資訊與該相關使用者數據料，該候選內容取得器1010決定從該內容池135所欲取得之該等內容片段。所述候選內容可以一種與該使用者複數個興趣一致的方式，或以個別方式決定。一般而言，存在大量的候選內容集合，而其需要進一步決定此集合中哪些內容片段係在該上下文資訊下最為適當。該多相內容排序單元1020採用來自該候選內容取得器1010、該廣告及該選擇性探測內容之該候選內容，作為進行推薦之一內容池，並接著執行多階段排序，例如以相關性為基礎的排序、以效能為基礎的排序等等，及針對繞著此推薦程序之上下文的複數個因子排序，並選擇該內容一子集合以作為向該使用者推薦之該個人化內容。

第十一圖為根據本發明教導一具體實施例，該內容排序單元之一示例程序流程圖。首先於1110處接收使用者相關資訊與使用者描述檔。根據該接收資訊，於1120處決定該使用者複數個興趣，該等使用者興趣接著可以用於在1150處從該內容池135取得候選內容。該等使用者興趣也可以用於分別在1140及1130處取得廣告及/或探測內容。所述取得內容於1160處進一步排序，以為該使用者選擇最適當的子集合。如以上討論，該選擇以一多相排序程序進行，該等相之每一相都指向某些排序條件或其組合，以產出不但對該等興趣而言與該使用者最為相關，而且是可能由該使用者感到興趣的高品質內容之一內容子集合。該選擇內容子集合也可以進一步在1170處根據例如上下文資訊過濾。例如，即使一使用者一般而言係對於政治與藝術的內容感到有興趣，如果該使用者目前在義大利米蘭時，該使用者便可能正在度假。在此情況中，與其選擇與政治有關的內容，選擇跟米蘭裡藝術博物館有關的內容可能更為相關。在此情況中，該多相內容排序單元1020可以根據此上下文資訊過濾掉與政治有關的內容。這為該使用者產出一最後的個人內容集合。在1180處，根據與該使用者周圍關聯之該上下文資訊(例如，所使用的裝置、網路頻寬等等)，該內容排序單元於1180處根據該上下文資訊包裹該經選擇的個人化內容，並接著在1190處傳輸該個人化內容至該使用者。

該系統10各種態樣的更多詳細揭示，特別是該個人化內容推薦模組100，係涵蓋於不同美國專利申請案及專利合作條約(PCT)申請案中，這些申請案的標題為「Method and System For User Profiling Via Mapping Third Party Interests To A Universal Interest Space」、「Method and System for Multi-Phase Ranking For Content Personalization」、「Method and System for Measuring User Engagement Using Click/Skip In Content Stream」、「Method and System for Dynamic Discovery And Adaptive Crawling of Content From the Internet」、「Method and System For Dynamic Discovery of Interesting URLs From Social Media Data Stream」、「Method and System for Discovery of User Unknown Interests」、「Method and System for Efficient Matching of User Profiles with Audience Segments」、Method and System For Mapping Short Term Ranking Optimization Objective to Long Term Engagement」、「Social Media Based Content Selection System」、「Method and System For Measuring User Engagement From Stream Depth」、「Method and System For Measuring User Engagement Using Scroll Dwell Time」、「Almost Online Large Scale Collaborative Based Recommendation System」與「Efficient and Fault-Tolerant Distributed Algorithm for Learning Latent Factor Models through Matrix Factorization」。本發明特別針對識別來自未知興趣的複數個個人化使用者興趣之系統及方法。尤其是，本發明係關於利用將探測內容插入該複數個個人化使用者串流當中，識別內容當中超過該複數個當前已知使用者興趣的使用者興趣。

推薦系統力求呈現高度個人化的項目給使用者，因此該使用者反覆將越來越受限於該推薦系統當前已知用於該使用者的興趣清單。長期來看，這會造成個人化篩選氣泡，其中只將呈現非常窄的使用者興趣子集的項目推薦給使用者。利用呈現經常來自項目全集的隨機項目，緩解此氣泡或瓶頸，以便探索使用者的新興趣，不過這種方式是非常偶然的。

個人化內容或推薦系統總是力求找出利用關於使用者的當前已知資訊來呈現最佳清單，與利用將內容的次佳清單呈現給使用者來探測可能位置興趣的空間並監控該反應間之平衡。在文章全體非常大並且興趣集合也非常大的系統中，則隨機探索使用者的積極興趣上非常沒有效率。在探索到興趣為正值的文章之前，會將許多興趣值不大或負的文章呈現給該使用者。

在使用合作篩選的系統內，例如推薦內容清單可為兩策略混合，即是根據使用者偏好以及隨機內容的內容，但是探測與利用的平衡不受控制。若可用相對小的潛在子空間來呈現大量使用者互動，這些篩選系統可運作良好，不過這種系統並不允許探測與利用之間細微的控制。某些系統可使用多選項吃角子老虎機器模型(Mmulti-arm bandit)或湯普森(Thomspon)取樣方式，其同時試圖獲得新知識，並且根據現有知識將決策最佳化，其中探測對利用的總量可更小心控制。不過多選項吃角子老虎機器模型與Thompson取樣較無效率，讓大多數文章幾乎沒有與任何使用者互動。

因此，需要建立一種跨越興趣空間的使用者描述檔，並且產生跨越該空間的距離度量，如此可用於智慧選擇探測之用的項目。該測量的距離可包括在使用者動作的最優先順序，以便將探測與利用平衡。此外，需要一種利用在該興趣空間內定義距離度量，並且利用小心運用觀察到的使用者互動來智慧選擇該使用者可能有興趣的內容，來探測超越該當前已知清單的使用者興趣清單之方法及系統。本發明的目標在於探測當前使用者興趣集合附近的興趣項目，這種目標興趣大幅改善該使用者可能喜歡該等探測項目之一者的機會。

第十二圖為例示內容個人化系統10一部分的圖式，如第一圖所示，包括一未知興趣探測器215。本具體實施例內該內容個人化系統10的其他相關部分包括應用程式130、使用者事件分析器175、使用者了解單元155、知識資料庫115、內容分類法165、使用者描述檔160、內容池135、內容排序單元210、關聯資訊分析器170以及內容來源110。未知興趣探測器215識別獲自於內容池135或內容來源110的探測內容，否則不會由內容排序單元210根據與包括使用者描述檔160的使用者相關之資訊來識別。未知興趣探測器215將該探測內容送入內容排序單元210，透過應用程式130推薦給使用者105。使用者105可選擇是否觀看內容，但是若使用者105確實觀看該內容，則使用者事件分析器175將分析使用者相對於該探測內容的行為，並且嘗試決定該使用者的活動是否反應使用者對於該探測內容所呈現主題有任何興趣。

這種指向該探測內容的已偵測使用者活動從使用者事件分析器175傳送至使用者了解單元155，這可匯集有關該探測內容的資訊，並且關聯於指向該探測內容的該使用者活動，來決定該使用者是否對於該探測內容中呈現的概念或主題有興趣。若透過分析發現新的使用者興趣，則使用者了解單元155將更新使用者描述檔160，如此新探索的興趣可反應在該使用者描述檔內。如此，個人化內容推薦模組100可連續探索使用者的未知興趣，以便增加對於使用者整體興趣的了解。

第十三圖描述儲存在使用者描述檔160內使用者興趣的高維度向量1300。高維度向量1300根據知識資料庫115及/或內容分類法165來建構，向量1301a、1301b...1301n內的每一輸入都映射至該知識資料庫內的一概念，或內容分類法165內的一等級，並且此向量的每一輸入中所記錄之分數代表在此特定概念內使用者興趣的評估位準。該向量可根據該知識資料庫與分類當中的概念來建構。多個向量也可建構，每一向量都對應一來源(例如一對應維基百科，另一對應內容分類法)。一般來說，該知識資料庫與內容分類法提供廣泛的興趣涵蓋範圍，並且形成一通用興趣空間。

第十四圖為內容分類法165的示範結構。第一階輸入1400代表第一階類別，意圖用於高階主題或專題(即是政治、運動、娛樂等等)，第二階輸入1410為第一階輸入1400的子類別(政治→選舉與投票權：運動→足球與棒球)，第三階輸入1420為子類別的子類別，即是第2階的子類別。其可進一步細分(娛樂→電影→喜劇與戲劇與浪漫劇)。使用者可對該第一階類別或第三階類別有興趣，但是並非一定兩者都喜歡，例如，對於選舉有興趣的使用者可能對於廣泛概念的政治沒有興趣，並且該使用者在高維度向量1300內的向量應該據此加權。不過，類別階層之間緊密的關係可為可能有興趣或該使用者可能有興趣的未知內容類別的某些指示。

第十五圖描述例如維基百科這類知識資料庫115的示範結構。雖然知識資料庫115可包括與內容分類法165類似的內容，不過其組織為一維度空間內無子類別的平面結構，例如，政治投票權與選舉全都是類別，並無第一階與第二階的關係。高維度向量1300可從該知識資料庫內找到的類別1500來建造，從概念分類法165與知識資料庫結構115之一或兩者來產生一高維度向量1300將導致一向量代表使用者興趣，其中每一輸入或興趣都根據過往的使用者行為來加權。

第十六圖描述針對一使用者105建造的高維度向量1600，其中在映射至內容分類法165的特定主體內有特定已評估/已識別使用者興趣。高維度向量1600可包括已識別的興趣1605和1610，這兩者都具有指示使用者強烈興趣的高分(以實心黑色表示)。對應1615和1620的輸入也可指出，在此點上並不知道該使用者是否對該等對應概念有興趣。使用者興趣1605例如對應至第三階類別爵士1411，並且興趣1610對應至第一階興趣選舉1406。這兩種已加權的興趣1605和1610都表示一使用者興趣主題，其中個人化內容匯集自內容池135，且在經由內容排序單元210運用使用者描述檔160內的高維度向量1600與該內容向量以排序個人化的內容之後，呈現給使用105。

第十六a圖描述識別當前使用者未知興趣以便產生探測內容之示範方法。在此範例中，從與該使用者相關聯的高維度向量1600當中可識別某些已知的使用者興趣。這種已知的興趣已經映射至一內容分類法。根據本發明，利用根據內容分類樹推論該使用者的當前已知興趣，則可識別相同使用者的未知興趣，例如，在一具體實施例中，該系統可探測該分類樹，利用在距離該分類樹內該使用者已知興趣所映射至的每一節點的一特定距離之內移動，來識別補充的興趣。例如在第十六a圖，該使用者的興趣已經映射至主題「選舉」1406及「爵士」1411。從這兩個節點，靠近的節點例如「政治」1401或「運動」1402，可由在該分類樹內移動來識別。如此，可從該使用者的已知興趣推斷使用者的未知興趣「政策」與「運動」。根據這種已識別的未知興趣，可識別出關於這種主題的內容為探測內容，並且推薦給使用者來測試對此主題是否有興趣。

在未知興趣的搜尋當中，會有些限制，例如限制搜尋領域的距離。該內容分類法可為非常大的樹，並且當該距離設定不大時，只能探測附近類似的興趣/主題。若該距離限制設定較大，則允許探測的該未知興趣會與該使用者當前已知興趣非常不同。該使用者已知興趣與未知興趣之間要探測的實際距離可用不同方式測量。例如，沿著該內容分類樹的每一躍程都可定義為一距離單位，已知興趣與該已識別未知興趣之間的躍程數量，可迅速計算出這兩者之間的實際距離。當透過距離設定的限制為無限大時，任何未知的興趣都可用來探測使用者的興趣。在此可有其他限制，限制如合去識別未知興趣。例如，橫越該分類樹的方式可受限於只前往特定方向，例如先往上再水平移動等等。

在第十六a圖例示的範例中，「選舉」與「政治」之間的距離可為1(一躍程)，而「爵士」與「運動」之間的距離可為5(往上2個躍程並且水平躍程數量大於3)，這可看待成興趣關係距離度量，為使用者已知興趣與潛在發現該使用者有興趣的未知興趣之評價。該未知興趣探測器可根據該興趣關係距離度量「走過」該分類，以識別當前未知的興趣。

未知興趣探測器215可預設限制該探測可前進多遠，例如，該臨界可設定為10，允許非常不相關的主題用來探測一使用者，或限制設定為3來保持主題關係更接近。此外，未知興趣探測器215可偶而隨機設定該距離臨界，允許隨機主題注入至識別一完全不相關的未知興趣的躍程。

在一具體實施例中，其他距離度量也可用來識別未知興趣。這種距離度量的範例包括但不受限於：文章全體中同時出現兩個興趣、大型使用者描述檔集合內同時出現兩個興趣、及大型使用者任務集合內同時出現兩個興趣。

針對文章全體中同時出現兩個興趣，該距離度量計算如下：針對每對興趣(標示為X和Y)，該系統可計算一應變表，

其中X=1表示當該文章內出現一興趣時時，並且X=0表示當該文章內未出現興趣時，這同樣適用於Y=1和Y=0，計數量η₁₀表示其中X=1和Y=0的文章數量，這同樣適用於η₁₁、η₀₁和η₀₀。一旦編譯該矩陣，距離度量可定義為1/(1+(η₁₁*η)/(η₀₁*η₀₁))的取對數的勝算比，其中η=η₀₀+η₀₁+η₁₀+η₁₁。

在另一具體實施例中，從查看大型使用者集合的興趣描述檔中，也可計算類似的同時出現。針對每一對興趣(X和Y)，該系統可如上面計算一應變表，不過此時η₁₀表示在其描述檔內具有興趣X(X=1)同時在其描述檔內不具有Y(Y=0)的使用者數量。同樣地，也可計算η₁₁、η₀₁和η₀₀。一旦全部四個都已經計算，則計算該距離度量內取對數的勝算比。

在另一具體實施例中，從查看大型使用者任務集合的興趣中，也可計算類似的同時出現。針對每一對興趣(X和Y)，該系統可如上面計算一應變表，不過此時η₁₀表示在該任務中所呈現具有興趣X(X=1)同時在相同任務內不具有Y(Y=0)的使用者任務數量。在一具體實施例中，該任務可定義為該使用者與該應用程式的一系列互動。任務由不活動的長期間s所限定(例如30分鐘或更久)，利用查看使用者在任務期間點擊的文章中之興趣，來計算使用者興趣存在或缺少。

如此計算出η₁₁、η₀₁和η₀₀的類似值。針對其他具體實施例，則計算出取對數的勝算比當成該距離度量。

不管使用何種計算方法，一旦已經定義多個距離度量，則計算出該應變表-這可結合來產生更好的距離度量。

在一具體實施例中，複數個距離度量可結合在一起，建立更可預測的距離度量。利用查看該使用者在應用程式內點擊的補充內容次數，就可決定距離度量的預測乘方。

第十七圖例示未知興趣探測器215的具體實施例。在此具體實施例中，未知興趣探測器215接收來自使用者描述檔160、內容分類法165、內容來源110、內容池135及未知興趣搜尋參數1750的輸入，以產生傳送至內容排序單元210的探測內容。

未知興趣探測器215包括已知興趣識別器1705、內容獲取器 150、補充興趣識別器1715、補充內容識別器1720、補充興趣池1725、補充內容池1730、隨機內容選擇器1735、本機型內容篩選1740以及補充內容選擇器1745。已知興趣識別器1705從使用者描述檔160接收一使用者興趣的高維度向量1600，並且識別該使用者105的該已知興趣。這些興趣傳遞至接收未知興趣搜尋參數1750的補充興趣識別器1715，其中該等參數將是該內容分類樹上的該距離參數，例如從此將識別補充興趣。其可為簡單數字，即是1-5，或可為隨機產生低於最大的距離臨界值的數字。其也可根據如上述的某些其他使用者指示器來計算。使用內容分類法165的該輸入，識別關於一或多個已知興趣之每一者的一組補充興趣，並且在搜尋參數1750之內識別這種補充興趣。該已設別的補充興趣之每一者都可加權。例如，根據在其發現未知興趣，每一未知興趣或補充興趣都可根據與該已知興趣的距離來加權。

一種將補充興趣加權的直覺方式係採用與該距離的成反比，即是該已知興趣與該未知興趣之間的距離越短，則權重就越高，並且距離越長，權重就越小，例如，與已知興趣距離1的補充興趣之權重將高於與已知興趣距離5的補充興趣。一旦已經識別該等補充興趣，則搭配其權重傳遞至補充興趣池1725。補充內容識別器1720可取得該資訊，並且收集藉由利用喚起內容獲取器150所識別的該等補充興趣相關之內容來擷取相關內容。該補充內容的來源可為該內容池，或可為其他一般網際網路來源。

已識別的該補充內容可根據分數來排序，例如測量補充或未知興趣與該內容之間近似度或匹配的近似度分數。該內容與該補充興趣的關聯越大，則該近似度分數就越高。然後每一段補充內容都用該近似度分數或有關該補充興趣或兩者的權重來加權，然後該補充內容放入補充內容池1730，以提供給使用者105。

此外及/或另外，隨機內容可由隨機內容選擇器1735從內容池135當中選擇，並且加入該補充內容池，在已識別的未知興趣之躍程下隨機呈現給使用者105。補充內容池1730可根據近似度/權重及/或信賴分數，將該補充內容排序，如此具有較高排序的該補充內容將以較高優先順序呈現給使用者105。

利用例如地點型內容篩選1740或其他條件篩選，例如年齡、性別等等，利用移除無關內容，亦即地理上根據當前個人屬性並無使用者105有興趣的內容，也可篩選內容池1730內的補充內容。然後在地點篩選之前與之後，由補充內容選擇器1745根據要加入內容排序單元210的探測內容之排序，從內容池1730選擇該已排序補充內容，供透過應用程式130呈現給使用者105。

第十八圖為未知興趣探測器215執行的資訊流之圖式。在步驟1800，從使用者描述檔160內儲存的資訊，識別在已知興趣識別器1705內的該使用者興趣。在步驟1805，由補充興趣識別器1715識別補充興趣。一旦已經從高維度向量識別使用者的興趣，則補充興趣搜尋參數1750由未知興趣探測器215接收，並且用來識別補充興趣的範圍。在步驟1815，在步驟1810，由補充興趣識別器1715識別的該等補充興趣係用來運用直接從內容池135與內容來源110接收內容的補充內容識別器1720來識別補充內容。在步驟1820，在有關該等補充興趣的該內容上計算近似度分數。

近似度係以該已識別供應興趣主題與該文件內容之間的關係為基礎。在步驟1825，該已識別的補充內容係根據該近似度分數及/或該等補充興趣的權重來排序，每一排序都可用來與該補充集合的興趣加權及該文章興趣權重進行加權。一不確定性測量也可加入每篇文章-並且可指定一些正/負互動。然後該已排序的補充內容傳遞至補充內容池1730。

該補充內容池的排序可採用任何方法。在一具體實施例中，可用建構補充文章池所使用的近似度來排序。在另一具體實施例中，該文章的普及可用來進行排序。因為該補充池已經預先選擇內含補充興趣候選，所以也可用隨機選擇的該文章。在步驟1830，該已排序的補充內容已經由補充內容選擇器1745從補充內容池1730當中選擇，供放入該個人化內容串流。一旦已經選取補充文章池，則與已經識別給該使用者的常規文章集合結合，此結合可用許多方式達成。在一具體實施例中，已經選擇該補充內容，然後插入文章的內容池給該使用者。在另一具體實施例中，指派分數給文章以及補充文章的內容池內每一文章，用此分數來排序，並且將文章集合及置頂文章回傳給使用者當成推薦的內容。利用結合普及度以及近似度分數，可計算出具體實施例內的該分數。最終分數也可包括從該距離計算出來的隨機因素，以便探測已知與未知興趣的空間。含具有長距離的興趣之文章將在最終分數上具有較大變化。呈現文章的推薦清單給使用者105，且使用者參與了該等文章。具有更多正向互動的文章將利用提高這些文章興趣的權重來改變使用者描述檔160。具有更多負向互動的文章將利用降低這些文章興趣的權重來改變使用者描述檔160。描述檔內的興趣越常呈現在文章內給該使用者，則與補充興趣相關聯的不確定性就越小。

第十九圖例示補充興趣識別器1715的具體實施例。補充興趣識別器1715可包括一已知興趣分析器1905、搜尋領域決定器1910、補充興趣搜尋器1915及補充興趣加權單元1920。補充興趣識別器1715從高維度向量1600接收使用者的已知興趣及其相關權重，並且識別一使用者的補充興趣及其個別權重。

第二十圖為補充興趣識別器1715的示範處理流程圖。在步驟2000，已知興趣分析器1905從使用者描述檔160接收該使用者的高維度向量。在步驟2005，搜尋領域決定器1910接收補充興趣搜尋參數1925，其可包括從該補充興趣識別器應該搜尋興趣的一已知興趣算起的距離。接下來在步驟2010，補充興趣搜尋器1915依賴來自搜尋領域決定器1910的該興趣參數，根據該等參數搜尋該等已知興趣，並且根據內容分類法165識別補充興趣。例如從第十六a圖所示，若該等搜尋參數的領域包括5的距離，則根據明確興趣爵士1411，運動1402可為一已識別的補充興趣，因為其位於定義的距離參數5之內。同樣地，具有距離=1的政治1401將為從興趣選舉1406識別的一補充興趣。

一旦識別之後，在步驟2015，計算每一補充興趣的該距離，且在步驟2020，補充興趣權重單元1920根據該距離計算每一補充興趣的權重。補充興趣權重與其距離成反比，如此距離越遠，指派給每一補充興趣的權重就越小。在步驟2025，每一補充興趣的權重可為輸出至例如補充興趣池1725的補充內容識別器1720，用來識別補充內容。

第二十一圖為補充內容識別器1720的具體實施例圖式，補充內容識別器1720包括補充內容候選分析器2105、內容相關活動分析器2110、近似度計算單元2115、確定性分數計算單元2120及補充內容選擇器 2125。

第二十二圖描述補充內容識別器1720的流程，在步驟2200，補充內容識別器1720接收來自補充興趣加權單元1920的該內容興趣權重。在步驟2205，針對已經識別的每一補充興趣，從內容池135或內容來源110獲得補充內容。一旦獲得內容，在步驟2210，近似度計算單元2115內計算該已提出補充內容與該補充興趣之間的該近似度分數。在步驟2215，在內容相關活動分析器2110內已針對有關指示廣泛品質的該內容之品質事件去分析該補充內容。這些事件可包括使用者停留時間、使用者點擊率等等。在步驟2220，利用確定性分數計算單元2120計算該潛在補充內容的信賴分數，然後在步驟2225，將該信賴分數傳遞至補充內容選擇器2125。根據該內容近似度分數以及該內容信賴分數，即是該內容的品質，在步驟2225，選取補充內容並輸出補充內容池1730。

為了實作本發明教導，可使用多種電腦硬體平台作為在此敘述之一或多個元件的硬體平台。所述電腦之該等硬體元件、操作系統與程式語言係本質上為一般的，並假設該領域技術人員對其適切熟悉，以調整這些技術以實作在此敘述之基本處理。一電腦具備複數個使用者介面元件，可用於實作一個人電腦(PC)或其他工作站或終端裝置的形式，當然在適當編程下一電腦也可做為一伺服器。相信該領域技術人員對於所述電腦設備的結構、程式與一般操作係為熟悉，而因此該圖式應該具有自我詮釋能力。

第二十三圖描述其上可實施本發明的一般電腦架構，並且具有例示包括使用者介面元件的電腦硬體平台之功能方塊圖。該電腦可為一般用途電腦或特殊用途電腦，此電腦2300可用來實施如本說明書所述該未知興趣識別器架構的任何組件。一或多個電腦上，例如電腦2300，透過其硬體、軟體程式、韌體或這些的組合可實施本發明內該系統的不同組件。雖然為了方便起見只顯示一部這種電腦，不過關於該目標度量識別的該等電腦功能可用分散方式在許多類似平台上實施，以分散處理負擔。

電腦2300例如包括COM連接埠2302連接並形成相連的網路，幫助資料通訊。電腦2300也包括一中央處理單元(CPU)2304，以一或多個處理器的形式，用來執行程式指令。該示範電腦平台包括一內部通訊匯流排2306、不同形式的程式儲存裝置與資料儲存裝置，例如磁碟2308、唯讀記憶體(ROM)2310或隨機存取記憶體(RAM)2312，讓許多資料檔案由該電腦處理及/或通訊，及由該CPU執行的可能程式指令。電腦2300也包括一I/O組件2314，支援該電腦與其中其他組件，例如使用者介面元件2316之間的輸入/輸出流。電腦2300也可透過網路通訊接收編程與資料。

因此，從已知興趣探索使用者未知興趣的方法態樣，如上述，可在編程當中實施。本技術的程式態樣可當作「產品」或「製造物品」，通常是可執行程式碼及/或相關資料的形式，可在一種機器可讀取媒體上執行或嵌入其內。有形非暫態「儲存」類型媒體包括用於電腦、處理器等等的任意或所有記憶體或其他儲存裝置，或其相關模組，例如許多半導體記憶體、磁帶機、磁碟機等等，可在任何時間上提供儲存能力給該軟體編程。

全部或部分軟體可有時透過網路通訊，例如網際網路或許多其他電信網路，這種通訊例如可從一部電腦或處理器將軟體載入另一部，如此可承載軟體元件的其他種媒體包括光、電和電磁波，如此可通過本機裝置之間的實體介面、透過有線與光纖網路以及透過許多空中連結來使用。承載這種波的實體元件，例如有線或無線連結、光學連結等等，也可考慮當成承載該軟體的媒體。如本說明書內所用，除非限制為有形「儲存」媒體，則例如電腦或機器「可讀取媒體」這類用詞代表參與提供指令給處理器供執行的任何媒體。

因此，機器可讀取媒體可採用許多形式，包括但不受限於有形儲存媒體、載波媒體或實體傳輸媒體。非揮發性儲存媒體包括例如光碟或磁碟，例如任何電腦內的任何儲存裝置等等，其可用來實施該系統或圖式所示的任何組件。揮發性儲存媒體包括動態記憶體，像是這種電腦平台的主記憶體。有形傳輸媒體包括同軸纜線、銅線以及光纖，包括形成電腦系統之內匯流排的線路。載波傳輸媒體也可採用電或電磁信號的型態，或聲音或光波，像是在射頻(RF)與紅外線(IR)資料通訊期間所產生的。因此電腦可讀取媒體的常見形式包括例如，軟碟、彈性磁碟、硬碟、磁帶、任何其他磁性媒體、CD-ROM、DVD或DVD-ROM、任何其他光學媒體、打孔卡、紙帶、具有打孔圖案的任何其他實體媒體、RAM、PROM和EPROM、FLASH-EPROM、任何其他記憶體晶片或卡匣、載波傳送的資料或指令、纜線或連結傳送，例如載波，或電腦可讀取編程程式碼及/或資料的任何其他媒體。電腦可讀取媒體的這許多形式可牽涉到攜帶一或多個指令的一或多個系列給一處理器來執行。

精通技術人士應瞭解，本發明可接受許多的修改及/或強化，例如，雖然上述許多組件的實施可在一硬體裝置內具體實施，但是其也可實施為只有軟體解決方案。此外，本說明書所揭示該系統的該等組件可實施成為一韌體、韌體/軟體組合、韌體/硬體組合或硬體/韌體/軟體組合。

雖然前面已經描述了據信為最佳的模式及/或其他範例，不過應瞭解，在此可進行許多修改，並且本說明書內揭示的主題可用許多形式與範例來實施，並且本發明可套用在許多應用當中，本說明書中僅描述其中一部分。因此將用以下的申請專利範圍，主張位於本發明真實領域之內的任何與所有應用、修改與變化。

105‧‧‧使用者

110‧‧‧內容來源

115‧‧‧知識資料庫

125‧‧‧廣告主

130‧‧‧應用程式

135‧‧‧內容池

155‧‧‧使用者了解單元

160‧‧‧使用者描述檔

165‧‧‧內容分類法

170‧‧‧關聯資訊分析器

175‧‧‧使用者事件分析器

180‧‧‧長期興趣識別器

185‧‧‧短期興趣識別器

210‧‧‧內容排序單元

215‧‧‧未知興趣探測器

Claims

一種用於識別一使用者的內容之方法，該方法係於一機器上實施，該機器具有至少一處理器；儲存裝置；及一通訊介面，該通訊介面連接一網路，該方法包括：取得有關一使用者的資訊，其中該資訊指示該使用者的一或多個興趣；根據該資訊以識別該使用者的至少一興趣；決定關於該使用者的該識別至少一興趣之每一者的一或多個補充興趣，其中該等一或多個補充興趣不會重疊該使用者的該等一或多個興趣；及識別關於該使用者的該識別至少一興趣之每一者的該等一或多個補充興趣相關聯的補充內容，其中該等一或多個補充興趣相關聯的該補充內容用來探索該使用者的未知興趣。
如申請專利範圍第1項之方法，更包括：識別該補充內容中的每一內容片段與其對應的補充興趣之間的關聯性；根據該關聯性將該補充內容中的每一內容片段排序；根據該排序選擇該補充內容中的至少某內容片段；及輸出來自該補充內容的該選定內容。
如申請專利範圍第1項之方法，更包括：隨機獲得內容；及將該隨機獲得內容加入該補充內容。
如申請專利範圍第2項之方法，更包括根據一條件篩選該補充內容中的該已排序內容。
一種用於識別未知使用者內容的系統，該系統包括：一取得單元，用於取得有關一使用者的資訊，其中該資訊指示該使用者的一或多個興趣；一興趣分析器，用於根據該資訊識別該使用者的至少一興趣；一補充興趣識別器，用於決定有關該使用者的該識別至少一興趣之每一者的一或多個補充興趣，其中該等一或多個補充興趣不會重疊該使用者的該等一或多個興趣；及一補充內容識別器，用於識別關於該使用者的該識別至少一興趣之每一者的該等一或多個補充興趣相關聯的補充內容，其中該等一或多個補充興趣相關聯的該補充內容用來探索該使用者的未知興趣。
如申請專利範圍第5項之系統，更包括：一補充加權單元，用於識別該補充內容中的每一內容片段與其對應補充興趣之間的關聯性；一排序單元，用於根據該關聯性將該補充內容中的每一內容片段排序；一選擇器，用於根據該排序選擇該補充內容中的至少某內容片段；及一輸出，用於輸出來自該補充內容的該選定內容。
一種非暫態機器可讀取媒體，其上記錄資訊用來識別未知使用者興趣，其中由一機器讀取該資訊時，該資訊導致該機器執行以下步驟：取得有關一使用者的資訊，其中該資訊指示該使用者的一或多個興趣；根據該資訊識別該使用者的至少一興趣；決定關於該使用者的該至少一興趣之每一者的一或多個補充興趣，其中該等一或多個補充興趣不會重疊到該使用者的該等一或多個興趣；及識別關於該使用者的該識別至少一興趣之每一者的該等一或多個補充興趣相關聯的補充內容，其中該等一或多個補充興趣相關聯的該補充內容用來探索該使用者的未知興趣。
如申請專利範圍第7項之媒體，其中該資訊由該機器讀取時，該資訊進一步使該機器執行以下步驟：識別該補充內容中的每一內容片段與其對應的補充興趣之間的關聯性；根據該關聯性將該補充內容中的每一內容片段排序；根據該排序選擇該補充內容中的至少某內容片段；及輸出來自該補充內容的該選定內容。
如申請專利範圍第1項之方法，其中決定步驟包括：評估複數個候選補充興趣之每一者的度量；及根據其有關一臨界值的個別度量，選擇該等一或多個補充興趣。
如申請專利範圍第9項之方法，其中該度量包括下列之至少一者：在一內容分類法中兩興趣之間的一距離；在一內容集合中兩興趣的同時發生；在一組使用者描述檔中兩興趣的同時發生；在一組使用者任務中兩興趣的同時發生；及以上的任意組合。
如申請專利範圍第1項之方法，其中根據該使用者與該補充內容之間的互動，探索該使用者的該未知興趣。
如申請專利範圍第5項之系統，更包括一隨機內容選擇器，其構成用來：隨機獲得內容；及將該隨機獲得的內容加入該補充內容。
如申請專利範圍第5項之系統，其中該補充興趣識別器更構成用來：評估複數個候選補充興趣之每一者的度量；及根據其有關一臨界值的個別度量，選擇該等一或多個補充興趣。
如申請專利範圍第13項之系統，其中該度量包括下列之至少之一者：在一內容分類法中兩興趣之間的一距離；在一內容集合中兩興趣的同時發生；在一組使用者描述檔中兩興趣的同時發生；在一組使用者任務中兩興趣的同時發生；及以上的任意組合。
如申請專利範圍第5項之系統，其中根據該使用者與該補充內容之間的互動，探索該使用者的該未知興趣。
如申請專利範圍第6項之系統，其中根據一條件篩選該補充內容中的該已排序內容。
如申請專利範圍第7項之媒體，其中該資訊由該機器讀取時，該資訊進一步使該機器執行以下步驟：隨機獲得內容；及將該隨機獲得的內容加入該補充內容。
如申請專利範圍第7項之媒體，其中決定步驟包括：評估複數個候選補充興趣之每一者的度量；及根據其有關一臨界值的個別度量，選擇該等一或多個補充興趣。
如申請專利範圍第18項之媒體，其中該度量包括下列至少之一者：在一內容分類法中兩興趣之間的一距離；在一內容集合中兩興趣的同時發生；在一組使用者描述檔中兩興趣的同時發生；在一組使用者任務中兩興趣的同時發生；及以上的任意組合。
如申請專利範圍第7項之媒體，其中根據該使用者與該補充內容之間的互動，探索該使用者的該未知興趣。