TWI424369B - 用於決定內容相關性的活動型使用者興趣模型化 - Google Patents

用於決定內容相關性的活動型使用者興趣模型化 Download PDF

Info

Publication number
TWI424369B
TWI424369B TW099121797A TW99121797A TWI424369B TW I424369 B TWI424369 B TW I424369B TW 099121797 A TW099121797 A TW 099121797A TW 99121797 A TW99121797 A TW 99121797A TW I424369 B TWI424369 B TW I424369B
Authority
TW
Taiwan
Prior art keywords
user
interest
profile
action
topics
Prior art date
Application number
TW099121797A
Other languages
English (en)
Other versions
TW201104617A (en
Inventor
Hemanth Sambrani
Rohan Monga
Sudharsan Vasudevan
Sanjeev Gupta
Original Assignee
Yahoo Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yahoo Inc filed Critical Yahoo Inc
Publication of TW201104617A publication Critical patent/TW201104617A/zh
Application granted granted Critical
Publication of TWI424369B publication Critical patent/TWI424369B/zh

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/335Filtering based on additional data, e.g. user or group profiles
    • G06F16/337Profile generation, learning or modification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • Development Economics (AREA)
  • Finance (AREA)
  • Data Mining & Analysis (AREA)
  • Accounting & Taxation (AREA)
  • Strategic Management (AREA)
  • General Engineering & Computer Science (AREA)
  • Game Theory and Decision Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Computational Linguistics (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Information Transfer Between Computers (AREA)

Description

用於決定內容相關性的活動型使用者興趣模型化
本發明係關於建立與運用使用者設定檔(profile),尤其係關於建立內含有關使用者興趣的資訊之設定檔。
隨著網際網路持續擴展,有效管理大量資訊並且將最相關資料傳送給使用者的難度越來越高。今日的資料庫內儲存為數眾多的電子資料,並且現今的搜尋引擎擁有豐富的資源,提供通常於單一網頁上顯示不完的大量資訊。因此,網站必須根據該等使用者的興趣訂製顯示給使用者的資訊。
使用者興趣資訊的使用
知道使用者有興趣的資訊類型,有助於將大量資訊過濾到剩下最有可能吸引使用者注意的資料,例如:知道該使用者喜歡瀏覽新聞標題並且對運動有興趣,可能促使該網站選擇主要屬於運動比賽、運動實況報導、運動公告等的標題顯示給使用者,並且放棄內含政治、經濟等的標題。
再者,知道該使用者有興趣的資訊類型也對網際網路商務有所幫助。將使用者可能有興趣的廣告顯示給該使用者,可提高該使用者實際購買該網站所廣告產品或服務的機會,例如:若知道該使用者對運動,尤其是高爾夫有興趣,則顯示有關高爾夫設備、高爾夫球場、高爾夫賽事等的廣告,會比顯示與高爾夫無關的廣告還要有商業價值。
此外,知道該使用者有興趣的資訊類型,對於調整回應該使用者查詢所提供的搜尋結果有幫助,例如:若知道該使用者最近加入PGA Tour網站所屬的網際網路聊天室,並且若該使用者提交有關「巡迴賽」的搜尋查詢,則可推斷出該使用者想要觀看PGA Tour網站、至PGA Tour相關聊天室的連結以及關於PGA高爾夫巡迴賽的其他連結。
決定使用者的興趣
可接受使用許多方法與許多來源,來決定該使用者有興趣的資訊類型,例如:可根據該使用者所提供當在許多網站、使用者群組、像是FacebookTM、MySpaceTM、TwitterTM等這些網際網路社交網路上建立自身設定檔之使用者資訊,來決定使用者的興趣。雖然建立了使用者設定檔,但是也可促使使用者指定使用者自身的興趣、喜好與厭惡者。
再者,可根據該使用者使用網際網路所閱讀、書寫或張貼的文件,來決定使用者的興趣,例如:知道該使用者撰寫有關運動的文章,尤其是關於「紐約洋基隊」,這可幫助決定使用者對於與「紐約洋基隊」相關的文章、部落格、報導等非常有興趣。
此外,根據該使用者加入的聊天室類型、該使用者造訪的網站類型、使用者所玩的網際網路遊戲類型、該使用者執行的搜尋等,可決定使用者的興趣。本技藝中亦已知其他決定使用者興趣的方法。
伺服器日誌(sever logs)可收集有關該使用者瀏覽過的網站之資訊,並且特殊應用程式可存取該使用者的裝置或該使用者的應用程式,例如:若該使用者擷取由特定公司控制的網站所提供之網頁,該公司可追蹤例如有關該使用者所擷取之網頁的資訊。若該使用者從不受該特定公司控制的網站擷取網頁,若例如來自該特定公司的工具列已經安裝在該使用者用來造訪該網頁的瀏覽器上,則該公司仍舊可追蹤該使用者所造訪的網頁。
用於收集使用者興趣資訊的工具
許多軟體應用程式已經開發用來收集有關使用者及其興趣的資訊,這種應用程式的範例為SearchFoxTM ,其在簡易資訊聚合(Really simple syndication,RSS)饋送當中收集有關該等使用者主題喜好的歷史資訊。
另一種用於收集該等使用者相關資訊的方法係以該等RSS饋送方式為基礎,根據該方式,建立從許多伺服器要求資訊的該等使用者之設定檔。RSS饋送聚合器可追蹤該等使用者執行的活動,以及該等使用者所選擇的連結,例如:該應用程式追蹤選取的網頁連結、部落格輸入、選取的新聞標題、播放的音軌、觀看的短片等。
其他用於收集有關該等使用者資訊的方式為根據Yahoo!TM 所開發,稱為內容最佳化認知引擎(Content Optimization Knowledge Engine,COKE)的人工智慧系統。COKE收集許多有關該等使用者的資訊,並且根據這些資訊與因素,像是每日之特定時間、每年之特定時間等,推斷該等使用者可能有興趣的內容類型,並且針對分配給該等使用者之內容個人化。
不過就自身來說,收集有關該使用者與該用者過去活動的資訊,通常並不足以決定目前哪個使用者之興趣對於該使用者而言最重要。收集該使用者的資訊可提供該使用者過去對哪些主題有興趣之指示,但是無法指出目前哪個興趣對該使用者而言比較重要或比較不重要。另一個只收集該使用者興趣之該資訊的問題在於,無法提供指示指出哪種興趣為長期興趣,而哪種只是出自於好奇。
本章節內描述的方式為可追求的方式,但是並非之前已經構想出或追求過的必要方式。因此除非有所指示,則不應假設由於包含在本章節內,所以本章節內描述的方式之任一者皆適用於先前技術。
在下列說明中,為了解釋,將公佈許多特定細節以提供對本發明通盤的了解。不過,吾人可瞭解到,在沒有這些特定細節的情況下也可實施本發明。在其他實例中,已知的結構與裝置都以方塊圖來顯示,以避免模糊本發明。
一般概觀
在此描述用於活動型使用者興趣模型化之技術。有關該等使用者在特定時期內表達出來的興趣之資訊都儲存在稱為設定檔的資料結構內,設定檔包含有關該等使用者有興趣之主題的資訊。
每一設定檔都關聯於一「設定檔目標」。一設定檔的該設定檔目標為其興趣反應在該設定檔內的實體。一「設定檔目標」可包含多位使用者,或可只包含一位使用者。為了解釋,當設定檔的設定檔目標包含多位使用者時,這些使用者之每一者也單獨稱為該設定檔的設定檔目標。
根據一個具體實施例,監視該設定檔目標所執行的該等動作。偵測到該設定檔目標執行特定動作時,一設定檔管理系統也決定(a)對應至該特定動作的動作類型,以及(b)與該特定動作相關聯的內容。
有關該等動作、該等動作類型以及與該等動作相關聯之該等內容的該資訊都經過處理,來決定該設定檔目標有興趣的該等主題、設定檔目標對於每一主題有多少興趣以及隨時間經過,哪些主題對於該設定檔目標變得較為重要或較不重要。
在一個具體實施例內,可根據該設定檔目標隨時間經過所表達出來的有關該等興趣之該資訊,來計算該設定檔目標,即是有關該設定檔目標的該等興趣之累積認知。該累積認知包含有關該設定檔目標有興趣之該等主題的該資訊,以及用於決定對該設定檔目標來說哪些主題目前比過去還要重要之資訊。
此後也描述產生資訊的技術,其反映出設定檔目標中一個成員的該等興趣對於相同設定檔目標中其他成員的該等興趣之相對重要性。
設定檔管理系統
第一圖為根據本發明之具體實施例,例示用於管理設定檔的系統100之範例方塊圖。系統100包含一或多位使用者120a、…、120n,其連接至電腦網路160,並且透過電腦網路160彼此通訊以及與許多網站通訊。
電腦網路160可為促成該等使用者之間通訊,並且提供網際網路服務給該等使用者的任何網路類型,例如:電腦網路160可為讓使用者120a、…、120n透過服務供應商之設備、數據機、電話線等連接的網際網路。
根據一個具體實施例,電腦網路160可為與網際網路通訊性耦合的區域網路或廣域網路。另外,電腦網路160可以不只是一個網路,而可以是使用許多通訊協定彼此通訊並且提供許多服務的許多異質性網路(heterogeneous networks)構成之網路。
使用者120a、…、120n為透過任何電子裝置類型,運用來自任何服務供應商類型的任何服務類型,來存取電腦網路160的使用者,例如:使用者120a、…、120n可從電腦工作站、膝上型電腦、主機電腦、個人數位助理裝置等存取電腦網路160,並且可使用許多技術、許多設備以及許多通訊協定與網際網路連線。
使用者120a、…、120n可從許多網站擷取網頁,例如:使用者120a、…、120n可將網頁載入其瀏覽器內、使用該等瀏覽器執行文件搜尋、撰寫文件並使用該瀏覽器張貼該等文件、透過網際網路從該瀏覽器啟動許多應用程式等。
使用者120a、…、120n可透過電腦網路160連上許多網站,該等網站可受到對應的網站管理模組130a、…、130m所管理,例如:當使用者120a從網站A載入網頁時,網站管理模組130a決定並且監督該使用者瀏覽器上顯示的資訊、決定需要從哪些來源收集所要求之資訊、決定如何分類、過濾、排列以及顯示資訊給使用者120a、決定可顯示哪種廣告等。網站管理模組130a、…、130m也可收集有關該使用者的資訊、建立使用者設定檔的儲藏庫(repository)、收集並更新有關該使用者的資訊、追蹤有關該使用者搜尋、使用者喜愛站台、使用者聯會與使用者群組、社交網路的資訊等。
網站管理模組130a、…、130m也可從連接至電腦網路160的許多網站、伺服器和資料庫要求有關該使用者的資訊,例如:網站管理模組130a、…、130m可要求有關該使用者興趣的資訊,來決定該使用者對於哪些主題有興趣。
根據一個具體實施例,設定檔管理系統110為系統100的一個元件。設定檔管理系統110收集有關該使用者動作的資訊,並且決定可擷取該使用者所表達之興趣的該使用者設定檔。設定檔管理系統110可建立該使用者的設定檔、決定個別使用者或群組使用者的興趣如何隨時間改變,以及決定該個別使用者的興趣與該使用者所屬群組的興趣間之關係。
設定檔管理系統110可為網站管理系統130a、…、130m的任一者之部分,或可為與網路160通訊性耦合的獨立專屬(standalone)系統。另外,設定檔管理系統110可實施為透過網路160與網站通訊的用戶端應用程式。
設定檔管理系統110包含動作分析器112、內容分析器114、使用者興趣管理器116以及設定檔管理器118。設定檔管理系統110的所有元件都可彼此通訊連接,並且可共享該等資源,像是資訊、資料庫等。
動作分析器112為電腦實施模組,其收集有關該使用者與使用者動作的資訊。利用存取儲存在該使用者電腦裝置上、儲存在許多伺服器上及/或許多資料庫內之資訊,可收集有關該使用者動作的資訊,例如:有關該使用者動作的資訊可從該使用者的電腦存取、由許多伺服器收集、由特殊應用程式追蹤等。根據另一範例,可使用像是SearchFoxTM 、RSS Feeds、COKE、網站工具列等這類工具,來收集有關該使用者動作的資訊。
動作分析器112分析該收集的資訊、識別該使用者執行的動作並且決定該等動作的動作類型,以下將描述動作類型。
動作分析器112所收集與計算的該資訊可儲存在稱為分析器資料庫150的資料庫內,分析器資料庫150可在與網路160通訊性耦合的獨立專屬伺服器內實施,或可為設定檔管理系統110的一部分。
內容分析器114的主要功能在於識別與該使用者動作相關聯的內容,並且分析與該等動作相關聯的該等內容。分析該等內容的目的在於決定該等內容係關於何事,例如:若該使用者撰寫文件並且將之張貼在網際網路上,則內容分析器114將檢查該文件內容,並且決定該文件內所討論主題/標題的清單。以下提供有關該內容分析的細節。
使用者興趣管理器116收集來自動作分析器112、內容分析器114以及與設定檔管理系統110通訊性耦合的資料庫之資訊,並且處理該資訊來決定該設定檔目標的興趣,例如:使用者興趣管理器116可決定該設定檔目標對於個別主題有多大的興趣,以及隨時間經過這些主題中哪一者對於該設定檔目標變得比較重要或比較不重要。以下提供有關使用者興趣管理器116的細節。
設定檔管理器118收集來自設定檔管理系統110其他模組的資訊,並且根據該資訊以及與設定檔管理系統110相關聯之儲存於分析器資料庫150內的資訊,來決定該設定檔目標的興趣,例如:設定檔管理器118決定該設定檔目標之個別成員的興趣如何影響該設定檔目標之其他成員之結合的興趣,以及該設定檔目標之其他成員之結合的興趣如何影響該設定檔目標之個別成員的興趣。此外,設定檔管理器118決定該設定檔目標的興趣如何隨時間改變,以及哪種興趣不隨時間經過改變對該設定檔目標的重要性。以下提供有關設定檔管理器118的細節。
有關設定檔的資訊可儲存在稱為設定檔資料庫140的資料庫內,此資料庫可在獨立專屬伺服器內實施,或可為分析器資料庫150的一部分。
使用者與設定檔目標
根據一個具體實施例,使用者為從與該網路通訊性耦合的電子裝置存取電腦網路之電腦網路使用者。特定於該使用者或該設定檔目標的資訊可包含設定檔目標的人口統計特性,像是年齡、性別、居住地、使用者的計算裝置組態等,例如:一個設定檔目標可包含住在加州、年齡20-25的男性,而另一個設定檔目標可包含住在加州聖荷西、年齡25-30的女性。
根據另一範例,特定於設定檔目標的資訊可包含有關該等使用者群組或與該使用者關係密切的社交網路之資訊。根據其他範例,有關該使用者興趣的該資訊可儲存在設定檔內。
收集有關設定檔目標的資訊
可從許多來源並且使用許多方法收集有關該設定檔目標的資訊。如上述,某些使用者在加入使用者群組、設定許多電腦帳號、加入社交網路,像是FaceBookTM、TwitterTM等之時輸入與他們自身相關的資訊。
利用攔截有關該等使用者在使用網際網路時所執行之動作之資訊,來收集其他資訊,例如:該收集的資訊可包含關於瀏覽、張貼部落格、讀取電子廣告等的該等細節。
使用許多方法和工具可攔截有關該等設定檔目標的資訊,例如:該資訊可從「網路瀏覽器的記錄標記」(cookies)收集、由來自許多網站、工具列等伺服器記錄收集。例如若該使用者與一公司的網站互動,該公司可輕鬆監視該使用者的動作。
不過若該使用者與不受公司網站管理的站台(第三方站台)互動,則可由該公司提供並安裝在該使用者的瀏覽器上的工具列所收集有關該使用者之資訊。如此該工具列可收集有關該使用者、該使用者的動作以及該使用者閱讀或撰寫的文件之資訊。
動作與動作類型
由使用者執行的許多動作可分成動作群組,並且每一動作群組都指定一種特定動作類型,例如:若使用者正撰寫部落格,則與撰寫該部落格的動作相關聯之動作類型可稱為「創作部落格」(blogging)。「創作部落格」動作類型可指定給在某方面關於創作部落格的動作,即是撰寫部落格、閱讀部落格、張貼部落格等。根據另一範例,稱為「瀏覽」的動作類型可指定給需要啟動瀏覽器、使用瀏覽器、傳送搜尋查詢給瀏覽器等的動作。其他動作類型可包含檢視、贊成、頁面檢視、點擊連結、傳送電子郵件、記錄書籤、張貼照片、設計網頁等。
在一個具體實施例內,如第一圖內所示意,由設定檔管理系統110監視設定檔目標所執行的動作,例如:請參閱第一圖,屬於特定設定檔目標的使用者120a(第一圖內未示出)開始要求網際網路資源的動作時,位於該使用者計算裝置上、網站管理模組130a、…、130m之任一者上或設定檔管理系統110上的特殊用戶端應用程式攔截有關該動作之資訊,並且提供該資訊給動作分析器112。
在該使用者執行的許多動作之間,特定動作會比其他動作對該使用者而言更為重要,因此特定動作可指示其中該使用者更有興趣的主題。這根據最可能是該動作需付出越多努力,則該使用者對該動作主題越有興趣之觀察,例如:在「創作部落格」與「贊成」動作之間,創作部落格比起贊成對於該使用者來說更重要,因為創作部落格比贊成需要該使用者付出較多努力(即是作文並修訂該文章),贊成只需要略讀文章並且點擊該選取的按鈕即可。
在一個具體實施例內,根據該使用者執行頻率來排序該等動作,例如:動作分析器可分析由該使用者執行的兩個動作,並且可決定該使用者執行頻率比另一個還高的動作可能對於該使用者來說最重要。這種決定係根據若重複相同動作很愉快的話,人們通常會重複執行相同動作之觀察。再者,該使用者長時間執行並且長時間內定期重複的該等動作可視為長期動作,並且最有可能指示該使用者的長期興趣。
在另一方面,該使用者鮮少或偶爾執行的該動作可為不僅只是好奇心的動作之範例,例如:若該使用者點擊關於「時尚」的自發性廣告的情況下,則該使用者對於「時尚」的興趣與其說是長期興趣,還不如說是「好奇心」比較適當。
根據一個具體實施例,針對所有使用者來全面排序動作,例如:經常執行的動作視為對該等使用者而言比較重要的動作,而很久以前執行過的動作視為目前對該等使用者較不重要的動作。這種順序的基本原理係根據觀察到使用者的興趣隨時間而改變,並且該等使用者過去有興趣的現在不一定有興趣。
與動作相關聯的內容
根據一個具體實施例,動作可具有相關聯的內容。該內容可為指示該內容主題的任何文字、詞彙或片語,這種文字或詞彙可從使用者撰寫、張貼在網際網路上、讀取等的該等文件內擷取,並且與內含已經定義主題的參考指南比較。
已知主題的指南可編排成為內含記錄的清單,其中每一筆記錄都包含一個主題以及至少語意上關於該主題的一個文字、詞彙或片語,例如:非常簡單的指南可包含下列記錄:{cars:(car ,cars ),efficiency:(efficiency ,efficient ,efficiently },其中「cars」和「efficiency」為主題,並且該等剩餘文字在語意上分別關於該等「cars」和「efficiency」。
在一個具體實施例內,利用將來自該指南的文字/詞彙/片語與該特定內容內呈現的文字/詞彙/片語匹配,來執行決定指示該內容的主題,並且對於匹配的該等文字/詞彙/片語而言,從該指南當中決定對應的主題,例如:若非常簡單的指南包含下列記錄:{cars:(car ,cars ),efficiency:(efficiency ,efficient ,efficiently },並且該內容包含下列文字「The President unveils carefficiency standards」,則指示該內容的該主題集可包含:{cars,efficiency}。
在一個具體實施例內,由該使用者執行的動作可具有相關聯的內容。與該等動作相關聯的內容之範例包含,但不受限於該使用者撰寫或張貼的文字、該使用者要求的頁面、該使用者檢視的文件等。參照上面的範例,若該使用者「正在閱讀部落格」,則該相關聯的內容可為「創作部落格」時該使用者閱讀到的文字。根據另一範例,若使用者正在瀏覽網際網路,則與「瀏覽」相關聯的內容可為該使用者下載的網頁之網址(Uniform Resource Locator,URL)位址,或是一旦該使用者選擇特定連結時顯示給該使用者的網頁文字。
不過,決定與其他動作相關聯的內容會比決定用於「創作部落格」或「瀏覽」的該內容複雜許多。例如:若動作為在FacebookTM 網頁上「張貼相片」,則因為該相片的內容為點陣圖、jpeg/tiff檔案等,並非文件檔案,所以與該動作相關聯的該內容並不明顯。在這種情況下,與「張貼相片」相關聯的內容可使用中繼資料決定,像是內含該相片的檔名。
根據另一範例,若使用者在使用者群組網站上張貼一首歌,則與「張貼一首歌」相關聯的內容不可為歌曲內容,因為該歌曲可能為例如mp3格式,不是文件格式。在這種情況下,與「張貼該歌曲」相關聯的內容可決定為例如歌名或內含該歌曲的檔名。
分析該內容
在一個具體實施例內,分析與動作相關聯的內容,並且決定指示特定於該內容的主題之文字、詞彙或片語。
不過,並非該內容內呈現的所有文字/詞彙/片語都必須指示特定於該內容的主題,例如:像是「和」(and)、「我」(I)、「但」(but)等字就很難指出該內容係關於何事。
將該內容與內含已定義主題的參考指南比較,可決定指示內容主題的文字、詞彙或片語,該指南可為系統設計者視為可辨識主題,並且作為額外主題來更新的主題之集合。
已知主題的該指南可編排成為內含記錄的清單,其中每一筆記錄都包含一個主題以及至少語意上關於該主題的一個文字、詞彙或片語,例如:非常簡單的指南可包含下列記錄:{cars:(car ,cars ),efficiency:(efficiency ,efficient ,efficiently },其中「cars」和「efficiency」為主題,並且該等剩餘文字在語意上分別關於「cars」和「efficiency」。
在一個具體實施例內,利用將來自該指南的文字/詞彙/片語與該特定內容內呈現的文字/詞彙/片語匹配,來執行決定指示該內容的主題,然後識別與所匹配文字/詞彙/片語相關聯的該指南內之主題,例如:若非常簡單的指南包含下列記錄:{cars:(car ,cars ),efficiency:(efficiency ,efficient ,efficiently },並且該內容包含下列文字「The President unveilscar efficiency standards」,則指示該內容的主題集可包含:{cars,efficiency}。內容分析可由第一圖內示意的內容分析器114來執行。
稜鏡向量
文件的內容可呈現在許多結構內,並且運用許多方法。呈現文件內容的該等方式其中之一可來自於稱為PRISMA/DB的工具,其為一種全面平行、相關聯資料庫管理系統(Database management system,DBMS)。PRISMA/DB的該設計與實施細節都說明於「portal.acm.org」網域的「citation.cfm?id=627541&jmp=cit&coll=GUIDE&dl=GUIDE&CFID=36518547&CFTOKEN=53129838#CIT」網頁上。
PRISMA/DB所使用的資料結構其中之一為「稜鏡向量」(prisma vector),其用來作為文件內容的簡潔代表。稜鏡向量具有可變長度,並且可包含許多資料欄位來儲存詞彙及其參數。
為了決定文件內容,將該稜鏡向量定義為包含一組配對的向量為足夠的,其中每一配對包含一個主題以及與該主題相關聯的主題權值。該等主題的範例包含文件內容內識別的文字、詞彙、片語等,其也決定作為該文件內容的指示以及該文件嘗試對準的興趣之暗示,例如:使用者造訪網頁P1,此網頁碰巧專屬於政治新聞、政治事件、政治評論等,而範例網頁P1可為網域「www.google.com」內的網頁「hostednews/afp/article/ALeqM5i-7wC-radTtoREZBhXL6SsxeKD3g」。
網頁P1具有相關聯的「內容p1」,其中包含該網頁上顯示的許多文字、詞彙與片語。內容分析器針對先前建立的內容指南來分析網頁P1之內容,並且決定來自該內容指南的許多詞彙與片語也呈現該「內容p1」內,該內容分析器選擇這些詞彙與片語作為該網頁的「內容p1」之指示。在此範例中,選取的主題為:「cars」、「AFP」、「efficiency standard」、「Barack Obama」、「regulations」以及「auto industry」。
主題權值
在一個具體實施例內,每一主題都擁有相關聯的主題權值。與特定主題相關聯的主題權值可指示該特定主題對該使用者整體興趣之計算貢獻多少權值。
主題權值取決於許多因素,像是:在對應至該特定主題的文字/詞彙/片語表達於內容之哪個部分、對應至該特定主題的該等特定文字/詞彙/片語在該內容內發生多少次等。
根據一個具體實施例,該等主題權值也可取決於該使用者所執行的動作類型,例如:對應至與「創作部落格」相關聯之內容內識別的主題「cars」之主題權值可高於自發性電子廣告內所顯示內容內識別的相同主題「cars」之權值。「創作部落格」內識別的該主題「cars」可具有比若在該自發性廣告內識別的還要高之權值,因為依照關於汽車的「創作部落格」,該使用者實際表達對於「cars」的興趣,而依照觀看該自發性廣告,該使用者並未表達出任何興趣。
指定主題權值給該等主題
藉由(1)運用儲存許多主題之初始權值的許多資料庫,以及(2)使用描述如何計算整體主題權值的許多方法,可取得其中不同因素影響該等整體主題權值之方式,例如:與特定動作類型相關聯的該主題「cars」之該主題權值可使用下列方程式計算:subject_weight=10*n,其中「n」為指出該內容內該主題{cars}的文字重複次數。
運用上列方程式,在該內容內表達該文字「car」兩次的範例中,與該主題「cars」相關聯的整體主題權值為10*2=20。方程式以及主題指南內識別之主題的初始權值可儲存在該設定檔管理系統可存取的權值資料庫內。
請參閱其中與該使用者動作相關聯的內容為網頁P1之範例,運用權值之資料庫,該內容分析器可決定選取主題之每一者的對應權值。在此範例中,該內容分析器回傳下列結果:
上面P1的結果可總結成下列稜鏡向量:[cars: 20,AFP: 15,efficiency standards: 10,Barack Obama: 10,regulations: 5,auto industry: 5]
使用者的興趣
在決定使用者的興趣方面,許多因素與資料可列入考量,例如:若該使用者正在撰寫關於某些主題的部落格或文章,這些主題與其他動作比較起來對該使用者而言較重要,因為該使用者花費時間與精力來撰寫這些主題,因此若該使用者執行兩個動作,像是撰寫關於「car」的部落格,並且製作一個至「car」的書籤連結,假設其他因素都相等,則該使用者對於撰寫部落格比製作書籤還要有興趣。
特定動作對於該使用者來說比其他動作更重要之該事實可反映在更重要動作(以及關於該動作的主題)的權值要高於其他動作的權值,例如:屬於特定動作類型(也稱為型別)的特定動作之排名可高於其他動作,且因此對於該使用者興趣之整體測量的貢獻要顯著高於其他動作,例如:若該使用者撰寫關於「car」的部落格並且製作一個至「car」的書籤連結,則關於識別為「創作部落格」的主題對於該使用者興趣的貢獻度要高於識別為與「製作書籤」相關之主題之貢獻。此決定由第一圖內所示意的使用者興趣管理器116所執行。
使用者興趣向量
有關使用者興趣的資訊可用許多方式表示,例如:使用稱為使用者興趣向量V(t)的資料結構來表示有關該等興趣的資訊。該使用者興趣向量內含配對的集合,其中每一配對都包含一個主題以及與該主題相關聯的主題權值。該使用者興趣向量內的主題稱為「興趣」,並且特定主題的主題權值稱為「興趣權值」。與該特定興趣相關聯的該興趣權值指出該特定興趣目前對於該使用者有多重要,並且參考其他主題。
在一個具體實施例內,回應於偵測到使用者執行與特定內容相關聯的動作,計算使用者興趣向量,例如:若在時間T1上,當執行該特定類型的特定動作,該使用者撰寫有關{cars,efficiency}的文章,其中與{cars}相關聯的權值為20並且與{efficiency}相關聯的權值為5,則在時間「T1」上代表該使用者興趣的該使用者興趣向量可表示為V(T1)=[cars: 20,efficiency: 5]。使用者興趣向量V(T1)內的資訊可解釋如下:在時間「T1」上執行該特定動作的該使用者對於兩種主題表示興趣:「cars」和「efficiency」;該使用者對於「cars」比對於「efficiency」還有興趣,因為雖然該動作所產生的該文件都屬於「cars」和「efficiency」,不過屬於「cars」的該文件要多過屬於「efficiency」的文件。因為在分析該文件之後,發現與「cars」相關聯的權值為「20」,並且與「efficiency」相關聯的權值為「5」,所以屬於「cars」的文件多過屬於「efficiency」的文件。
應用衰減函數至使用者興趣向量
在一個具體實施例內,該使用者興趣向量V(t)擷取資訊,其指出某些興趣為長期興趣,其他只是出於好奇心,例如:若該使用者已經密集撰寫並張貼許多有關汽車的部落格記錄,但是偶爾會閱讀有關「時尚」的文章,則該使用者興趣向量V(t)可利用計算該興趣「汽車」的相對高興趣權值和該興趣「時尚」的相對低興趣權值,造成此事實。
計算使用者興趣向量
在此有許多表示該使用者興趣向量V(t)的方式。根據一種方式,該使用者興趣向量V(t)定義為:
V(t)=f(P(d),A,D(u))+N*e^(-t/λ),
其中:P(d)為文件d的內容之稜鏡向量,A為該使用者所執行的動作類型,D(u)為代表有關使用者之人口統計資訊的函數,d為與動作A相關聯的文件,N為好奇心指示器,若動作類型為「好奇心」,則標示為「#」,e^(-t/λ)為指數衰減函數,其中λ為實驗決定的常數,f為產生實數的函數;使用乘法作為例示。
例如:使用者執行具有指示「好奇心」(相對於長期興趣)之關聯類型的特定動作,並且執行關聯文件d。文件d具有下列稜鏡向量:
[James Frey: 50,Oprah Winfrey: 40,Reuters: 40,memoir: 35,Vanity Fair: 10,revelations: 5]
其中該稜鏡向量指示主題與其對應權值間之下列關係:
然後,該使用者興趣向量V(t)可計算如下:
V(t)=f(25,[James Frey: 50,Oprah Winfrey: 40,Reuters: 40,memoir: 35,Vanity Fair: 10,revelations: 5])+[0]#=>
V(t)=25*[James Frey: 50,Oprah Winfrey: 40,Reuters: 40,memoir: 35,Vanity Fair: 10,revelations: 5]=>
V(t)=[James Frey: 1250,Oprah Winfrey: 1000,Reuters: 1000,memoir: 875,Vanity Fair: 250,revelations: 125]
在此範例中,該使用者興趣向量V(t)內的資訊可解譯如下:該使用者讀取網頁P來執行好奇心動作,指派給該動作的權值為25,該動作與該網頁內容指出,在當時該使用者對於「James Frey」、「Oprah Winfrey」、「Reuters」、「memoir」、「Vanity Fair」和「revelations」有興趣,並且上列標題係從使用者最有興趣者排到最沒興趣者。
使用者設定檔向量
隨著該設定檔目標內的使用者開始並執行許多動作,則可收集有關這些動作的資訊來表示該設定檔目標的累積興趣。關於該設定檔目標之興趣的累積認知可用許多方式表示,例如:可使用該設定檔目標來表示有關該使用者從開始收集該等使用者興趣時到目前,已經表達興趣的累積認知之使用者的使用者興趣向量。
在一個具體實施例內,可根據目前個別興趣對於該使用者的該重要性,來組織該使用者設定檔向量內的資訊,例如:若在過去,該使用者表達對於「汽車」的興趣,並且最近該使用者表達對於「時尚」有興趣,則該使用者設定檔向量將指出該使用者對於「汽車」和「時尚」都有興趣,並且將指示對於該使用者來說,目前「汽車」是否比「時尚」還要重要。
使用者設定檔向量可表示為,該使用者在特定時間週期期間所表達出來的許多興趣之排序清單。在每次取得有關該使用者所執行動作的新資訊之後,就可更新該使用者設定檔向量。該使用者設定檔向量經過更新,以反映出某些使用者興趣隨著時間經過對於該使用者來說更為重要或較不重要。利用對在該等使用者興趣向量內已經識別的興趣應用該衰減函數,可擷取該關係。
在此有許多算術表示與該使用者相關聯的使用者設定檔向量之方式,其中一種方式係使用下列方程式:
V=V(t)*α+V(t-1)*(1-α),
其中:
V(t)為在時間t上更新的該使用者興趣向量,以及α為歷史係數,由實驗決定。
在時間t=T1上計算的該使用者興趣向量如下:
V(t)=[James Frey: 1250,Oprah Winfrey: 1000,Reuters: 1000,memoir: 875,Vanity Fair: 250,revelations: 125]
如上所述,α由實驗決定,並且表示一衰減分量以確定新的興趣比舊的興趣對該使用者設定檔之貢獻度較大。
在此範例中,α=0.7。請注意,若在時間t=T1之前,該設定檔管理系統尚未收集到任何有關該使用者興趣的資訊,則V(t-1)=[],空白向量。因此,該使用者設定檔向量V可表示為:
V=V(t)*.7+V(t-1)*(1-.7)=>
V=[James Frey: 1250,Oprah Winfrey: 1000,Reuters: 1000,memoir: 875,Vanity Fair: 250,revelations: 125]*0.7+0.3*[]=>
V=[James Frey: 875,Oprah Winfrey: 700,Reuters: 700,memoir: 612.5,Vanity Fair: 175,revelations: 87.5]
上面使用者設定檔向量內含的資訊可解譯如下:根據所收集到目前為止有關該使用者的資訊,在時間T1上執行動作之後,該使用者對於「James Frey」最有興趣,然後是「Oprah Winfrey」、「Reuters」、「memoir」、「Vanity Fair」,最後是「revelations」。
深度設定檔的好處
在一個具體實施例內,使用者設定檔向量可稱為深度設定檔,因為其表示出非常詳細的資訊,這些資訊關於最近該設定檔目標已表達的結合的興趣、指出隨著時間這些興趣如何改變以及目前哪個興趣對於該使用者來說最重要。
根據深度設定檔將使用者興趣模型化的方式,以其動作以及與該等動作相關聯的內容為基礎,提供一種簡單但是有效率的方式給設定檔使用者。
雖然有許多種使用者描述化的機制,本申請案內呈現的方式併入依照使用者動作的創新加權特色方式,此為該內容之內該興趣的直接指示器。結合代表該內容本質的稜鏡向量,吾人可決定使用者的短期與長期興趣。利用修訂與更新該使用者設定檔向量,該向量代表特定時間上該使用者最有興趣主題的最新、已加權、已優先化以及已互相關聯的清單。
預測與該使用者最有關聯的內容
使用者設定檔向量可用來預測顯示給該使用者的最有關聯內容,例如:若該設定檔目標內的該使用者已表達出對於「汽車」有極大興趣,但是對於「時尚」則興趣缺缺,吾人可推斷出當該使用者要閱讀新聞標題時,關於「汽車」的該等標題對於該使用者的吸引力要大出關於「時尚」的該等頭條。
同樣地,若該使用者對「汽車」的興趣高於「時尚」,則在訂定目標並且選擇電子廣告時,吾人可推斷該使用者可能較傾向購買汽車雜誌而非購買時尚雜誌。
資料結構
用於計算該使用者興趣向量V(t)的資訊可儲存在許多資料結構內,第二圖內示意這種結構的一個範例。
第二圖為例示於其中實施並實踐本發明之具體實施例的資料結構200範例之方塊圖。第二圖示意根據在兩個不同時間上執行的兩個不同動作,所計算的兩個使用者興趣向量。第一使用者興趣向量260a在時間t=T1上計算,而第二使用者興趣向量260k在時間t=T2上計算。在T1上計算之儲存在使用者興趣向量260a內的該資訊,係用來在時間T2上計算使用者興趣向量260k。
有關該使用者在時間T1上執行之動作的資訊都儲存在稱為動作210a的資料結構內。有關與動作210a相關聯的動作類型之資訊儲存在稱為動作類型220a的結構內,並且指示動作210a為長期興趣或只是「好奇心」的指示器,係儲存在稱為好奇心指示器240a的資料結構內。
有關與動作210a相關聯的內容之資訊儲存在示意為內容230a的資料結構內,內容230a會經過分析,並且指示內容的一組主題被識別。內容230a可具有一或多個主題。第二圖內示意內容230a的兩示範主題,分別為主題240a和主題240b。
與主題240a相關聯的權值儲存在稱為主題權值250a的資料結構內,而與主題240b相關聯的權值則儲存在稱為主題權值250b的資料結構內。主題權值250a和250b可根據對應的主題240a和240b,及/或動作210a的動作類型220a。
指出從該使用者在時間T1上執行的動作,推斷出使用者興趣之使用者興趣向量260a係至少部分根據動作類型220a、好奇心指示器240a、主題240a、主題權值250a、主題240b和主題權值250b所表示之資訊來計算。像是衰減函數的參數這些其他資訊也可包含在計算使用者興趣向量260a當中。
表示時間T1上該使用者的結合的興趣之使用者設定檔向量270a,係至少部分根據先前計算的使用者設定檔向量(第二圖內未示出)內以及使用者興趣向量260a內所呈現之資訊來更新。在第二圖內示意的該範例中,假設先前的使用者設定檔向量為空白,並且主題240a和主題240b為動作210a的內容230a之指示,並且對應的主題權值為主題權值250a和主題權值250b,則使用者設定檔向量270a可包含下列資料配對:
{主題a:興趣權值(a1)}
{主題b:興趣權值(b1)}
表示在時間t=T2上使用者興趣的使用者興趣向量260k,以和上述使用者興趣向量260a類似的方式計算。
指示在時間T2上該使用者的結合的興趣之使用者設定檔向量270k,係至少部分根據儲存在使用者設定檔向量270a內的資訊以及使用者興趣向量260k內所呈現之資訊來更新。在第二圖內示意的該範例中,在時間T1上識別的主題清單已經由時間T2上識別的主題所補充,對應的興趣權值已經在時間T2上重新計算,以表示時間T2上的設定檔興趣,並且使用者設定檔向量270k包含下列資料配對:
{主題k:興趣權值(k2)}
{主題m:興趣權值(m2)}
{主題a:興趣權值(a2)}
{主題b:興趣權值(b2)}
設定檔目標的設定檔
在一個具體實施例內,群組之成員的使用者設定檔向量已經結合,並且該群組之興趣的累積表示整個一起計算。該群組之使用者的興趣之表示稱為該設定檔目標的設定檔,例如:若一或多位使用者屬於特定設定檔目標群組,則設定檔目標的設定檔可為利用處理來自個別使用者的個別使用者設定檔之資訊所計算之向量。
利用包含設定檔目標成員所表達出來的所有興趣,並且從與目標成員所表達之特定興趣相關聯的興趣權值中計算結果興趣權值,來更新與設定檔目標相關聯的設定檔,例如:若特定設定檔目標包含兩位使用者,並且第一位使用者對於「汽車」有興趣,而第二位使用者對於「時尚」有興趣,則目標設定檔可包含「汽車」與「時尚」作為興趣,並且與興趣相關聯的權值將對應至設定檔目標已經分別分成「汽車」群組與「時尚」群組之興趣結合總量。
在一個具體實施例內,與設定檔目標相關聯的設定檔已更新,來包含使用者的人口統計特性及/或以設定檔目標分組的人口統計特性。
在一個具體實施例內,與設定檔目標相關聯的設定檔內儲存之資訊可用來更新設定檔目標之個別成員的使用者興趣向量,以反映出設定檔目標之興趣改變對於個別成員之興趣的影響。
更新該設定檔目標的設定檔
第三圖為例示根據本發明之具體實施例,更新與設定檔目標相關聯的設定檔範例之流程圖。在步驟310內,偵測到與設定檔目標相關聯之使用者所執行的動作。上面已經描述許多攔截有關使用者動作資訊的方法。有關動作的資訊會傳送至設定檔管理系統。
該設定檔管理系統接收有關使用者動作的資訊,並將該資訊傳輸給一動作分析器,該動作分析器決定與動作相關聯的動作類型,並且決定動作是否具有長期興趣或好奇心的特性。上面已經描述過長期興趣動作與好奇心動作間之差異。
在步驟320內,該設定檔管理系統傳輸有關動作的資訊給一內容分析器,該內容分析器決定與動作相關聯的內容。上面已經描述過許多內容之範例以及用於決定內容的方法。
接著,該內容分析器決定指示特定於內容的議題之主題,這可用上述的主題或指南清單達成。主題係根據指示已知為主題或興趣的標題之文字、詞彙及/或片語來決定。
然後,決定與主題相關聯的主題權值,並且計算中間使用者興趣向量。主題權值表示該使用者對於特定主題可能有的興趣總量,並且可使用經驗資料、算術方程式、有關主題本身的資訊、與動作相關聯的動作類型等來決定。上面已經提供主題權值的詳細描述。
在步驟330內,該設定檔管理系統傳輸先前處理之結果給一使用者興趣管理器,該使用者興趣管理器決定該內容分析器所識別的該組主題之一或多個興趣權值。計算興趣權值時可將各別主題權值,以及與該使用者所執行之動作相關聯的動作類型列入考慮。此時稱為興趣的主題與對應的興趣權值結合,並且根據興趣權值排序結果配對。排序的配對可如上述表示為使用者興趣向量。
接著在步驟340內,該使用者興趣管理器可將使用者興趣向量傳送給維護並更新使用者設定檔向量的一設定檔管理器,該設定檔管理器將處理該使用者興趣向量,以合併過去記錄與該使用者興趣有關的資訊。已更新的使用者設定檔向量反映使用者興趣如何隨時間改變。此處理的結果可儲存在與該使用者相關聯的設定檔資料庫內。
在步驟340內,該設定檔管理器也更新與該使用者所屬之特定設定檔目標相關聯的設定檔。與設定檔目標相關聯的設定檔係至少部分根據來自已更新之使用者設定檔的興趣權值。上面已經描述有關產生目標群組之設定檔的細節。
範例
計算使用者興趣向量以及使用者設定檔向量
在此範例中,該使用者在網際網路作業期間執行的許多動作都分成四種個別動作類型,這四種動作類型分別是:1)創作部落格,2)檢視,3)贊成以及4)觀看網頁。該等動作類型的名稱分別縮寫成B、R、T和P。
此外,在此範例中,與B、R和T相關聯的動作類型指示長期興趣,而P的動作類型則指示好奇心。
動作類型之每一者都具有指定的動作類型權值,特定動作類型權值反映出特定類型所執行之動作對於該等使用者興趣之整體量測的相對貢獻。在此範例中,動作類型權值如下:B=100、R=50、T=25、P=200(此時忽略人口統計元件)。
此外,在此範例中,該使用者造訪三個示範網頁P1、P2和P3。在此範例中,網頁P1專屬於政治新聞、政治事件、政治評論等,這種網頁的範例為網域「www.google.com」內的網頁「hostednews/afp/article/ALeqM5i-7wC-radTtoREZBhXL6SsxeKD3g」。
網頁P1具有相關聯的內容p1,其中包含該網頁上顯示的許多文字、詞彙與片語。內容分析器針對先前建立的內容指南來分析網頁P1之該內容,並且決定指示該網頁內容p1的詞彙與片語以及對應主題集。在此範例中,該主題集包含:「cars」、「AFP」、「efficiency standard」、「Barack Obama」、「regulations」以及「auto industry」。
接著,該內容分析器運用權值資料庫,決定每一選取主題的對應權值。在此範例中,該內容分析器回傳下列結果:
上面P1的結果可總結成下列稜鏡向量:[cars: 20,AFP: 15,efficiency standards: 10,Barack Obama: 10,regulations: 5,auto industry: 5]
此向量表示該網頁的要點,其提供該網頁的談論重點並且識別該網頁上所呈現之選取主題的相對重要性。
另一頁P2關於名人八卦,這種網頁的範例為來自網域「omg.yahoo.com」的「news/oprah-apologizes-for-slamming-author-james-frey/22495?nc」,其具有下列稜鏡向量:
[James Frey: 50,Oprah Winfrey: 40,Reuters: 40,memoir: 35,Vanity Fair: 10,revelations: 5]
網頁P3與電影有關,這種網頁的範例為來自網域「movies.yahoo.com」的「movie/1800079223/details」,其具有下列稜鏡向量:
[Movies: 100,The Hunt for Red October: 70,Trailers: 50,Showtimes: 50,Premiere Photos: 50,Paramount Pictures: 40,Critics Reviews: 40]
有關網頁P1、P2和P3,對應URL以及對應向量的資訊接著儲存在設定檔管理系統內,並且備妥用來決定使用者的興趣。
在此範例中,新使用者加入該網路並且第一次使用網路服務,因為這是該使用者第一次使用網路的服務,該設定檔管理系統並無關於該使用者興趣的資訊,因此該設定檔管理系統使使用者興趣向量為空白V(t)=[]與該使用者產生關聯。
在此範例中,該使用者是特定目標群組內的唯一使用者。
使用者興趣利用關聯於使用者動作的時間軸來索引,並且根據該使用者執行的動作來變更。在此範例中,使用下列標記法指出已經計算過之使用者興趣向量V(t),來反映該使用者造訪過網頁P,同時在時間t上執行類型「T」的動作A之後使用者興趣之變更:
T: A->P,V(t),
其中:T表示該使用者執行類型A的動作之時間,P表示該使用者所造訪並同時在時間T上執行類型A的動作之網頁,以及V(t)表示在時間T上更新的使用者興趣向量。
如本申請之先前段落內所述,使用者興趣向量V(t)定義為:
V(t)=f(P(d),A,D(u))+N*e^(-t/λ),
其中:P(d)為文件d的稜鏡向量,A為該使用者所執行的動作類型,D(u)為代表有關使用者之人口統計資訊的函數,N為好奇心指示器,以及e^(-t/λ)為指數衰減函數,其中λ由實驗決定。
隨著該使用者持續進行網際網路作業並且開始許多動作,該設定檔管理系統會以系統方式收集有關使用者動作的資訊。例如:若在時間T1上,該使用者藉由喚起網頁P2開始類型T的動作「A」(「贊成」),則有關在時間T1上開始類型T的動作「A」以及造訪網頁P2之資訊會傳送給該設定檔管理系統,供進一步處理。該設定檔管理系統更新該使用者的興趣向量,來反映在時間T1上所發生的任何使用者興趣變更。
運用上列標記法並且利用上述V(t)的定義取代V(t),則該使用者利用喚起網頁P2在時間T1上開始類型T的動作之後,使用者興趣向量V(t)的更新產生如下:
T1: T->P2,V(t)=f(P(d),A,D(u))+N*e^(-t/λ).
不過如上述,動作類型T稱為「贊成」型動作,其屬於長期興趣,並非只是好奇心。因此,上列等式內的N為零。為了清晰起見,若該動作具有好奇心指示器,則在該文件的該稜鏡向量之後輸入「#」。另請注意,與該動作類型「T」相關聯的該動作權值為「25」。
如上述,網頁P2具有下列稜鏡向量:
[James Frey: 50,Oprah Winfrey: 40,Reuters: 40,memoir: 35,Vanity Fair: 10,revelations: 5]
因此,使用者興趣向量V(t)可計算如下:
V(t)=f(25,[James Frey: 50,Oprah Winfrey: 40,Reuters: 40,memoir: 35,Vanity Fair: 10,revelations: 5])+[0]#=>
V(t)=25*[James Frey: 50,Oprah Winfrey: 40,Reuters: 40,memoir: 35,Vanity Fair: 10,revelations: 5]=>
V(t)=[James Frey: 1250,Oprah Winfrey: 1000,Reuters: 1000,memoir: 875,Vanity Fair: 250,revelations: 125]
如本申請之先前段落內所述,與該使用者相關聯的使用者設定檔向量V定義如下:
V=V(t)*α+V(t-1)*(1-α),
其中:V(t)為在時間t上更新的使用者興趣向量,以及α為歷史係數,由實驗決定。
如上所述,α由實驗決定,並且表示一衰減分量以確定較新的興趣比較舊的興趣對該使用者設定檔之貢獻較大。在此範例中,α=0.7。V(t-1)=[],空白向量,因為在時間t之前,該設定檔管理系統尚未收集到任何有關該等使用者興趣的資訊。因此,使用者設定檔向量V可表示為:
V=V(t)*.7+V(t-1)*(1-.7)=>
V=[James Frey: 1250,Oprah Winfrey: 1000,Reuters: 1000,memoir: 875,Vanity Fair: 250,revelations: 125]*0.7+0.3*[]=>
V=[James Frey: 875,Oprah Winfrey: 700,Reuters: 700,memoir: 612.5,Vanity Fair: 175,revelations: 87.5]
如上述計算的使用者設定檔向量V表示在時間T1上,執行類型為T的其第一動作並且涉及存取網頁P2的使用者之使用者興趣。
該使用者設定檔向量中的資訊可解譯如下:在時間T1上,使用者似乎對「James Frey」最有興趣,然後是「Oprah Winfrey」,而對「revelations」最沒興趣。
此時在時間T2上,使用者開始類型P的動作,以及涉及存取網頁P1的該動作,這可表示如下:
T2: P->P1,因此V(t)=f(P(d),A,D(u))+N*e^(-t/λ),
其中N=f(P(d),A,D(u))
如上述,網頁P1的稜鏡向量為:
[cars: 20,AFP: 15,efficiency standards: 10,Barack Obama: 10,regulations: 5,auto industry: 5]
動作類型P指示好奇心,並非使用者的長期興趣。因此,該第一詞彙將為0,因為並無長期興趣指示器。
因此,使用者興趣向量V(t)可計算如下:
V(t)=0+f(200,[cars: 20,AFP: 15,efficiency standards: 10,Barack Obama: 10,regulations: 5,auto industry: 5])*e^(-t/λ)
其中t=1,λ=1(t、λ為某些時間單位的表示)=>
V(t)=200*[cars: 20,AFP: 15,efficiency standards: 10,Barack Obama: 10,regulations: 5,auto industry: 5]#*e^(-1)=>
V(t)=[cars: 4000,AFP: 3000,efficiency standards: 2000,Barack Obama: 2000,regulations: 1000,auto industry:1000]#*e^(-1)。
為了簡化,在此範例中,e=2。如此,e^(-1)-。因此,V(t)=[cars: 2000,AFP: 1500,efficiency standards: 1000,Barack Obama: 1000,regulations: 500,auto industry: 500]#
此時就可計算使用者設定檔向量V。記住使用者設定檔向量V=V(t)*α+V(t-1)*(1-α),並且α=0.7。V(t-1)為時間t=T1上計算的該使用者設定檔向量。因此,
V=V(T2)*.7+V(T1)*.3=>
V=0.7*[cars: 2000,AFP: 1500,efficiency standards: 1000,Barack Obama: 1000,regulations: 500,auto industry: 500]#+0.3*[James Frey: 1250,Oprah Winfrey: 1000,Reuters: 1000,memoir: 875,Vanity Fair: 250,revelations: 125]=>
V=[cars: 1400,AFP: 1050,efficiency standards: 700,Barack Obama: 700,regulations: 350,auto industry: 350]#+[James Frey: 375,Oprah Winfrey: 300,Reuters: 300,memoir: 262.5,Vanity Fair: 37.5,revelations: 37.5]
因此在時間T2上,該使用者似乎對「cars」最有興趣,然後是「AFP」,並且對「James Frey」和「Oprah Winfrey」比較沒興趣,而「revelations」保持於使用者興趣清單的最後一名。
在時間T3上,使用者開始類型B的動作,並且存取網頁P3,這可表示為:
T3: B->P3,V(t)=f(P(d),A,D(u))+N*e^(-t/λ)
因此,在時間T3上開始的該動作之V(t)計算如下:
V(t)=f(100,[Movies: 100,The Hunt for Red October: 70,Trailers: 50,Showtimes: 50,Premiere Photos: 50,Paramount Pictures: 40,Critics Reviews: 40])+[0]#=>
V(t)=100*[Movies: 100,The Hunt for Red October: 70,Trailers: 50,Showtimes: 50,Premiere Photos: 50,Paramount Pictures: 40,Critics Reviews: 40]=>
V(t)=[Movies: 10000,The Hunt for Red October: 7000,Trailers: 5000,Showtimes: 5000,Premiere Photos: 5000,Paramount Pictures: 4000,Critics Reviews: 4000]
反映在時間T3上更新之來自使用者興趣向量的資訊之已更新使用者設定檔向量可計算如下:
V=V(t)*α+V(t-1)*(1-α),α=0.7=>
V=0.7*[Movies: 10000,The Hunt for Red October: 7000,Trailers: 5000,Showtimes: 5000,Premiere Photos: 5000,Paramount Pictures: 4000,Critics Reviews: 4000]+0.3*([cars: 1400,AFP: 1050,efficiency standards:700,Barack Obama: 700,regulations: 350,auto industry: 350]#e^(-t/λ)+[James Frey: 375,Oprah Winfrey: 300,Reuters: 300,memoir: 262.5,Vanity Fair: 37.5,revelations: 37.5])
替換t=2,如此,
V=[Movies: 7000,The Hunt for Red October: 4900,Trailers: 3500,Showtimes: 3500,Premiere Photos: 3500,Paramount Pictures: 2800,Critics Reviews: 2800,James Frey: 112.5,Oprah Winfrey: 90,Reuters: 90,memoir: 78.75,Vanity Fair: 11.25,revelations: 11.25]+[cars: 105,AFP: 78.75,efficiency standards: 52.5,Barack Obama: 52.5,regulations: 26.25,auto industry: 26.25]#
因此在時間T3上,該使用者似乎對「Movies」最有興趣,尤其是「The Hunt for Red October」。再者,請注意在時間T3上,該使用者對於「Movies」和「The Hunt for Red October」的興趣要高於該使用者在時間T2上最有興趣的「cars」和「AFP」。此外,請注意,該使用者在時間T2上對於「cars」和「AFP」比起現在對該使用者為較不重要的「James Frey」和「Oprah Winfrey」有興趣,這可藉由指出該使用者在T2上執行的動作為該使用者的好奇心,而非使用者長期興趣來解釋。因此,該使用者在時間T2上表現出來的該好奇心可視為「短期」興趣,因此對該使用者長期設定檔的貢獻會消失地比該使用者在時間T1上表現出來的長期興趣還要快,當然也快過於時間T3上表現出來的興趣。該等好奇心興趣減弱速度快過該等長期興趣。
在該使用者開始額外動作並且造訪其他網頁時,有關這些動作與網頁的資訊可併入,來更新該使用者興趣向量,然後更新該使用者設定檔向量。
另請注意,雖然此範例只定義四種動作類型以及四個不同網頁,不過在例示如何計算該使用者興趣向量與該使用者設定檔向量時,可併入額外動作類型以及其他網頁。
將文件與該使用者興趣匹配
此範例例示如何知道使用者興趣對於選擇使用者感興趣之文件而言非常有用,尤其是,此範例例示如何使用使用者設定檔向量,來決定哪些文件已經備妥顯示給使用者、使用者可能最有興趣。
在此範例中,有三個文件可顯示給使用者,這些文件名為D1、D2和D3。目標在於決定該使用者對於D1、D2或D3哪一個最有興趣,對哪一個最沒興趣。
此外,假設使用下列稜鏡向量表示文件D1:
[Barack Obama: 10,Movies: 20,Showtimes: 50,Dark Knight: 50]
D2使用下列稜鏡向量表示:
[Oprah Winfrey: 20,efficiency standards: 30,ratings: 30,cars: 10]
D3使用下列稜鏡向量表示:
[Space Shuttle: 50,Hubble: 30,NASA: 10]
文件與使用者興趣的關聯可使用兩向量的內積來決定,兩向量的內積,也就是已知的純量積,為採用實數空間內定義的兩向量並且回傳實值純量的運算。尤其是,兩向量a =[a 1 ,a 2,...,a n ]和b =[b 1 ,b 2 ,...,b n ]的內積定義為:
其中Σ表示總和標記,且n 為向量的維度。
在歐式幾何(Euclidean geometry)當中,向量a 和向量b 的內積定義為:
a‧b=|a||b|cosθ
其中|a |和|b |表示ab 的對應長度,且θ為ab 之間的角度。
此等式可重新撰寫如下:
若向量ab 彼此垂直,並且向量ab 之每一者具有長度一,則ab 之間角度的餘弦為零,並且ab 的內積也為零。在另一方面,若向量ab 彼此平行,並且向量ab 之每一者具有長度一,則ab 之間角度的餘弦為一,並且ab 的內積也為一。因此利用計算向量ab 間之餘弦,則可決定向量ab 之間的角度。
若向量ab 彼此垂直,即使若向量ab 之任一者具有一以外的長度,則ab 的內積仍舊為零,並且ab 之間角度的餘弦為零。不過,若向量ab 不垂直(但是它們之間的角度小於90度並且具有正值),則向量ab 的內積為大於0的正值。因此針對任兩向量ab ,其間角度的餘弦越大,則其間的角度越小。
若兩向量彼此平行,則表示「類似的」資訊,若兩向量彼此垂直,則表示「相異的」資訊。利用計算向量ab 之間角度的餘弦,則可決定各別向量ab 所表示之內容的「類似度」或「相異度」。
尤其是,若向量ab 之間角度的餘弦為零,則該等向量表示「相異的」資訊。因此,兩向量之間角度的餘弦越大,則該等向量表示的內容越相似。
用於描述兩文件之類似度的詞彙為「餘弦類似度」,因此針對任兩向量ab ,其間角度的餘弦越大,則其所表示的內容越類似。依照推論,其間角度的餘弦越小,則其所表示的內容相異越大。
因為文件的內容可由向量表示,並且整體使用者興趣也可用向量表示,準備顯示給該使用者的文件以及該等使用者興趣間之類似度可由計算這兩向量之間角度的餘弦來決定。
在此範例中,由上述該稜鏡向量來表示文件之內容,並且也如上述利用使用者設定檔向量V來表示使用者的興趣。
底下計算的目的在於決定文件的稜鏡向量與使用者設定檔向量V如何匹配,即是計算文件的稜鏡向量與使用者設定檔向量V間之餘弦類似度。
等式
可用文件的稜鏡向量取代向量a 並且用使用者設定檔向量V取代向量b 來重新撰寫。
底下計算關於使用者設定檔向量V以及分別關於文件D1、文件D2和文件D3的餘弦類似度值。在底下的該等計算當中,該「.」符號表示兩向量的內積。
計算D1的餘弦類似度:
D1.V/(|D|*|V|)
=[Barack Obama: 10,Movies: 20,Showtimes: 50,Dark Knight: 50].([Movies: 7000,The Hunt for Red October: 4900,Trailers: 3500,Showtimes: 3500,Premiere Photos: 3500,Paramount Pictures: 2800,Critics Reviews: 2800,James Frey: 112.5,Oprah Winfrey: 90,Reuters: 90,memoir: 78.75,Vanity Fair: 11.25,revelations: 11.25]+[cars: 105,AFP: 78.75,efficiency standards: 52.5,Barack Obama: 52.5,regulations: 26.25,auto industry: 26.25]#)
=[Barack Obama: 525,Movies: 140000,Showtimes: 175000]/(sqrt(100+400+2500+2500)*sqrt(49*10^6+2401*10^4+1225*10^4+1225*10^4+784*10^4+784*10^4+12656.25+8100+8100+6201.5625+126.5625+126.5625+689.0625+11025+689.0625+2756.25+2756.25+6201.5625)
=[Barack Obama: 525,Movies: 140000,Showtimes: 175000]/(74.16198*352.32105387)
=[Barack Obama: 525,Movies: 140000,Showtimes: 175000]/26128.826950685863
=[Barack Obama: 0.0200927504702,Movies: 5.35806679206,Showtimes: 6.69758349008]
此向量的模數,即是D1與V之間角度的餘弦=8.577115370180687。
計算D2的餘弦類似度:
D2. V/(|D|*|V|)
=[Oprah Winfrey: 20,efficiency standards: 30,ratings: 30,cars: 10].([Movies: 7000,The Hunt for Red October: 4900,Trailers: 3500,Showtimes: 3500,Premiere Photos: 3500,Paramount Pictures: 2800,Critics Reviews: 2800,James Frey: 112.5,Oprah Winfrey: 90,Reuters: 90,memoir: 78.75,Vanity Fair: 11.25,revelations: 11.25]+[cars: 105,AFP: 78.75,efficiency standards: 52.5,Barack Obama: 52.5,regulations: 26.25,auto industry: 26.25]#)
=[Oprah Winfrey: 1800,efficiency standards: 1575,cars: 1050]/(sqrt(400+900+900+100)*sqrt(49*10^6+2401*10^4+1225*10^4+1225*10^4+784*10^4+784*10^4+12656.25+8100+8100+6201.5625+126.5625+126.5625+689.0625+11025+689.0625+2756.25+2756.25+6201.5625)
=[Oprah Winfrey: 1800,efficiency standards: 1575,cars: 1050]/(47.958315233127195*352.32105387)
=[Oprah Winfrey: 0.10652952503974485,efficiency standards: 0.093213334409776735,cars: 0.062142222939851159]
此向量的模數=0.15459275949697207。
計算D3的餘弦類似度:
D3.V/(|D|*|V|)=[Space Shuttle: 50,Hubble: 30,NASA: 10].([Movies: 7000,The Hunt for Red October: 4900,Trailers: 3500,Showtimes: 3500,Premiere Photos: 3500,Paramount Pictures: 2800,Critics Reviews: 2800,James Frey: 112.5,Oprah Winfrey: 90,Reuters: 90,memoir: 78.75,Vanity Fair: 11.25,revelations: 11.25]+[cars: 105,AFP: 78.75,efficiency standards: 52.5,Barack Obama: 52.5,regulations: 26.25,auto industry: 26.25]#)=[]
此向量的模數=0。
根據上面的計算,各別(捨去為兩位數)餘弦值為:D1為「8.5」、D2為「0.1」並且D3為「0」。
如上面所提及,兩向量之間角度的餘弦值越大,則該等向量表示的內容越相似。因此,使用者對於D1最有興趣,接著是D2,然後D3。
硬體概觀
根據一個具體實施例,本文描述的技術由一或多個專用型計算裝置來實施。該等專用型計算裝置可為執行該等技術的硬接線,或可包含數位電子元件,像是不斷被程式設計來執行該等技術的一或多個特殊應用積體電路(application-specific integrated circuit,ASIC)或場可程式閘陣列(field programmable gate array,FPGA),或可包含一或多個通用硬體處理器,其經程式設計來執行根據韌體、記憶體、其他儲存裝置或組合內的程式指令之該等技術。這種專用型計算裝置也可結合利用客製程式設計來達成該等技術的客製硬接線邏輯、ASIC或FPGA。該等專用型計算裝置可為桌上型電腦系統、可攜式電腦系統、手持式裝置、網路裝置或併入硬接線及/或程式邏輯來實施該等技術的任何其他裝置。
例如:第四圖為例示於其上實施本發明之具體實施例的電腦系統400之方塊圖。電腦系統400包含匯流排402或其他用於通訊資訊的通訊機構,並且硬體處理器404耦合至匯流排402,用來處理資訊。硬體處理器404可為例如通用微處理器。
電腦系統400也包含主記憶體406,像是隨機存取記憶體(Random access memory,RAM)或其他動態儲存裝置,耦合至匯流排402,用於儲存處理器404要執行的資訊與指令。主記憶體406也可用於儲存暫時變數或要由處理器404執行之指令執行期間的其他中間資訊。這種指令當儲存在處理器404可存取的儲存媒體時,將電腦系統400當成專用型機器,其經客製化來執行該等指令內指定的該等操作。
電腦系統400另包含唯讀記憶體(Read only memory,ROM)408或耦合至匯流排402的其他靜態儲存裝置,用於儲存處理器404的靜態資訊以及指令。提供儲存裝置410,像是磁碟或光碟,並耦合至匯流排402,用來儲存資訊與指令。
電腦系統400可透過匯流排402耦合至顯示器412,像是陰極射線管(Cathode ray tube,CRT),用來顯示資訊給電腦使用者。包含字母與數字與其他按鍵的輸入裝置414,耦合至匯流排402,用於將資訊以及命令選擇傳遞至處理器404。另一種使用者輸入裝置為游標控制器416,像是滑鼠、軌跡球或游標指引按鍵,用於將方向資訊以及命令選擇傳遞至處理器404,並且用於控制顯示器412上的游標移動。此輸入裝置通常具有兩軸內,第一軸(例如x)和第二軸(例如y)的兩個自由度,其允許該裝置指定平面內的位置。
電腦系統400可運用客製化的硬接線邏輯、一或多個與該電腦系統結合的ASIC或FPGA、韌體及/或程式邏輯來實施此處所述之該等技術,導致或程式設計電腦系統400成為專用型機器。根據一個具體實施例,此處的該等技術由電腦系統400執行,來回應執行主記憶體406內含之一或多個指令的一或多種順序的處理器404。這種指令可從另一儲存媒體,像是儲存裝置410,讀入主記憶體406。主記憶體406內含指令之該等順序的執行導致處理器404執行此處所述的該等處理步驟。在替代具體實施例內,硬接線電路可用於取代或結合軟體指令。
此處所使用的「儲存媒體」一詞就是儲存資料及/或指令,導致機器以特定方式操作之任何媒體。這種儲存媒體可包含非揮發性媒體及/或揮發性媒體,非揮發性媒體包含例如光碟或磁碟,像是儲存裝置410。揮發性媒體包含動態記憶體,像是主記憶體406。儲存媒體的常見形式包含例如:軟碟、彈性磁碟、硬碟、固態硬碟、磁帶或任何其他磁性資料儲存媒體、CD-ROM、任何其他光學資料儲存媒體、具有打孔圖案的任何實體媒體、RAM、可程式唯讀記憶體(Programmable read-only memory,PROM)、可抹除可程式唯讀記憶體(Erasable programmable read-only memory,EPROM)、快閃型可抹除可程式唯讀記憶體(Flash erasable programmable read-only memory FLASH-EPROM)、非揮發性隨機存取記憶體(Non-volatile random accesss memory,NVRAM)、任何其他記憶體晶片或卡匣。
儲存媒體不同於傳輸媒體,但是可用來與傳輸媒體結合。傳輸媒體參與傳輸儲存媒體間之資料,例如:傳輸媒體包含同軸纜線、銅線以及光纖,包含其中內含匯流排402的該等電線。傳輸媒體也可採用聲波或光波的型態,像是在無線電波與紅外線資料通訊期間所產生者。
許多型態之媒體可牽涉到用一或多種順序攜帶一或多個指令,來讓處理器404執行,例如:該等指令一開始可記錄在遠端電腦的磁碟或固態硬碟上,該遠端電腦將該等指令載入其動態記憶體,並使用數據機透過電話線傳送該等指令。電腦系統400上的數據機可接收該電話線上的該等資料,並且使用紅外線發射器將該等資料轉換成紅外線信號,紅外線偵測器可接收該紅外線信號內攜帶的該等資料,並且適當電路可將該等資料放在匯流排402上。匯流排402攜帶該等資料至主記憶體406,處理器404就可從該主記憶體擷取並執行該等指令。主記憶體406所接收的該等指令可在由處理器404執行之前或之後,選擇性儲存在儲存裝置410上。
電腦系統400也包含耦合至匯流排402的通訊介面418。通訊介面418提供耦合至網路連結420(其連接至區域網路422)的雙向資料通訊,例如:通訊介面418可為整合服務數位網路(integrated services digital network,ISDN)卡、纜線數據機、衛星數據機或提供資料通訊連接至對應類型之電話線的數據機。針對另一範例,通訊介面418可為區域網路(local area network,LAN)卡,以提供資料通訊連接至相容的LAN。也可實施無線連結。在任何這種實施當中,通訊介面418傳送並接收攜帶代表許多種資訊的數位資料串流之電子、電磁或光學信號。
網路連結420通常透過一或多個網路提供資料通訊至其他資料裝置,例如:網路連結420可透過區域網路422提供連接至主機電腦424,或至網際網路服務供應商(Internet Service Provider,ISP) 426所操作的資料設備。ISP 426依序透過現在通稱為「網際網路」428的全球封包資料通訊網路提供資料通訊服務。區域網路422和網際網路428都使用攜帶數位資料串流的電子、電磁或光學信號。通過許多網路的該等信號以及在網路連結420上並且通過通訊介面418的該等信號,攜帶該等數位資料至電腦系統400並攜帶來自電腦系統400的該等數位資料,都為傳輸媒體的範例型態。
電腦系統400可通過該(等)網路、網路連結420和通訊介面418,傳送訊息與接收資料,包含程式碼。在網際網路範例中,伺服器430可通過網際網路428、ISP 426、區域網路422和通訊介面418傳輸應用程式的要求程式碼。
處理器404可執行該已接收的程式碼(在接收時),及/或將該程式碼儲存在儲存裝置410或其他非揮發性儲存裝置內,以便稍後執行。
在前述的說明書中,本發明的具體實施例已經參考可隨實施改變的許多特定細節來說明。因此,本發明的該唯一與排他指標,以及本發明申請者所欲之目的,為包含任何後續修正之申請專利範圍之集合,該集合以在其中這種申請專利範圍所發佈的特定型態發佈自本申請書。此處明確揭示內含在申請專利範圍內條款的任何定義,這些定義應支配該等申請專利範圍內使用的條款之意義。因此,申請專利範圍內未明確列舉的限制、元件、性質、特色、優點或屬性不應以任何方式限制申請專利範圍。據此,本說明書與該等圖式僅為例示而非限制。
100...系統
110...設定檔管理系統
112...動作分析器
114...內容分析器
116...使用者興趣管理器
118...設定檔管理器
120a~120n...使用者
130a~130m...網站管理模組
140...設定檔資料庫
150...分析器資料庫
160...電腦網路
210a...動作
210k...動作
220a...動作類型
220k...動作類型
230a...內容
230k...內容
240a...主題,好奇心指示器
240k...主題,好奇心指示器
240b...主題
240m...主題
250a...主題權值
250b...主題權值
250k...主題權值
250m...主題權值
260a...使用者興趣向量
260k...使用者興趣向量
270a...使用者設定檔向量
270k...使用者設定檔向量
400...電腦系統
402...匯流排
404...處理器
406...主記憶體
408...唯讀記憶體
410...儲存裝置
412...顯示器
414...輸入裝置
416...游標控制器
418...通訊介面
420...網路連結
422...區域網路
424...主機電腦
426...網際網路服務供應商
428...網際網路
430...伺服器
本發明藉由範例進行說明並且不受其限制,在附圖中的數據以及其中相同的參考編號指示相同的元件,其中:
第一圖為例示於其中實施並實踐本發明具體實施例的系統範例之方塊圖;
第二圖為例示於其中實施並實踐本發明具體實施例的資料結構範例之方塊圖;
第三圖為例示根據本發明之具體實施例,更新與設定檔目標相關聯的設定檔範例之流程圖;以及
第四圖為例示於其中實施本發明之具體實施例的電腦系統之方塊圖。
100...系統
110...設定檔管理系統
112...動作分析器
114...內容分析器
116...使用者興趣管理器
118...設定檔管理器
120a...120n...使用者
130a...130m...網站管理模組
140...設定檔資料庫
150...分析器資料庫
160...電腦網路

Claims (20)

  1. 一種方法,該方法包含:監視與一設定檔目標相關聯的一使用者所執行之動作;偵測該使用者所執行與一特定內容相關聯的一特定動作;其中該特定內容與一或多個主題的一特定集合有關,每一主題都具有該特定內容之一對應主題權值;決定該特定動作的一特定動作類型,其中該特定動作的該特定動作類型為複數個動作類型之其中一者;決定一或多個主題的該特定集合之一或多個興趣權值,係至少部分根據:(1)對應至該特定內容之一或多個主題的該特定集合之該等主題權值,(2)該特定動作類型,及(3)該使用者之至少一人口統計特性;至少部分根據該一或多個興趣權值,更新與該設定檔目標相關聯的一設定檔;其中該更新步驟由一或多個專用型計算裝置所執行。
  2. 如申請專利範圍第1項之方法,其中進一步包含決定該特定動作類型的一動作類型權值,並且至少部分根據該特定動作類型的該動作類型權值,更新與該設定檔目標相關聯的該設定檔。
  3. 如申請專利範圍第1項之方法,其中該決定一或多個主題的該特定集合之一或多個興趣權值,係至少部分根據該使用者是否對過去一或多個主題的該特定集合內任何主題有興趣。
  4. 如申請專利範圍第1項之方法,其中該決定一或多個主題的該特定集合之一或多個興趣權值,係至少部分根據該特定動作是否與一長期興趣相關聯。
  5. 如申請專利範圍第1項之方法,其中該決定一或多個主題的該特定集合之一或多個興趣權值,係至少部分根據與該設定檔目標相關聯的任何使用者是否對過去一或多個主題的該特定集合內任何主題有興趣。
  6. 如申請專利範圍第1項之方法,其中該更新與該設定檔目標相關聯的一設定檔,進一步包含應用一衰減函數至一或多個主題的該特定集合之該一或多個興趣權值。
  7. 如申請專利範圍第1項之方法,其中該使用者具有特定於該設定檔目標的相關一或多個人口統計特性。
  8. 如申請專利範圍第7項之方法,其中該更新與該設定檔目標相關聯的一設定檔,進一步包含應用與該使用者相關聯的該一或多個人口統計特性以決定一或多個主題的該特定集合之該一或多個興趣權值。
  9. 一種儲存媒體,儲存由一或多個計算裝置執行時可導致如申請專利範圍第1項所述之方法的性能之指令。
  10. 一種儲存媒體,儲存由一或多個計算裝置執行時可導致如申請專利範圍第2項所述之方法的性能之指令。
  11. 一種儲存媒體,儲存由一或多個計算裝置執行時可導致如申請專利範圍第3項所述之方法的性能之指令。
  12. 一種儲存媒體,儲存由一或多個計算裝置執行時可導致如申請專利範圍第4項所述之方法的性能之指令。
  13. 一種儲存媒體,儲存由一或多個計算裝置執行時可導致如申請專利範圍第5項之方法的性能之指令。
  14. 一種儲存媒體,儲存由一或多個計算裝置執行時可導致如申請專利範圍第6項所述之方法的性能之指令。
  15. 一種儲存媒體,儲存由一或多個計算裝置執行時可導致如申請專利範圍第7項所述之方法的性能之指令。
  16. 一種儲存媒體,儲存由一或多個計算裝置執行時可導致如申請專利範圍第8項所述之方法的性能之指令。
  17. 一種方法,該方法包含:監視與一設定檔目標相關聯的一使用者所執行之動作;偵測該使用者所執行與一特定內容相關聯的一特定動作;其中該特定內容與一或多個主題的一特定集合有關,每一主題都具有該特定內容之一對應主題權值;決定該特定內容之一或多個主題的該特定集合之一或多個興趣目前值;其中該一或多個興趣目前值指出該使用者目前對一或多個主題的該特定集合內每一主題有多少興趣,且係至少部分根據該使用者之至少一人口統計特性所決定;決定一或多個主題的該特定集合之一或多個興趣過去值;其中該一或多個興趣過去值指出與該特定目標相關聯的任何使用者過去對一或多個主題的該特定集合內之每一主題有多少興趣;至少部分根據該一或多個興趣目前值以及該一或多個興趣過去值,更新與該設定檔目標相關聯的一設定檔;其中該更新步驟由依照程式指令程式設計為專用型機器的一或多個專用型計算裝置所執行。
  18. 如申請專利範圍第17項之方法,其中該決定該特定 內容之一或多個主題的該特定集合之一或多個興趣目前值,係進一步至少部分根據與該特定內容之一或多個主題的該特定集合相關聯之主題權值。
  19. 如申請專利範圍第18項之方法,其中該決定該特定內容之一或多個主題的該特定集合之一或多個興趣目前值,係進一步至少部分根據與該特定動作相關聯的一動作類型權值。
  20. 如申請專利範圍第17項之方法,其中該更新與該設定檔目標相關聯的一設定檔,進一步包含應用一衰減函數至一或多個主題的該特定集合之該一或多個興趣過去值。
TW099121797A 2009-07-16 2010-07-02 用於決定內容相關性的活動型使用者興趣模型化 TWI424369B (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US12/504,527 US8612435B2 (en) 2009-07-16 2009-07-16 Activity based users' interests modeling for determining content relevance

Publications (2)

Publication Number Publication Date
TW201104617A TW201104617A (en) 2011-02-01
TWI424369B true TWI424369B (zh) 2014-01-21

Family

ID=43450166

Family Applications (1)

Application Number Title Priority Date Filing Date
TW099121797A TWI424369B (zh) 2009-07-16 2010-07-02 用於決定內容相關性的活動型使用者興趣模型化

Country Status (3)

Country Link
US (1) US8612435B2 (zh)
TW (1) TWI424369B (zh)
WO (1) WO2011008848A2 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI764884B (zh) * 2016-03-11 2022-05-21 香港商阿里巴巴集團服務有限公司 書籤的管理方法和裝置

Families Citing this family (79)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8065619B2 (en) * 2007-09-04 2011-11-22 Yahoo! Inc. Customized today module
US8504558B2 (en) 2008-07-31 2013-08-06 Yahoo! Inc. Framework to evaluate content display policies
US8244517B2 (en) 2008-11-07 2012-08-14 Yahoo! Inc. Enhanced matching through explore/exploit schemes
US8539359B2 (en) * 2009-02-11 2013-09-17 Jeffrey A. Rapaport Social network driven indexing system for instantly clustering people with concurrent focus on same topic into on-topic chat rooms and/or for generating on-topic search results tailored to user preferences regarding topic
US8301624B2 (en) 2009-03-31 2012-10-30 Yahoo! Inc. Determining user preference of items based on user ratings and user features
US8600979B2 (en) 2010-06-28 2013-12-03 Yahoo! Inc. Infinite browse
US20120023201A1 (en) * 2010-07-26 2012-01-26 Atlas Advisory Partners, Llc Unified Content Delivery Platform
US20120042263A1 (en) 2010-08-10 2012-02-16 Seymour Rapaport Social-topical adaptive networking (stan) system allowing for cooperative inter-coupling with external social networking systems and other content sources
WO2012056463A1 (en) * 2010-10-29 2012-05-03 Hewlett-Packard Development Company, L.P. Content recommendation for groups
US20120197881A1 (en) 2010-11-23 2012-08-02 Allen Blue Segmentation of professional network update data
US8949239B2 (en) 2011-01-20 2015-02-03 Linkedin Corporation Methods and systems for utilizing activity data with clustered events
US9172762B2 (en) 2011-01-20 2015-10-27 Linkedin Corporation Methods and systems for recommending a context based on content interaction
US9229900B2 (en) 2011-01-20 2016-01-05 Linkedin Corporation Techniques for ascribing social attributes to content
US10168413B2 (en) 2011-03-25 2019-01-01 T-Mobile Usa, Inc. Service enhancements using near field communication
CN102724168B (zh) * 2011-03-30 2014-10-01 腾讯科技(深圳)有限公司 一种推送用户信息的方法及装置
US20120253930A1 (en) * 2011-04-01 2012-10-04 Microsoft Corporation User intent strength aggregating by decay factor
US20120272168A1 (en) * 2011-04-20 2012-10-25 Panafold Methods, apparatus, and systems for visually representing a relative relevance of content elements to an attractor
US20150135048A1 (en) * 2011-04-20 2015-05-14 Panafold Methods, apparatus, and systems for visually representing a relative relevance of content elements to an attractor
US8676937B2 (en) * 2011-05-12 2014-03-18 Jeffrey Alan Rapaport Social-topical adaptive networking (STAN) system allowing for group based contextual transaction offers and acceptances and hot topic watchdogging
US20120296735A1 (en) * 2011-05-20 2012-11-22 Yahoo! Inc. Unified metric in advertising campaign performance evaluation
US20130019187A1 (en) * 2011-07-15 2013-01-17 International Business Machines Corporation Visualizing emotions and mood in a collaborative social networking environment
US9824199B2 (en) 2011-08-25 2017-11-21 T-Mobile Usa, Inc. Multi-factor profile and security fingerprint analysis
US20130054433A1 (en) * 2011-08-25 2013-02-28 T-Mobile Usa, Inc. Multi-Factor Identity Fingerprinting with User Behavior
US20140149204A1 (en) * 2011-08-30 2014-05-29 Mediamind Technologies Ltd. System and method for advertising verification based on users' demographics
US20130086063A1 (en) * 2011-08-31 2013-04-04 Trista P. Chen Deriving User Influences on Topics from Visual and Social Content
US20130085858A1 (en) * 2011-10-04 2013-04-04 Richard Bill Sim Targeting advertisements based on user interactions
US9754279B2 (en) * 2011-10-27 2017-09-05 Excalibur Ip, Llc Advertising campaigns utilizing streaming analytics
US20130159254A1 (en) * 2011-12-14 2013-06-20 Yahoo! Inc. System and methods for providing content via the internet
US9128896B2 (en) 2011-12-20 2015-09-08 Bitly, Inc. Systems and methods for identifying phrases in digital content that are trending
US9111211B2 (en) 2011-12-20 2015-08-18 Bitly, Inc. Systems and methods for relevance scoring of a digital resource
US9582592B2 (en) 2011-12-20 2017-02-28 Bitly, Inc. Systems and methods for generating a recommended list of URLs by aggregating a plurality of enumerated lists of URLs, the recommended list of URLs identifying URLs accessed by users that also accessed a submitted URL
US9619811B2 (en) 2011-12-20 2017-04-11 Bitly, Inc. Systems and methods for influence of a user on content shared via 7 encoded uniform resource locator (URL) link
US9135344B2 (en) * 2011-12-20 2015-09-15 Bitly, Inc. System and method providing search results based on user interaction with content
US9135211B2 (en) 2011-12-20 2015-09-15 Bitly, Inc. Systems and methods for trending and relevance of phrases for a user
TWI482108B (zh) 2011-12-29 2015-04-21 Univ Nat Taiwan To bring virtual social networks into real-life social systems and methods
US9525998B2 (en) * 2012-01-06 2016-12-20 Qualcomm Incorporated Wireless display with multiscreen service
US8458196B1 (en) * 2012-01-31 2013-06-04 Google Inc. System and method for determining topic authority
US8458195B1 (en) * 2012-01-31 2013-06-04 Google Inc. System and method for determining similar users
US8886648B1 (en) 2012-01-31 2014-11-11 Google Inc. System and method for computation of document similarity
US8458194B1 (en) * 2012-01-31 2013-06-04 Google Inc. System and method for content-based document organization and filing
US8458193B1 (en) * 2012-01-31 2013-06-04 Google Inc. System and method for determining active topics
US8458192B1 (en) * 2012-01-31 2013-06-04 Google Inc. System and method for determining topic interest
US8458197B1 (en) * 2012-01-31 2013-06-04 Google Inc. System and method for determining similar topics
US8756236B1 (en) 2012-01-31 2014-06-17 Google Inc. System and method for indexing documents
US20130212028A1 (en) * 2012-02-14 2013-08-15 MonkeyContact, Inc. Systems and methods for leveraging social context in consumer transactions
US9262752B2 (en) * 2012-06-08 2016-02-16 Google Inc. Attendee suggestion for events based on profile information on a social networking site
US8904296B2 (en) * 2012-06-14 2014-12-02 Adobe Systems Incorporated Method and apparatus for presenting a participant engagement level in an online interaction
JP5882187B2 (ja) * 2012-12-12 2016-03-09 日本電信電話株式会社 ユーザ属性推定器構築装置、方法、ユーザ属性推定装置、及びプログラム
US20140280575A1 (en) * 2013-03-14 2014-09-18 Google Inc. Determining activities relevant to users
WO2014160236A1 (en) * 2013-03-14 2014-10-02 Google Inc. Determining activities relevant to users and/or groups of individuals
US9218497B2 (en) 2014-02-24 2015-12-22 Microsoft Technology Licensing, Llc Incentive-based app execution
US9473944B2 (en) 2014-02-24 2016-10-18 Microsoft Technology Licensing, Llc Local personal daemon
US9432472B2 (en) 2014-02-24 2016-08-30 Microsoft Technology Licensing, Llc Accelerated training of personal daemons
US9852208B2 (en) * 2014-02-25 2017-12-26 International Business Machines Corporation Discovering communities and expertise of users using semantic analysis of resource access logs
US9754306B2 (en) 2014-03-03 2017-09-05 Invent.ly LLC Recommendation engine with profile analysis
US9560055B2 (en) 2014-04-30 2017-01-31 Microsoft Technology Licensing, Llc Client-side integration framework of services
DE102015107786A1 (de) 2015-05-18 2016-11-24 Iunera GmbH & Co. KG System, Verfahren und Anordnungen für das implizite Bewerten und Auffinden von Dokumenten
US10425492B2 (en) 2015-07-07 2019-09-24 Bitly, Inc. Systems and methods for web to mobile app correlation
US20170052926A1 (en) * 2015-08-17 2017-02-23 Ci&T System, method, and computer program product for recommending content to users
US9747348B2 (en) * 2015-11-12 2017-08-29 International Business Machines Corporation Personality-relevant search services
US10394829B2 (en) 2015-12-08 2019-08-27 International Business Machines Corporation Content authoring
US9836183B1 (en) * 2016-09-14 2017-12-05 Quid, Inc. Summarized network graph for semantic similarity graphs of large corpora
US10942971B2 (en) * 2016-10-14 2021-03-09 NewsRx, LLC Inserting elements into artificial intelligence content
TWI642015B (zh) 2016-11-11 2018-11-21 財團法人工業技術研究院 產生使用者瀏覽屬性的方法、以及非暫存電腦可讀的儲存媒介
US10467230B2 (en) 2017-02-24 2019-11-05 Microsoft Technology Licensing, Llc Collection and control of user activity information and activity user interface
US10732796B2 (en) 2017-03-29 2020-08-04 Microsoft Technology Licensing, Llc Control of displayed activity information using navigational mnemonics
US10671245B2 (en) 2017-03-29 2020-06-02 Microsoft Technology Licensing, Llc Collection and control of user activity set data and activity set user interface
US10757218B2 (en) * 2017-03-29 2020-08-25 Alibaba Group Holding Limited Method and apparatus for generating push notifications
US10853220B2 (en) 2017-04-12 2020-12-01 Microsoft Technology Licensing, Llc Determining user engagement with software applications
US10693748B2 (en) 2017-04-12 2020-06-23 Microsoft Technology Licensing, Llc Activity feed service
US10534825B2 (en) 2017-05-22 2020-01-14 Microsoft Technology Licensing, Llc Named entity-based document recommendations
US10528228B2 (en) 2017-06-21 2020-01-07 Microsoft Technology Licensing, Llc Interaction with notifications across devices with a digital assistant
US11580088B2 (en) 2017-08-11 2023-02-14 Microsoft Technology Licensing, Llc Creation, management, and transfer of interaction representation sets
US11232109B1 (en) * 2017-12-01 2022-01-25 Pinterest, Inc. Object identification based on long-term user behavior and short-term interest
US20190288964A1 (en) * 2018-03-15 2019-09-19 International Business Machines Corporation Processing Combined Multi-Source Data Streams
US11120218B2 (en) 2019-06-13 2021-09-14 International Business Machines Corporation Matching bias and relevancy in reviews with artificial intelligence
US11908003B2 (en) 2020-08-24 2024-02-20 Capital One Services, Llc Methods and systems for updating a user interface based on level of user interest
US12014029B2 (en) * 2021-05-26 2024-06-18 Intuit Inc. Smart navigation
US11968130B2 (en) 2022-08-30 2024-04-23 Bank Of America Corporation Real-time adjustment of resource allocation based on usage mapping via an artificial intelligence engine

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6134532A (en) * 1997-11-14 2000-10-17 Aptex Software, Inc. System and method for optimal adaptive matching of users to most relevant entity and information in real-time
US20070260624A1 (en) * 2006-03-29 2007-11-08 Chung Christina Y Incremental update of long-term and short-term user profile scores in a behavioral targeting system
TW200912781A (en) * 2007-09-05 2009-03-16 China Times Interactive Co Ltd Content comparing marketing system and operation method therefor

Family Cites Families (123)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5446891A (en) * 1992-02-26 1995-08-29 International Business Machines Corporation System for adjusting hypertext links with weighed user goals and activities
US6202058B1 (en) * 1994-04-25 2001-03-13 Apple Computer, Inc. System for ranking the relevance of information objects accessed by computer users
US5758257A (en) * 1994-11-29 1998-05-26 Herz; Frederick System and method for scheduling broadcast of and access to video programs and other data using customer profiles
US6029195A (en) * 1994-11-29 2000-02-22 Herz; Frederick S. M. System for customized electronic identification of desirable objects
JPH0926970A (ja) * 1994-12-20 1997-01-28 Sun Microsyst Inc 情報を検索するコンピュータによる実行方法及び装置
US6092049A (en) * 1995-06-30 2000-07-18 Microsoft Corporation Method and apparatus for efficiently recommending items using automated collaborative filtering and feature-guided automated collaborative filtering
AU1566597A (en) * 1995-12-27 1997-08-11 Gary B. Robinson Automated collaborative filtering in world wide web advertising
US5727129A (en) * 1996-06-04 1998-03-10 International Business Machines Corporation Network system for profiling and actively facilitating user activities
US5890152A (en) * 1996-09-09 1999-03-30 Seymour Alvin Rapaport Personal feedback browser for obtaining media files
US6128663A (en) * 1997-02-11 2000-10-03 Invention Depot, Inc. Method and apparatus for customization of information content provided to a requestor over a network using demographic information yet the user remains anonymous to the server
US5937397A (en) * 1997-04-10 1999-08-10 International Business Machines Corporation Social learning inferencing engine for intelligent agent environment
US5937422A (en) * 1997-04-15 1999-08-10 The United States Of America As Represented By The National Security Agency Automatically generating a topic description for text and searching and sorting text by topic using the same
US20060020614A1 (en) * 1997-08-08 2006-01-26 Kolawa Adam K Method and apparatus for automated selection, organization, and recommendation of items based on user preference topography
US7050992B1 (en) * 1998-03-03 2006-05-23 Amazon.Com, Inc. Identifying items relevant to a current query based on items accessed in connection with similar queries
EP1060449B1 (en) * 1998-03-03 2003-06-25 Amazon.Com, Inc. Identifying the items most relevant to a current query based on items selected in connection with similar queries
US7720723B2 (en) * 1998-09-18 2010-05-18 Amazon Technologies, Inc. User interface and methods for recommending items to users
US6598054B2 (en) * 1999-01-26 2003-07-22 Xerox Corporation System and method for clustering data objects in a collection
US7472102B1 (en) 1999-10-29 2008-12-30 Microsoft Corporation Cluster-based and rule-based approach for automated web-based targeted advertising with quotas
US6665653B1 (en) 1999-07-03 2003-12-16 Microsoft Corporation Noise reduction for a cluster-based approach for targeted item delivery with inventory management
WO2001006398A2 (en) * 1999-07-16 2001-01-25 Agentarts, Inc. Methods and system for generating automated alternative content recommendations
US7630986B1 (en) 1999-10-27 2009-12-08 Pinpoint, Incorporated Secure data interchange
MXPA02004473A (es) * 1999-11-02 2004-09-10 Clarity Inc E Sistema de clasificacion verbal para el envio y recepcion eficientes de informacion.
US7035825B1 (en) * 2000-01-04 2006-04-25 E.Piphany, Inc. Managing relationships of parties interacting on a network
EP1252735B1 (en) * 2000-01-12 2011-08-24 Jupiter Media Metrix, Inc. System and method for estimating prevalence of digital content on the world-wide-web
US20020013782A1 (en) * 2000-02-18 2002-01-31 Daniel Ostroff Software program for internet information retrieval, analysis and presentation
US6947922B1 (en) 2000-06-16 2005-09-20 Xerox Corporation Recommender system and method for generating implicit ratings based on user interactions with handheld devices
US20020062247A1 (en) * 2000-08-29 2002-05-23 Allen Bradley P. Selecting web site content to be displayed to a web site visitor based upon a probability distribution
US7117208B2 (en) 2000-09-28 2006-10-03 Oracle Corporation Enterprise web mining system and method
US7440943B2 (en) 2000-12-22 2008-10-21 Xerox Corporation Recommender system and method
US6728706B2 (en) * 2001-03-23 2004-04-27 International Business Machines Corporation Searching products catalogs
DE10154656A1 (de) 2001-05-10 2002-11-21 Ibm System und Verfahren für Empfehlungen von Artikeln
US20050193335A1 (en) * 2001-06-22 2005-09-01 International Business Machines Corporation Method and system for personalized content conditioning
EP1415307A2 (en) * 2001-08-06 2004-05-06 Mercury Interactive Corporation System and method for automated analysis of load testing results
US7112208B2 (en) * 2001-08-06 2006-09-26 Morris John K Compact suture punch with malleable needle
US20030040850A1 (en) * 2001-08-07 2003-02-27 Amir Najmi Intelligent adaptive optimization of display navigation and data sharing
KR100438857B1 (ko) * 2001-09-26 2004-07-05 엘지전자 주식회사 사용자 선호도 기반 멀티미디어 검색 시스템
US7162522B2 (en) * 2001-11-02 2007-01-09 Xerox Corporation User profile classification by web usage analysis
US7203909B1 (en) * 2002-04-04 2007-04-10 Microsoft Corporation System and methods for constructing personalized context-sensitive portal pages or views by analyzing patterns of users' information access activities
US7765467B2 (en) * 2002-06-12 2010-07-27 Microsoft Corporation Undoing pending changes applied to web pages
US20040044571A1 (en) 2002-08-27 2004-03-04 Bronnimann Eric Robert Method and system for providing advertising listing variance in distribution feeds over the internet to maximize revenue to the advertising distributor
EP1860579A1 (en) * 2002-08-30 2007-11-28 Sony Deutschland Gmbh Method to split a multiuser profile
US9983559B2 (en) * 2002-10-22 2018-05-29 Fisher-Rosemount Systems, Inc. Updating and utilizing dynamic process simulation in an operating process environment
US7584165B2 (en) * 2003-01-30 2009-09-01 Landmark Graphics Corporation Support apparatus, method and system for real time operations and maintenance
US7013238B1 (en) * 2003-02-24 2006-03-14 Microsoft Corporation System for delivering recommendations
US7827183B2 (en) 2003-03-19 2010-11-02 Customiser Limited Recognition of patterns in data
JP4296050B2 (ja) * 2003-07-14 2009-07-15 三菱電機株式会社 電子制御装置
US8373660B2 (en) * 2003-07-14 2013-02-12 Matt Pallakoff System and method for a portable multimedia client
US20050096949A1 (en) * 2003-10-29 2005-05-05 International Business Machines Corporation Method and system for automatic continuous monitoring and on-demand optimization of business IT infrastructure according to business objectives
US7483891B2 (en) * 2004-01-09 2009-01-27 Yahoo, Inc. Content presentation and management system associating base content and relevant additional content
US20060010029A1 (en) * 2004-04-29 2006-01-12 Gross John N System & method for online advertising
EP2487599A1 (en) * 2004-05-04 2012-08-15 Boston Consulting Group, Inc. Method and apparatus for selecting, analyzing and visualizing related database records as a network
US20050256694A1 (en) 2004-05-12 2005-11-17 Mike Taylor Variable accuracy simulation software and method of using the same
US8065383B2 (en) 2004-05-17 2011-11-22 Simplefeed, Inc. Customizable and measurable information feeds for personalized communication
US7698626B2 (en) * 2004-06-30 2010-04-13 Google Inc. Enhanced document browsing with automatically generated links to relevant information
CA2512945A1 (en) * 2004-07-23 2006-01-23 Genesis Group Inc. System and method for estimating user ratings from user behavior and providing recommendations
KR20070084368A (ko) * 2004-11-18 2007-08-24 코닌클리케 필립스 일렉트로닉스 엔.브이. 사용자 프로파일을 업데이트하기 위한 장치 및 방법
US20060149710A1 (en) * 2004-12-30 2006-07-06 Ross Koningstein Associating features with entities, such as categories of web page documents, and/or weighting such features
US7594189B1 (en) * 2005-04-21 2009-09-22 Amazon Technologies, Inc. Systems and methods for statistically selecting content items to be used in a dynamically-generated display
US20080305781A1 (en) 2005-04-25 2008-12-11 Wilson Eric S Cognitive scheduler
US7657100B2 (en) * 2005-05-09 2010-02-02 Like.Com System and method for enabling image recognition and searching of images
US7805496B2 (en) * 2005-05-10 2010-09-28 International Business Machines Corporation Automatic generation of hybrid performance models
US9286388B2 (en) * 2005-08-04 2016-03-15 Time Warner Cable Enterprises Llc Method and apparatus for context-specific content delivery
US20070088852A1 (en) 2005-10-17 2007-04-19 Zohar Levkovitz Device, system and method of presentation of advertisements on a wireless device
JP2009514075A (ja) * 2005-10-28 2009-04-02 テレコム・イタリア・エッセ・ピー・アー 選択されたコンテンツアイテムをユーザーに提供する方法
US7493329B2 (en) * 2005-11-17 2009-02-17 Bea Systems, Inc. System and method for providing generic controls in a communities framework
US9251520B2 (en) 2006-02-22 2016-02-02 Google Inc. Distributing mobile advertisements
US7774341B2 (en) * 2006-03-06 2010-08-10 Veveo, Inc. Methods and systems for selecting and presenting content based on dynamically identifying microgenres associated with the content
WO2007115224A2 (en) * 2006-03-30 2007-10-11 Sri International Method and apparatus for annotating media streams
US20100138451A1 (en) * 2006-04-03 2010-06-03 Assaf Henkin Techniques for facilitating on-line contextual analysis and advertising
US20090327193A1 (en) 2008-06-27 2009-12-31 Nokia Corporation Apparatus, method and computer program product for filtering media files
US20070266025A1 (en) * 2006-05-12 2007-11-15 Microsoft Corporation Implicit tokenized result ranking
CN100530183C (zh) * 2006-05-19 2009-08-19 华为技术有限公司 一种收集用户数据的系统及方法
US20070277205A1 (en) 2006-05-26 2007-11-29 Sbc Knowledge Ventures L.P. System and method for distributing video data
US20070276826A1 (en) 2006-05-26 2007-11-29 Yahoo! Inc. Aggregation of affinity lists
US8166029B2 (en) * 2006-09-07 2012-04-24 Yahoo! Inc. System and method for identifying media content items and related media content items
US20080077574A1 (en) * 2006-09-22 2008-03-27 John Nicholas Gross Topic Based Recommender System & Methods
GB0619616D0 (en) * 2006-10-05 2006-11-15 Oti Ophthalmic Technologies Optical imaging apparatus with spectral detector
US8112312B2 (en) * 2006-10-19 2012-02-07 Johannes Ritter Multivariate testing optimization method
TWI337712B (en) * 2006-10-30 2011-02-21 Inst Information Industry Systems and methods for measuring behavior characteristics, and machine readable medium thereof
US7584171B2 (en) * 2006-11-17 2009-09-01 Yahoo! Inc. Collaborative-filtering content model for recommending items
US7590616B2 (en) * 2006-11-17 2009-09-15 Yahoo! Inc. Collaborative-filtering contextual model based on explicit and implicit ratings for recommending items
US7809470B2 (en) 2006-11-28 2010-10-05 S & S X-Ray Products, Inc. Controlled access supply cabinet and system
US8423565B2 (en) * 2006-12-21 2013-04-16 Digital Doors, Inc. Information life cycle search engine and method
US20080162699A1 (en) * 2006-12-29 2008-07-03 John Gaffney Selectively Apportioning User Web Traffic
US20080162399A1 (en) * 2006-12-31 2008-07-03 Think Passenger, Inc. Consumer marketing platform
US20080201643A1 (en) * 2007-02-01 2008-08-21 7 Billion People, Inc. System for creating customized web content based on user behavioral portraits
US7930286B2 (en) * 2007-02-16 2011-04-19 Yahoo! Inc. Federated searches implemented across multiple search engines
WO2008101355A1 (en) * 2007-02-23 2008-08-28 1698413 Ontario Inc. System and method for delivering content and advertisements
US20080249832A1 (en) * 2007-04-04 2008-10-09 Microsoft Corporation Estimating expected performance of advertisements
EP2150902A4 (en) 2007-04-22 2012-03-21 Phone Through Inc METHODS AND APPARATUS ASSOCIATED WITH CONTENT SHARING BETWEEN DEVICES
US20080270151A1 (en) * 2007-04-26 2008-10-30 Bd Metrics Method and system for developing an audience of buyers and obtaining their behavioral preferences to promote commerce on a communication network
US7890549B2 (en) * 2007-04-30 2011-02-15 Quantum Leap Research, Inc. Collaboration portal (COPO) a scaleable method, system, and apparatus for providing computer-accessible benefits to communities of users
US8301623B2 (en) * 2007-05-22 2012-10-30 Amazon Technologies, Inc. Probabilistic recommendation system
US20080300894A1 (en) 2007-06-01 2008-12-04 John George H Television Audience Targeting Online
US20090024546A1 (en) * 2007-06-23 2009-01-22 Motivepath, Inc. System, method and apparatus for predictive modeling of spatially distributed data for location based commercial services
US20090037402A1 (en) * 2007-07-31 2009-02-05 Rosie Jones System and method for predicting clickthrough rates and relevance
US7904303B2 (en) * 2007-08-24 2011-03-08 Yahoo! Inc. Engagement-oriented recommendation principle
DE102007040343B4 (de) * 2007-08-27 2010-12-30 Siemens Ag Vorrichtung und Verfahren zum Erzeugen einer Zufallsbitfolge
US8229798B2 (en) * 2007-09-26 2012-07-24 At&T Intellectual Property I, L.P. Methods and apparatus for modeling relationships at multiple scales in ratings estimation
US20090089234A1 (en) * 2007-09-28 2009-04-02 Rockwell Automation Technologies, Inc. Automated code generation for simulators
US20090171728A1 (en) * 2007-12-27 2009-07-02 Yan Tak W Simulation framework for evaluating designs for sponsored search markets
US20090171763A1 (en) * 2007-12-31 2009-07-02 Yahoo! Inc. System and method for online advertising driven by predicting user interest
US7984004B2 (en) * 2008-01-17 2011-07-19 Microsoft Corporation Query suggestion generation
US20090265290A1 (en) * 2008-04-18 2009-10-22 Yahoo! Inc. Optimizing ranking functions using click data
US8380562B2 (en) 2008-04-25 2013-02-19 Cisco Technology, Inc. Advertisement campaign system using socially collaborative filtering
CA2634020A1 (en) 2008-05-30 2009-11-30 Biao Wang System and method for multi-level online learning
US20090299945A1 (en) * 2008-06-03 2009-12-03 Strands, Inc. Profile modeling for sharing individual user preferences
US7685232B2 (en) 2008-06-04 2010-03-23 Samsung Electronics Co., Ltd. Method for anonymous collaborative filtering using matrix factorization
US20100241507A1 (en) * 2008-07-02 2010-09-23 Michael Joseph Quinn System and method for searching, advertising, producing and displaying geographic territory-specific content in inter-operable co-located user-interface components
US8312032B2 (en) * 2008-07-10 2012-11-13 Google Inc. Dictionary suggestions for partial user entries
US8037080B2 (en) * 2008-07-30 2011-10-11 At&T Intellectual Property Ii, Lp Recommender system utilizing collaborative filtering combining explicit and implicit feedback with both neighborhood and latent factor models
US8504558B2 (en) * 2008-07-31 2013-08-06 Yahoo! Inc. Framework to evaluate content display policies
US8566150B2 (en) * 2008-08-08 2013-10-22 Google Inc. Analyzing a content-requesting media item
US8533041B2 (en) * 2008-09-29 2013-09-10 Hewlett-Packard Development Company, L.P. Risk-and-return based advertisement selection and scheduling
US9002729B2 (en) * 2008-10-21 2015-04-07 Accenture Global Services Limited System and method for determining sets of online advertisement treatments using confidences
US20100121801A1 (en) * 2008-11-07 2010-05-13 Roy H Scott Enhanced matching through explore/exploit schemes
US8244517B2 (en) 2008-11-07 2012-08-14 Yahoo! Inc. Enhanced matching through explore/exploit schemes
US8037067B1 (en) * 2008-11-14 2011-10-11 United Services Automobile Association (Usaa) Systems and methods for tracking user activity at website
US20100131863A1 (en) * 2008-11-27 2010-05-27 Mobixell Networks Ltd Incremental collaborative filtering
US8316020B1 (en) * 2008-12-09 2012-11-20 Amdocs Software Systems Limited System, method, and computer program for creating a group profile based on user profile attributes and a rule
US8135739B2 (en) * 2008-12-29 2012-03-13 Microsoft Corporation Online relevance engine
US20100241639A1 (en) * 2009-03-20 2010-09-23 Yahoo! Inc. Apparatus and methods for concept-centric information extraction
US8301624B2 (en) * 2009-03-31 2012-10-30 Yahoo! Inc. Determining user preference of items based on user ratings and user features

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6134532A (en) * 1997-11-14 2000-10-17 Aptex Software, Inc. System and method for optimal adaptive matching of users to most relevant entity and information in real-time
US20070260624A1 (en) * 2006-03-29 2007-11-08 Chung Christina Y Incremental update of long-term and short-term user profile scores in a behavioral targeting system
TW200912781A (en) * 2007-09-05 2009-03-16 China Times Interactive Co Ltd Content comparing marketing system and operation method therefor

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI764884B (zh) * 2016-03-11 2022-05-21 香港商阿里巴巴集團服務有限公司 書籤的管理方法和裝置

Also Published As

Publication number Publication date
TW201104617A (en) 2011-02-01
WO2011008848A4 (en) 2011-06-16
WO2011008848A2 (en) 2011-01-20
US8612435B2 (en) 2013-12-17
US20110016121A1 (en) 2011-01-20
WO2011008848A3 (en) 2011-04-28

Similar Documents

Publication Publication Date Title
TWI424369B (zh) 用於決定內容相關性的活動型使用者興趣模型化
US11199939B2 (en) Evaluation of interactions with a user interface
US10824682B2 (en) Enhanced online user-interaction tracking and document rendition
RU2720899C2 (ru) Способ и система для определения зависящих от пользователя пропорций содержимого для рекомендации
JP5608286B2 (ja) 無限ブラウズ
US9165060B2 (en) Content creation and management system
RU2725659C2 (ru) Способ и система для оценивания данных о взаимодействиях пользователь-элемент
US20160299989A1 (en) User behavior models based on source domain
US20100121857A1 (en) Internet based method and system for ranking artists using a popularity profile
US20110145219A1 (en) Objective and subjective ranking of comments
US20160055242A1 (en) Systems and methods for analyzing content from digital content sources
US11681765B2 (en) System and method for integrating content into webpages
US9864768B2 (en) Surfacing actions from social data
EP2628097A1 (en) Systems and methods for using a behavior history of a user to augment content of a webpage
US20070255701A1 (en) System and method for analyzing internet content and correlating to events
US11822447B2 (en) Methods and servers for storing data associated with users and digital items of a recommendation system

Legal Events

Date Code Title Description
MM4A Annulment or lapse of patent due to non-payment of fees