TWI475412B

TWI475412B - 數位內容次序調整方法和數位內容匯流器

Info

Publication number: TWI475412B
Application number: TW101111679A
Authority: TW
Inventors: Shin Yi Wu; Yu Hsiang Hsiao; Chi Chun Kao; Po Yuan Ting; Yi Cyuan Chen; Wen Hsi Yeh
Original assignee: Ind Tech Res Inst
Priority date: 2012-04-02
Filing date: 2012-04-02
Publication date: 2015-03-01
Also published as: US20130262966A1; TW201342088A

Description

數位內容次序調整方法和數位內容匯流器

本揭露是有關於一種依據使用者的偏好和社群關係的數位內容(digital content)次序調整方法和數位內容匯流器(digital content aggregator)。

隨著iPad的風行，Flipboard這類串流式數位內容匯流媒體相繼現身。Flipboard是iPad的一款應用程式，使用者可以訂閱多個內容來源(content source)，每個內容來源可提供許多數位內容。如果內容來源是電子雜誌，其數位內容就是雜誌中的文章。如果內容來源是臉書(Facebook)、推特(Twitter)或噗浪(Plurk)之類的社群網站，其數位內容就是使用者發表的短句、文章、靜態圖片或動態影片。由於這些數位內容隨時間而不斷產生，不斷發表，所以可稱為內容串流(content stream)。Flipboard是將每個訂閱的內容來源視為一本虛擬雜誌，例如臉書和推特各為一本雜誌。雜誌風格的數位內容呈現方式使Flipboard普遍受到大眾的愛用，然而如果訂閱的內容來源過多，會造成資訊過載(information overload)的問題。

為解決資訊過載的問題，另一個應用程式Zite提出個人化的解決方案。Zite的使用者可以設定自己想訂閱的主題，例如汽車、寵物或美食等等。此外Zite也會觀察使用者的閱覽行為，藉由觀察使用者點擊觀看或不點擊觀看哪些題材、文章長度如何、和使用者的閱讀時間長度等，不斷了解使用者的興趣，藉此提供個人化的數位內容的呈現次序。

本揭露提供一種數位內容次序調整方法和數位內容匯流器(digital content aggregator)，可分析使用者的閱覽行為記錄(reading behavior log)且/或社群行為記錄(social behavior log)，得知使用者關於一個或多個內容串流其中的數位內容的偏好因素。

本揭露提供的數位內容次序調整方法和數位內容匯流器可將上述的一個或多個內容串流組合成一個匯流串流(aggregated stream)，並根據上述數位內容的時間因素，以及使用者關於上述數位內容的偏好因素，決定上述數位內容在匯流串流中的次序。這樣的次序調整可讓使用者優先看到最新鮮、最相關和最感興趣的數位內容，可避免眾多內容來源所造成的資訊過載。

為讓本揭露之上述特徵能更明顯易懂，下文特舉實施例，並配合所附圖式作詳細說明如下。

圖1是依照本揭露一實施例的一種數位內容匯流器120的示意圖。圖2、圖5A至圖5D以及圖6是數位內容匯流器所執行的數位內容次序調整方法的流程圖，其中圖2繪示主要步驟，圖5A至圖5D和圖6繪示進一步的細節。

本實施例中，可以有一個或多個內容來源，例如內容來源111~113，提供一個或多個內容串流給數位內容匯流器120。上述內容來源可以是社群網站、新聞網站或電子雜誌等數位內容提供者。數位內容匯流器120執行圖2的步驟220，將上述內容串流組合成一個匯流串流，提供給閱覽器(viewer) 130顯示，以供使用者點閱瀏覽。在組合內容串流時，數位內容匯流器120根據上述內容串流其中的數位內容的時間因素，以及使用者關於上述數位內容的偏好因素，決定上述數位內容在匯流串流中的次序。這次序也就是閱覽器130呈現給使用者的顯示次序。上述的時間因素至少包括上述數位內容的發表時間和有效期間其中之一。上述的偏好因素至少包括使用者關於上述數位內容的偏好和社群關係其中之一。

數位內容匯流器120可以為多位使用者提供上述的數位內容整合與排序服務。數位內容匯流器120可依照步驟220將個別使用者訂閱的內容串流組合成匯流串流，並調整其中的數位內容的次序，然後提供此匯流串流以供該使用者的閱覽器顯示。為了使數位內容匯流器120能分析使用者的偏好，閱覽器會記錄所屬使用者對上述數位內容的閱覽行為，將此閱覽行為記錄提供給數位內容匯流器120。為了分析使用者的社群關係，數位內容匯流器120會自使用者加入的一個或多個社群網站，例如社群網站141~143，取得使用者的社群行為記錄。

數位內容匯流器120包括偏好分析模組121和次序調整模組123。偏好分析模組121根據一或多個使用者的閱覽行為記錄且/或社群行為記錄，分析上述使用者關於上述內容串流的數位內容的偏好因素，將分析結果存入資料庫122。偏好分析模組121以遞增(incremental)方式產生上述的分析結果，也就是每隔一段預設時間(例如五分鐘)分析最近一段預設時間(例如九十天)內的閱覽行為記錄且/或社群行為記錄，並根據閱覽行為記錄和社群行為記錄之變動部分，每次逐步更新上述分析結果。次序調整模組123將上述內容串流組合成一個匯流串流，並根據上述數位內容的時間因素，以及使用者的上述偏好因素，決定上述數位內容在匯流串流中的次序。次序調整模組123以即時(real time)方式進行上述內容串流的組合與排序。也就是說，次序調整模組123只在閱覽器130被使用來閱覽數位內容時才進行上述內容串流的組合與排序。

圖3是數位內容匯流器120的另一個示意圖。偏好分析模組121可包括圖3的數位內容分析模組321、閱覽行為分析模組322、使用者分群模組323、以及社群關係分析模組324。資料庫311~313分別儲存上述的內容串流、閱覽行為記錄、以及社群行為記錄，以供數位內容分析模組321、閱覽行為分析模組322、以及社群關係分析模組324使用。資料庫122可包括圖3的資料庫331~333，資料庫331~333分別儲存數位內容分析模組321、使用者分群模組323、以及社群關係分析模組324所產生的資料，以供次序調整模組123使用。

資料庫311~313和331~333可以是數位內容匯流器120其中的一部分，也可以獨立於數位內容匯流器120之外。本揭露並不限定使用資料庫，在其他實施例中，資料庫311~313和331~333所儲存的資料可以改用檔案或其他種類的資料結構儲存於硬碟或記憶體等儲存裝置之中。上述儲存裝置可以獨立於圖3的各模組之外，也可以是圖3的一個或多個模組的一部分。

閱覽器130可以是硬體或軟體，例如可連接網路的智慧型手機、平板電腦、筆記型電腦或個人電腦等電子裝置，或以上電子裝置其中的應用程式。數位內容匯流器120也可以是硬體或軟體，例如可連接網路的伺服器或此伺服器其中的軟體。如果數位內容匯流器120是硬體，則圖3所示的次序調整模組123、數位內容分析模組321、閱覽行為分析模組322、使用者分群模組323、以及社群關係分析模組324都可以是硬體模組或軟體模組。如果數位內容匯流器120是軟體，則圖3所示的次序調整模組123、數位內容分析模組321、閱覽行為分析模組322、使用者分群模組323、以及社群關係分析模組324就是其中的軟體模組。

數位內容分析模組321可分析並擷取上述內容串流的數位內容的發表時間、長度、型態與特徵等資訊，並且將這些資訊存入資料庫331，以供次序調整模組123使用。上述的長度是指文章的文字長度或動態影片的時間長度，諸如此類。型態是指純文字、音樂、圖文或影音等媒體型態。至於特徵則視數位內容的型態而定。對於文章而言，其特徵是指文章之中的關鍵字。對於音樂，其特徵可包含(但不限於)旋律、曲調、演唱者或樂器等等。對於靜態圖片，其特徵可以是圖片中的物件或輪廓，例如房屋、車輛、窗戶、輪胎、男人或女人等各種人物、或貓狗等各種動物。對於動態影片，其特徵可包含(但不限於)影片中的物件、動作、影片類別、導演或演員等等。以上各種特徵可用現有的特徵萃取演算法取得，或由上傳者標註(tagging)。

閱覽行為分析模組322根據使用者在閱覽行為記錄中對上述數位內容的點閱行為以及上述數位內容的特徵而產生使用者的偏好模式(preference pattern)，這個偏好模式代表使用者個人對於數位內容的偏好。本實施例的使用者偏好模式包括該使用者在閱覽行為記錄中點閱過的數位內容的特徵與上述特徵的分數。分數的計算方式是將使用者的點閱行為分為一個或多個種類，將點閱行為的每個種類對應一個預設的分數。當閱覽行為分析模組322分析某一使用者的閱覽行為記錄時，每當該使用者在閱覽行為記錄中點閱一個數位內容，閱覽行為分析模組322就將該數位內容的特徵加入該使用者的偏好模式，並且將該使用者對該數位內容的點閱行為的種類的分數，累加至該數位內容的特徵在該使用者的偏好模式中的分數。

舉例而言，可將使用者的閱覽行為分為表1所示的四種，並將這四種行為對應表1所示的預設分數。這些閱覽行為都來自使用者的閱覽行為記錄。

表1　使用者的閱覽行為與對應分數

一開始，使用者的偏好模式是空白的。若該使用者在閱覽行為記錄中點閱某一篇文章，而此文章的特徵包括{食譜、番茄、肉醬、義大利麵}，則閱覽行為分析模組322會將{食譜、番茄、肉醬、義大利麵}這四個特徵加入該使用者的偏好模式，而且將這四個特徵在該使用者的偏好模式中的分數加一。此時該使用者的偏好模式如表2所示。

表2　使用者的偏好模式範例

接下來，若該使用者在閱覽行為記錄中給某一篇文章按「讚」，而此文章的特徵包括{嬰兒、副食品、食譜}，則閱覽行為分析模組322會將{嬰兒、副食品、食譜}這三個特徵加入該使用者的偏好模式，然後將這三個特徵在該使用者的偏好模式中的分數加二。此時該使用者的偏好模式如表3所示。

表3　使用者的偏好模式範例

接下來，若該使用者在閱覽行為記錄中分享某一篇文章，而此文章的特徵包括{肉醬、番茄、香腸、燉肉}，則閱覽行為分析模組322會將{肉醬、番茄、香腸、燉肉}這四個特徵加入該使用者的偏好模式，然後將這四個特徵在該使用者的偏好模式中的分數加三。此時該使用者的偏好模式如表4所示。

表4　使用者的偏好模式範例

從這個範例可以看出，一個使用者的偏好模式中的特徵，就是這個使用者在閱覽行為記錄中閱覽過的數位內容的特徵的聯集。當閱覽行為分析模組322以上述方式將某一使用者的閱覽行為記錄分析完畢，就可以得到該使用者的偏好模式。

當閱覽行為分析模組322分析過一或多個使用者的閱覽行為記錄之後，使用者分群模組323自閱覽行為分析模組322取得這些使用者的偏好模式，根據一個遞增階層式分群演算法(incremental hierarchical clustering algorithm)和這些使用者的偏好模式建立一個群組樹，將使用者分別加入群組樹之中的群組，同時計算各群組使用者之共同偏好特徵。

圖4A是本實施例的一個群組樹的範例。圖4A的群組樹包括多個節點R、C₁ 、C₂ 、D₁ ~D₇ 、E₁ 和E₂ 。每個節點都是一個群組(cluster)，而所謂群組就是偏好相近的使用者所組成的同好團體。群組之中可以包括子群組(child cluster)，也就是同好團體之中的進一步劃分，例如群組C₁ 包括子群組D₁ ~D₄ ，群組D₃ 包括子群組E₁ 和E₂ 。因此群組C₁ 可稱為D₁ ~D₄ 的父群組(parent cluster)，群組D₃ 可稱為E₁ 和E₂ 的父群組。根群組是群組樹的根節點(root node)，例如圖4A的根群組R，根群組包括所有使用者。內群組就是群組樹的內節點(inner node)，例如內群組C₁ 、C₂ 和D₃ 。一個內群組所包括的使用者是其子群組的使用者的聯集。葉群組就是群組樹的葉節點(leaf node)，例如葉群組D₁ ~D₂ 、D₄ ~D₇ 和E₁ ~E₂ 。使用者的實際歸屬關係是在葉群組。

圖5A至圖5D繪示本實施例的使用者分群模組323所執行的遞增階層式分群演算法，但本揭露不以此為限，根據其他的遞增階層式分群演算法也能達到建構群組樹並且將使用者分群的目的。

上述的遞增階層式分群演算法其中的遞增(incremental)是指不需要在每次分析閱覽行為記錄之後重建群組樹，而是只需要在第一次分析時建立群組樹，接下來的每一次分析過後只需要對每一個使用者執行圖5A的流程。圖5A的流程會逐一檢查每一個使用者的狀況，若該使用者已存在於群組樹中，則檢查是否要改變該使用者所屬的群組，若該使用者尚未加入群組樹，則根據該使用者的偏好模式將該使用者加入群組樹的一個葉群組。

在說明圖5A的流程之前，必須先說明使用者分群模組323如何計算相似度(similarity)。在本實施例中，使用者分群模組323可計算三種相似度，分別是兩個使用者之間的相似度、一個使用者和一個群組之間的相似度、以及兩個群組之間的相似度。

兩個使用者之間的相似度可根據兩個使用者的偏好模式而計算產生。目前已經有多種方法可用來計算兩個使用者的相似度或距離，例如歐氏距離(Euclidean distance)、馬氏距離(Mahalanobis distance)、漢默距離(Hamming distance)、皮爾森相關度(Pearson correlation coefficient)、史匹爾曼階級相關係數(Spearman's rank correlation coefficient)、以及餘弦相似度(cosine similarity)。若計算出來的是距離，取其倒數就是相似度。以下說明的計算方法是根據漢默距離，但本揭露不以此為限，在其他實施例中可改用其他計算方法。

假設要計算使用者A和B的相似度。首先將使用者A和B的偏好模式其中的特徵依照至少一個預設的臨界值區分為多個集合。例如依照臨界值t₁ ,t₂ ,t₃ ,...,t_i 將使用者A的偏好模式的特徵分為i+1個集合s_A1 ,s_A2 ,s_A3 ,...,s_A(i+1) ，其中i為正整數，s_A1 是使用者A的偏好模式的特徵其中分數小於t₁ 者所組成的集合，s_A2 是使用者A的偏好模式的特徵其中分數大於或等於t₁ 而且小於t₂ 者所組成的集合，s_A3 是使用者A的偏好模式的特徵其中分數大於或等於t₂ 而且小於t₃ 者所組成的集合，依此類推，s_A (_i+1 )是使用者A的偏好模式的特徵其中分數大於或等於t_i 者所組成的集合。同理，可依照臨界值t₁ ,t₂ ,t₃ ,...,t_i 將使用者B的偏好模式的特徵分為i+1個集合s_B1 ,s_B2 ,s_B3 ,...,s_B(i+1) 。

使用者A和B的相似度可用下列公式計算

其中w_j 是s_Aj 和s_Bj 所對應的權重，權重w_j 都是預設值，Sim_j 是s_Aj 和s_Bj 的相似度。若s_Aj 和s_Bj 這兩個集合的特徵數量總和不為零，則Sim_j 可用下列公式計算

其中count()是括號其中的集合的特徵數量。若s_Aj 和s_Bj 這兩個集合的特徵數量總和為零，則Sim_j 等於1。

在本揭露的其他實施例中，上述的相似度公式可以做一點變化，如下

公式(3)比公式(1)多出w₀ 和Sim₀ ，其中w₀ 是特徵集合s_A0 和s_B0 所對應的預設權重，Sim₀ 是特徵集合s_A0 和s_B0 的相似度，s_A0 是使用者A的偏好模式的所有特徵的集合，s_B0 是使用者B的偏好模式的所有特徵的集合。Sim₀ 的計算方式和其餘的Sim_j 相同。

一個使用者和一個群組的相似度是根據該使用者的偏好模式和該群組其中至少一個使用者的偏好模式而產生，例如可根據該群組的使用者的偏好模式產生該群組本身的偏好模式，這個群組本身的偏好模式就是該群組使用者之共同偏好特徵，然後利用該使用者的偏好模式和該群組的偏好模式來計算該使用者和該群組的相似度。

舉例而言，若用上述方式將某群組C其中每一個使用者U的偏好模式的特徵依照預設的臨界值t₁ ,t₂ ,t₃ ,...,t_i 區分為i+1個集合s_U1 ,s_U2 ,s_U3 ,...,s_U(i+1) ，則群組C的偏好模式可由集合s_C1 ,s_C2 ,s_C3 ,...,s_C(i+1) 組成。若有一個特徵存在於群組C的超過一個預設比例的使用者的s_U1 之中，則將此特徵加入群組C的集合s_C1 ，若有一個特徵存在於群組C的超過上述預設比例的使用者的s_U2 之中，則將此特徵加入群組C的集合s_C2 ，依此類推。以此方式過濾群組C的所有使用者的所有特徵，就可得到群組C的偏好模式。

由於群組的偏好模式的格式和使用者相同，所以可使用上述的公式(1)或(3)計算一個使用者和一個群組之間的相似度。

本揭露的使用者和群組之間的相似度並不限於上述的計算法，在其他實施例中可以改用其他方式來計算使用者和群組之間的相似度。以計算使用者A和群組C的相似度為例，可在群組C選取一個使用者B做為群組C的代表使用者，然後計算使用者A、B之間的相似度，做為使用者A和群組C的相似度。群組C的代表使用者B有多種選取方式，例如可選取最先加入群組C的使用者，或選取群組C其中偏好模式和群組C本身的偏好模式最相似的使用者，或在群組C當中用亂數選取一個使用者，作為代表使用者B。

至於兩個群組之間的相似度，有兩種計算方式。第一種方式是計算兩個群組本身的偏好模式的相似度，做為兩個群組之間的相似度。第二種方式是計算兩個群組的代表使用者的相似度，做為兩個群組之間的相似度。

以下說明圖5A的流程，使用者分群模組323可以在閱覽行為分析模組322分析過一或多個使用者的閱覽行為記錄並得到這些使用者的偏好模式之後，對每一個上述使用者執行圖5A的流程。

首先，在步驟502檢查使用者是否已存在於群組樹中。如果已經存在，則在步驟504檢查該使用者和該使用者原先所屬的群組的相似度是否大於預設的層級臨界值T_L 。層級臨界值T_L 的下標字L表示群組樹的層級，根群組R的層級等於0，根群組R的子群組的層級等於1，再向下的群組的層級就逐級遞增。在步驟504，L等於該使用者所屬群組的層級。層級臨界值T_L 是層級L的遞增函數，例如，T_L 可以是等差級數、等比級數、以指數式成長的級數，或以上級數的變化或組合。

如果該使用者和原先所屬群組的相似度大於預設的臨界值，則該使用者可以繼續留在原先所屬的群組中，因為使用者的偏好模式可能有變化，所以必須在步驟506更新該使用者原先所屬群組的偏好模式。

另一方面，如果該使用者和原先所屬群組的相似度不大於預設的臨界值，則在步驟508自該使用者原先所屬的群組移除該使用者，在步驟510更新該使用者原先所屬群組的偏好模式，並且在步驟512執行圖5B的流程以在群組樹中尋找該使用者所屬的群組。

回到步驟502，如果該使用者尚不存在於群組樹中，則直接在步驟512執行圖5B的流程以在群組樹中尋找該使用者所屬的群組。

圖5B繪示步驟512的詳細流程，此流程使用一個臨時變數C*表示使用者目前可能加入的群組。首先，在步驟522將C*設定為群組樹的根群組R。在步驟524檢查群組樹是否僅有根群組R，如果是，表示此群組樹是在初始狀態，還沒有任何使用者加入群組樹。所以流程進入步驟526，在群組C*之下新增一個子群組C'，在步驟528將C*設定為C'，然後進入步驟542。

在步驟524的檢查中，如果群組樹除了根群組R以外還包括其他群組，則進入步驟530，檢查C*是否有任何子群組。如果沒有，則流程進入步驟542。如果有，則在步驟532計算該使用者和C*的每一個子群組C_j 的相似度，然後在步驟534檢查下列不等式是否成立。

其中max表示最大值，P_i 是該使用者，Sim(P_i ,C_j )就是該使用者P_i 和子群組C_j 的相似度，T_L+1 是上述的層級臨界值，L等於群組C*所在的層級。不等式(4)的意思是該使用者和每一個子群組C_j 的相似度其中最高的相似度是否小於層級臨界值T_L+1 。如果不等式(4)不成立，則在步驟536將C*設定為子群組C_j 之中和該使用者的相似度最高者，然後返回步驟530。反之如果不等式(4)成立，則進入步驟538，在群組C*之下新增子群組C'，在步驟540將C*設定為C'，然後進入步驟542。

在步驟542，將該使用者加入群組C*，並更新群組C*的偏好模式，C*成為該使用者所屬的群組。然後在步驟544設定群組C*的代表使用者。如前所述，代表使用者有多種選取方法，例如可選取最先加入群組C*的使用者，或選取群組C*其中偏好模式和群組C*本身的偏好模式最相似的使用者，或在群組C*當中用亂數選取一個使用者，作為C*的代表使用者。若以最先加入的使用者做為C*的代表使用者，則後面有新使用者加入時，代表使用者就不需要重新設定。

接下來，在步驟546檢查C*的父群組是否符合凝聚條件，也就是檢查C*的父群組的子群組數量是否大於預設的凝聚臨界值T_B 。如果是，則在步驟548對C*的父群組執行如圖5C所示的凝聚(agglomerate)程序，否則流程直接進入步驟550。接下來，在步驟550檢查群組C*是否符合分裂條件，也就是檢查群組C*的使用者數量是否大於預設的分裂臨界值T_F ，如果是，則對C*執行如圖5D所示的分裂(split)程序，將群組C*一分為二。

總而言之，圖5B的流程是自群組樹的根群組開始，比較該使用者和群組樹的群組的相似度，根據上述比較決定一條路徑，逐層向下，最後到達一個葉群組或新增一個葉群組，並且以最後到達的葉群組或新增的葉群組作為該使用者所屬的群組。至於上述的凝聚程序和分裂程序，則是對群組樹本身的調整，細節如下。

圖5C繪示上述的凝聚程序的流程，請參照圖4B，凝聚程序是針對包含過多子群組的群組。舉例來說，如果群組C有太多子群組，則可在群組C之下新增子群組C₁ 和C₂ ，將群組C原有的子群組分別依附在C₁ 和C₂ 之下。

以下說明凝聚程序的流程。首先在步驟562接收輸入群組C。若凝聚程序是在圖5B的步驟548執行，則群組C就是步驟548的群組C*的父群組。若凝聚程序是在圖5D的步驟596執行，則群組C就是步驟596的群組Cp。

然後在步驟564，移除群組C的所有子群組，將這些子群組加入一個臨時串列t。在步驟566，在群組C之下新增兩個子群組C₁ 和C₂ 。在步驟568，以任意方式從臨時串列t的所有子群組的代表使用者之中選取一個代表使用者A，例如可用亂數選取代表使用者A。然後在步驟570，將使用者A設定為群組C₁ 的代表使用者，將使用者A在臨時串列t當中所屬的子群組C_A 自t移除並加入群組C₁ ，也就是使群組C_A 成為C₁ 的子群組之一。

接下來，在步驟572，從臨時串列t的所有子群組的代表使用者之中選取和代表使用者A的相似度最低的代表使用者B。然後在步驟574，將使用者B設定為群組C₂ 的代表使用者，將使用者B在臨時串列t當中所屬的子群組C_B 自t移除並加入群組C₂ ，也就是使群組C_B 成為C₂ 的子群組之一。

接下來，在步驟576，對於臨時串列t當中剩餘的每一群組C*，比較群組C*和群組C_A 之間的相似度以及群組C*和群組C_B 之間的相似度。若群組C*和群組C_A 之間的相似度較高，則將群組C*加入群組C₁ ，也就是使群組C*成為C₁ 的子群組之一。若群組C*和群組C_B 之間的相似度較高，則將群組C*加入群組C₂ ，也就是使群組C*成為C₂ 的子群組之一。然後在步驟578更新兩群組C₁ 和C₂ 的偏好模式。

圖5D繪示上述的分裂程序的流程，請參照圖4C，分裂程序是針對包含過多使用者的群組。舉例來說，如果群組C有太多使用者，則可將群組C分裂為群組C₁ 和C₂ 。

以下說明分裂程序的流程。首先在步驟582接收輸入群組C。若分裂程序是在圖5B的步驟552執行，則群組C就是步驟552的群組C*。

然後，在步驟584將群組C自其父群組Cp之下移除。在步驟586，在群組Cp之下新增子群組C₁ 和C₂ 。在步驟588，以任意方式自群組C選取一個使用者A，將使用者A加入群組C₁ ，作為C₁ 的代表使用者。自群組C選取使用者A的方式不限，例如可選取第一個加入群組C的使用者，或用亂數自群組C選取一個使用者。然後在步驟590，在群組C當中找出和使用者A的相似度最低的使用者B，將使用者B加入C₂ 作為C₂ 的代表使用者。

接下來，在步驟592，對群組C的每一其餘使用者X，比較使用者X和使用者A的相似度以及使用者X和使用者B的相似度。若使用者X和使用者A的相似度較高，則將使用者X加入群組C₁ ，反之則將使用者X加入群組C₂ 。然後更新群組C₁ 和C₂ 的偏好模式。

接下來，在步驟594檢查群組C的父群組Cp是否符合凝聚條件，也就是檢查Cp的子群組數量是否大於預設的凝聚臨界值T_B 。如果是，則在步驟596對群組Cp執行如圖5C所示的凝聚程序。

一個群組的偏好模式可包括在該群組的使用者的偏好模式中分布比例大於或等於一個預設臨界值的特徵，以及這些特徵的分布比例。例如，若有一個特徵出現在該群組的83%的使用者的偏好模式中，則此特徵的分佈比例就是0.83。使用者分群模組323將每一個使用者的偏好模式、上述的群組樹、以及每一個群組的偏好模式存放在資料庫332，以供次序調整模組123使用。

上述的遞增階層式分群演算法所建構完成的群組樹可持續使用，當某一個使用者的閱覽行為記錄改變時，使用者分群模組323可檢查該使用者和所屬群組的相似度是否仍然大於或等於預設的層級臨界值T_L 。如果該使用者和所屬群組的相似度已經低於層級臨界值T_L ，則使用者分群模組323將該使用者自該群組刪除，更新該群組的偏好模式，並且將該使用者重新加入群組樹。若該使用者和所屬群組的相似度仍大於或等於層級臨界值T_L ，則只要更新所屬群組之偏好模式即可。這樣可降低重新建構群組樹的頻率以提高效率。

社群關係分析模組324可在社群行為記錄中分析並擷取使用者在社群網站的一個或多個朋友和該使用者的互動行為。從這些互動行為可得知該使用者的好友的偏好。

更具體的說，社群關係分析模組324可分析某一使用者的社群行為記錄，並記錄特定的數位內容是否為該使用者的朋友發表、是否受該使用者的朋友推薦、以及是否受該使用者的朋友回應、轉載或引用，但不限這些社群行為。社群關係分析模組324也可以根據社群行為記錄，分析並記錄該使用者對朋友過去發表的數位內容的互動行為，例如按「讚」、留言或分享，計算使用者與朋友間的社群關係分數，進而影響數位內容的推薦程度。社群關係分析模組324將上述的分析結果存入資料庫333，以供次序調整模組123使用。

次序調整模組123根據資料庫331~333所儲存的分析結果，執行圖6的方法流程，將來自一個或多個內容來源的一個或多個內容串流組成一個匯流串流，並調整其中的數位內容的次序。圖7可說是圖6的方法流程的示意圖，也可說是圖6的方法流程的一個範例。圖7繪示三個內容串流701~703，內容串流701~703上方有多個黑點表示內容串流701~703的數位內容本身與其發表時間，例如黑點751即代表內容串流701的一個數位內容本身，以及此數位內容的發表時間。每個黑點右邊有一條橫線表示數位內容的有效期間，例如橫線752表示數位內容751的有效期間。時間軸770表示從過去到現在的時間，越向右邊表示越接近現在時間。

以下說明圖6流程。首先，次序調整模組123在步驟620將每一個內容串流701~703切分為多個區段，例如內容串流701~703的第一個區段分別是711~713。圖7之中，Δ_T 是每一個內容串流的時間長度，而Δ_t 是每一個區段的時間長度。每個內容串流701~703是由多個區段組成，次序調整模組123輸出的匯流串流740同樣是由多個區段組成。對於正整數i，匯流串流740的第i個區段和每一個內容串流701~703的第i個區段皆有相同的起始時間和結束時間。

每個區段可包括一個或多個數位內容，例如內容串流701的第一個區段711包括數位內容761和762。在本實施例中，有兩種方式可決定數位內容所歸屬的區段。第一種方式是每一個區段包括該區段所屬的內容串流其中，有效期間起始於該區段的數位內容，上述有效期間的起始時間就是數位內容的發表時間。例如內容串流701的第三個區段包括數位內容751。第二種方式是每一個區段包括該區段所屬的內容串流其中，有效期間結束於該區段的數位內容，例如內容串流701的第一個區段包括數位內容751。有效期間可根據內容來源的更新頻率或數位內容的長度來設定。對於更新頻率較低的內容來源或較長的數位內容，可設定較長的有效期間，讓使用者有較長的時間可閱覽。

接下來，次序調整模組123在步驟640對每一個上述區段，根據使用者關於該區段的數位內容的偏好因素，決定該區段的數位內容的次序。為了決定上述次序，次序調整模組123為每一個數位內容計算一個對應的總體偏好分數(total preference score)，並且將每一個區段內的數位內容分別根據總體偏好分數排序，總體偏好分數越高的數位內容次序越前面。總體偏好分數的計算公式如下：

TPS=Ω×(W_Ω +W_L P_L +W_T P_T +W_R P_R )...........(5)

W_Ω +W_L +W_T +W_R =1........................................(6)

其中TPS就是總體偏好分數。Ω是使用者對於數位內容的特徵偏好分數，可表示使用者與其同好群組偏愛具有哪些特徵的數位內容。P_L 是使用者對於數位內容的長度偏好分數，表示使用者偏愛哪一種長度的數位內容，例如短句、短文章或長文章。P_T 是使用者對於數位內容的型態偏好分數，表示使用者偏愛哪一種媒體型態的數位內容，例如純文字、音樂、圖文或影音。P_R 是使用者對於數位內容的社群關係分數，表示使用者和社群網站上的朋友的互動是否緊密，以及是否偏好同樣的數位內容。W_Ω 、W_L 、W_T 以及W_R 是預設的權重。

本實施例的總體偏好分數TPS是使用Ω、P_L 、P_T 以及P_R 這四項分數來計算，但本揭露並不以此為限，在其他實施例中可以簡化公式(5)和(6)，只用Ω、P_L 、P_T 以及P_R 這四項分數其中的一至三項來計算總體偏好分數TPS。以下說明次序調整模組123如何計算這四項分數。

特徵偏好分數Ω可以等於Ω₁ 、Ω₂ 或Ω₁ +Ω₂ 。Ω₁ 和Ω₂ 的計算公式如下。

公式(7)其中，Q₁ 是此數位內容的特徵和閱覽此數位內容的使用者的偏好模式的特徵的交集，x_i 是Q₁ 其中的特徵，x_i .pt是特徵x_i 在該使用者的偏好模式之中的分數。c是預設常數，例如0、1、或其他數值。

公式(8)其中，Q₂ 是此數位內容的特徵和閱覽此數位內容的使用者所屬的群組的偏好模式的特徵的交集，x_j 是Q₂ 其中的特徵，x_j .sup是特徵x_j 在該群組的偏好模式之中的分布比例。

為了計算長度偏好分數P_L 和型態偏好分數P_T ，可將數位內容分為多個長度種類，例如短、中、長，並且將數位內容分為多個型態種類，例如短訊息、純文字、圖文、音樂、影音。長度偏好分數P_L 可以是此數位內容所屬的長度種類在閱覽此數位內容的使用者的閱覽行為記錄其中的所有數位內容之中所佔的比例。型態偏好分數P_T 可以是此數位內容所屬的型態種類在閱覽此數位內容的使用者的閱覽行為記錄其中的所有數位內容之中所佔的比例。

社群關係分數P_R 可根據此數位內容是否受使用者的朋友推薦以及該使用者對朋友過去發表的數位內容的互動行為的種類而產生。本實施例的社群關係分數P_R 的計算公式如下。

其中F是該使用者在社群網站的朋友的集合。變數I_i 是根據該使用者與其朋友i關於此數位內容的互動而產生，細節後述。RSC_i 是該使用者的朋友i對該使用者的相對社群緊密度(relative social closeness)，計算方式如下。

首先，可將該使用者對朋友過去發表的數位內容的互動行為分為幾個種類，分別為每一個互動行為種類設定一個分數，例如表5所示。

表5　使用者的互動行為種類範例

以該使用者的朋友B為例，將該使用者的社群行為記錄中，該使用者在社群網站上對朋友B過去發表的數位內容的每一個互動行為所對應的分數全部累加，可得到朋友B對該使用者的社群緊密度SC_B 。其他朋友對該使用者的社群緊密度可用同樣方式計算。然後可用下列公式計算朋友B對該使用者的相對社群緊密度RSC_B 。

其中F是該使用者的朋友的集合，SC_i 是朋友i對該使用者的社群緊密度。

本實施例中，有兩種方式可計算公式(9)的變數I_i 。第一種方式使用在數位內容來自非社群網站，例如新聞網站或電子雜誌時。第一種方式是根據此數位內容是否受該使用者的朋友i推薦。而所謂推薦是指朋友i在閱覽器130上閱覽此數位內容時，針對此數位內容按「讚」，或類似的動作。例如，若此數位內容受朋友i推薦，則I_i 等於1，否則I_i 等於0。

第二種方式是根據此數位內容是否為朋友i在社群網站上發表或分享，以及此數位內容是否在社群網站上受朋友i回應。例如，若此數位內容為朋友i發表或分享或受到朋友i的任何回應，則I_i 等於1。若此數位內容不為朋友i發表或分享，而且沒受到朋友i的任何回應，則I_i 等於0。此外，如果此數位內容是由朋友i發表或分享，則可將朋友i對該使用者的社群緊密度SC_i 乘上一個預設倍數，例如兩倍。

次序調整模組123可根據公式(9)計算社群關係分數P_R 。或者，社群關係分析模組324可負責公式(9)的部份或全部計算，然後將計算成果存放在資料庫333，以供次序調整模組123取用。

接下來，次序調整模組123在步驟660用內容串流701~703的區段組成匯流串流740。匯流串流740包括多個區段，而且對於任一正整數i，匯流串流740的第i個區段是由內容串流701~703的第i個區段所組成。如圖7所繪示的範例，內容串流701~703的第一個區段711~713經過步驟640的計算總體偏好分數和排序後，分別成為區段721~723，然後次序調整模組123將區段721~723組成匯流串流740的第一個區段731。匯流串流740的其他區段依此類推。

次序調整模組123可根據閱覽行為記錄中，使用者對於每一個內容串流的數位內容的點閱次數，決定來自不同內容串流的數位內容在匯流串流中的次序。舉例來說，假設在某一個使用者的閱覽行為記錄中，該使用者對於內容串流701~703的數位內容的點閱次數分別是C₁ 、C₂ 、C₃ ，則可計算內容串流701~703的點閱機率P₁ 、P₂ 、P₃ 如下。

P₁ =C₁ /(C₁ +C₂ +C₃ )..........................................(11)

P₂ =C₂ /(C₁ +C₂ +C₃ )..........................................(12)

P₃ =C₃ /(C₁ +C₂ +C₃ )..........................................(13)

然後用下列公式計算另一組機率P₁ ’、P₂ ’和P₃ ’

P_k ’=μ/n+(1-μ)×P_k ...............................................(14)

其中n是內容串流數量，對於圖7的內容串流701~703來說，n等於3。k是1至n的整數。依據公式(14)，機率P_k ’是平均機率1/n和點閱機率P_k 的加權平均，這兩個機率的權值由變異因子μ決定。變異因子μ可以是0至1的任意實數，例如0.2。變異因子μ可防止使用者只看某幾種內容來源就難以接收到其他內容來源的推薦，導致沒看過的內容來源就永遠排在最後而難以改變。

對於匯流串流740的第i個區段(i為正整數)，次序調整模組123可用亂數選擇內容串流701~703其中之一，上述亂數選擇內容串流701~703的機率分別是P₁ ’、P₂ ’、P₃ ’。然後將內容串流701~703的每個區段視為佇列(queue)，取出被選中的內容串流的第i個區段的第一個數位內容，也就是總體偏好分數最高的數位內容，使該數位內容成為匯流串流740的第i個區段的第一個數位內容。然後用同一亂數選擇內容串流701~703其中之一，取出被選中的內容串流的第i個區段的第一個數位內容，使該數位內容成為匯流串流740的第i個區段的第二個數位內容，依此類推，直到內容串流701~703的第i個區段都成為空佇列。這樣可將內容串流701~703的第i個區段的數位內容全部併入匯流串流740的第i個區段。

次序調整模組123用以上方式產生匯流串流740的每一個區段，然後輸出匯流串流740供閱覽器130顯示。閱覽器130依照數位內容在匯流串流740中的次序顯示上述數位內容。雖然圖7繪示三個內容串流701~703，但本揭露並不限於此，在其他實施例中，數位內容匯流器120可對任意數量的一個或多個內容串流進行排序與組合。

以上實施例提出一種可感知使用者偏好的數位內容次序調整方法和數位內容匯流器，以使用者的個人偏好為主，同好群組的熱門偏好為輔，並納入社群關係，可在維持數位內容新鮮度的前提下調整數位內容的呈現次序。串流式數位內容的特點在於內容隨時間不斷產生，議題不斷變化，長度、型態、發文者各不相同。以上實施例所提供的數位內容次序調整方法和數位內容匯流器可整合不同來源的資訊，讓使用者在每次閱覽時，只需翻閱前幾頁即可閱覽大部分近期有趣的主題，可讓使用者在輕鬆的閱讀狀態下取得最新最有興趣的資訊。

雖然本揭露已以實施例揭露如上，然其並非用以限定本揭露，任何所屬技術領域中具有通常知識者，在不脫離本揭露之精神和範圍內，當可作些許之更動與潤飾，故本揭露之保護範圍當視後附之申請專利範圍所界定者為準。

111~113．．．內容來源

120．．．數位內容匯流器

121．．．偏好分析模組

122．．．資料庫

123．．．次序調整模組

130．．．閱覽器

141~143．．．社群網站

220．．．流程步驟

311~313．．．資料庫

321．．．數位內容分析模組

322．．．閱覽行為分析模組

323．．．使用者分群模組

324．．．社群關係分析模組

331~333．．．資料庫

502~596、620~660．．．流程步驟

701~703．．．內容串流

711~713、721~723．．．內容串流的區段

731．．．匯流串流的區段

740．．．匯流串流

751．．．數位內容的發表時間

752．．．數位內容的有效期間

761、762．．．數位內容

770．．．時間軸

C、C₁ ~C₂ 、Cp、D₁ ~D₇ 、E₁ ~E₂ 、R．．．使用者群組

圖1是依照本揭露一實施例的一種數位內容匯流器的示意圖。

圖2是依照本揭露一實施例的一種數位內容次序調整方法的流程圖。

圖3是依照本揭露一實施例的一種數位內容匯流器的示意圖。

圖4A至圖4C是依照本揭露一實施例的群組樹的示意圖。

圖5A至圖6是依照本揭露一實施例的一種數位內容次序調整方法的流程圖。

圖7是依照本揭露一實施例的一種數位內容次序調整方法的示意圖。