TWI499290B - 資訊推薦方法及系統 - Google Patents

資訊推薦方法及系統 Download PDF

Info

Publication number
TWI499290B
TWI499290B TW101145189A TW101145189A TWI499290B TW I499290 B TWI499290 B TW I499290B TW 101145189 A TW101145189 A TW 101145189A TW 101145189 A TW101145189 A TW 101145189A TW I499290 B TWI499290 B TW I499290B
Authority
TW
Taiwan
Prior art keywords
rule
type
item
scoring
rules
Prior art date
Application number
TW101145189A
Other languages
English (en)
Other versions
TW201421984A (zh
Inventor
Shun Chieh Lin
Kuang Hung Cheng
Huan Wen Tsai
Shin Mu Tseng
Bai En Shie
Cheng Wei Wu
Original Assignee
Ind Tech Res Inst
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ind Tech Res Inst filed Critical Ind Tech Res Inst
Priority to TW101145189A priority Critical patent/TWI499290B/zh
Publication of TW201421984A publication Critical patent/TW201421984A/zh
Application granted granted Critical
Publication of TWI499290B publication Critical patent/TWI499290B/zh

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

資訊推薦方法及系統
本揭露係一種資訊推薦方法及系統,特別是關於一種利用關聯式規則的資訊推薦方法及系統。
隨著資訊科技的發達帶來大量資訊,產生資訊爆炸的現象。對此開發出透過個人化偏好推估,以在大量資訊中引導使用者挑選出最感興趣或有用的資訊的推薦方法。現有的推薦方法可分成協合過濾式(Collaborative-Filtering)或是內容及規則式(Content and Rule based)。
協合過濾式的推薦方式針對每一個產品或服務等資訊,依據使用者的喜好程度,以及資訊與喜好程度之間的相似程度進行推薦。但是針對新的使用者,由於使用記錄不足,所以難以達到有效的預測與推薦,而有冷起始的問題。
內容及規則式的推薦方式則分析使用者數據,透過資料探勘(data mining)技術產生關聯式規則(association rule)以將資訊進行排名及推薦。然而目前利用關聯式規則的推薦方式僅考慮單種行為關聯,與使用者實際使用行為狀況不符。更甚者,傳統方法常使用基本型的關聯式資訊做規則推薦,在不同使用情境下或沒有使用者行為(user behavior)的資料時,無法進行推薦。再者,使用者當下使用行為特徵不明確時,由於傳統方法僅依同類型的關聯式規則進行推薦,而有命中率(hit ratio)低或是使用者回應率(recall)低的問題。
本揭露之一實施例提供一種資訊推薦方法,以從多個資訊項目之中提供至少一推薦項目。其中資訊推薦方法包括以下步驟。執行多個關聯式規則(Association rule)產生程序以產生對應多個規則類型的多個關聯式規則。依據一使用者情境,選擇至少一個規則類型;並依據使用者情境,對選擇的至少一個規則類型所對應的關聯式規則評分,得到多個匹配率。接著依據匹配率,選擇關聯式規則的其中多個,作為多個評分規則;再利用評分規則對資訊項目評分,以從資訊項目中選擇並輸出至少一個推薦項目。
本揭露之一實施例提供一種資訊推薦系統,包括一規則產生模組、一情境匹配模組、一規則評分模組以及一合併評分模組,並可執行上述資訊推薦方法。規則產生模組用以執行多個關聯式規則產生程序以產生對應多個規則類型的多個關聯式規則。情境匹配模組用以依據使用者情境,選擇至少一個規則類型。規則評分模組用以依據使用者情境,對選擇的至少一個規則類型所對應的關聯式規則評分得到多個匹配率,並依據匹配率,選擇關聯式規則的其中多個作為多個評分規則。合併評分模組用以利用評分規則對資訊項目評分,以從資訊項目中選擇並輸出至少一個推薦項目。
本揭露實施例如提供之資訊推薦方法及系統產生多個關 聯性規則後,可根據不同的使用者情境選出適合的關聯式規則,並統整選擇的關聯式規則所產生的結果,再依據統整結果提供推薦項目。因此資訊推薦方法及系統即使在使用者當下使用行為特徵不明確時也能找出最適當的推薦項目,而較傳統方法具有更高的推薦命中率。
以下在實施方式中詳細敘述本揭露之詳細特徵以及優點,其內容足以使任何熟習相關技藝者了解本揭露之技術內容並據以實施,且根據本說明書所揭露之內容、申請專利範圍及圖式,任何熟習相關技藝者可輕易地理解本揭露相關之目的及優點。
本揭露之實施例提供一種資訊推薦方法及系統,以從多個資訊項目之中提供至少一推薦項目。請參照「第1圖」以及「第2圖」,其分別為一實施範例之資訊推薦系統之方塊示意圖,以及資訊推薦方法之流程圖。在此實施例中之資訊推薦系統20包括一規則產生模組22、一情境匹配模組24、一規則評分模組26以及一合併評分模組28,並可執行一資訊推薦方法。其中資訊推薦系統20可以於雲端或局端的一伺服器,也可以實作成使用者終端的電子裝置。而資訊推薦方法則可以由伺服器或使用者終端的電子裝置所執行。
其中規則產生模組22執行多個關聯式規則(association rule)產生程序,以產生多個關聯式規則(步驟S100)。其中關 聯式規則產生程序可以是一基本型規則(association rule)產生程序、一序列型規則(sequential pattern rule)產生程序、一效益型規則(utility pattern rule)產生程序或一週期型規則(cyclic pattern rule)產生程序,且關聯式規則可以是一基本型、一序列型、一效益型或一週期型。
規則產生模組22可連接一基本型樣本資料庫31、一序列型樣本資料庫32、一效益型樣本資料庫33以及一週期型樣本資料庫34,並利用這些樣本資料庫產生關聯式規則。而規則產生模組22產生的關聯式規則也可以依據類型個別儲存於一個或多個規則資料庫,以供資訊推薦方法重新利用。也就是說,如果樣本資料庫沒有更新,情境匹配模組24、規則評分模組26以及合併評分模組28可以利用已產生的關聯式規則對不同的使用者進行多次推薦。
其中基本型樣本資料庫31、序列型樣本資料庫32、效益型樣本資料庫33以及週期型樣本資料庫34中可以存放已經過資料探勘(data mining)之後得到的各種樣本資料;而每一種規則產生程序都可以依據這些樣本資料產生一個或多個的關聯式規則。此外,規則產生模組22也可以連接其他類型的樣本資料庫,並可利用其他類型的關聯式規則產生程序產生對應的關聯式規則,再繼續後續的步驟。
基本型的關聯式規則的格式為:「Rk :Ak →Ck 」;其中Rk 為關聯式規則,Ak 為一已知項目集,Ck 為一推測項目集,表示「當 Ak 發生時,就會發生Ck 」的這個規則。
以下簡介基本型產生程序將基本型樣本轉換成關聯式規則的例子。
假設基本型樣本資料庫31中包括「{A}:17.2%」以及「{A,B}:2.84%」兩個基本型樣本;其中「{A}:17.2%」表示A出現的比例(又稱為支持度,support)是17.2%;「{A,B}:2.84%」表示A與B同時出現的比例是2.84%。依據這兩個基本型樣本,規則產生模組22可以產生一個候補規則「{A}→{B}:2.84%:16.51%」,表示當A出現時B也會出現。且此候補規則的支持度為2.84%,信賴度(confidence)為2.84÷17.2=16.51%。
規則產生模組22產生候補規則後可確認候補規則的信賴度是否小於一最小信賴度,若是的話再將信賴度大於最小信賴度的後補規則作為產生的關聯式規則。假設上述「{A}→{B}:2.84%:16.51%」的候補規則可被作為關聯式規則,表示基於當A出現時B也會出現的定義,當使用者買了A就可推薦B給使用者。
序列的關聯式規則的格式為:「」;其中R為關聯式規則,Em 為第m個事件項目集,Tm 為第m個時間間隔。序列型產生程序大致上與基本型產生程序相同,但序列型產生程序須考量事件項目集之間的順序。規則產生模組22產生候補規則後可確認候補規則的信賴度是否小於最小信賴 度後,規則產生模組22再將信賴度大於最小信賴度的後補規則作為產生的關聯式規則。以下簡介序列型產生程序將序列型樣本轉換成關聯式規則的例子。
假設序列型樣本資料庫32中包括「{A}:71%」以及「{A}T1 (=7){B}:9.1%」兩個序列型樣本;其中「{A}:17.2%」表示A出現的比例是17.2%;「{A}T1 (=7){B}:9.1%」表示A出現並經過7個時間單位後B也出現的比例是9.1%。依據這兩個序列型樣本,規則產生模組22可以產生一個候補規則「{A}T1 (=7)→{B}:12.817%:9.1%」,表示當A出現並經過7個時間單位後B也會出現。且此候補規則的支持度為9.1%,信賴度為9.1÷71=12.817%。
假設上述「{A}T1 (=7)→{B}:12.817%:9.1%」的候補規則可被作為關聯式規則,表示當使用者買了A且過了7個時間單位後就可推薦B給使用者。
效益型的關聯式規則的格式與基本型的關聯式規則的格式相同,且效益型產生程序大致上與基本型產生程序相同,但在效益型樣本資料庫33之中定義有一高效益項目集(high utility itemset)。但對於每一個候補規則,除了要確認其信賴度是否小於最小信賴度之外,還要確認候補規則中的已知項目集以及推測項目集是否屬於高效益項目集。規則產生模組22可將信賴度大於最小信賴度,且已知項目集以及推測項目集都屬於高效益項目集的後補規則作為產生的關聯式規則。
週期型的關聯式規則的格式中,可對一個關聯式規則「R:Ak →Ck 」或一個已知項目集Ak 設定至少一週期c(l,o),已表示此關聯式規則或此已知項目集會週期性的發生。其中l係為整個週期中的時間單位的總個數;o係為一時間偏移量(offset),代表此關聯式規則或此已知項目集在整個週期中的第幾個時間單位開始發生。換句話說,週期型的關聯式規則都具有至少一個時間偏移量。
根據本揭露的一實施範例,週期型關聯式規則可以直接透過資料探勘找出。若找出的樣本是週期型的,則此週期型樣本可以直接拿來作為週期型的關聯式規則。因此於週期型產生程序中,規則產生模組22可以直接從週期型樣本資料庫34取出週期型樣本作為週期型的關聯式規則。舉例而言,假設週期型樣本資料庫34中包括「A:(3,2)」的週期型樣本,其表示A從第3個時間單位開始,每隔2個時間單位都會週期性地出現。此週期型樣本可直接被當作週期型的關聯式規則,並表示在使用者買了A且每經過2個時間單位時,都可再推薦A給使用者。此外,依據產生方式,關聯式規則可以是布林值的關聯式規則(Boolean association rule)、定量的關聯式規則(quantitative association rule)、單維的關聯式規則(single dimensional association rule)、多維的關聯式規則(multidimensional association rule)、單層的關聯式規則(single-level association rule)或是多層的關聯式規則(multilevel association rule)。
產生關聯式規則之後,情境匹配模組24依據一使用者情境35選擇至少一個規則類型(步驟S200)。請參照「第3圖」,其係為本揭露步驟S200之一實施範例流程圖。情境匹配模組24可先判斷一使用者行為紀錄檔(user behavior log file)是否存在(步驟S210)。當使用者行為紀錄檔存在時,情境匹配模組24可讀取使用者行為紀錄檔以作為使用者情境35,並從基本型、序列型或效益型中選擇符合使用者情境35的至少一個規則類型(步驟S220)。
網路瀏覽器或多媒體播放器等使用者目前使用的服務或應用程式可能維護有使用者行為紀錄檔,其中可紀錄使用者目前甚至是過去的行為。例如網路瀏覽器可針對每個會話(session)維護使用者連結過的網址、連結的時間、點選的網頁項目等內容,而多媒體播放器可紀錄有使用者已收看或收聽的多媒體、開始播放多媒體的時間以及播放的總時間等內容。
使用者行為紀錄檔可分為過去的紀錄檔或是目前與使用者操作同步的紀錄檔。於步驟S210,情境匹配模組24會尋找使用的服務或應用程式目前是否有正在維持一個使用者行為紀錄檔,也就是服務或應用程式對應目前使用者情境35同步更新的紀錄檔。若有,再將此一同步更新的紀錄檔作為使用者情境35。例如網路瀏覽器可能會產生多個對應不同使用時間以及連線對象的session,而情境匹配模組24會尋找對應資訊推薦系統20且對應目前使用者情境35同步更新的紀錄檔。
此外,部分服務或應用程式也可供使用者輸入對於已瀏覽過的網站或已播放過的多媒體進行評分,並將使用者自行輸入的評分紀錄在使用者行為紀錄檔。
情境匹配模組24可以嘗試讀取此一使用者行為紀錄檔作為使用情境,並從其中取出關於使用者目前或過去的行為的相關資料。依據能從使用者情境35獲得的資料,可以選出符合使用者情境35的類型以及符合的關聯式規則。
而當使用者行為紀錄檔不存在時,情境匹配模組24可以讀取目前時間以作為使用者情境35,並選擇週期型的規則類型(步驟S230)。舉例而言,每個週期型的關聯式規則都具有至少一個時間偏移量;情境匹配模組24可判斷並選出時間偏移量與目前時間相同或相近的週期型的關聯式規則。
以下以使用者透過網路瀏覽器在購物網站的兩個例子,說明如何依據使用者情境35選擇規則類型。
上述使用者情境35可被表示成「{1,B C}」、「{4,B C H I}」、「{7,B C E}」、「{10,A B C}」、「{13,B C H I}」以及「{16, }」。假設目前為第16個時間單位,且使用者登入購物網站後還沒有將任何物品放入購物車內;因此不存在有目前的使用者行為紀錄檔,且目前時間是第16個時間單位。則情境匹配模組24會將目前時間(第16個時間單位)作為使用者情境35,並選擇週期型的規則類型。於後續的步驟S300以及步驟S400,規則評分模組26可以對所有的週期型的關聯式規則評分,合併評分模組28則可利用部份週期型的關聯式規則對資訊項目評分以提供至少一個推薦項目給使用者。
又假設使用者在第16個時間單位登入並已將物品B、C以及H放入購物車,則情境匹配模組24會找到內容為「{16,B C H}」的使用者行為紀錄檔。則情境匹配模組24將內容為「{16,B C H}」的使用者行為紀錄檔作為使用者情境35,並可選擇基本型、序列型以及效益型的規則類型。於後續的步驟S300以及步驟S400,規則評分模組26可以對所有的基本型、序列型以及效益型的關聯式規則評分,合併評分模組28則可利用部份基本型、序列型以及效益型的關聯式規則對資訊項目評分以提供推薦項目給使用者。
選擇出符合使用者情境35的規則類型後,規則評分模組 26依據使用者情境35,對選擇的規則類型所對應的關聯式規則(以下簡稱為選擇的關聯式規則)評分得到多個匹配率(步驟S300),且這些匹配率與選擇的關聯式規則個別對應。依據匹配率,規則評分模組26就可選擇關聯式規則的其中多個作為多個評分規則(步驟S400)。也就是說,可從選擇的關聯式規則之中再進一步地選出評分規則。
請參照「第4圖」,其係為本揭露步驟S300以及步驟S400之一實施範例流程圖。規則評分模組26可先判斷選擇的關聯式規則的規則類型(步驟S310),再個別計算選擇的關聯式規則的匹配率。
當選擇的關聯式規則屬於基本型或效益型時,規則評分模組26可依據使用者情境35以及每一個屬於基本型或效益型的選擇的關聯式規則的已知項目集與推測項目集與計算匹配率(步驟S320)。且於步驟S320中,可利用所有過去以及目前的使用者行為紀錄檔計算匹配率。
如上所述,基本型以及效益型的關聯式規則的格式為:Rk :Ak →Ck
對基本型或效益型的關聯式規則計算匹配率的公式舉例如下:
其中Rk 為第k個關聯式規則;Ak 為Rk 的已知項目集;Ck 為Rk 的推測項目集;X為輸入項目集,可以是目前的使用者情境35;MR(X,Rk )為關聯式規則Rk 對輸入項目集的匹配率。若有多個基本型或效益型的關聯式規則被選出,於步驟S320中可依據上述「式1」逐一計算選擇的基本型或效益型的關聯式規則的匹配率。
承前例,假設使用者情境35表示成「{1,B C}」、「{4,B C H I}」、「{7,B C E}」、「{10,A B C}」、「{13,B C H I}」以及「{16,B C H}」,因此X為目前的使用者情境35「{B,C,H}」。
並假設屬於基本型或效益型的選擇的關聯式規則有:R1 :{A}→{B};R2 :{B,C}→{H};R3 :{B,C}→{I};以及R4 :{C}→{k,J}。
利用上述「式1」可計算得到關聯式規則R1 的匹配率是0,R2 的匹配率是0,R3 的匹配率是0.67,R4 的匹配率是0.33。
接著規則評分模組26可對於每一個選擇的關聯式規則,依據匹配率,將選擇的規則類型所對應的關聯式規則由高到低排序(步驟S410)。對於每一個選擇的規則類型,規則評分模組26可將最高的前K個匹配率所對應的關聯式規則輸出為評分規則(步驟S420)。其中K為大於2的正整數,例如可以是2、5或是10。因此前例的4個基本型或效益型的選擇的關聯式規則經排序後會是R3 、R4 、R1 以及R2 。而當取K等於2時, R3 以及R4 會被選為評分規則。
此外,當有多個關聯式規則的匹配率相同時,可額外考慮關聯式規則的信賴度、支持度或效益值(utility)。舉例而言,若關聯式規則R1 與R2 對應相同的匹配率,則比較關聯式規則R1 與R2 的信賴度大小。若關聯式規則R1 與R2 的信賴度相同,再比較支持度。若效益型關聯式規則R1 與R2 的支持度相同,就再比較效益值,以將關聯式規則R1 與R2 排序。
當選擇的關聯式規則屬於序列型時,規則評分模組26可依據使用者情境35以及每一個選擇的關聯式規則的事件項目集與時間間隔計算匹配率(步驟S330)。且於步驟S330中,可利用所有過去以及目前的使用者行為紀錄檔計算匹配率。如上所述,序列型的關聯式規則的格式為:。相對地,規則評分模組26可依據使用者情境35產生相同格式的測試序列
利用序列型的關聯式規則計算第一評分的公式舉例如下:
而R為關聯式規則;Em 為關連式規則R的第m個事件項目集,m為正整數;Tm 為關連式規則R的第m個時間間隔;mra 為關連式規則R的第a個事件項目集的匹配率;TDa 為第a 個事件項目集的一時間差比值;#Total_Time_Intervals為一時間間隔總合,一般直接取關聯式規則R以及測試序列S之中最大的時間間隔;ρ為常數,預設為1;X為推測項目集,是關連式規則R的最後一個事件項目集;MR(S,R)為關聯式規則R對測試序列的匹配率。若有多個序列型的關聯式規則被選出,於步驟S330中可依據上述「式2」到「式4」逐一計算選擇的序列型的關聯式規則的匹配率。
假設使用者情境35表示成「{1,B C}」、「{4,B C H I}」、「{7,B C E}」、「{10,A B C}」、「{13,B C H I}」以及「{16,B C H}」,這些過去以及目前的使用者情境35可整理成測試序列「S:{B,C}T1 ’{B,C,H,I}T2 ’{B,C,E}T3 ’{A,B,C}T4 ’{B,C,H,I}T5 ’{B,C,H}」。其中T1 到T5 為前後之使用者情境35的時間間隔;可計算得到T1 ’=T2 ’=T3 ’=T4 ’=T5 ’=3。
並假設屬於序列型的選擇的關聯式規則有:R5 :{A,C}T1 (=3){B,C}T2 (=4){B,C,E}T3 (=3){A,C,H}T4 (=5){B,C,H,I}T5 (=2)→{B,C,K};R6 :{D,E}T1 (=3){J,K}T2 (=2){A,F}T3 (=3){G,J}T4 (=3){B,C}T5 (=3)→{A,H};以及R7 :{O,G}T1 (=3){K,L}T2 (=3){J,L,K}T3 (=4){D,E}T4 (=3){B,H,I}T5 (=4)→{B,C,J}。
以利用上述「式2」到「式4」計算關聯式規則R5 的匹配 率MR(S,R5 )為例。;MR(S,R5 )=mr0 +mr1 ×TD1 +...+mr5 ×TD5 =0.5+0.8+0.3+1+0.4+0.33=3.33。同樣利用上述「式2」到「式4」,可計算得到關聯式規則R6 的匹配率是0.75,R7 的匹配率是1.1。
當選擇的關聯式規則屬於週期型時,規則評分模組26可依據目前的使用者情境35的目前時間以及每一個選擇的關聯式規則的時間偏移量計算匹配率(步驟S340)。如前述,週期型樣本可直接被當作週期型的關聯式規則。根據本揭露的一實施範例,規則評分模組26可先取得週期型的關聯式規則中的時間偏移量,並可比較目前時間與各時間偏移量,以將目前時間與各時間偏移量之間的相近程度作為匹配率。類似地,若有多個週期型的關聯式規則被選出,於步驟S340中可依據上述方式逐一利用週期型的關聯式規則計算的匹配率。
根據本揭露的另一實施範例,若選擇的關聯式規則是週期型,規則評分模組26可不計算週期型的關聯式規則的匹配率,而是直接從資訊項目資料庫36中選出時間偏移量符合目前時間的週期型的關聯式規則。舉例而言,可先判斷各週期型的關聯式規則的時間偏移量與目前時間的差值,並將差值小於一門檻值的時間偏移量所對應的週期型的關聯式規則作為評分規則。
依據匹配率獲得評分規則後,合併評分模組28利用評分規則對資訊項目評分,以從資訊項目中選擇並輸出至少一個推薦項目(步驟S500)。請參照「第5圖」,其係為本揭露步驟S500之一實施範例流程圖。
合併評分模組28可先依據每一個評分規則的匹配率、信賴度以及支持度,計算每一個評分規則的一第一評分(步驟S510)。計算第一評分的公式舉例如下:RS (R e )=α (MR (R e ))×β (sup(R e ))×γ (conf (R e )) (式5)。
其中Re 為第e個評分規則;MR(Re )為評分規則Re 對測試序列的匹配率;sup(Re )為評分規則Re 的支持度;conf(Re )為評分規則Re 的信賴度;α、β以及γ為加權權重,可以是由使用者自行定義的常數。
假設經由步驟S100到步驟S400得到的評分規則如下:基本型的評分規則R3 :{B,C}→{I},匹配率是0.68,支持度是50%,信賴度是50%;基本型的評分規則R4 :{C}→{k,J},匹配率是0.33,支持度是50%,信賴度是50%;序列型的評分規則R5 :{A,C}T1 (=3){B,C}T2 (=4){B,C,E}T3 (=3){A,C,H}T4 (=5){B,C,H,I}T5 (=2)→{B,C,K},匹配率是3.33,支持度是30%,信賴度是20%;序列型的評分規則R7 :{O,G}T1 (=3){K,L}T2 (=3){J,L,K}T3 (=4){D,E}T4 (=3){B,H,I}T5 (=4)→{B,C,J},匹配率是 1.1,支持度是40%,信賴度是40%;效益型的評分規則R8 :{B,C}→{H,G},匹配率是0.88,支持度是50%,信賴度是50%;以及效益型的評分規則R9 :{B}→{I},匹配率是0.73,支持度是50%,信賴度是45%。
假設加權權重α、β以及γ都是1,則可利用上述「式5」計算得到這些評分規則的第一評分。RS(R3 )=0.68×0.5×0.5=0.17;RS(R4 )=0.33×0.5×0.5=0.0825;RS(R5 )=3.33×0.3×0.2=0.1998;RS(R7 )=0.73×0.4×0.4=0.176;RS(R8 )=0.88×0.5×0.5=0.22;RS(R9 )=0.68×0.5×0.45=0.16425。
合併評分模組28並可依據評分規則從這些資訊項目中選擇多個候選項目(步驟S520);其中每一個候選項目對應至少一個評分規則。於步驟S520中可將所有評分規則的推測項目集(若是序列型的評分規則就是最後一個事件項目集)的聯集內容作為候選項目。以上述評分規則R3 、R4 、R5 、R7 、R8 以及R9 為例,候選項目會是物件B、C、G、H、I、J以及K。
根據本揭露的一實施範例,合併評分模組28可將與目前的使用者情境35重複的物件從候選項目中刪除。例如依據目前的使用者行為紀錄檔「{16,B C H}」得知物件B、C以及H目前已被放入購物車中,就不需再將物件B、C以及H推薦給使用者,因此可以只將物件G、I、J以及K作為候選項目。
依據第一評分獲得候選項目後,合併評分模組28將對應 於同一個候選項目的多個第一評分合併為一第二評分,並依據第二評分從候選項目中選擇並輸出推薦項目(步驟S530)。請參照「第6A圖」,其係為本揭露步驟S530之一實施範例流程圖。
合併評分模組28可計算對應於同一個候選項目的第一評分的總合(sum)作為第二評分(步驟S531);且計算第二評分時,也可依據關聯式規則的類型給予不同的權重再計算總合。而每一個候選項目都對應一個第二評分。
計算第二評分的公式舉例如下:
其中x為候選項目;IS(x)為候選項目x的第二評分;W1 、W2 以及W3 為加權權重,可以是由使用者自行定義的常數;Ri 、Rj 以及Rk 為對應候選項目的評分規則;RS(Ri )、RS(Rj )以及RS(Rk )表示利用評分規則Ri 、Rj 以及Rk 對候選項目計算得到的第一評分;AR為基本型的關聯式規則;HP為效益型的關聯式規則;SP為序列型的關聯式規則;Ci 、Cj 以及Ck 為關聯式規則Ri 、Rj 以及Rk 的推測項目集。根據另一實施範例,「式6」中更可加總加權權重W4 與週期性的評分規則的第一評分的乘積。
合併評分模組28再依據第二評分,將候選項目由高到低排序(步驟S532);最後合併評分模組28可將候選項目中第二評分最高的前N個輸出為推薦項目(步驟S533),其中N為正 整數。
舉例而言,物件I有出現在基本型的評分規則R3 以及效益型的評分規則R9 ;因此依據上述「式6」將評分規則R3 與評分規則R9 的第一評分加總可得到物件I的第二評分是0.17+0.16425=0.33425。依此類推可以算出物件G的第二評分是0.22,物件J的第二評分是0.2585,且物件K的第二評分是0.2823。
則依據第二評分將候選項目由高到低排序會得到推薦項目為物件I、K、J以及G。若要輸出N=2個推薦項目,就會選第二評分最高的前兩個候選項目(物件I以及K)作為推薦項目。
又舉例而言,假設K等於2,N等於3,分別有一個基本型、一個序列型以及一個效益型的關聯式規則被選擇,且同分的候選項目會一併被選出。並假設基本型的關聯式規則輸出的候選項目A、B、C、D以及E的第一評分分別是0.8、0.8、0.8、0.6以及0.6;序列型的關聯式規則輸出的候選項目A、B、C、D以及E的第一評分分別是1.7、1.7、2.3、2.3以及2.3;效益型的關聯式規則輸出的候選項目A、C以及E的第一評分分別是0.4、0.2以及0.4;加權權重W1 、W2 以及W3 都是1。
則依據上述「式6」將對應相同候選項目的第一評分加總後,可以計算得到候選項目A、B、C、D以及E的第二評分分別是2.9、4.8、3.3、2.9以及1。故依據第二評分的大小將候選 項目A、B、C、D以及E排序後可得到候選項目B、C、A、D以及E的順序,再選前三個候選項目B、C以及A作為推薦項目。另外由於候選項目A與D的第二評分相同,因此可以也將候選項目D作為推薦項目。
合併評分模組28可將各類型的評分規則的第一評分整合成第二評分,再依據第二評分挑選推薦項目。換句話說,合併評分模組28能夠綜合考量各種評分方式再進行推薦。因此即使使用者當下的使用行為特徵不明顯使得各評分規則之第一評分相近,也能夠選出較適當的推薦項目給使用者。
請參照「第6B圖」,其係為本揭露步驟S530之另一實施範例流程圖。於「第6B圖」的實施範例之中,合併評分模組28可計算對應於同一個候選項目的第一評分的平均值作為第二評分(步驟S536)。更進一步地,合併評分模組28可以依據各候選項目對應的關聯式規則的信賴度、支持個數或效益值,計算對應於同一個候選項目的第一評分的加權平均值作為第二評分。
合併評分模組28再依據第二評分,將候選項目由高到低排序(步驟S532);最後合併評分模組28可將候選項目中第二評分最高的前N個輸出為推薦項目(步驟S533),其中N為正整數。
根據本揭露的另一實施範例,若選擇的關聯式規則是週期型,合併評分模組28可不進行評分,而是直接將對應於週期 型的關聯式規則的候選項目作為推薦項目。如此一來,即使使用者行為紀錄檔不存在,資訊推薦系統20也能夠依據目前時間從資訊項目資料庫36中選出時間偏移量符合目前時間的資訊項目作為推薦項目。因此資訊推薦系統20可適用於目前時間或是行為紀錄檔等各種使用者情境35,更可適用於各種類型的關聯式規則。
請參照「第7圖」,其係為本揭露的一實施範例之推薦項目之示意圖。於「第7圖」的實施範例中,使用者可以於一個購物網站以「里約大冒險」作為關鍵字進行檢索,可能會出現「憤怒鳥遊戲」、「里約大冒險DVD」以及「憤怒鳥玩偶」的推薦項目52。資訊項目可以是服務項目、購物項目、新聞項目或商品廣告項目,因此資訊推薦系統20可依據廠商需求從資訊項目資料庫36中選出合適的服務、商品、新聞或廣告作為推薦項目52並呈現給使用者。
舉例而言,資訊項目可以是供行動裝置終端購買或下載的應用程式(application,App)、音樂或電子書;可以是智慧電視終端可觀賞、下載或執行的多媒體頻道、應用程式、遊戲;也可以是網路書店或網路零售商推出的其他網路付費服務。
請參照「第8圖」為本揭露的一實施範例之資訊推薦方法之模擬結果之曲線圖,以及「第9A圖」到「第9C圖」,其分別為純基本型的關聯式規則之模擬結果之曲線圖,純序列型的關聯式規則之模擬結果之曲線圖,以及純效益型的關聯式規則 之模擬結果之曲線圖。
實驗模擬的資料產生器使用JAVA語言撰寫,並使用MySQL資料庫。可先產生多筆序列資料(Sequence data),再產生各筆交易中的購買數量(Purchased quantity)資料及各資訊項目的單價資料(Unit profit)。最後再以參數設定的方式來設定兩交易之間的時間間隔,其中每筆交易可視為一個session,並對應到一筆使用者情境35。
實驗模擬的參數配置(configuration)如下表。
由「第8圖」與「第9A圖」到「第9C圖」可見,由於資 訊推薦方法可整合多種類型的關聯式規則再進行推薦,因此反應推薦項目是否有機會正確的主要指標命中率(hit ratio)高於單純使用基本型關聯式規則、序列型關聯式規則或效益型關聯式規則產生的推薦項目。
綜上所述,本揭露之資訊推薦方法及系統在產生各種類型的關聯性規則後,可根據不同的使用者情境選出多個適合的規則類型。接著利用各個選擇的關聯性規則的第一評分並排名後,可選出符合使用者情境的評分規則,以準確地對資訊項目評分。資訊推薦方法及系統可再重新計算全域性的第二評分並依據第二評分重新排名,以統整評分規則所產生的結果,再依據統整結果提供推薦項目。因此本揭露之資訊推薦方法及系統能夠解決使用者當下使用行為特徵不明確時,造成傳統上有資訊項整體表現較佳但僅以些微評分差距而不被推薦的情況。
再者,本揭露之資訊推薦方法及系統可利用週期型的關聯式規則,因此即使沒有使用者行為,也可利用目前時間進行推薦。即使不用週期型的關聯式規則進行評分,資訊推薦方法及系統也能找出時間偏移量符合目前時間的資訊項目作為推薦項目。如此一來,就能夠整合不同種類的關聯性規則以及使用者情境,更可增加資訊推薦方法及系統的彈性。
以上較佳具體實施範例之詳述,是希望藉此更加清楚描述本發明之特徵與精神,並非以上述揭露的較佳具體實施範例對本發明之範疇加以限制。相反地,其目的是希望將各種改變及 具相等性的安排涵蓋於本發明所欲申請之專利範圍的範疇內。
20‧‧‧資訊推薦系統
22‧‧‧規則產生模組
24‧‧‧情境匹配模組
26‧‧‧規則評分模組
28‧‧‧合併評分模組
31‧‧‧基本型樣本資料庫
32‧‧‧序列型樣本資料庫
33‧‧‧效益型樣本資料庫
34‧‧‧週期型樣本資料庫
35‧‧‧使用者情境
36‧‧‧資訊項目資料庫
52‧‧‧推薦項目
第1圖係為本揭露的一實施範例之資訊推薦系統之方塊示意圖。
第2圖係為本揭露的一實施範例之資訊推薦方法之流程圖。
第3圖係為本揭露的步驟S200之一實施範例流程圖。
第4圖係為本揭露的步驟S300以及步驟S400之一實施範例流程圖。
第5圖係為本揭露的步驟S500之一實施範例流程圖。
第6A圖係為本揭露的步驟S530之一實施範例流程圖。
第6B圖係為本揭露的步驟S530之一實施範例流程圖。
第7圖係為本揭露的一實施範例之推薦項目之示意圖。
第8圖係為本揭露的一實施範例之資訊推薦方法之模擬結果之曲線圖。
第9A圖係為本揭露的純基本型關聯式規則之模擬結果之曲線圖。
第9B圖係為本揭露的純序列型關聯式規則之模擬結果之曲線圖。
第9C圖係為純效益型關聯式規則之模擬結果之曲線圖。

Claims (20)

  1. 一種資訊推薦方法,用以從多個資訊項目之中提供至少一推薦項目,該資訊推薦方法包括:執行多個關聯式規則產生程序以產生對應多個規則類型的多個關聯式規則;依據一使用者情境,選擇至少一該規則類型;依據該使用者情境,對選擇的該至少一規則類型所對應的該些關聯式規則評分得到多個匹配率;依據該些匹配率,選擇該些關聯式規則的其中多個作為多個評分規則;以及利用該些評分規則對該些資訊項目評分,以從該些資訊項目中選擇並輸出該至少一推薦項目;其中該些關聯式規則產生程序係為一基本型產生程序、一序列型產生程序、一效益型產生程序或一週期型產生程序,且該些規則類型係為一基本型、一序列型、一效益型或一週期型;而依據該使用者情境,對選擇的該至少一規則類型所對應的該些關聯式規則評分得到該些匹配率的步驟包括:當該些選擇的關聯式規則屬於該基本型或該效益型時,依據該使用者情境以及每一該選擇的關聯式規則的一已知項目集與一推測項目集計算該些匹配率。
  2. 如申請專利範圍第1項所述之資訊推薦方法,其中依據該使 用者情境選擇至少一該規則類型的步驟包括:判斷一使用者行為紀錄檔是否存在;以及當該使用者行為紀錄檔存在時,讀取該使用者行為紀錄檔作為該使用者情境,並從該基本型、該序列型或該效益型中選擇符合該使用者情境的至少一該規則類型。
  3. 如申請專利範圍第2項所述之資訊推薦方法,其中依據該使用者情境選擇至少一該規則類型的步驟更包括:當該使用者行為紀錄檔不存在時,讀取一目前時間作為該使用者情境,並選擇該週期型的該規則類型。
  4. 如申請專利範圍第1項所述之資訊推薦方法,其中依據該使用者情境,對選擇的該至少一規則類型所對應的該些關聯式規則評分得到該些匹配率的步驟包括:當該些選擇的關聯式規則屬於一序列型時,依據該使用者情境以及每一該選擇的關聯式規則的至少一事件項目集與至少一時間間隔計算該些匹配率。
  5. 如申請專利範圍第1項所述之資訊推薦方法,其中依據該使用者情境,對選擇的該至少一規則類型所對應的該些關聯式規則評分得到該些匹配率的步驟包括:當該些選擇的關聯式規則屬於一週期型時,依據該使用者情境以及每一該選擇的關聯式規則的一時間偏移量計算該些匹配率。
  6. 如申請專利範圍第1項所述之資訊推薦方法,其中依據該些 匹配率,選擇該些關聯式規則的其中多個作為該些評分規則的步驟包括:依據該些匹配率,將選擇的該至少一規則類型所對應的該些關聯式規則由高到低排序;以及將最高的前K個該些匹配率所對應的該些關聯式規則輸出為該些評分規則,其中K為大於2的正整數。
  7. 如申請專利範圍第1項所述之資訊推薦方法,其中利用該些評分規則對該些資訊項目評分,以從該些資訊項目中選擇並輸出該至少一推薦項目的步驟包括:依據每一該評分規則的該匹配率、一信賴度以及一支持度,計算每一該評分規則的一第一評分;依據該些評分規則從該些資訊項目中選擇多個候選項目,其中每一該候選項目對應至少一該評分規則;以及將對應於同一該候選項目的該些第一評分合併為一第二評分,並依據該些第二評分從該些候選項目中選擇並輸出該至少一推薦項目。
  8. 如申請專利範圍第7項所述之資訊推薦方法,其中將對應於同一該候選項目的該些第一評分合併為該第二評分,並依據該些第二評分從該些候選項目中選擇並輸出該至少一推薦項目的步驟包括:計算對應於同一該候選項目的該些第一評分的總合作為該第二評分; 依據該些第二評分,將該些候選項目由高到低排序;以及將該些候選項目中該第二評分最高的前N個輸出為該至少一推薦項目,其中N為正整數。
  9. 如申請專利範圍第7項所述之資訊推薦方法,其中該將對應於同一該候選項目的該些第一評分合併為該第二評分,並依據該些第二評分從該些候選項目中選擇並輸出該至少一推薦項目的步驟包括:計算對應於同一該候選項目的該些第一評分的一平均值作為該第二評分;依據該些第二評分,將該些候選項目由高到低排序;以及將該些候選項目中該第二評分最高的前N個輸出為該至少一推薦項目,其中N為正整數。
  10. 如申請專利範圍第1項所述之資訊推薦方法,其中該資訊項目係為服務項目、購物項目、新聞項目或商品廣告項目。
  11. 一種資訊推薦系統,用以從多個資訊項目之中提供至少一推薦項目,該資訊推薦系統包括:一規則產生模組,用以執行多個關聯式規則產生程序,以產生對應多個規則類型的多個關聯式規則;一情境匹配模組,用以依據一使用者情境,選擇至少一該規則類型; 一規則評分模組,用以依據該使用者情境,對選擇的該至少一規則類型所對應的該些關聯式規則評分,得到多個匹配率,並依據該些匹配率,選擇該些關聯式規則的其中多個作為多個評分規則;以及一合併評分模組,用以利用該些評分規則對該些資訊項目評分,以從該些資訊項目中選擇並輸出該至少一推薦項目;其中該些關聯式規則產生程序係為一基本型產生程序、一序列型產生程序、一效益型產生程序或一週期型產生程序,且該些規則類型係為一基本型、一序列型、一效益型或一週期型,而當該些選擇的關聯式規則屬於該基本型或該效益型時,該規則評分模組依據該使用者情境以及每一該選擇的關聯式規則的一已知項目集與一推測項目集計算該些匹配率。
  12. 如申請專利範圍第11項所述之資訊推薦系統,其中該情境匹配模組判斷一使用者行為紀錄檔是否存在,且當該使用者行為紀錄檔存在時,讀取該使用者行為紀錄檔作為該使用者情境,並從該基本型、該序列型或該效益型中選擇符合該使用者情境的至少一該規則類型。
  13. 如申請專利範圍第11項所述之資訊推薦系統,其中當該使用者行為紀錄檔不存在時,該情境匹配模組讀取一目前時間作為該使用者情境,並選擇該週期型的該規則類型。
  14. 如申請專利範圍第11項所述之資訊推薦系統,其中當該些選擇的關聯式規則屬於一序列型時,該規則評分模組依據該使用者情境以及每一該選擇的關聯式規則的至少一事件項目集與至少一時間間隔計算該些匹配率。
  15. 如申請專利範圍第11項所述之資訊推薦系統,其中當該些選擇的關聯式規則屬於一週期型時,該規則評分模組依據該使用者情境以及每一該選擇的關聯式規則的一時間偏移量計算該些匹配率。
  16. 如申請專利範圍第11項所述之資訊推薦系統,其中該規則評分模組依據該些匹配率,將每一選擇的該至少一規則類型所對應的該些關聯式規則由高到低排序,並將最高的前K個該些匹配率所對應的該些關聯式規則輸出為該些評分規則,其中K為大於2的正整數。
  17. 如申請專利範圍第11項所述之資訊推薦系統,其中該合併評分模組依據每一該評分規則的該匹配率、一信賴度以及一支持度,計算每一該評分規則的一第一評分,並依據該些評分規則從該些資訊項目中選擇多個候選項目,其中每一該候選項目對應至少一該評分規則,且該合併評分模組將對應於同一該候選項目的該些第一評分合併為一第二評分,並依據該些第二評分從該些候選項目中選擇並輸出該至少一推薦項目。
  18. 如申請專利範圍第17項所述之資訊推薦系統,其中該合併 評分模組計算對應於同一該候選項目的該些第一評分的總合作為該第二評分,依據該些第二評分,將該些候選項目由高到低排序,以及將該些候選項目中該第二評分最高的前N個輸出為該至少一推薦項目,其中N為正整數。
  19. 如申請專利範圍第17項所述之資訊推薦系統,其中該合併評分模組計算對應於同一該候選項目的該些第一評分的一平均值作為該第二評分;依據該些第二評分,將該些候選項目由高到低排序;以及將該些候選項目中該第二評分最高的前N個輸出為該至少一推薦項目,其中N為正整數。
  20. 如申請專利範圍第11項所述之資訊推薦系統,其中該資訊項目係為服務項目、購物項目、新聞項目或商品廣告項目。
TW101145189A 2012-11-30 2012-11-30 資訊推薦方法及系統 TWI499290B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
TW101145189A TWI499290B (zh) 2012-11-30 2012-11-30 資訊推薦方法及系統

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
TW101145189A TWI499290B (zh) 2012-11-30 2012-11-30 資訊推薦方法及系統

Publications (2)

Publication Number Publication Date
TW201421984A TW201421984A (zh) 2014-06-01
TWI499290B true TWI499290B (zh) 2015-09-01

Family

ID=51393624

Family Applications (1)

Application Number Title Priority Date Filing Date
TW101145189A TWI499290B (zh) 2012-11-30 2012-11-30 資訊推薦方法及系統

Country Status (1)

Country Link
TW (1) TWI499290B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI660315B (zh) * 2016-11-04 2019-05-21 中華電信股份有限公司 Sequence recommendation method
US11250338B2 (en) 2016-11-29 2022-02-15 Industrial Technology Research Institute Method for enhancing association rules, apparatus using the same and computer readable medium therefor
US11314794B2 (en) 2018-12-14 2022-04-26 Industrial Technology Research Institute System and method for adaptively adjusting related search words

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI634499B (zh) * 2016-11-25 2018-09-01 財團法人工業技術研究院 資料分析方法、系統及非暫態電腦可讀取媒體
TWI668580B (zh) * 2018-01-19 2019-08-11 中華電信股份有限公司 頻繁時間間隔序列樣式探勘系統及方法

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TW200619989A (en) * 2003-12-15 2006-06-16 Koninkl Philips Electronics Nv Method and apparatus of information recommendation
US20080195607A1 (en) * 2000-05-17 2008-08-14 Matsushita Electric Industrial Co., Ltd. Information recommendation apparatus and information recommendation system
TW201109944A (en) * 2009-09-08 2011-03-16 Univ Nat Cheng Kung Music recommendation method and program product thereof
CN102317941A (zh) * 2011-07-30 2012-01-11 华为技术有限公司 信息推荐方法、推荐引擎及网络系统
TW201236442A (en) * 2011-02-20 2012-09-01 Mediatek Inc Playback methods and playback apparatuses for processing multi-view content
CN101661483B (zh) * 2008-08-29 2012-10-03 株式会社理光 一种推荐系统及推荐方法
CN102789462A (zh) * 2011-05-18 2012-11-21 阿里巴巴集团控股有限公司 一种项目推荐方法及系统

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080195607A1 (en) * 2000-05-17 2008-08-14 Matsushita Electric Industrial Co., Ltd. Information recommendation apparatus and information recommendation system
TW200619989A (en) * 2003-12-15 2006-06-16 Koninkl Philips Electronics Nv Method and apparatus of information recommendation
CN101661483B (zh) * 2008-08-29 2012-10-03 株式会社理光 一种推荐系统及推荐方法
TW201109944A (en) * 2009-09-08 2011-03-16 Univ Nat Cheng Kung Music recommendation method and program product thereof
TW201236442A (en) * 2011-02-20 2012-09-01 Mediatek Inc Playback methods and playback apparatuses for processing multi-view content
CN102789462A (zh) * 2011-05-18 2012-11-21 阿里巴巴集团控股有限公司 一种项目推荐方法及系统
CN102317941A (zh) * 2011-07-30 2012-01-11 华为技术有限公司 信息推荐方法、推荐引擎及网络系统

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI660315B (zh) * 2016-11-04 2019-05-21 中華電信股份有限公司 Sequence recommendation method
US11250338B2 (en) 2016-11-29 2022-02-15 Industrial Technology Research Institute Method for enhancing association rules, apparatus using the same and computer readable medium therefor
US11314794B2 (en) 2018-12-14 2022-04-26 Industrial Technology Research Institute System and method for adaptively adjusting related search words

Also Published As

Publication number Publication date
TW201421984A (zh) 2014-06-01

Similar Documents

Publication Publication Date Title
Kumar et al. Social popularity based SVD++ recommender system
US10452662B2 (en) Determining search result rankings based on trust level values associated with sellers
CN108040294B (zh) 用于推荐视频的方法、系统及计算机可读介质
US8825638B1 (en) System for generating behavior-based associations for multiple domain-specific applications
CN111461841B (zh) 物品推荐方法、装置、服务器及存储介质
US8290927B2 (en) Method and apparatus for rating user generated content in search results
US10997184B2 (en) System and method for ranking search results
US20150324868A1 (en) Query Categorizer
US20120143840A1 (en) Detection of behavior-based associations between search strings and items
US20010013009A1 (en) System and method for computer-based marketing
US20170154116A1 (en) Method and system for recommending contents based on social network
US20110145226A1 (en) Product similarity measure
TWI499290B (zh) 資訊推薦方法及系統
JP2011524576A (ja) 使用パターンを用いた検索方法及びシステム
US9679018B1 (en) Document ranking based on entity frequency
CN109587527B (zh) 一种个性化视频推荐的方法及装置
US20180260406A1 (en) Spell checker
KR102051311B1 (ko) 개인화 알고리즘을 이용하여 고객 로그 맞춤형 사이트를 추천하는 방법 및 개인화 알고리즘 서버
US10579752B2 (en) Generating a model based on input
KR20140056307A (ko) 사용자 맞춤형 광고 제공 기법
Johari et al. The Hybrid Recommender System of the Indonesian Online Market Products using IMDb weight rating and TF-IDF
JP2019020939A (ja) 情報処理システム、情報処理方法、およびプログラム
Souza Cabral et al. Combining multiple metadata types in movies recommendation using ensemble algorithms
Shirai et al. Incremental set recommendation based on class differences
JP5519406B2 (ja) サーバ装置、ジャンルスコア算出方法およびプログラム