TW201109944A

TW201109944A - Music recommendation method and program product thereof

Info

Publication number: TW201109944A
Application number: TW98130262A
Authority: TW
Inventors: Shin-Mu Tseng; Ja-Hwung Su; Hsin-Ho Yeh
Original assignee: Univ Nat Cheng Kung
Priority date: 2009-09-08
Filing date: 2009-09-08
Publication date: 2011-03-16
Also published as: TWI410811B

Description

201109944 六、發明說明：【發明所屬之技術領域】本發明是有關於一種音樂推薦方法與其程式產品，特別是有關於一種可根據使用者狀態來進行音樂推薦之方法與其程式產品。【先前技術】隨著多媒體處理技術和無線網路傳輸技術的快速進 • 步，人們可以輕易地透過行動裝置(例如：手機或個人數位助理）來從網路上獲得多媒體商品（例如：影片或音樂）。也就疋說’只要有網路服務存在的地方，人們便可以輕易地從網站上選購歌曲，而不必特地到實體商店去購買音樂光碟。、然而，一般的音樂販售網站，例如：亞馬遜(Amaz〇n)，皆提供有數百萬首的歌曲供顧客挑選。因此，使用者難以了解這數百萬首歌曲中，哪一首可能是自己喜歡的。為了 ♦解決這個問題’有些業者研發了資訊推薦技術來評估這數百萬首歌曲中，有哪些可能是使用者所喜歡的。目刖習知的資訊推薦技術係根據過去網路使用者對於現有歌曲的評分來推薦歌曲給使用者。然而，對於新歌曲而言，必須經過一段時間才會有評分，因此在這段空窗期中，％知的負訊推薦技術無法正確地推薦歌曲給使用者。再者，當歌曲的評分資料數不夠多時，習知的資訊推薦技術也無法正確地推薦歌曲給使用者。另外，目前習知的資訊推薦技術皆未考量到使用者的狀態。例如，使用者在白 201109944 天對-首歌給予了很高的評分可能對同-首歌曲給予很低的評=到了晚上’此使用者因此’冑要-種新的音樂推薦方薦技術的缺點。个又吾為知身訊推【發明内容】因此，本發明之一其電腦程式產品。方面是在提供一種音樂推薦方法與

很據本發明員她例

從，，，牡此首樂推薦方法中，首先 3 =候1 資料與每—候選資料之複數個評Γ資ΐ ，史：用：二應至一個歷史使用者環境狀態，11 些歷史使用者狀態值係分別屬於==態值’ $ 箪，權1 A m〜 ⑺屬於複數個5辰境狀態類別。去態包二二-彳之使用者環境狀態’其巾此使用者環境法 i於二/ B @使用者狀態值，這些使用者狀態值係分另將候境狀態類別。然後，進行離線處理階段，C η貝料—對—轉換為複數個特徵化資料，其中每一與二料包含複數靖徵#段’這些特徵#段係對應至福、徵類型。接著’進行線上處理階段，以根據特徵類尘來決定每一候選資料之使用者喜好度。斤在上述之離線處理階段中，首先根據預設單位時間來 /將每候選資料依序切割為複數個子資料。然後，利用特徵擷取肩算法來摘取每一候選資料之每一子資料之至少一，徵參數。接著，根據每一候選資料之每一子資料之該至 ^特徵參數’利用第一分群演算法來將全部子資料分為 201109944 複數個子資料群組，其中子資料群組係一對一對應至複數個參數類型。然後，根據每一候選資料之每一子資料所對應之子資料群組，來決定每一候選資料之每一子資料所對應之參數類型。接著，根據預設數量來將每一候選資料之子資料依序分為複數個子資料序列。然後，利用序列相似度演算法來比較全部子資料序列之相似度，並獲得每一候選資料之每一子資料序列之序列相似度值。接著，根據每一候選資料之每一子資料之子資料序列的序列相似度值，利用第二分群演算法來將全部子資料序列分為複數個序列群組，其中這些序列群組係一對一對應至複數個序列類型。然後’提供預設切割視窗與其預設移動距離，其中預設切割視窗具有視窗長度，此切割視窗之該視窗長度和預設移動距離為預設單位時間之長度的倍數。接著，利用切割視窗來於每一候選資料之子資料序列上依序移動此預設移動距離，以從候選資料之全部子資料序列中取出特徵片段。 ’

y 在上述之線上處理階段中，首先進行狀態比較步驟，以利用預設差異度_來比較使时環餘態分資料所對應之歷史使用者環境狀態的相似度，而 :中決定複數筆相關評分資料。然後，根據相關評分；料來從候選資料中決定複數個相關候選資料，資料係一對一對應至相關評分資料。接、資料來從特徵類财決定複數__ 據相關候選特徵類型係對應至特徵片段之複數個】關特徵片段係構成相關候選資料。然後，片段’而相徵類型於每-相關候選資财所包含^算每-相關特 7符徵片段的個數，r 201109944 以獲得每一相關特徵類型之複數個相關著，根據每—相關特徵類型所對應 =數。接，定每-相關特徵類型之特徵正評價根據正評價閥值和每—相關特徵類之微i 。然，決定正評價特徵類==賈’ 負斤價閥值和每-相_徵㈣根據特徵類型中，決定至少—負評價特來從相關價類型和負評價類型，來從相關特徵類 '^根正評高度相關特徵類型，其中高度相關特徵少一於負評價_之至少十接著，===屬向度相關特徵類型之一預測評價。然後 - 特徵片段和每-高度相_徵類型之、^資，之一候選資料之使用者喜好度。 ’、β貝，來決定每根據本發明之另一實施例，前述之電腦载入並執行後，此電腦可進行前述之音=薦產;^ 【實施方式】請參照第1圖，其係繪示根據本樂推薦方法的流程示意圖。音樂推薦階段㈣和線上處理階段120。在離線處理階:為= 對資料庫130中的候選資料，例如中枝外取步驟112,以將每一個候選資料轉換枓。每-個特徵化資料包含有複數個特徵片段，這㈣徵 201109944 片段係對應至複數個特徵類型。當資料庫中的候選資料都被轉換成特徵化資料後’代表這些候選資料可以多個特徵類型來表示。在以下的敘述中，這些特徵化資料的集合稱為特徵化資料庫140。在線上處理階段12〇中，首先進行喜好類型探勘步驟 122，以根據歷史使用者之評分資料庫150和目前使用者的環境狀態160，來從特徵化資料庫+探勘出全部特徵類型的預測評價。接著，進行資料喜好度預測步驟124，以根據特徵類型的預測評價來預測資料庫中未被目前使用者評分之候選資料的使用者喜好度，來產出推薦資料清單17〇。此推薦資料清單170係根據每一個候選資料的使用者喜好度來排列候選資料。另外，推薦資料清單170亦可只列出喜好度最同的候選資料。請同時參照第2圖、第3a圖、第3b圖和第4圖，第 2圖係繪示根據本發明之一實施例之特徵擷取步驟112的流程示意圖。第3a圖和第3b圖係繪示第2圖中步驟112a 至步驟112f的示意圖。第4圖係繪示第2圖中步驟112g 至步驟112h的示意圖。在特徵擷取步驟112中，首先進行步驟U2a，以根據預設之單位時間來將每一個候選資料210依序切割為複數個子資料220。接著，進行步驟112b，以利用特徵擷取演算法來擷取每一個子資料220的特徵參數。在本實施例中，候選資料為MPEG-1 Layer III(MP3)格式，所使用之特徵擷取演算法為特徵改良型離散餘弦轉換演算法(Μ 〇 d i fi e d discrete cosine transform; MDCT)，而子資料之長度為一個音框之時間長度，即26毫秒。透過MDCT演算法’可畔 201109944 子复料轉換為脈衝編碼調變（pulse c〇de modulation，pcM) 格式’且由每一個子資料中取出36個MDCT特徵參數。然後’進行基於音框之分群步驟112c，以根據每一子資料220之特徵係數，利用分群演算法，來將全部的子資料220分為複數個資料群組。這些資料群組係一對一對應至複數個參數類型。在本實施例中，係將特徵相似的子資料分在同一組資料群組中，如此每一個子資料都會對應至一個參數類型。如第3b)圖所示，本實施例將參數類型分成 1、2、3、4和5 ’而每一個子資料所對應之參數類型則標示於其上。另外’分群步驟112c所使用之分群演算法為密度分群法(Density-Based Spatial Clustering of Applications with Noise; DBSCAN)、K 中數分群法(K-mean clustering)、多代表點分群法（CURE)或平衡式反覆化簡和分群法 (BIRCH)。接著，進行步驟112d，以根據預設數量來將每一個候選資料210之子資料220依序分為複數個子資料序列230。在本實施例中，預設數量為3，因此每3個子資料被視為一個子資料序列230。然後，進行步驟112e，以利用序列相似度演算法來比較子資料序列230間的相似度。在本實施例中，係利用基因序列比對演算法來比對每個子資料序列230間的相似度。例如，S.Bneedleman和C.D.Wunsch所提出之方法”A general method applicable to the search for similarities in the amino acid sequence of two proteins”。在此演算法中’係以一子資料序列為標準序列，並計算其他子資料序列與此標準序列之相似度，如此每個子資料序列便會對應至一個序 9 201109944 列相似度值。接著’進行基於序列之分群步驟112f，以根據資料序列230之序列相似度值’利用分群演算法來將全部的子資料序列230分為複數個序列群組，其中這些序列群組係一對一對應至複數個序列類型。在本實施例中’係將彼此相似的子資料序列230分至同一群組，如此每個子資料序列 230都會對應至一個序列類型。如第3圖所示，本實施例將序列類型分成八、；8、（：、〇、£和？，而每一個子資料序列所對應之序列類型則標示於其上。另外，分群步驟112d 所使用之分群演算法為密度分群法（Density-Based Spatial

Clustering 〇f Applications with Noise; DBSCAN)、K 中數分群法(K-mean clustering)、多代表點分群法(CURE)或平衡式反覆化簡和分群法(birch)。由第3a圖和第3b圖可知，經過步驟112a至112f的處理後，每一個候選資料210皆可透過不同類型之子資料序列的組合來表示。因此，在以下的敘述中將各類型的子資料序列統稱為基礎樣本240。接著，進行步驟112g，以提供預設切割視窗與此預設切割視窗之預設移動距離。預設切割視窗之長度和該預設移動距離為預設單位時間之長度的倍數。然後，進行步驟 112h，以利用切割視窗來於每一候選資料上依序移動預設移動距離，以取出特徵片段。如第4圖所示，候選資料31〇已轉換成由多個基礎樣本所構成之資料。當切割視窗之長度定為4個基礎樣本，而移動距離定為2個基礎樣本時，候選資料310可以取出5個特徵片段：eabc、bccd、 CDDA、DABC和BCCD。當全部候選資料所包含的特徵圪 201109944 段都被決定後，便可以將這些特徵片段分類，使每一個特徵片段對應到一個特徵類型。在本實施例中，每一個不同的特徵片段都被視為不同的特徵類型，例如’ EABC和 BCCD屬於不同的特徵類型，而BCCD和BCCD則是屬於相同之特徵類型。請同時參照第5圖和第6圖，第5圖係繪示根據本發明一實施例之歷史使用者資料列表400的結構示意圖，第 6圖係繪示根據本發明一實施例之喜好類型探勘步驟122

的流程示意圖。在本實施例中，資料列表4〇〇係儲存於評分資料庫150中。資料列表4〇〇記載歷史使用者之狀態值，例如：心跳數(HB)、室溫值(AT)、噪音音量(NV)、溼度值 (Η Y) ’以及歷史使用者對於候選資料km丨、咖、k叫、i叫、 itm5的評分資料’其中評分資料代表歷史使用者對候選資料的評價。㈣資料的評價仙G〜5分來表示，i代表最低的評價，5代表最高的評價，❿G代表未評價。因此評 k大於2稱之為正面評價，反之稱為負面評價。

由於歷史❹者之㈣值對包含歷史使歸本身的狀 Μ例如·體溫）或歷史使用者之環境狀況(例如：室溫），在 :下=述中’使用者本身狀態和環境狀況將以「環境狀 = 即此「環境狀態」包含使用者本身狀態和使 ^^ 至少—者。值得注意的是，在本實施例中，義:所包含的環境狀態類別(如:溼度等) ^。境狀態相同’如此可方便後續步驟的進 201109944 史使用者環境狀態的相似度，而從評分資料中選出對應至與使用者環境狀態相似之歷史使用者環境狀態的評分資料，即相關評分資料。由於相關評分資料所對應之歷史使用者環境狀態係類似於目前使用者環境狀態，因此相關評分資料有助於預測目前使用者的喜好。另外，為了方便說明，本實施例之評分資料記載了使用者的姓名Name，然而記載使用者姓名並非是必要的。

值得一提的是，目前使用者也可能已對候選資料進行坪分的動作，因此當得知目前使用者的環境狀態後，新增的評分資料與目前使用者環境狀態亦可加入至歷史使用^ 資料列表400中，如此可利用目前使用者對已評分之候選資料的評分資料來預測尚未評分之候選資料的使用者喜好度。當相關評分資料被決定後，進行步驟122b，以從候選 "貝料中，根據相關評分資料來決定複數個相關候選資料。例如，在第5圖中，當「心跳數：79下、體溫：35.9度、、澄度別」的歷过用者環境狀態對候職料_^分被決定為相關評分資料時’其對應之相關候選#料即為候選資料itm!。接著，進行步驟122c，以根據相關候選資料來決定相關特徵_。每—筆㈣候選資料都會對應至至少-個特徵片段&些特徵片&在此稱為相關特徵片段，而相關特徵類型，：部相關候選資料之相關 Γ二步驟咖，以計算全部的相關特徵類型對應至母-候❽料㈣徵類型BCCD分別於候料料—2、itm3、itm4、itms 201109944 中匕3的特徵片段的個數。另外，此個數在以下的敘述中稱為相關特徵片段個數。接著，進行步驟l22e，以根據步驟122所獲得之相關特徵片·^又的個數，來決定每一相關特徵類型之特徵正評價特徵負„平鈿。例如’當候選資料itm】和丨恤5被決定為相關候選資料，且候選資料itm丨和itm5皆只獲得負面評價時’若候選資料itmi# itm5共包含3個屬於特徵類型bCCd 的特徵片段，則特徵類型BCCD會得到特徵負評價值3。反之’备候選資料itmi和itm5被決定為相關候選資料，且候選資料itmi和itm5皆只獲得正面評價時，則特徵類型 BCCD會彳于到特徵正評價值3。在本發明其他實施例中，亦可考慮相關候選資料所獲得的評價個數。例如，當候選資料1和itm5被決定為相關候選資料，且候選資料itmi和 itm5皆只獲得負面評價時，若候選資料itmi包含i個屬於特徵類型BCCD的特徵片段，候選資料itm5包含2個屬於特徵類型BCCD的特徵片段，且候選資料itmi對應有兩個負面評價’則特徵類型BCCD會得到特徵負評價值 1*2+2=4 〇 ' 然後，進行步驟122f，以根據預設之正評價閥值和每一相關特徵類型之特徵正評價，來從相關特徵類型中，決定至少一正評價特徵類型。例如：當特徵類型BCCE)之特徵正評價為5，且正評價閥值為4時，由於正評價大於閥，，因此特徵類型BCCD可被決定為正評價特徵類型。接著，進行步驟122g，以減預設之貞評價閥值和每一相關特徵類型之特徵負評價，來從相關特徵類型中，決定至少 -負評價特徵類型。例如’ #特徵㈣EABC之特徵負評「 13 201109944 價為5 ’且負評價閥值為4時，由於特徵負評價大於閥值，因此特=類型EABC可被決定為負評價特徵類型。，值得注意的是，在本實施例中，被決定為正評價特徵類型之特徵類型也可能同時被決定為負評價特徵類型。反 =被決定為負評價特徵類型之特徵類型也可能同時被決定為正評價特徵類型。另外，在本發明之其他實施例中，亦可根據歷史使用者給予相關候選資料之正評價個數和負評價個數來決定正評價閥值和負評價閥值。然後’進行步驟122h ’以根據負評價特徵類型之特徵負砰彳貝和正評價特徵類型之特徵正評價，來從相關特徵類型中，決定高度相關特徵類型，其中高度相關特徵類型為相關特徵類型中屬於正評價類型的相關特徵類型，或是相關特徵類型中屬於負評價類型的相關特徵類型。接著，進行步驟122i，以根據每一高度相關特徵類型之特徵負評價和特徵正評價之差值，來決定每一高度相關特徵類型之預測評價。例如，當高度相關特徵類型BCCD 之正評價為5時，由於其沒有特徵負評價，因此其預測評價即為5。又例如’當特徵類型AABC同時被決定為負評價特徵類型和正評價特徵類型，且其特徵負評價為5、特徵正評價值為6時，特徵類型AABC之預測評價為1，即特徵正評價減去特徵負評價。當全部高度相關類型的總預測評價都被計算獲得後，即可進行資料喜好度預測步驟124,來決定每一候選資料之使用者喜好度。請參照第7圖，其係繪示根據本發明一實施例之資料喜好度預測步驟124的流程示意圖。在喜好度預測步驟124r 201109944 中，首，進行步驟l24a，以根據候選資料所對應之特徵片段來從高度相關特徵類型中，決定匹配特徵類型。例如：當某一候選資料之特徵片段為EACC、BCCA和EACC，且高度相關特徵類型為BCCA、EACC和BCCD時，此候選資料之匹配特徵類型即為BCCA和EACC。接著，進行步驟124b，以根據匹配特徵類型之預測評價和匹配特徵類型所包含的特徵片段個數來決定候選資料之使用者喜好度。例如：上述之候選資料的匹配特徵類型為BCCA和EACC，且EACC有兩個。當EACC之預測評價為5，BCCA之預測評價為4時’則此候選資料之使用者喜好度為5+5+4=14 值得注意的是，在計算使用者喜好度時並不限於僅將各匹配特徵類型之預測評價乘上對應的個數。在本發明之其他實施例t，亦可將每個匹配特徵類型對應至一個權值’再利用此權值來計算候選資料的喜好度。請參照第8圖，其係繪示根據本發明之一實施例之狀態比較步驟122a的流程示意圖。在狀態比較步驟122a中，首先進行步驟810，以利用相似度演算法來計算欲比較之歷史使用者環境狀態的每一個歷史使用者狀態值(例如：心跳數)與目前使用者的狀態值之差異，以得到對應至每一個狀態類別的狀態差異度。若考慮到每一種狀態類別的重要性皆不同’可採用具有加權算法的相似度演算法來對不同的環境狀態定出不同的權值並進行計算。另外’值得注意的是’本實施例之狀態差異度皆以絕對值來表示，因此狀態差異度皆為正數。然後，進行步驟820 ’以判斷狀態差異度的總和是否小於預設之差異度閥值，並提供判斷結果。當判斷結果為是時，進行步驟830，以將此歷史使用^ 15 201109944 者環境狀態所對應之評分資料決定為相關評分資料。請參照第9圖，其係繪示根據本發明之一實施例之無用特徵類型過濾步驟900的流程示意圖。由於特徵擷取步驟112所獲得之特徵類型可能不具有代表性，因此可於特徵擷取步驟之後，進行特徵類型過濾步驟9〇〇，以將特徵類型中無用的特徵類型刪除。在特徵類型過濾步驟900 申，首先進行步驟910，以計算每一特徵類型所對應之特徵片段個數。然後，進行步驟920，以根據預設之出現次數閥值來決定無用特徵類型，其中當一特徵類型所對應之特徵片段個數係大於出現次數閥值，此特徵類型便被決定為無用特徵類型。接著，進行步驟930，以從特徵類型中，將無用特徵類型刪除。值得一提的是，本實施例係以每一特徵類型於全部候選資料中出現的次數來做為判斷此特徵類型是否為無用特徵類型，意即根據每一特徵類型之出現頻率來做為判斷的依據。因此，本實施例採用詞彙頻率和反轉文件頻率（Term Frequency Inverse Document Frequency; TFIDF)演算法來判斷無用特徵類型。爲了使線上處理階段的流程能更清楚和完整，以下再以一實施例來說明線上處理階段。請同時參照第10圖和第11圖，第10圖係繪示根據本發明一實施例之候選資料CD1、CD2、CD3、CD4和CD5 之特徵化資料的結構示意圖。第11圖係繪示候選資料 CD卜CD2、CD3、CD4和CD5之特徵片段所包含的特徵類型。在本實施例中’全部的候選資料CD1、CD2、CD3、 CD4和CD5之特徵化資料包含包含A、B、C、和D四種 201109944 類型之基礎樣本，且切割視窗之長度為4個基礎樣本，移動距離為2個基礎樣本。如第1〇圖所示，候選資料CD1、 CD2、CD3、CD4、CD5和CD6所對應的特徵類型為CDDA、 DABC、BCCD、CDAB、CACD、EABC 和 CDEA。請同時參照第12圖和第13圖。第12圖係繪示對候選資料CD1、CD2、CD3、CD4和CD5進行評分之歷史使用者的資料列表900。第13圖係繪示目前使用者之資料列表 950。資料列表900包含歷史使用者Alice、Andre、Ben、 Eric和Juice在不同的環境狀態SS下，對候選資料CD1、 CD2、CD3、CD4 和 CD5 的評分以及 Alice、Andre、Ben、

Eric和juice之使用者狀態值（例如：心跳數）。因此每個歷史使用者環境狀態E卜E2、E3、…和E12皆會對應到一個評分資料組’而每個評分資料組則包含歷史使用者對每個候選資料CD卜CD2、CD3、CD4和CD5的評分資料。另外’目前使用者之資料列表950紀錄了目前使用者David 之狀態值與David對部份候選資料的評分，其中資料列表 9〇〇所包含的環境狀態類別係與環境狀態列表950相同。在本實施例之線上處理階段中，首先比較每一個歷史使用者環境狀態與目前使用者環境狀態的相似度，以決定相關評分資料（步驟122a)。在此，以Alice之環境狀態Ei 與David之環境狀態的比較為例。首先，計算對應至每一環境狀態類別HB、BT、AT、NV和HY之狀態差值(步肆 810) ’即狀態差異度，如此可得到對應至hb之狀態差異度為I 79-75 | = 4、BT之狀態差異度為| 35.9-36.7 | = 〇·8、AT之狀態差異度為| 25-25.9 | =0.9、NV之狀態差異度為| 54-50 | = 4、HY之狀態差異度為| 80-80 | = 〇。然 17 201109944 後，判斷所有狀態差異度的總和是否小於預設之狀態差異度閥值，以將狀態差異度總和小於狀態差異度閥值之環境 . 狀態所對應之評分資料選為相關評分資料（步驟82〇和 830)。在本實施例中，狀態差異度閥值設為5〇，因此，環境狀態 El、E5、E6、E7、E8、E9、E10、E12 所對應之評分資料被選為相關評分資料。另外，本實施例亦將目前使用者之環境狀態與評分加入至歷史評分資料中，因此目前使用之評分資料亦為相關評分資料。 * 接著，根據相關評分資料來決定相關選資料（步驟 122b)。在本實施例中，環境狀態El、E5、E6、E7、E8、 E9、E10、E12以及目前使用者環境狀態所對應之評分資料係對應至候選資料CD1、CD2、CD4和CD5，因此候選資料CD卜CD2、CD4和CD5被決定為相關候選資料。然後，將相關候選資料CD 1、CD2、CD4和CD5所對應的特徵類型 CDDA、DABC、BCCD、CDAB、EABC 和 EDEA 決定為相關特徵類型（步驟122c)。接著，相關特徵類型CDDa、 DABC、BCCD、CDAB、EABC和EDEA分別於相關候選貝料CD卜CD2、CD4和CD5中所包含的特徵片段個數(步驟122d)。例如’相關特徵類型CDDA於相關二 CD卜CD2、CD4和CD5中的特徵片段個數分別為y 1和〇 ;相關特徵類型BCCD於相關候選f料咖心、 CD4和CD5 t的特徵片段個數分別為卜卜、下的敘述中’每倾徵㈣所對應於每侧 :二應的特徵片段個數將稱為相關特徵片段個數。、’所對請參照第Η圖’其係㈣正評價特徵_、負評價掩 18 201109944 徵f型和高度相關特徵類型之示意圖。在本實施例中，當 j知每個相關特徵類型之相關特徵片段個數後，便可利用 d相關特徵>}段個數來決定每—相關特徵類型之特徵正評價和特徵負評價（步驟122e)e值得注意的是，本實施例亦考慮歷史使用者給予相關候選資料之正評價個數和負評價個數來決定-相關特徵類型之特徵正評價和特徵負: 價。、在決定每一相關特徵類型之特徵正評價和特徵負評價時首先计算歷史使用者給予相關候選資料之正評價個數和負評價個數。例如：相關候選資料CD1對應有i個負面評價和1個正面評價；相關候選資料CD2對應有3個負面評價：相關候選資料CD4對應有1個負面評價和i個正面評價；相關候選資料CD5對應有2個正面評價。接著，計算每一相關特徵類型之特徵正評價和特徵負評價。在本實施例中’係以下壯式來計算相_徵類型之特徵 FPtype和特徵負評價FNtype : FPtype=(Ntype.CD1*VCD,p)+( Ntyp,CD2*VcD2.p) +( NtypecD4， +( Ntype-CD5*VCD5-P)； FNtype=(Ntype.CD1*Vc：D1-N)+( Ntype.CD2*VcD2 N) +( Ntype-CD5*VCD5_N) ; tyPe'CD4 VcD4-n) 其中’Ntype-CD1為相關特徵類型於候選資料中徵片段數量;Ntype-CD2為相關特徵類型於候選二:= 相關特徵片段數量；Ntype-CD4為相 4 CD2中的 CD4中的相關特徵片段數量；N關^型於候選資料選資料CD5中的相關特徵片段目關特徵類型於候料⑽的正面評價個數;v一關:選== 201109944 "=數’v⑽4相關候選#料咖的正面評價個數；相關候選資料CD5的正面評價個數；v_為㈣二、身，CD1的負面評價個數;％ n為相關候選資料⑽ /垂面貝個S，VcD4_N為相關候選資'料CD4❾負面評價個數；veD5.N為相瞧選#料CD5的負面評價個數。β :相特徵類型CDDA為例來解釋：相關特徵 CDDA於相關候選資料⑽、CD2、⑽和cd5中

片&個數分別為卜2、1和〇，由於相關候選資料CD5未包含有相_徵麵CDDA，且相_選㈣⑽只有負面評價，因此相關特徵類型CDDA之特徵正評、

可表示如下： eDDA fpcdda=(ncdda.cd1*Vcdi p)+( Ncdda cD4*VcD4 p); 其中ncdda_cd1為相關特徵類型CDDA於相關候選資料 CD1中的個數；NCDDA_CD4為相關特徵類型CDDA於相關候選負料CD4中的個數。由上式可得到相關特徵類型之特徵正评價為1*1 + 1*1=2。類似地，相關特徵類型之特徵負評價FNcdda可用表示如下： FNcdda=(Ncdda-cdi*Vcdi-n)+(NCDDa-cd2*Vcd2-n)+ (NcDDA-CD4*VCD4-N); 其中NCDDA-CD2為相關特徵類型CDDA於相關候選資料 CD2中的個數。由上式可得到相關特徵類型CDDA之特徵負評價為 1*1+2*3+1*1=8。當每一相關特徵類型之特徵正評價和特徵負評價都被計算求得後’根據正評價閥值和每一相關特徵類型之特徵正評價，來從相關特徵類型中’決定至少一正評價特徵頬型（步驟122f)。同時也可根據預設之負評價閥值和每一相 201109944 Μ特，類51之特徵負評價關特徵類型中，決定至少-負評價特徵類型(步驟⑽。

實施例中’係根據歷史使用者給予相關候選資料之個數和負評價個數來決定正評價閥值和負評價閥，，因將相關候選資料所對應的正評價個數相加即可付到正::價閥冑4。將相關候選資料所對應的負評價個數相加可％•到負評價閥值5。接著，便如第14圖所示，從相關特徵類型中找出特徵正評價大於或等於正評價閥值4的特徵類型’並將其決定為正評價特徵類型，以及從相關特徵類型中找㈣徵貞評價大於或等於負評價閥值5的特徵類型’並將其決定為負評價特徵類型。由帛14冑可看出相關特徵類型EABC為正評價特徵類型，相關特徵類型 CDDA和DABC為負評價特徵類型，而相關特徵類塑bccd 則同時屬於正評價特徵類型和負特徵評價類型。無論是正貝特徵類型或是負特徵評價類型，其皆經過閥值的測試’即代表正（負）特徵評價類型在相關候選資料中平均至少出現過一次。因此，這些正評價特徵類型和負特徵評價類型可視為高度相關之特徵類型（步驟122h)。然後，決定每一個高度相關特徵類型之預測評價。在本實施例中，係將高度相關特徵類型之正特徵正評價和特徵負評價相減’ 來得到其預測評價（步驟122i)。例如’高度相關特徵類型 BCCD之預測評價為4-6)=-2，而高度相關特徵類型CDDA 之預測評價為0-8)=-8 ° 請參照第15圖’其係繪示候選資料CD1之匹配特徵類型。當決定高度相關特徵類型以後，即可根據候選資料所對應之特徵片段來從高度相關特徵類型中，決定候選資[.Ξ ] 201109944 料之匹配特徵類型（步驟124a)。例如，候選資料CD1所對應的特徵類型為CDDA、DABC、BCCD和CDAB，但CDAB ’ 並不屬於高度相關特徵類型，因此候選資料CD1所對應的匹配特徵類型為CDDA、DABC和BCCD。然後，根據匹配特徵類型之預測評價和匹配特徵類型所包含的特徵片段個數來決定候選資料之使用者喜好度（步驟124b)。在本實施例中，係利用詞彙頻率和反轉文件頻率演算法來計算高度相關特徵類型之權重，以表達出每個匹配特徵類型的重要性皆不相同。每個特徵類型之TF1DF值係如第16圖所鲁示’因此候選資料CD1之使用者喜好度為 0.0352*(_8)+0.0282*(-5)+0.0222*(-2)=-〇.464。由以上說明可知本實施例之音樂推薦方法可預測每個候選資料的使用者喜好度’因此當候選資料的評分數量不夠多時’本實施例之音樂推薦方法仍可正確地推薦資料給使用者。再者，本實施例之音樂推薦方法考慮了使用者的狀態，因此在推薦的正確性上可較其他推薦技術更高。另外根據本發明之其他實施例，本發明實施例之音樂響推薦方法為-種電腦程式產品，儲存於一健存裝置中，例如：光碟片。當電腦讀取此光碟片後，此電腦便可執行本發明實施例之音樂推薦方法。雖然本發明已以實施例揭露如上，然其並非用以限$ 本發明，任何熟習此技藝者，在不簡本㈣之精神和棄 :内’當可：各：之更動與潤飾，因此本發明之保當視後附之申請專利範圍所界定者為準。 22 201109944 【圖式簡單說明】為讓本發明之上述和其他目的、特徵、和優點能更明顯易懂，上文特舉一較佳實施例，並配合所附圖式，作詳細說明如下：第1圖，其係繪示根據本發明之一實施例之音樂推薦方法的流程示意圖。第2圖係繪示根據本發明之一實施例之特徵擷取步驟的流程不意圖。第3a圖和第3b圖係繪示第2圖中步驟112a至步驟 112f的示意圖。第4圖係繪示第2圖中步驟112g至步驟112h的示意圖。第5圖係繪示根據本發明一實施例之資料列表的結構不意圖。第6圖係繪示根據本發明一實施例之喜好類型探勘步驟的流程示意圖。第7圖係繪示根據本發明一實施例之資料喜好度預測步驟的流程示意圖。第8圖係繪示根據本發明之一實施例之狀態比較步驟的流程示意圖。第9圖係繪示根據本發明之一實施例之無用特徵類型過遽步驟的流程示意圖。第10圖係繪示根據本發明一實施例之候選資料之特徵化資料的結構示意圖。第11圖係繪示候選資料之特徵片段所包含的特徵類型。 r 23 201109944 第12圖係繪示對候選資料進行評分之歷史使用者的資料列表。第13圖係繪示目前使用者之資料列表。第14圖係繪示正評價特徵類型、負評價特徵類型和高度相關特徵類型之示意圖。第15圖係繪示候選資料之匹配特徵類型。第16圖係繪示每個特徵類型所對應之TFIDF值。【主要元件符號說明】

110 :離線處理階段 112a〜112h :步驟 122 :喜好類型探勘步驟 124 :資料喜好度預測步驟 130 :候選資料庫 150 :評分資料庫 170 :推薦資料清單 220 :子資料 240 .基礎樣本 400 :資料列表 810〜830 :步驟 CD1〜CD5 :候選資料 112 :特徵擷取步驟 120 :線上處理階段 122a〜122i :步驟 124a〜124b :步驟 140 :特徵化資料庫 160 :使用者環境狀態 210 :候選資料 230 :子資料序列 310 :候選資料 800 :特徵類型過濾步驟 900〜930 :步驟 E1〜E12 :環境狀態 24

Claims

201109944 七、申請專利範園： 1. 一種音樂推薦方法，包含：獲得複數個候選資料與每一該些候選資料之複數個評分資料，其中每一該些評分資料係對應至一歷史使用者環境狀態，該歷史使用者環境狀態包含至少一歷史使用者狀態值，該些歷史使用者狀態值分別屬於複數個環境狀態類別；獲得一使用者之一使用者環境狀態，其中該使用者環 φ 境狀態包含至少一使用者狀態值，該些使用者狀態值分別屬於該些環境狀態類別；進行一離線處理階段，以將該些候選資料一對一轉換為複數個特徵化資料，其中每一該些特徵化資料包含複數個特徵片段，該些特徵化資料之全部的特徵片段分別屬於複數個特徵類型，該離線處理階段包含：根據一預設單位時間來將每一該些候選資料依序切割為複數個子資料； _ 利用一特徵擷取演算法來擷取每一該些候選資料之每一該些子資料之至少一特徵參數；根據每一該些候選資料之每一該些子資料之該至少一特徵參數，利用—第一分群演算法來將全部子資料分為複數個子資料群組，其中該些子資料群組係一對一對應至複數個參數類型；根據每-該些候選資料之每一該些子資料所對應之該子:貝料群組來決定每一該些候選資料之每一該些子資料所對應之該參數類型；根攄一預設數量來將每一該些候選資料之該些子「 25 201109944 資料依序分為複數個子資料序列；利用一序列相似度演算法來比較全部子資料序列之相似度，並獲得每一該些候選資料之每一該些子資料序列之一序列相似度值；根據每一該些候選資料之每一該些子資料之該些子資料序列之該些序列相似度值，利用一第二分群演算法來將全部子資料序列分為複數個序列群組，其中該些序列群組係一對一對應至複數個序列類型；提供一預設切割視窗與該預設切割視窗之一預設移動距離，其中該預設切割視窗具有一視窗長度，該切割視窗之該視窗長度和該預設移動距離為該預設單位時間之長度的倍數；以及利用該切割視窗來於每一該些候選資料之該些子資料序列上依序移動該預設移動距離，以從該些候選資料之全部子資料序列中取出該些特徵片段；進行一線上處理階段，以根據該些特徵類型來決定每一該些候選資料之一使用者喜好度，其中該線上處理階段包含：進行一狀態比較步驟，以利用一預設差異度閥值來比較該使用者環境狀態與每一該些評分資料所對應之該歷史使用者環境狀態的相似度，而從該些評分資料中決定複數筆相關評分資料；根據該些相關評分資料，來從該些候選資料中決定複數個相關候選資料，其中該些相關候選資料係一對一對應至該些相關評分資料； r 26 201109944 根據該些相關候選資料來從該些特徵類型中決定複數個相關特徵類型，其中該些相關特徵類型係對應至該些特徵片段之複數個相關特徵片段，而該些相關特徵片段係構成該些相關候選資料；計算每一該些相關特徵類型於每一該些相關候選資料中所包含的特徵片段的個數，以獲得每一該些相關特徵類型之複數個相關特徵片段個數；根據每一該些相關特徵類型之該些相關特徵片段個數，來決定每一該些相關特徵類型之一特徵正評價和一特徵負評價；根據一正評價閥值和每一該些相關特徵類型之該特徵正評價，來從該些相關特徵類型中，決定至少一正評價特徵類型；根據一負評價閥值和每一該些相關特徵類型之該特徵負評價，來從該些相關特徵類型中，決定至少一負評價特徵類型；根據該至少一正評價類型和該至少一負評價類型，來從該些相關特徵類型中，決定至少一高度相關特徵類型，其中該至少一高度相關特徵類型為該些相關特徵類型中屬於該正評價類型之至少一者，或為該些相關特徵類型中屬於該負評價類型之至少一者；根據每一該些高度相關特徵類型之該特徵負評價和該特徵正評價之一評價差值，來決定每一該至少一高度相關特徵類型之一預測評價；以及根據該些候選資料之該些特徵片段和每一該至少一高度相關特徵類型之該預測評價，來決定每一該些. 27 201109944 候選資料之該使用者喜好度。 2. 如申請專利範圍第1項所述之音樂推薦方法，更包含：根據該些相關評分資料來計算每一該些相關候選資料所對應之一正評價個數和一負評價個數；以及將該些相關候選資料之該些正評價個數加總，以得到該正評價閥值。 3. 如申請專利範圍第1項所述之音樂推薦方法，更包含：根據該些相關評分資料來計算每一該些相關候選資料所對應之一負評價個數；以及將該些相關候選資料之該些負評價個數加總，以得到該負評價閥值。 4. 如申請專利範圍第1項所述之音樂推薦方法，其中決定每一該些候選資料之該使用者喜好度之步驟包含：根據該候選資料所對應之該些特徵片段，來從該至少一高度相關特徵類型中，決定至少一匹配特徵類型，其中該至少一匹配特徵類型包含該候選資料所對應之該些特徵片段之至少一者；以及根據每一該至少一匹配特徵類型之該預測評價和每一該至少一匹配特徵類型所包含的特徵片段個數來決定該候選資料之該使用者喜好度。 28 201109944 包含：5.如申請專利第w所述之音樂推薦方法，更計算每一特徵類型所對應之一特徵片段個數. 根據-出現次數閥值來決定該些特徵類之無用特徵類型，中每一咳黾少一 |田枯微 u ^ 、甲母°哀至夕無用特徵片段所對應之 u特徵片段個數係大於該出現次數閥值；以及從該些特徵類型中，將該至少一無用特徵類型刪除。 6. 如申凊專利範圍第1項所述之音樂推薦方法，其中該特徵擷取演算法為改良型離散餘弦轉換演算法 (Modified discrete cosine transform; MDCT)。 7. 如申請專利範圍第1項所述之音樂推薦方法，其中該第一分群演算法為密度分群法(Density-Based Spatial Clustering of Applications with Noise; DBSCAN)、K 中數分群法(K-mean clustering)、多代表點分群法(CURE)或平衡式反覆化簡和分群法(BIRCH)。 8. 如申請專利範圍第1項所述之音樂推薦方法，其中該第二分群演算法為密度分群法（Density-Based Spatial Clustering of Applications with Noise; DBSCAN)、K 中數叢聚法(K-mean clustering)、多代表點分群法(CURE)或平衡式反覆化簡和分群法(BIRCH)。 9. 如申請專利範圍第1項所述之音樂推薦方法’其中該序列相似度演算法為基因序列比對演算法° [ 29 201109944 10·如申請專利範圍第1項所述之音樂推薦方法，其中，該些候選資料之格式為MPEG-1 Layer ΙΠ(ΜΡ3)格式，而該些子資料之格式為脈衝編碼調變（Pulse_c〇de modulation，PCM)格式。 U.如申請專利範圍第1項所述之音樂推薦方法，其中該狀態比較步驟包含：利用一相似度演算法來計算該歷史使用者環境狀態之母"亥些歷史使用者狀態值與相應之該使用者狀態值之差值，以得到複數個狀態差異度，其中該錄態差異度係一對一對應至該些差異度閥值；判斷該些狀態差異度之和是否小於該差異度閥值，以提供一判斷結果；以及當該判斷結果為是時，決定該歷史使用者環境狀態所對應之該評分資料為該相關評分資料。 12.如申請專利範圍第丨項所述之音樂推薦方法，更包含將該使时對該㈣選詩之複數铺增評分加入至該些評分資料中。 _ ㈣腦程式產品，經由—電腦載人該程式並打後，該電腦可進行如巾料鋪項所述之音薦方法。、