TW201109944A - Music recommendation method and program product thereof - Google Patents
Music recommendation method and program product thereof Download PDFInfo
- Publication number
- TW201109944A TW201109944A TW98130262A TW98130262A TW201109944A TW 201109944 A TW201109944 A TW 201109944A TW 98130262 A TW98130262 A TW 98130262A TW 98130262 A TW98130262 A TW 98130262A TW 201109944 A TW201109944 A TW 201109944A
- Authority
- TW
- Taiwan
- Prior art keywords
- feature
- data
- candidate
- sub
- evaluation
- Prior art date
Links
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
201109944 六、發明說明: 【發明所屬之技術領域】 本發明是有關於一種音樂推薦方法與其程式產品,特 別是有關於一種可根據使用者狀態來進行音樂推薦之方法 與其程式產品。 【先前技術】 隨著多媒體處理技術和無線網路傳輸技術的快速進 • 步,人們可以輕易地透過行動裝置(例如:手機或個人數位 助理)來從網路上獲得多媒體商品(例如:影片或音樂)。也 就疋說’只要有網路服務存在的地方,人們便可以輕易地 從網站上選購歌曲,而不必特地到實體商店去購買音樂光 碟。 、 然而,一般的音樂販售網站,例如:亞馬遜(Amaz〇n), 皆提供有數百萬首的歌曲供顧客挑選。因此,使用者難以 了解這數百萬首歌曲中,哪一首可能是自己喜歡的。為了 ♦解決這個問題’有些業者研發了資訊推薦技術來評估這數 百萬首歌曲中,有哪些可能是使用者所喜歡的。 目刖習知的資訊推薦技術係根據過去網路使用者對於 現有歌曲的評分來推薦歌曲給使用者。然而,對於新歌曲 而言,必須經過一段時間才會有評分,因此在這段空窗期 中,%知的負訊推薦技術無法正確地推薦歌曲給使用者。 再者,當歌曲的評分資料數不夠多時,習知的資訊推薦技 術也無法正確地推薦歌曲給使用者。另外,目前習知的資 訊推薦技術皆未考量到使用者的狀態。例如,使用者在白 201109944 天對-首歌給予了很高的評分 可能對同-首歌曲給予很低的評=到了晚上’此使用者 因此’冑要-種新的音樂推薦方 薦技術的缺點。 个又吾為知身訊推 【發明内容】 因此,本發明之一 其電腦程式產品。 方面是在提供一種音 樂推薦方法與
很據本發明 員她例
從,,,牡此首樂推薦方法中,首先 3 =候1 資料與每—候選資料之複數個評Γ資ΐ ,史:用:二應至一個歷史使用者環境狀態,11 些歷史使用者狀態值係分別屬於==態值’ $ 箪,權1 A m〜 ⑺屬於複數個5辰境狀態類別。去 態包二二-彳之使用者環境狀態’其巾此使用者環境法 i於二/ B @使用者狀態值,這些使用者狀態值係分另 將候境狀態類別。然後,進行離線處理階段,C η貝料—對—轉換為複數個特徵化資料,其中每一與 二料包含複數靖徵#段’這些特徵#段係對應至福、徵類型。接著’進行線上處理階段,以根據特徵類 尘來決定每一候選資料之使用者喜好度。 斤在上述之離線處理階段中,首先根據預設單位時間來 /將每候選資料依序切割為複數個子資料。然後,利用特 徵擷取肩算法來摘取每一候選資料之每一子資料之至少一 ,徵參數。接著,根據每一候選資料之每一子資料之該至 ^特徵參數’利用第一分群演算法來將全部子資料分為 201109944 複數個子資料群組,其中子資料群組係一對一對應至複數 個參數類型。然後,根據每一候選資料之每一子資料所對 應之子資料群組,來決定每一候選資料之每一子資料所對 應之參數類型。接著,根據預設數量來將每一候選資料之 子資料依序分為複數個子資料序列。然後,利用序列相似 度演算法來比較全部子資料序列之相似度,並獲得每一候 選資料之每一子資料序列之序列相似度值。接著,根據每 一候選資料之每一子資料之子資料序列的序列相似度值, 利用第二分群演算法來將全部子資料序列分為複數個序列 群組,其中這些序列群組係一對一對應至複數個序列類 型。然後’提供預設切割視窗與其預設移動距離,其中預 設切割視窗具有視窗長度,此切割視窗之該視窗長度和預 設移動距離為預設單位時間之長度的倍數。接著,利用切 割視窗來於每一候選資料之子資料序列上依序移動此預設 移動距離,以從候選資料之全部子資料序列中取出特徵片 段。 ’
y 在上述之線上處理階段中,首先進行狀態比較步驟, 以利用預設差異度_來比較使时環餘態 分 資料所對應之歷史使用者環境狀態的相似度,而 :中決定複數筆相關評分資料。然後,根據相關評分;料 來從候選資料中決定複數個相關候選資料, 資料係一對一對應至相關評分資料。接 、 資料來從特徵類财決定複數__ 據相關候選 特徵類型係對應至特徵片段之複數個】 關特徵片段係構成相關候選資料。然後,片段’而相 徵類型於每-相關候選資财所包含^算每-相關特 7符徵片段的個數,r 201109944 以獲得每一相關特徵類型之複數個相關 著,根據每—相關特徵類型所對應 =數。接 ,定每-相關特徵類型之特徵正評價 根據正評價閥值和每—相關特徵類之微i 。然 ,決定正評價特徵類==賈’ 負斤價閥值和每-相_徵㈣ 根據 特徵類型中,決定至少—負評價特來從相關 價類型和負評價類型,來從相關特徵類 '^根正評 高度相關特徵類型,其中高度相關特徵 少一 於負評價_之至少十接著,===屬 向度相關特徵類型之一預測評價。然後 - 特徵片段和每-高度相_徵類型之、^資,之 一候選資料之使用者喜好度。 ’、β貝,來決定每 根據本發明之另一實施例,前述之 電腦载入並執行後,此電腦可進行前述之音=薦產;^ 【實施方式】 請參照第1圖,其係繪示根據本 樂推薦方法的流程示意圖。音樂推薦 階段㈣和線上處理階段120。在離線處理階:為= 對資料庫130中的候選資料,例如 中枝外 取步驟112,以將每一個候選資料轉換 枓。每-個特徵化資料包含有複數個特徵片段,這㈣徵 201109944 片段係對應至複數個特徵類型。當資料庫中的候選資料都 被轉換成特徵化資料後’代表這些候選資料可以多個特徵 類型來表示。在以下的敘述中,這些特徵化資料的集合稱 為特徵化資料庫140。 在線上處理階段12〇中,首先進行喜好類型探勘步驟 122,以根據歷史使用者之評分資料庫150和目前使用者的 環境狀態160,來從特徵化資料庫+探勘出全部特徵類型 的預測評價。接著,進行資料喜好度預測步驟124,以根 據特徵類型的預測評價來預測資料庫中未被目前使用者評 分之候選資料的使用者喜好度,來產出推薦資料清單17〇。 此推薦資料清單170係根據每一個候選資料的使用者喜好 度來排列候選資料。另外,推薦資料清單170亦可只列出 喜好度最同的候選資料。 請同時參照第2圖、第3a圖、第3b圖和第4圖,第 2圖係繪示根據本發明之一實施例之特徵擷取步驟112的 流程示意圖。第3a圖和第3b圖係繪示第2圖中步驟112a 至步驟112f的示意圖。第4圖係繪示第2圖中步驟112g 至步驟112h的示意圖。 在特徵擷取步驟112中,首先進行步驟U2a,以根據 預設之單位時間來將每一個候選資料210依序切割為複數 個子資料220。接著,進行步驟112b,以利用特徵擷取演 算法來擷取每一個子資料220的特徵參數。在本實施例 中,候選資料為MPEG-1 Layer III(MP3)格式,所使用之特 徵擷取演算法為特徵改良型離散餘弦轉換演算法(Μ 〇 d i fi e d discrete cosine transform; MDCT),而子資料之長度為一個 音框之時間長度,即26毫秒。透過MDCT演算法’可畔 201109944 子复料轉換為脈衝編碼調變(pulse c〇de modulation,pcM) 格式’且由每一個子資料中取出36個MDCT特徵參數。 然後’進行基於音框之分群步驟112c,以根據每一子 資料220之特徵係數,利用分群演算法,來將全部的子資 料220分為複數個資料群組。這些資料群組係一對一對應 至複數個參數類型。在本實施例中,係將特徵相似的子資 料分在同一組資料群組中,如此每一個子資料都會對應至 一個參數類型。如第3b)圖所示,本實施例將參數類型分成 1、2、3、4和5 ’而每一個子資料所對應之參數類型則標 示於其上。另外’分群步驟112c所使用之分群演算法為密 度分群法(Density-Based Spatial Clustering of Applications with Noise; DBSCAN)、K 中數分群法(K-mean clustering)、 多代表點分群法(CURE)或平衡式反覆化簡和分群法 (BIRCH)。 接著,進行步驟112d,以根據預設數量來將每一個候 選資料210之子資料220依序分為複數個子資料序列230。 在本實施例中,預設數量為3,因此每3個子資料被視為 一個子資料序列230。 然後,進行步驟112e,以利用序列相似度演算法來比 較子資料序列230間的相似度。在本實施例中,係利用基 因序列比對演算法來比對每個子資料序列230間的相似 度。例如,S.Bneedleman和C.D.Wunsch所提出之方法”A general method applicable to the search for similarities in the amino acid sequence of two proteins”。在此演算法中’係以 一子資料序列為標準序列,並計算其他子資料序列與此標 準序列之相似度,如此每個子資料序列便會對應至一個序 9 201109944 列相似度值。 接著’進行基於序列之分群步驟112f,以根據資料序 列230之序列相似度值’利用分群演算法來將全部的子資 料序列230分為複數個序列群組,其中這些序列群組係一 對一對應至複數個序列類型。在本實施例中’係將彼此相 似的子資料序列230分至同一群組,如此每個子資料序列 230都會對應至一個序列類型。如第3圖所示,本實施例 將序列類型分成八、;8、(:、〇、£和?,而每一個子資料序 列所對應之序列類型則標示於其上。另外,分群步驟112d 所使用之分群演算法為密度分群法(Density-Based Spatial
Clustering 〇f Applications with Noise; DBSCAN)、K 中數分 群法(K-mean clustering)、多代表點分群法(CURE)或平衡式 反覆化簡和分群法(birch)。 由第3a圖和第3b圖可知,經過步驟112a至112f的處 理後,每一個候選資料210皆可透過不同類型之子資料序 列的組合來表示。因此,在以下的敘述中將各類型的子資 料序列統稱為基礎樣本240。 接著,進行步驟112g,以提供預設切割視窗與此預設 切割視窗之預設移動距離。預設切割視窗之長度和該預設 移動距離為預設單位時間之長度的倍數。然後,進行步驟 112h,以利用切割視窗來於每一候選資料上依序移動預設 移動距離,以取出特徵片段。如第4圖所示,候選資料31〇 已轉換成由多個基礎樣本所構成之資料。當切割視窗之長 度定為4個基礎樣本,而移動距離定為2個基礎樣本時, 候選資料310可以取出5個特徵片段:eabc、bccd、 CDDA、DABC和BCCD。當全部候選資料所包含的特徵圪 201109944 段都被決定後,便可以將這些特徵片段分類,使每一個特 徵片段對應到一個特徵類型。在本實施例中,每一個不同 的特徵片段都被視為不同的特徵類型,例如’ EABC和 BCCD屬於不同的特徵類型,而BCCD和BCCD則是屬於 相同之特徵類型。 請同時參照第5圖和第6圖,第5圖係繪示根據本發 明一實施例之歷史使用者資料列表400的結構示意圖,第 6圖係繪示根據本發明一實施例之喜好類型探勘步驟122
的流程示意圖。在本實施例中,資料列表4〇〇係儲存於評 分資料庫150中。資料列表4〇〇記載歷史使用者之狀態值, 例如:心跳數(HB)、室溫值(AT)、噪音音量(NV)、溼度值 (Η Y) ’以及歷史使用者對於候選資料km丨、咖、k叫、i叫、 itm5的評分資料’其中評分資料代表歷史使用者對候選資 料的評價。㈣資料的評價仙G〜5分來表示,i代表最 低的評價,5代表最高的評價,❿G代表未評價。因此評 k大於2稱之為正面評價,反之稱為負面評價。
由於歷史❹者之㈣值對包含歷史使歸本身的狀 Μ例如·體溫)或歷史使用者之環境狀況(例如:室溫),在 :下=述中’使用者本身狀態和環境狀況將以「環境狀 = 即此「環境狀態」包含使用者本身狀態和使 ^^ 至少—者。值得注意的是,在本實施例中, 義:所包含的環境狀態類別(如:溼度等) ^。境狀態相同’如此可方便後續步驟的進 201109944 史使用者環境狀態的相似度,而從評分資料中選出對應至 與使用者環境狀態相似之歷史使用者環境狀態的評分資 料,即相關評分資料。由於相關評分資料所對應之歷史使 用者環境狀態係類似於目前使用者環境狀態,因此相關評 分資料有助於預測目前使用者的喜好。另外,為了方便說 明,本實施例之評分資料記載了使用者的姓名Name,然而 記載使用者姓名並非是必要的。
值得一提的是,目前使用者也可能已對候選資料進行 坪分的動作,因此當得知目前使用者的環境狀態後,新增 的評分資料與目前使用者環境狀態亦可加入至歷史使用^ 資料列表400中,如此可利用目前使用者對已評分之候選 資料的評分資料來預測尚未評分之候選資料的使用者喜好 度。 當相關評分資料被決定後,進行步驟122b,以從候選 "貝料中,根據相關評分資料來決定複數個相關候選資料。 例如,在第5圖中,當「心跳數:79下、體溫:35.9度、、 澄度別」的歷过用者環境狀態對候職料_^分被 決定為相關評分資料時’其對應之相關候選#料即為候選 資料itm!。 接著,進行步驟122c,以根據相關候選資料來決定相 關特徵_。每—筆㈣候選資料都會對應至至少-個特 徵片段&些特徵片&在此稱為相關特徵片段,而相關特 徵類型,:部相關候選資料之相關 Γ二步驟咖,以計算全部的相關特徵類 型對應至母-候❽料㈣ 徵類型BCCD分別於候料料—2、itm3、itm4、itms 201109944 中匕3的特徵片段的個數。另外,此個數在以下的敘述中 稱為相關特徵片段個數。 接著,進行步驟l22e,以根據步驟122所獲得之相關 特徵片·^又的個數,來決定每一相關特徵類型之特徵正評價 特徵負„平鈿。例如’當候選資料itm】和丨恤5被決定為相 關候選資料,且候選資料itm丨和itm5皆只獲得負面評價 時’若候選資料itmi# itm5共包含3個屬於特徵類型bCCd 的特徵片段,則特徵類型BCCD會得到特徵負評價值3。 反之’备候選資料itmi和itm5被決定為相關候選資料,且 候選資料itmi和itm5皆只獲得正面評價時,則特徵類型 BCCD會彳于到特徵正評價值3。在本發明其他實施例中,亦 可考慮相關候選資料所獲得的評價個數。例如,當候選資 料1和itm5被決定為相關候選資料,且候選資料itmi和 itm5皆只獲得負面評價時,若候選資料itmi包含i個屬於 特徵類型BCCD的特徵片段,候選資料itm5包含2個屬於 特徵類型BCCD的特徵片段,且候選資料itmi對應有兩個 負面評價’則特徵類型BCCD會得到特徵負評價值 1*2+2=4 〇 ' 然後,進行步驟122f,以根據預設之正評價閥值和每 一相關特徵類型之特徵正評價,來從相關特徵類型中,決 定至少一正評價特徵類型。例如:當特徵類型BCCE)之特 徵正評價為5,且正評價閥值為4時,由於正評價大於閥 ,,因此特徵類型BCCD可被決定為正評價特徵類型。接 著,進行步驟122g,以減預設之貞評價閥值和每一相關 特徵類型之特徵負評價,來從相關特徵類型中,決定至少 -負評價特徵類型。例如’ #特徵㈣EABC之特徵負評「 13 201109944 價為5 ’且負評價閥值為4時,由於特徵負評價大於閥值, 因此特=類型EABC可被決定為負評價特徵類型。 ,值得注意的是,在本實施例中,被決定為正評價特徵 類型之特徵類型也可能同時被決定為負評價特徵類型。反 =被決定為負評價特徵類型之特徵類型也可能同時被決 定為正評價特徵類型。另外,在本發明之其他實施例中, 亦可根據歷史使用者給予相關候選資料之正評價個數和負 評價個數來決定正評價閥值和負評價閥值。 然後’進行步驟122h ’以根據負評價特徵類型之特徵 負砰彳貝和正評價特徵類型之特徵正評價,來從相關特徵類 型中,決定高度相關特徵類型,其中高度相關特徵類型為 相關特徵類型中屬於正評價類型的相關特徵類型,或是相 關特徵類型中屬於負評價類型的相關特徵類型。 接著,進行步驟122i,以根據每一高度相關特徵類型 之特徵負評價和特徵正評價之差值,來決定每一高度相關 特徵類型之預測評價。例如,當高度相關特徵類型BCCD 之正評價為5時,由於其沒有特徵負評價,因此其預測評 價即為5。又例如’當特徵類型AABC同時被決定為負評 價特徵類型和正評價特徵類型,且其特徵負評價為5、特 徵正評價值為6時,特徵類型AABC之預測評價為1,即 特徵正評價減去特徵負評價。 當全部高度相關類型的總預測評價都被計算獲得後, 即可進行資料喜好度預測步驟124,來決定每一候選資料 之使用者喜好度。 請參照第7圖,其係繪示根據本發明一實施例之資料 喜好度預測步驟124的流程示意圖。在喜好度預測步驟124r 201109944 中,首,進行步驟l24a,以根據候選資料所對應之特徵片 段來從高度相關特徵類型中,決定匹配特徵類型。例如: 當某一候選資料之特徵片段為EACC、BCCA和EACC,且 高度相關特徵類型為BCCA、EACC和BCCD時,此候選 資料之匹配特徵類型即為BCCA和EACC。接著,進行步 驟124b,以根據匹配特徵類型之預測評價和匹配特徵類型 所包含的特徵片段個數來決定候選資料之使用者喜好度。 例如:上述之候選資料的匹配特徵類型為BCCA和EACC, 且EACC有兩個。當EACC之預測評價為5,BCCA之預 測評價為4時’則此候選資料之使用者喜好度為5+5+4=14 值得注意的是,在計算使用者喜好度時並不限於僅將 各匹配特徵類型之預測評價乘上對應的個數。在本發明之 其他實施例t,亦可將每個匹配特徵類型對應至一個權 值’再利用此權值來計算候選資料的喜好度。 請參照第8圖,其係繪示根據本發明之一實施例之狀 態比較步驟122a的流程示意圖。在狀態比較步驟122a中, 首先進行步驟810,以利用相似度演算法來計算欲比較之 歷史使用者環境狀態的每一個歷史使用者狀態值(例如:心 跳數)與目前使用者的狀態值之差異,以得到對應至每一個 狀態類別的狀態差異度。若考慮到每一種狀態類別的重要 性皆不同’可採用具有加權算法的相似度演算法來對不同 的環境狀態定出不同的權值並進行計算。另外’值得注意 的是’本實施例之狀態差異度皆以絕對值來表示,因此狀 態差異度皆為正數。然後,進行步驟820 ’以判斷狀態差 異度的總和是否小於預設之差異度閥值,並提供判斷結 果。當判斷結果為是時,進行步驟830,以將此歷史使用^ 15 201109944 者環境狀態所對應之評分資料決定為相關評分資料。 請參照第9圖,其係繪示根據本發明之一實施例之無 用特徵類型過濾步驟900的流程示意圖。由於特徵擷取步 驟112所獲得之特徵類型可能不具有代表性,因此可於特 徵擷取步驟之後,進行特徵類型過濾步驟9〇〇,以將特徵 類型中無用的特徵類型刪除。在特徵類型過濾步驟900 申,首先進行步驟910,以計算每一特徵類型所對應之特 徵片段個數。然後,進行步驟920,以根據預設之出現次 數閥值來決定無用特徵類型,其中當一特徵類型所對應之 特徵片段個數係大於出現次數閥值,此特徵類型便被決定 為無用特徵類型。接著,進行步驟930,以從特徵類型中, 將無用特徵類型刪除。 值得一提的是,本實施例係以每一特徵類型於全部候 選資料中出現的次數來做為判斷此特徵類型是否為無用特 徵類型,意即根據每一特徵類型之出現頻率來做為判斷的 依據。因此,本實施例採用詞彙頻率和反轉文件頻率(Term Frequency Inverse Document Frequency; TFIDF)演算法來判 斷無用特徵類型。 爲了使線上處理階段的流程能更清楚和完整,以下再 以一實施例來說明線上處理階段。 請同時參照第10圖和第11圖,第10圖係繪示根據本 發明一實施例之候選資料CD1、CD2、CD3、CD4和CD5 之特徵化資料的結構示意圖。第11圖係繪示候選資料 CD卜CD2、CD3、CD4和CD5之特徵片段所包含的特徵 類型。在本實施例中’全部的候選資料CD1、CD2、CD3、 CD4和CD5之特徵化資料包含包含A、B、C、和D四種 201109944 類型之基礎樣本,且切割視窗之長度為4個基礎樣本,移 動距離為2個基礎樣本。如第1〇圖所示,候選資料CD1、 CD2、CD3、CD4、CD5和CD6所對應的特徵類型為CDDA、 DABC、BCCD、CDAB、CACD、EABC 和 CDEA。 請同時參照第12圖和第13圖。第12圖係繪示對候選 資料CD1、CD2、CD3、CD4和CD5進行評分之歷史使用 者的資料列表900。第13圖係繪示目前使用者之資料列表 950。資料列表900包含歷史使用者Alice、Andre、Ben、 Eric和Juice在不同的環境狀態SS下,對候選資料CD1、 CD2、CD3、CD4 和 CD5 的評分以及 Alice、Andre、Ben、
Eric和juice之使用者狀態值(例如:心跳數)。因此每個歷 史使用者環境狀態E卜E2、E3、…和E12皆會對應到一個 評分資料組’而每個評分資料組則包含歷史使用者對每個 候選資料CD卜CD2、CD3、CD4和CD5的評分資料。另 外’目前使用者之資料列表950紀錄了目前使用者David 之狀態值與David對部份候選資料的評分,其中資料列表 9〇〇所包含的環境狀態類別係與環境狀態列表950相同。 在本實施例之線上處理階段中,首先比較每一個歷史 使用者環境狀態與目前使用者環境狀態的相似度,以決定 相關評分資料(步驟122a)。在此,以Alice之環境狀態Ei 與David之環境狀態的比較為例。首先,計算對應至每一 環境狀態類別HB、BT、AT、NV和HY之狀態差值(步肆 810) ’即狀態差異度,如此可得到對應至hb之狀態差異 度為I 79-75 | = 4、BT之狀態差異度為| 35.9-36.7 | = 〇·8、AT之狀態差異度為| 25-25.9 | =0.9、NV之狀態差異 度為| 54-50 | = 4、HY之狀態差異度為| 80-80 | = 〇。然 17 201109944 後,判斷所有狀態差異度的總和是否小於預設之狀態差異 度閥值,以將狀態差異度總和小於狀態差異度閥值之環境 . 狀態所對應之評分資料選為相關評分資料(步驟82〇和 830)。在本實施例中,狀態差異度閥值設為5〇,因此,環 境狀態 El、E5、E6、E7、E8、E9、E10、E12 所對應之評 分資料被選為相關評分資料。 另外,本實施例亦將目前使用者之環境狀態與評分加 入至歷史評分資料中,因此目前使用之評分資料亦為相關 評分資料。 * 接著,根據相關評分資料來決定相關選資料(步驟 122b)。在本實施例中,環境狀態El、E5、E6、E7、E8、 E9、E10、E12以及目前使用者環境狀態所對應之評分資料 係對應至候選資料CD1、CD2、CD4和CD5,因此候選資 料CD卜CD2、CD4和CD5被決定為相關候選資料。然後, 將相關候選資料CD 1、CD2、CD4和CD5所對應的特徵類 型 CDDA、DABC、BCCD、CDAB、EABC 和 EDEA 決定 為相關特徵類型(步驟122c)。接著,相關特徵類型CDDa、 DABC、BCCD、CDAB、EABC和EDEA分別於相關候選 貝料CD卜CD2、CD4和CD5中所包含的特徵片段個數(步 驟122d)。例如’相關特徵類型CDDA於相關 二 CD卜CD2、CD4和CD5中的特徵片段個數分別為y 1和〇 ;相關特徵類型BCCD於相關候選f料咖心、 CD4和CD5 t的特徵片段個數分別為卜卜、 下的敘述中’每倾徵㈣所對應於每侧 :二 應的特徵片段個數將稱為相關特徵片段個數。、’所對 請參照第Η圖’其係㈣正評價特徵_、負評價掩 18 201109944 徵f型和高度相關特徵類型之示意圖。在本實施例中,當 j知每個相關特徵類型之相關特徵片段個數後,便可利用 d相關特徵>}段個數來決定每—相關特徵類型之特徵正 評價和特徵負評價(步驟122e)e值得注意的是,本實施例 亦考慮歷史使用者給予相關候選資料之正評價個數和負評 價個數來決定-相關特徵類型之特徵正評價和特徵負: 價。 、 在決定每一相關特徵類型之特徵正評價和特徵負評價 時首先计算歷史使用者給予相關候選資料之正評價個數 和負評價個數。例如:相關候選資料CD1對應有i個負面 評價和1個正面評價;相關候選資料CD2對應有3個負面 評價:相關候選資料CD4對應有1個負面評價和i個正面 評價;相關候選資料CD5對應有2個正面評價。接著,計 算每一相關特徵類型之特徵正評價和特徵負評價。在本實 施例中’係以下壯式來計算相_徵類型之特徵 FPtype和特徵負評價FNtype : FPtype=(Ntype.CD1*VCD,p)+( Ntyp,CD2*VcD2.p) +( NtypecD4, +( Ntype-CD5*VCD5-P); FNtype=(Ntype.CD1*Vc:D1-N)+( Ntype.CD2*VcD2 N) +( Ntype-CD5*VCD5_N) ; tyPe'CD4 VcD4-n) 其中’Ntype-CD1為相關特徵類型於候選資料中 徵片段數量;Ntype-CD2為相關特徵類型於候選二:= 相關特徵片段數量;Ntype-CD4為相 4 CD2中的 CD4中的相關特徵片段數量;N關^型於候選資料 選資料CD5中的相關特徵片段目關特徵類型於候 料⑽的正面評價個數;v一關:選== 201109944 "=數’v⑽4相關候選#料咖的正面評價個數; 相關候選資料CD5的正面評價個數;v_為㈣ 二、身,CD1的負面評價個數;% n為相關候選資料⑽ /垂面貝個S,VcD4_N為相關候選資'料CD4❾負面評價 個數;veD5.N為相瞧選#料CD5的負面評價個數。β :相特徵類型CDDA為例來解釋:相關特徵 CDDA於相關候選資料⑽、CD2、⑽和cd5中
片&個數分別為卜2、1和〇,由於相關候選資料CD5未 包含有相_徵麵CDDA,且相_選㈣⑽只有負 面評價,因此相關特徵類型CDDA之特徵正評 、
可表示如下: eDDA fpcdda=(ncdda.cd1*Vcdi p)+( Ncdda cD4*VcD4 p); 其中ncdda_cd1為相關特徵類型CDDA於相關候選資料 CD1中的個數;NCDDA_CD4為相關特徵類型CDDA於相關候 選負料CD4中的個數。由上式可得到相關特徵類型 之特徵正评價為1*1 + 1*1=2。類似地,相關特徵類型 之特徵負評價FNcdda可用表示如下: FNcdda=(Ncdda-cdi*Vcdi-n)+(NCDDa-cd2*Vcd2-n)+ (NcDDA-CD4*VCD4-N); 其中NCDDA-CD2為相關特徵類型CDDA於相關候選資料 CD2中的個數。由上式可得到相關特徵類型CDDA之特徵 負評價為 1*1+2*3+1*1=8。 當每一相關特徵類型之特徵正評價和特徵負評價都被 計算求得後’根據正評價閥值和每一相關特徵類型之特徵 正評價,來從相關特徵類型中’決定至少一正評價特徵頬 型(步驟122f)。同時也可根據預設之負評價閥值和每一相 201109944 Μ特,類51之特徵負評價 關特徵類型中,決定至 少-負評價特徵類型(步驟⑽。
實施例中’係根據歷史使用者給予相關候選資料 之個數和負評價個數來決定正評價閥值和負評價閥 ,,因將相關候選資料所對應的正評價個數相加即可 付到正::價閥冑4。將相關候選資料所對應的負評價個數 相加可%•到負評價閥值5。接著,便如第14圖所示,從相 關特徵類型中找出特徵正評價大於或等於正評價閥值4的 特徵類型’並將其決定為正評價特徵類型,以及從相關特 徵類型中找㈣徵貞評價大於或等於 負評價閥值5的特徵 類型’並將其決定為負評價特徵類型。由帛14冑可看出相 關特徵類型EABC為正評價特徵類型,相關特徵類型 CDDA和DABC為負評價特徵類型,而相關特徵類塑bccd 則同時屬於正評價特徵類型和負特徵評價類型。無論是正 貝特徵類型或是負特徵評價類型,其皆經過閥值的測 試’即代表正(負)特徵評價類型在相關候選資料中平均至 少出現過一次。因此,這些正評價特徵類型和負特徵評價 類型可視為高度相關之特徵類型(步驟122h)。然後,決定 每一個高度相關特徵類型之預測評價。在本實施例中,係 將高度相關特徵類型之正特徵正評價和特徵負評價相減’ 來得到其預測評價(步驟122i)。例如’高度相關特徵類型 BCCD之預測評價為4-6)=-2,而高度相關特徵類型CDDA 之預測評價為0-8)=-8 ° 請參照第15圖’其係繪示候選資料CD1之匹配特徵 類型。當決定高度相關特徵類型以後,即可根據候選資料 所對應之特徵片段來從高度相關特徵類型中,決定候選資[.Ξ ] 201109944 料之匹配特徵類型(步驟124a)。例如,候選資料CD1所對 應的特徵類型為CDDA、DABC、BCCD和CDAB,但CDAB ’ 並不屬於高度相關特徵類型,因此候選資料CD1所對應的 匹配特徵類型為CDDA、DABC和BCCD。然後,根據匹 配特徵類型之預測評價和匹配特徵類型所包含的特徵片段 個數來決定候選資料之使用者喜好度(步驟124b)。在本實 施例中,係利用詞彙頻率和反轉文件頻率演算法來計算高 度相關特徵類型之權重,以表達出每個匹配特徵類型的重 要性皆不相同。每個特徵類型之TF1DF值係如第16圖所 鲁 示’因此候選資料CD1之使用者喜好度為 0.0352*(_8)+0.0282*(-5)+0.0222*(-2)=-〇.464。 由以上說明可知本實施例之音樂推薦方法可預測每個 候選資料的使用者喜好度’因此當候選資料的評分數量不 夠多時’本實施例之音樂推薦方法仍可正確地推薦資料給 使用者。再者,本實施例之音樂推薦方法考慮了使用者的 狀態,因此在推薦的正確性上可較其他推薦技術更高。 另外根據本發明之其他實施例,本發明實施例之音樂 響推薦方法為-種電腦程式產品,儲存於一健存裝置中,例 如:光碟片。當電腦讀取此光碟片後,此電腦便可執行本 發明實施例之音樂推薦方法。 雖然本發明已以實施例揭露如上,然其並非用以限$ 本發明,任何熟習此技藝者,在不簡本㈣之精神和棄 :内’當可:各:之更動與潤飾,因此本發明之保 當視後附之申請專利範圍所界定者為準。 22 201109944 【圖式簡單說明】 為讓本發明之上述和其他目的、特徵、和優點能更明 顯易懂,上文特舉一較佳實施例,並配合所附圖式,作詳 細說明如下: 第1圖,其係繪示根據本發明之一實施例之音樂推薦 方法的流程示意圖。 第2圖係繪示根據本發明之一實施例之特徵擷取步驟 的流程不意圖。 第3a圖和第3b圖係繪示第2圖中步驟112a至步驟 112f的示意圖。 第4圖係繪示第2圖中步驟112g至步驟112h的示意 圖。 第5圖係繪示根據本發明一實施例之資料列表的結構 不意圖。 第6圖係繪示根據本發明一實施例之喜好類型探勘步 驟的流程示意圖。 第7圖係繪示根據本發明一實施例之資料喜好度預測 步驟的流程示意圖。 第8圖係繪示根據本發明之一實施例之狀態比較步驟 的流程示意圖。 第9圖係繪示根據本發明之一實施例之無用特徵類型 過遽步驟的流程示意圖。 第10圖係繪示根據本發明一實施例之候選資料之特 徵化資料的結構示意圖。 第11圖係繪示候選資料之特徵片段所包含的特徵類 型。 r 23 201109944 第12圖係繪示對候選資料進行評分之歷史使用者的 資料列表。 第13圖係繪示目前使用者之資料列表。 第14圖係繪示正評價特徵類型、負評價特徵類型和高 度相關特徵類型之示意圖。 第15圖係繪示候選資料之匹配特徵類型。 第16圖係繪示每個特徵類型所對應之TFIDF值。 【主要元件符號說明】
110 :離線處理階段 112a〜112h :步驟 122 :喜好類型探勘步驟 124 :資料喜好度預測步驟 130 :候選資料庫 150 :評分資料庫 170 :推薦資料清單 220 :子資料 240 .基礎樣本 400 :資料列表 810〜830 :步驟 CD1〜CD5 :候選資料 112 :特徵擷取步驟 120 :線上處理階段 122a〜122i :步驟 124a〜124b :步驟 140 :特徵化資料庫 160 :使用者環境狀態 210 :候選資料 230 :子資料序列 310 :候選資料 800 :特徵類型過濾步驟 900〜930 :步驟 E1〜E12 :環境狀態 24
Claims (1)
- 201109944 七、申請專利範園: 1. 一種音樂推薦方法,包含: 獲得複數個候選資料與每一該些候選資料之複數個評 分資料,其中每一該些評分資料係對應至一歷史使用者環 境狀態,該歷史使用者環境狀態包含至少一歷史使用者狀 態值,該些歷史使用者狀態值分別屬於複數個環境狀態類 別; 獲得一使用者之一使用者環境狀態,其中該使用者環 φ 境狀態包含至少一使用者狀態值,該些使用者狀態值分別 屬於該些環境狀態類別; 進行一離線處理階段,以將該些候選資料一對一轉換 為複數個特徵化資料,其中每一該些特徵化資料包含複數 個特徵片段,該些特徵化資料之全部的特徵片段分別屬於 複數個特徵類型,該離線處理階段包含: 根據一預設單位時間來將每一該些候選資料依序 切割為複數個子資料; _ 利用一特徵擷取演算法來擷取每一該些候選資料 之每一該些子資料之至少一特徵參數; 根據每一該些候選資料之每一該些子資料之該至 少一特徵參數,利用—第一分群演算法來將全部子資 料分為複數個子資料群組,其中該些子資料群組係一 對一對應至複數個參數類型; 根據每-該些候選資料之每一該些子資料所對應 之該子:貝料群組來決定每一該些候選資料之每一該些 子資料所對應之該參數類型; 根攄一預設數量來將每一該些候選資料之該些子「 25 201109944 資料依序分為複數個子資料序列; 利用一序列相似度演算法來比較全部子資料序列 之相似度,並獲得每一該些候選資料之每一該些子資 料序列之一序列相似度值; 根據每一該些候選資料之每一該些子資料之該些 子資料序列之該些序列相似度值,利用一第二分群 演算法來將全部子資料序列分為複數個序列群組, 其中該些序列群組係一對一對應至複數個序列類 型; 提供一預設切割視窗與該預設切割視窗之一預設 移動距離,其中該預設切割視窗具有一視窗長度,該 切割視窗之該視窗長度和該預設移動距離為該預設單 位時間之長度的倍數;以及 利用該切割視窗來於每一該些候選資料之該些子 資料序列上依序移動該預設移動距離,以從該些候選 資料之全部子資料序列中取出該些特徵片段; 進行一線上處理階段,以根據該些特徵類型來決定每 一該些候選資料之一使用者喜好度,其中該線上處理階段 包含: 進行一狀態比較步驟,以利用一預設差異度閥值 來比較該使用者環境狀態與每一該些評分資料所對應 之該歷史使用者環境狀態的相似度,而從該些評分資 料中決定複數筆相關評分資料; 根據該些相關評分資料,來從該些候選資料中決 定複數個相關候選資料,其中該些相關候選資料係一 對一對應至該些相關評分資料; r 26 201109944 根據該些相關候選資料來從該些特徵類型中決定 複數個相關特徵類型,其中該些相關特徵類型係對應 至該些特徵片段之複數個相關特徵片段,而該些相關 特徵片段係構成該些相關候選資料; 計算每一該些相關特徵類型於每一該些相關候選 資料中所包含的特徵片段的個數,以獲得每一該些相 關特徵類型之複數個相關特徵片段個數; 根據每一該些相關特徵類型之該些相關特徵片段 個數,來決定每一該些相關特徵類型之一特徵正評價 和一特徵負評價; 根據一正評價閥值和每一該些相關特徵類型之該 特徵正評價,來從該些相關特徵類型中,決定至少一 正評價特徵類型; 根據一負評價閥值和每一該些相關特徵類型之該 特徵負評價,來從該些相關特徵類型中,決定至少一 負評價特徵類型; 根據該至少一正評價類型和該至少一負評價類 型,來從該些相關特徵類型中,決定至少一高度相關 特徵類型,其中該至少一高度相關特徵類型為該些相 關特徵類型中屬於該正評價類型之至少一者,或為該 些相關特徵類型中屬於該負評價類型之至少一者; 根據每一該些高度相關特徵類型之該特徵負評價 和該特徵正評價之一評價差值,來決定每一該至少一 高度相關特徵類型之一預測評價;以及 根據該些候選資料之該些特徵片段和每一該至少 一高度相關特徵類型之該預測評價,來決定每一該些. 27 201109944 候選資料之該使用者喜好度。 2. 如申請專利範圍第1項所述之音樂推薦方法,更 包含: 根據該些相關評分資料來計算每一該些相關候選資料 所對應之一正評價個數和一負評價個數;以及 將該些相關候選資料之該些正評價個數加總,以得到 該正評價閥值。 3. 如申請專利範圍第1項所述之音樂推薦方法,更 包含: 根據該些相關評分資料來計算每一該些相關候選資料 所對應之一負評價個數;以及 將該些相關候選資料之該些負評價個數加總,以得到 該負評價閥值。 4. 如申請專利範圍第1項所述之音樂推薦方法,其 中決定每一該些候選資料之該使用者喜好度之步驟包含: 根據該候選資料所對應之該些特徵片段,來從該至少 一高度相關特徵類型中,決定至少一匹配特徵類型,其中 該至少一匹配特徵類型包含該候選資料所對應之該些特徵 片段之至少一者;以及 根據每一該至少一匹配特徵類型之該預測評價和每一 該至少一匹配特徵類型所包含的特徵片段個數來決定該候 選資料之該使用者喜好度。 28 201109944 包含:5.如申請專利第w所述之音樂推薦方法,更 計算每一特徵類型所對應之一特徵片段個數. 根據-出現次數閥值來決定該些特徵類之 無用特徵類型,中每一咳黾少一 |田枯微 u ^ 、甲母°哀至夕無用特徵片段所對應之 u特徵片段個數係大於該出現次數閥值;以及 從該些特徵類型中,將該至少一無用特徵類型刪除。 6. 如申凊專利範圍第1項所述之音樂推薦方法,其 中該特徵擷取演算法為改良型離散餘弦轉換演算法 (Modified discrete cosine transform; MDCT)。 7. 如申請專利範圍第1項所述之音樂推薦方法,其 中該第一分群演算法為密度分群法(Density-Based Spatial Clustering of Applications with Noise; DBSCAN)、K 中數分 群法(K-mean clustering)、多代表點分群法(CURE)或平衡式 反覆化簡和分群法(BIRCH)。 8. 如申請專利範圍第1項所述之音樂推薦方法,其 中該第二分群演算法為密度分群法(Density-Based Spatial Clustering of Applications with Noise; DBSCAN)、K 中數叢 聚法(K-mean clustering)、多代表點分群法(CURE)或平衡式 反覆化簡和分群法(BIRCH)。 9. 如申請專利範圍第1項所述之音樂推薦方法’其 中該序列相似度演算法為基因序列比對演算法° [ 29 201109944 10·如申請專利範圍第1項所述之音樂推薦方法,其 中,該些候選資料之格式為MPEG-1 Layer ΙΠ(ΜΡ3)格式, 而該些子資料之格式為脈衝編碼調變(Pulse_c〇de modulation,PCM)格式。 U.如申請專利範圍第1項所述之音樂推薦方法,其 中該狀態比較步驟包含: 利用一相似度演算法來計算該歷史使用者環境狀態之 母"亥些歷史使用者狀態值與相應之該使用者狀態值之差 值,以得到複數個狀態差異度,其中該錄態差異度係一 對一對應至該些差異度閥值; 判斷該些狀態差異度之和是否小於該差異度閥值,以 提供一判斷結果;以及 當該判斷結果為是時,決定該歷史使用者環境狀態所 對應之該評分資料為該相關評分資料。 12.如申請專利範圍第丨項所述之音樂推薦方法,更 包含將該使时對該㈣選詩之複數铺增評分加入至 該些評分資料中。 _ ㈣腦程式產品,經由—電腦載人該程式並 打後,該電腦可進行如巾料鋪項所述之音 薦方法。 、
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
TW98130262A TWI410811B (zh) | 2009-09-08 | 2009-09-08 | 音樂推薦方法與其程式產品 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
TW98130262A TWI410811B (zh) | 2009-09-08 | 2009-09-08 | 音樂推薦方法與其程式產品 |
Publications (2)
Publication Number | Publication Date |
---|---|
TW201109944A true TW201109944A (en) | 2011-03-16 |
TWI410811B TWI410811B (zh) | 2013-10-01 |
Family
ID=44836119
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW98130262A TWI410811B (zh) | 2009-09-08 | 2009-09-08 | 音樂推薦方法與其程式產品 |
Country Status (1)
Country | Link |
---|---|
TW (1) | TWI410811B (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TWI499290B (zh) * | 2012-11-30 | 2015-09-01 | Ind Tech Res Inst | 資訊推薦方法及系統 |
TWI584139B (zh) * | 2016-09-09 | 2017-05-21 | Speech recognition system and its information processing method applied to non - real - time signal source | |
TWI613606B (zh) * | 2016-12-16 | 2018-02-01 | 財團法人工業技術研究院 | 使用者喜好之預測方法 |
TWI614703B (zh) * | 2012-03-27 | 2018-02-11 | Alibaba Group Services Ltd | 資訊推薦方法及資訊推薦裝置 |
TWI703515B (zh) * | 2018-07-18 | 2020-09-01 | 香港商阿里巴巴集團服務有限公司 | 訓練改編水準評價模型、評價改編水準的方法及裝置 |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104991900A (zh) * | 2015-06-09 | 2015-10-21 | 腾讯科技(深圳)有限公司 | 一种音乐数据推送方法及装置 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7081579B2 (en) * | 2002-10-03 | 2006-07-25 | Polyphonic Human Media Interface, S.L. | Method and system for music recommendation |
TW200606681A (en) * | 2004-08-13 | 2006-02-16 | Parasoft Corp | Music recommendation system and method |
-
2009
- 2009-09-08 TW TW98130262A patent/TWI410811B/zh not_active IP Right Cessation
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TWI614703B (zh) * | 2012-03-27 | 2018-02-11 | Alibaba Group Services Ltd | 資訊推薦方法及資訊推薦裝置 |
TWI499290B (zh) * | 2012-11-30 | 2015-09-01 | Ind Tech Res Inst | 資訊推薦方法及系統 |
TWI584139B (zh) * | 2016-09-09 | 2017-05-21 | Speech recognition system and its information processing method applied to non - real - time signal source | |
TWI613606B (zh) * | 2016-12-16 | 2018-02-01 | 財團法人工業技術研究院 | 使用者喜好之預測方法 |
TWI703515B (zh) * | 2018-07-18 | 2020-09-01 | 香港商阿里巴巴集團服務有限公司 | 訓練改編水準評價模型、評價改編水準的方法及裝置 |
US11074897B2 (en) | 2018-07-18 | 2021-07-27 | Advanced New Technologies Co., Ltd. | Method and apparatus for training adaptation quality evaluation model, and method and apparatus for evaluating adaptation quality |
US11367424B2 (en) | 2018-07-18 | 2022-06-21 | Advanced New Technologies Co., Ltd. | Method and apparatus for training adaptation quality evaluation model, and method and apparatus for evaluating adaptation quality |
Also Published As
Publication number | Publication date |
---|---|
TWI410811B (zh) | 2013-10-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4678546B2 (ja) | 推薦装置および方法、プログラム、並びに記録媒体 | |
US8463717B2 (en) | Method and apparatus for predicting preference rating for content, and method and apparatus for selecting sample content | |
WO2017096877A1 (zh) | 一种推荐方法和装置 | |
Bogdanov et al. | How much metadata do we need in music recommendation?: A subjective evaluation using preference sets | |
US20060217828A1 (en) | Music searching system and method | |
US8543529B2 (en) | Content selection based on consumer interactions | |
TW201109944A (en) | Music recommendation method and program product thereof | |
US20090089265A1 (en) | Information processing apparatus, information processing method, and program | |
US8611676B2 (en) | Information processing apparatus, feature extraction method, recording media, and program | |
JP2010061601A (ja) | 推薦装置および方法、プログラム、並びに記録媒体 | |
EP2976727A1 (en) | Cross media recommendation | |
JP5553232B2 (ja) | 楽曲再生システム | |
US20080195661A1 (en) | Digital media recognition using metadata | |
TW201104466A (en) | Digital data processing method for personalized information retrieval and computer readable storage medium and information retrieval system thereof | |
JP2007058842A (ja) | 情報処理装置、特徴抽出方法、記録媒体、および、プログラム | |
JP2011145742A (ja) | 情報処理装置、情報処理方法、およびプログラム | |
JP5481295B2 (ja) | オブジェクト推薦装置、オブジェクト推薦方法、オブジェクト推薦プログラムおよびオブジェクト推薦システム | |
Chou et al. | Evaluating music recommendation in a real-world setting: On data splitting and evaluation metrics | |
KR101102823B1 (ko) | 무드에 따른 상황추론 사례기반 음악추천시스템 및 그 방법 | |
JP2013033376A (ja) | 情報処理装置、情報処理方法、および、プログラム | |
JP5013161B2 (ja) | 情報処理装置および情報処理方法、提供装置および提供方法、並びにプログラム | |
JP4594701B2 (ja) | 情報検索装置、情報検索方法及び情報検索用プログラム並びに情報記録媒体 | |
JP2007115222A (ja) | 情報処理装置および方法、並びにプログラム | |
Bogdanov et al. | Taking advantage of editorial metadata to recommend music | |
Girsang et al. | Song recommendation system using collaborative filtering methods |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
MM4A | Annulment or lapse of patent due to non-payment of fees |