TW201109944A - Music recommendation method and program product thereof - Google Patents

Music recommendation method and program product thereof Download PDF

Info

Publication number
TW201109944A
TW201109944A TW98130262A TW98130262A TW201109944A TW 201109944 A TW201109944 A TW 201109944A TW 98130262 A TW98130262 A TW 98130262A TW 98130262 A TW98130262 A TW 98130262A TW 201109944 A TW201109944 A TW 201109944A
Authority
TW
Taiwan
Prior art keywords
feature
data
candidate
sub
evaluation
Prior art date
Application number
TW98130262A
Other languages
English (en)
Other versions
TWI410811B (zh
Inventor
Shin-Mu Tseng
Ja-Hwung Su
Hsin-Ho Yeh
Original Assignee
Univ Nat Cheng Kung
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Univ Nat Cheng Kung filed Critical Univ Nat Cheng Kung
Priority to TW98130262A priority Critical patent/TWI410811B/zh
Publication of TW201109944A publication Critical patent/TW201109944A/zh
Application granted granted Critical
Publication of TWI410811B publication Critical patent/TWI410811B/zh

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

201109944 六、發明說明: 【發明所屬之技術領域】 本發明是有關於一種音樂推薦方法與其程式產品,特 別是有關於一種可根據使用者狀態來進行音樂推薦之方法 與其程式產品。 【先前技術】 隨著多媒體處理技術和無線網路傳輸技術的快速進 • 步,人們可以輕易地透過行動裝置(例如:手機或個人數位 助理)來從網路上獲得多媒體商品(例如:影片或音樂)。也 就疋說’只要有網路服務存在的地方,人們便可以輕易地 從網站上選購歌曲,而不必特地到實體商店去購買音樂光 碟。 、 然而,一般的音樂販售網站,例如:亞馬遜(Amaz〇n), 皆提供有數百萬首的歌曲供顧客挑選。因此,使用者難以 了解這數百萬首歌曲中,哪一首可能是自己喜歡的。為了 ♦解決這個問題’有些業者研發了資訊推薦技術來評估這數 百萬首歌曲中,有哪些可能是使用者所喜歡的。 目刖習知的資訊推薦技術係根據過去網路使用者對於 現有歌曲的評分來推薦歌曲給使用者。然而,對於新歌曲 而言,必須經過一段時間才會有評分,因此在這段空窗期 中,%知的負訊推薦技術無法正確地推薦歌曲給使用者。 再者,當歌曲的評分資料數不夠多時,習知的資訊推薦技 術也無法正確地推薦歌曲給使用者。另外,目前習知的資 訊推薦技術皆未考量到使用者的狀態。例如,使用者在白 201109944 天對-首歌給予了很高的評分 可能對同-首歌曲給予很低的評=到了晚上’此使用者 因此’冑要-種新的音樂推薦方 薦技術的缺點。 个又吾為知身訊推 【發明内容】 因此,本發明之一 其電腦程式產品。 方面是在提供一種音 樂推薦方法與
很據本發明 員她例
從,,,牡此首樂推薦方法中,首先 3 =候1 資料與每—候選資料之複數個評Γ資ΐ ,史:用:二應至一個歷史使用者環境狀態,11 些歷史使用者狀態值係分別屬於==態值’ $ 箪,權1 A m〜 ⑺屬於複數個5辰境狀態類別。去 態包二二-彳之使用者環境狀態’其巾此使用者環境法 i於二/ B @使用者狀態值,這些使用者狀態值係分另 將候境狀態類別。然後,進行離線處理階段,C η貝料—對—轉換為複數個特徵化資料,其中每一與 二料包含複數靖徵#段’這些特徵#段係對應至福、徵類型。接著’進行線上處理階段,以根據特徵類 尘來決定每一候選資料之使用者喜好度。 斤在上述之離線處理階段中,首先根據預設單位時間來 /將每候選資料依序切割為複數個子資料。然後,利用特 徵擷取肩算法來摘取每一候選資料之每一子資料之至少一 ,徵參數。接著,根據每一候選資料之每一子資料之該至 ^特徵參數’利用第一分群演算法來將全部子資料分為 201109944 複數個子資料群組,其中子資料群組係一對一對應至複數 個參數類型。然後,根據每一候選資料之每一子資料所對 應之子資料群組,來決定每一候選資料之每一子資料所對 應之參數類型。接著,根據預設數量來將每一候選資料之 子資料依序分為複數個子資料序列。然後,利用序列相似 度演算法來比較全部子資料序列之相似度,並獲得每一候 選資料之每一子資料序列之序列相似度值。接著,根據每 一候選資料之每一子資料之子資料序列的序列相似度值, 利用第二分群演算法來將全部子資料序列分為複數個序列 群組,其中這些序列群組係一對一對應至複數個序列類 型。然後’提供預設切割視窗與其預設移動距離,其中預 設切割視窗具有視窗長度,此切割視窗之該視窗長度和預 設移動距離為預設單位時間之長度的倍數。接著,利用切 割視窗來於每一候選資料之子資料序列上依序移動此預設 移動距離,以從候選資料之全部子資料序列中取出特徵片 段。 ’
y 在上述之線上處理階段中,首先進行狀態比較步驟, 以利用預設差異度_來比較使时環餘態 分 資料所對應之歷史使用者環境狀態的相似度,而 :中決定複數筆相關評分資料。然後,根據相關評分;料 來從候選資料中決定複數個相關候選資料, 資料係一對一對應至相關評分資料。接 、 資料來從特徵類财決定複數__ 據相關候選 特徵類型係對應至特徵片段之複數個】 關特徵片段係構成相關候選資料。然後,片段’而相 徵類型於每-相關候選資财所包含^算每-相關特 7符徵片段的個數,r 201109944 以獲得每一相關特徵類型之複數個相關 著,根據每—相關特徵類型所對應 =數。接 ,定每-相關特徵類型之特徵正評價 根據正評價閥值和每—相關特徵類之微i 。然 ,決定正評價特徵類==賈’ 負斤價閥值和每-相_徵㈣ 根據 特徵類型中,決定至少—負評價特來從相關 價類型和負評價類型,來從相關特徵類 '^根正評 高度相關特徵類型,其中高度相關特徵 少一 於負評價_之至少十接著,===屬 向度相關特徵類型之一預測評價。然後 - 特徵片段和每-高度相_徵類型之、^資,之 一候選資料之使用者喜好度。 ’、β貝,來決定每 根據本發明之另一實施例,前述之 電腦载入並執行後,此電腦可進行前述之音=薦產;^ 【實施方式】 請參照第1圖,其係繪示根據本 樂推薦方法的流程示意圖。音樂推薦 階段㈣和線上處理階段120。在離線處理階:為= 對資料庫130中的候選資料,例如 中枝外 取步驟112,以將每一個候選資料轉換 枓。每-個特徵化資料包含有複數個特徵片段,這㈣徵 201109944 片段係對應至複數個特徵類型。當資料庫中的候選資料都 被轉換成特徵化資料後’代表這些候選資料可以多個特徵 類型來表示。在以下的敘述中,這些特徵化資料的集合稱 為特徵化資料庫140。 在線上處理階段12〇中,首先進行喜好類型探勘步驟 122,以根據歷史使用者之評分資料庫150和目前使用者的 環境狀態160,來從特徵化資料庫+探勘出全部特徵類型 的預測評價。接著,進行資料喜好度預測步驟124,以根 據特徵類型的預測評價來預測資料庫中未被目前使用者評 分之候選資料的使用者喜好度,來產出推薦資料清單17〇。 此推薦資料清單170係根據每一個候選資料的使用者喜好 度來排列候選資料。另外,推薦資料清單170亦可只列出 喜好度最同的候選資料。 請同時參照第2圖、第3a圖、第3b圖和第4圖,第 2圖係繪示根據本發明之一實施例之特徵擷取步驟112的 流程示意圖。第3a圖和第3b圖係繪示第2圖中步驟112a 至步驟112f的示意圖。第4圖係繪示第2圖中步驟112g 至步驟112h的示意圖。 在特徵擷取步驟112中,首先進行步驟U2a,以根據 預設之單位時間來將每一個候選資料210依序切割為複數 個子資料220。接著,進行步驟112b,以利用特徵擷取演 算法來擷取每一個子資料220的特徵參數。在本實施例 中,候選資料為MPEG-1 Layer III(MP3)格式,所使用之特 徵擷取演算法為特徵改良型離散餘弦轉換演算法(Μ 〇 d i fi e d discrete cosine transform; MDCT),而子資料之長度為一個 音框之時間長度,即26毫秒。透過MDCT演算法’可畔 201109944 子复料轉換為脈衝編碼調變(pulse c〇de modulation,pcM) 格式’且由每一個子資料中取出36個MDCT特徵參數。 然後’進行基於音框之分群步驟112c,以根據每一子 資料220之特徵係數,利用分群演算法,來將全部的子資 料220分為複數個資料群組。這些資料群組係一對一對應 至複數個參數類型。在本實施例中,係將特徵相似的子資 料分在同一組資料群組中,如此每一個子資料都會對應至 一個參數類型。如第3b)圖所示,本實施例將參數類型分成 1、2、3、4和5 ’而每一個子資料所對應之參數類型則標 示於其上。另外’分群步驟112c所使用之分群演算法為密 度分群法(Density-Based Spatial Clustering of Applications with Noise; DBSCAN)、K 中數分群法(K-mean clustering)、 多代表點分群法(CURE)或平衡式反覆化簡和分群法 (BIRCH)。 接著,進行步驟112d,以根據預設數量來將每一個候 選資料210之子資料220依序分為複數個子資料序列230。 在本實施例中,預設數量為3,因此每3個子資料被視為 一個子資料序列230。 然後,進行步驟112e,以利用序列相似度演算法來比 較子資料序列230間的相似度。在本實施例中,係利用基 因序列比對演算法來比對每個子資料序列230間的相似 度。例如,S.Bneedleman和C.D.Wunsch所提出之方法”A general method applicable to the search for similarities in the amino acid sequence of two proteins”。在此演算法中’係以 一子資料序列為標準序列,並計算其他子資料序列與此標 準序列之相似度,如此每個子資料序列便會對應至一個序 9 201109944 列相似度值。 接著’進行基於序列之分群步驟112f,以根據資料序 列230之序列相似度值’利用分群演算法來將全部的子資 料序列230分為複數個序列群組,其中這些序列群組係一 對一對應至複數個序列類型。在本實施例中’係將彼此相 似的子資料序列230分至同一群組,如此每個子資料序列 230都會對應至一個序列類型。如第3圖所示,本實施例 將序列類型分成八、;8、(:、〇、£和?,而每一個子資料序 列所對應之序列類型則標示於其上。另外,分群步驟112d 所使用之分群演算法為密度分群法(Density-Based Spatial
Clustering 〇f Applications with Noise; DBSCAN)、K 中數分 群法(K-mean clustering)、多代表點分群法(CURE)或平衡式 反覆化簡和分群法(birch)。 由第3a圖和第3b圖可知,經過步驟112a至112f的處 理後,每一個候選資料210皆可透過不同類型之子資料序 列的組合來表示。因此,在以下的敘述中將各類型的子資 料序列統稱為基礎樣本240。 接著,進行步驟112g,以提供預設切割視窗與此預設 切割視窗之預設移動距離。預設切割視窗之長度和該預設 移動距離為預設單位時間之長度的倍數。然後,進行步驟 112h,以利用切割視窗來於每一候選資料上依序移動預設 移動距離,以取出特徵片段。如第4圖所示,候選資料31〇 已轉換成由多個基礎樣本所構成之資料。當切割視窗之長 度定為4個基礎樣本,而移動距離定為2個基礎樣本時, 候選資料310可以取出5個特徵片段:eabc、bccd、 CDDA、DABC和BCCD。當全部候選資料所包含的特徵圪 201109944 段都被決定後,便可以將這些特徵片段分類,使每一個特 徵片段對應到一個特徵類型。在本實施例中,每一個不同 的特徵片段都被視為不同的特徵類型,例如’ EABC和 BCCD屬於不同的特徵類型,而BCCD和BCCD則是屬於 相同之特徵類型。 請同時參照第5圖和第6圖,第5圖係繪示根據本發 明一實施例之歷史使用者資料列表400的結構示意圖,第 6圖係繪示根據本發明一實施例之喜好類型探勘步驟122
的流程示意圖。在本實施例中,資料列表4〇〇係儲存於評 分資料庫150中。資料列表4〇〇記載歷史使用者之狀態值, 例如:心跳數(HB)、室溫值(AT)、噪音音量(NV)、溼度值 (Η Y) ’以及歷史使用者對於候選資料km丨、咖、k叫、i叫、 itm5的評分資料’其中評分資料代表歷史使用者對候選資 料的評價。㈣資料的評價仙G〜5分來表示,i代表最 低的評價,5代表最高的評價,❿G代表未評價。因此評 k大於2稱之為正面評價,反之稱為負面評價。
由於歷史❹者之㈣值對包含歷史使歸本身的狀 Μ例如·體溫)或歷史使用者之環境狀況(例如:室溫),在 :下=述中’使用者本身狀態和環境狀況將以「環境狀 = 即此「環境狀態」包含使用者本身狀態和使 ^^ 至少—者。值得注意的是,在本實施例中, 義:所包含的環境狀態類別(如:溼度等) ^。境狀態相同’如此可方便後續步驟的進 201109944 史使用者環境狀態的相似度,而從評分資料中選出對應至 與使用者環境狀態相似之歷史使用者環境狀態的評分資 料,即相關評分資料。由於相關評分資料所對應之歷史使 用者環境狀態係類似於目前使用者環境狀態,因此相關評 分資料有助於預測目前使用者的喜好。另外,為了方便說 明,本實施例之評分資料記載了使用者的姓名Name,然而 記載使用者姓名並非是必要的。
值得一提的是,目前使用者也可能已對候選資料進行 坪分的動作,因此當得知目前使用者的環境狀態後,新增 的評分資料與目前使用者環境狀態亦可加入至歷史使用^ 資料列表400中,如此可利用目前使用者對已評分之候選 資料的評分資料來預測尚未評分之候選資料的使用者喜好 度。 當相關評分資料被決定後,進行步驟122b,以從候選 "貝料中,根據相關評分資料來決定複數個相關候選資料。 例如,在第5圖中,當「心跳數:79下、體溫:35.9度、、 澄度別」的歷过用者環境狀態對候職料_^分被 決定為相關評分資料時’其對應之相關候選#料即為候選 資料itm!。 接著,進行步驟122c,以根據相關候選資料來決定相 關特徵_。每—筆㈣候選資料都會對應至至少-個特 徵片段&些特徵片&在此稱為相關特徵片段,而相關特 徵類型,:部相關候選資料之相關 Γ二步驟咖,以計算全部的相關特徵類 型對應至母-候❽料㈣ 徵類型BCCD分別於候料料—2、itm3、itm4、itms 201109944 中匕3的特徵片段的個數。另外,此個數在以下的敘述中 稱為相關特徵片段個數。 接著,進行步驟l22e,以根據步驟122所獲得之相關 特徵片·^又的個數,來決定每一相關特徵類型之特徵正評價 特徵負„平鈿。例如’當候選資料itm】和丨恤5被決定為相 關候選資料,且候選資料itm丨和itm5皆只獲得負面評價 時’若候選資料itmi# itm5共包含3個屬於特徵類型bCCd 的特徵片段,則特徵類型BCCD會得到特徵負評價值3。 反之’备候選資料itmi和itm5被決定為相關候選資料,且 候選資料itmi和itm5皆只獲得正面評價時,則特徵類型 BCCD會彳于到特徵正評價值3。在本發明其他實施例中,亦 可考慮相關候選資料所獲得的評價個數。例如,當候選資 料1和itm5被決定為相關候選資料,且候選資料itmi和 itm5皆只獲得負面評價時,若候選資料itmi包含i個屬於 特徵類型BCCD的特徵片段,候選資料itm5包含2個屬於 特徵類型BCCD的特徵片段,且候選資料itmi對應有兩個 負面評價’則特徵類型BCCD會得到特徵負評價值 1*2+2=4 〇 ' 然後,進行步驟122f,以根據預設之正評價閥值和每 一相關特徵類型之特徵正評價,來從相關特徵類型中,決 定至少一正評價特徵類型。例如:當特徵類型BCCE)之特 徵正評價為5,且正評價閥值為4時,由於正評價大於閥 ,,因此特徵類型BCCD可被決定為正評價特徵類型。接 著,進行步驟122g,以減預設之貞評價閥值和每一相關 特徵類型之特徵負評價,來從相關特徵類型中,決定至少 -負評價特徵類型。例如’ #特徵㈣EABC之特徵負評「 13 201109944 價為5 ’且負評價閥值為4時,由於特徵負評價大於閥值, 因此特=類型EABC可被決定為負評價特徵類型。 ,值得注意的是,在本實施例中,被決定為正評價特徵 類型之特徵類型也可能同時被決定為負評價特徵類型。反 =被決定為負評價特徵類型之特徵類型也可能同時被決 定為正評價特徵類型。另外,在本發明之其他實施例中, 亦可根據歷史使用者給予相關候選資料之正評價個數和負 評價個數來決定正評價閥值和負評價閥值。 然後’進行步驟122h ’以根據負評價特徵類型之特徵 負砰彳貝和正評價特徵類型之特徵正評價,來從相關特徵類 型中,決定高度相關特徵類型,其中高度相關特徵類型為 相關特徵類型中屬於正評價類型的相關特徵類型,或是相 關特徵類型中屬於負評價類型的相關特徵類型。 接著,進行步驟122i,以根據每一高度相關特徵類型 之特徵負評價和特徵正評價之差值,來決定每一高度相關 特徵類型之預測評價。例如,當高度相關特徵類型BCCD 之正評價為5時,由於其沒有特徵負評價,因此其預測評 價即為5。又例如’當特徵類型AABC同時被決定為負評 價特徵類型和正評價特徵類型,且其特徵負評價為5、特 徵正評價值為6時,特徵類型AABC之預測評價為1,即 特徵正評價減去特徵負評價。 當全部高度相關類型的總預測評價都被計算獲得後, 即可進行資料喜好度預測步驟124,來決定每一候選資料 之使用者喜好度。 請參照第7圖,其係繪示根據本發明一實施例之資料 喜好度預測步驟124的流程示意圖。在喜好度預測步驟124r 201109944 中,首,進行步驟l24a,以根據候選資料所對應之特徵片 段來從高度相關特徵類型中,決定匹配特徵類型。例如: 當某一候選資料之特徵片段為EACC、BCCA和EACC,且 高度相關特徵類型為BCCA、EACC和BCCD時,此候選 資料之匹配特徵類型即為BCCA和EACC。接著,進行步 驟124b,以根據匹配特徵類型之預測評價和匹配特徵類型 所包含的特徵片段個數來決定候選資料之使用者喜好度。 例如:上述之候選資料的匹配特徵類型為BCCA和EACC, 且EACC有兩個。當EACC之預測評價為5,BCCA之預 測評價為4時’則此候選資料之使用者喜好度為5+5+4=14 值得注意的是,在計算使用者喜好度時並不限於僅將 各匹配特徵類型之預測評價乘上對應的個數。在本發明之 其他實施例t,亦可將每個匹配特徵類型對應至一個權 值’再利用此權值來計算候選資料的喜好度。 請參照第8圖,其係繪示根據本發明之一實施例之狀 態比較步驟122a的流程示意圖。在狀態比較步驟122a中, 首先進行步驟810,以利用相似度演算法來計算欲比較之 歷史使用者環境狀態的每一個歷史使用者狀態值(例如:心 跳數)與目前使用者的狀態值之差異,以得到對應至每一個 狀態類別的狀態差異度。若考慮到每一種狀態類別的重要 性皆不同’可採用具有加權算法的相似度演算法來對不同 的環境狀態定出不同的權值並進行計算。另外’值得注意 的是’本實施例之狀態差異度皆以絕對值來表示,因此狀 態差異度皆為正數。然後,進行步驟820 ’以判斷狀態差 異度的總和是否小於預設之差異度閥值,並提供判斷結 果。當判斷結果為是時,進行步驟830,以將此歷史使用^ 15 201109944 者環境狀態所對應之評分資料決定為相關評分資料。 請參照第9圖,其係繪示根據本發明之一實施例之無 用特徵類型過濾步驟900的流程示意圖。由於特徵擷取步 驟112所獲得之特徵類型可能不具有代表性,因此可於特 徵擷取步驟之後,進行特徵類型過濾步驟9〇〇,以將特徵 類型中無用的特徵類型刪除。在特徵類型過濾步驟900 申,首先進行步驟910,以計算每一特徵類型所對應之特 徵片段個數。然後,進行步驟920,以根據預設之出現次 數閥值來決定無用特徵類型,其中當一特徵類型所對應之 特徵片段個數係大於出現次數閥值,此特徵類型便被決定 為無用特徵類型。接著,進行步驟930,以從特徵類型中, 將無用特徵類型刪除。 值得一提的是,本實施例係以每一特徵類型於全部候 選資料中出現的次數來做為判斷此特徵類型是否為無用特 徵類型,意即根據每一特徵類型之出現頻率來做為判斷的 依據。因此,本實施例採用詞彙頻率和反轉文件頻率(Term Frequency Inverse Document Frequency; TFIDF)演算法來判 斷無用特徵類型。 爲了使線上處理階段的流程能更清楚和完整,以下再 以一實施例來說明線上處理階段。 請同時參照第10圖和第11圖,第10圖係繪示根據本 發明一實施例之候選資料CD1、CD2、CD3、CD4和CD5 之特徵化資料的結構示意圖。第11圖係繪示候選資料 CD卜CD2、CD3、CD4和CD5之特徵片段所包含的特徵 類型。在本實施例中’全部的候選資料CD1、CD2、CD3、 CD4和CD5之特徵化資料包含包含A、B、C、和D四種 201109944 類型之基礎樣本,且切割視窗之長度為4個基礎樣本,移 動距離為2個基礎樣本。如第1〇圖所示,候選資料CD1、 CD2、CD3、CD4、CD5和CD6所對應的特徵類型為CDDA、 DABC、BCCD、CDAB、CACD、EABC 和 CDEA。 請同時參照第12圖和第13圖。第12圖係繪示對候選 資料CD1、CD2、CD3、CD4和CD5進行評分之歷史使用 者的資料列表900。第13圖係繪示目前使用者之資料列表 950。資料列表900包含歷史使用者Alice、Andre、Ben、 Eric和Juice在不同的環境狀態SS下,對候選資料CD1、 CD2、CD3、CD4 和 CD5 的評分以及 Alice、Andre、Ben、
Eric和juice之使用者狀態值(例如:心跳數)。因此每個歷 史使用者環境狀態E卜E2、E3、…和E12皆會對應到一個 評分資料組’而每個評分資料組則包含歷史使用者對每個 候選資料CD卜CD2、CD3、CD4和CD5的評分資料。另 外’目前使用者之資料列表950紀錄了目前使用者David 之狀態值與David對部份候選資料的評分,其中資料列表 9〇〇所包含的環境狀態類別係與環境狀態列表950相同。 在本實施例之線上處理階段中,首先比較每一個歷史 使用者環境狀態與目前使用者環境狀態的相似度,以決定 相關評分資料(步驟122a)。在此,以Alice之環境狀態Ei 與David之環境狀態的比較為例。首先,計算對應至每一 環境狀態類別HB、BT、AT、NV和HY之狀態差值(步肆 810) ’即狀態差異度,如此可得到對應至hb之狀態差異 度為I 79-75 | = 4、BT之狀態差異度為| 35.9-36.7 | = 〇·8、AT之狀態差異度為| 25-25.9 | =0.9、NV之狀態差異 度為| 54-50 | = 4、HY之狀態差異度為| 80-80 | = 〇。然 17 201109944 後,判斷所有狀態差異度的總和是否小於預設之狀態差異 度閥值,以將狀態差異度總和小於狀態差異度閥值之環境 . 狀態所對應之評分資料選為相關評分資料(步驟82〇和 830)。在本實施例中,狀態差異度閥值設為5〇,因此,環 境狀態 El、E5、E6、E7、E8、E9、E10、E12 所對應之評 分資料被選為相關評分資料。 另外,本實施例亦將目前使用者之環境狀態與評分加 入至歷史評分資料中,因此目前使用之評分資料亦為相關 評分資料。 * 接著,根據相關評分資料來決定相關選資料(步驟 122b)。在本實施例中,環境狀態El、E5、E6、E7、E8、 E9、E10、E12以及目前使用者環境狀態所對應之評分資料 係對應至候選資料CD1、CD2、CD4和CD5,因此候選資 料CD卜CD2、CD4和CD5被決定為相關候選資料。然後, 將相關候選資料CD 1、CD2、CD4和CD5所對應的特徵類 型 CDDA、DABC、BCCD、CDAB、EABC 和 EDEA 決定 為相關特徵類型(步驟122c)。接著,相關特徵類型CDDa、 DABC、BCCD、CDAB、EABC和EDEA分別於相關候選 貝料CD卜CD2、CD4和CD5中所包含的特徵片段個數(步 驟122d)。例如’相關特徵類型CDDA於相關 二 CD卜CD2、CD4和CD5中的特徵片段個數分別為y 1和〇 ;相關特徵類型BCCD於相關候選f料咖心、 CD4和CD5 t的特徵片段個數分別為卜卜、 下的敘述中’每倾徵㈣所對應於每侧 :二 應的特徵片段個數將稱為相關特徵片段個數。、’所對 請參照第Η圖’其係㈣正評價特徵_、負評價掩 18 201109944 徵f型和高度相關特徵類型之示意圖。在本實施例中,當 j知每個相關特徵類型之相關特徵片段個數後,便可利用 d相關特徵>}段個數來決定每—相關特徵類型之特徵正 評價和特徵負評價(步驟122e)e值得注意的是,本實施例 亦考慮歷史使用者給予相關候選資料之正評價個數和負評 價個數來決定-相關特徵類型之特徵正評價和特徵負: 價。 、 在決定每一相關特徵類型之特徵正評價和特徵負評價 時首先计算歷史使用者給予相關候選資料之正評價個數 和負評價個數。例如:相關候選資料CD1對應有i個負面 評價和1個正面評價;相關候選資料CD2對應有3個負面 評價:相關候選資料CD4對應有1個負面評價和i個正面 評價;相關候選資料CD5對應有2個正面評價。接著,計 算每一相關特徵類型之特徵正評價和特徵負評價。在本實 施例中’係以下壯式來計算相_徵類型之特徵 FPtype和特徵負評價FNtype : FPtype=(Ntype.CD1*VCD,p)+( Ntyp,CD2*VcD2.p) +( NtypecD4, +( Ntype-CD5*VCD5-P); FNtype=(Ntype.CD1*Vc:D1-N)+( Ntype.CD2*VcD2 N) +( Ntype-CD5*VCD5_N) ; tyPe'CD4 VcD4-n) 其中’Ntype-CD1為相關特徵類型於候選資料中 徵片段數量;Ntype-CD2為相關特徵類型於候選二:= 相關特徵片段數量;Ntype-CD4為相 4 CD2中的 CD4中的相關特徵片段數量;N關^型於候選資料 選資料CD5中的相關特徵片段目關特徵類型於候 料⑽的正面評價個數;v一關:選== 201109944 "=數’v⑽4相關候選#料咖的正面評價個數; 相關候選資料CD5的正面評價個數;v_為㈣ 二、身,CD1的負面評價個數;% n為相關候選資料⑽ /垂面貝個S,VcD4_N為相關候選資'料CD4❾負面評價 個數;veD5.N為相瞧選#料CD5的負面評價個數。β :相特徵類型CDDA為例來解釋:相關特徵 CDDA於相關候選資料⑽、CD2、⑽和cd5中
片&個數分別為卜2、1和〇,由於相關候選資料CD5未 包含有相_徵麵CDDA,且相_選㈣⑽只有負 面評價,因此相關特徵類型CDDA之特徵正評 、
可表示如下: eDDA fpcdda=(ncdda.cd1*Vcdi p)+( Ncdda cD4*VcD4 p); 其中ncdda_cd1為相關特徵類型CDDA於相關候選資料 CD1中的個數;NCDDA_CD4為相關特徵類型CDDA於相關候 選負料CD4中的個數。由上式可得到相關特徵類型 之特徵正评價為1*1 + 1*1=2。類似地,相關特徵類型 之特徵負評價FNcdda可用表示如下: FNcdda=(Ncdda-cdi*Vcdi-n)+(NCDDa-cd2*Vcd2-n)+ (NcDDA-CD4*VCD4-N); 其中NCDDA-CD2為相關特徵類型CDDA於相關候選資料 CD2中的個數。由上式可得到相關特徵類型CDDA之特徵 負評價為 1*1+2*3+1*1=8。 當每一相關特徵類型之特徵正評價和特徵負評價都被 計算求得後’根據正評價閥值和每一相關特徵類型之特徵 正評價,來從相關特徵類型中’決定至少一正評價特徵頬 型(步驟122f)。同時也可根據預設之負評價閥值和每一相 201109944 Μ特,類51之特徵負評價 關特徵類型中,決定至 少-負評價特徵類型(步驟⑽。
實施例中’係根據歷史使用者給予相關候選資料 之個數和負評價個數來決定正評價閥值和負評價閥 ,,因將相關候選資料所對應的正評價個數相加即可 付到正::價閥冑4。將相關候選資料所對應的負評價個數 相加可%•到負評價閥值5。接著,便如第14圖所示,從相 關特徵類型中找出特徵正評價大於或等於正評價閥值4的 特徵類型’並將其決定為正評價特徵類型,以及從相關特 徵類型中找㈣徵貞評價大於或等於 負評價閥值5的特徵 類型’並將其決定為負評價特徵類型。由帛14冑可看出相 關特徵類型EABC為正評價特徵類型,相關特徵類型 CDDA和DABC為負評價特徵類型,而相關特徵類塑bccd 則同時屬於正評價特徵類型和負特徵評價類型。無論是正 貝特徵類型或是負特徵評價類型,其皆經過閥值的測 試’即代表正(負)特徵評價類型在相關候選資料中平均至 少出現過一次。因此,這些正評價特徵類型和負特徵評價 類型可視為高度相關之特徵類型(步驟122h)。然後,決定 每一個高度相關特徵類型之預測評價。在本實施例中,係 將高度相關特徵類型之正特徵正評價和特徵負評價相減’ 來得到其預測評價(步驟122i)。例如’高度相關特徵類型 BCCD之預測評價為4-6)=-2,而高度相關特徵類型CDDA 之預測評價為0-8)=-8 ° 請參照第15圖’其係繪示候選資料CD1之匹配特徵 類型。當決定高度相關特徵類型以後,即可根據候選資料 所對應之特徵片段來從高度相關特徵類型中,決定候選資[.Ξ ] 201109944 料之匹配特徵類型(步驟124a)。例如,候選資料CD1所對 應的特徵類型為CDDA、DABC、BCCD和CDAB,但CDAB ’ 並不屬於高度相關特徵類型,因此候選資料CD1所對應的 匹配特徵類型為CDDA、DABC和BCCD。然後,根據匹 配特徵類型之預測評價和匹配特徵類型所包含的特徵片段 個數來決定候選資料之使用者喜好度(步驟124b)。在本實 施例中,係利用詞彙頻率和反轉文件頻率演算法來計算高 度相關特徵類型之權重,以表達出每個匹配特徵類型的重 要性皆不相同。每個特徵類型之TF1DF值係如第16圖所 鲁 示’因此候選資料CD1之使用者喜好度為 0.0352*(_8)+0.0282*(-5)+0.0222*(-2)=-〇.464。 由以上說明可知本實施例之音樂推薦方法可預測每個 候選資料的使用者喜好度’因此當候選資料的評分數量不 夠多時’本實施例之音樂推薦方法仍可正確地推薦資料給 使用者。再者,本實施例之音樂推薦方法考慮了使用者的 狀態,因此在推薦的正確性上可較其他推薦技術更高。 另外根據本發明之其他實施例,本發明實施例之音樂 響推薦方法為-種電腦程式產品,儲存於一健存裝置中,例 如:光碟片。當電腦讀取此光碟片後,此電腦便可執行本 發明實施例之音樂推薦方法。 雖然本發明已以實施例揭露如上,然其並非用以限$ 本發明,任何熟習此技藝者,在不簡本㈣之精神和棄 :内’當可:各:之更動與潤飾,因此本發明之保 當視後附之申請專利範圍所界定者為準。 22 201109944 【圖式簡單說明】 為讓本發明之上述和其他目的、特徵、和優點能更明 顯易懂,上文特舉一較佳實施例,並配合所附圖式,作詳 細說明如下: 第1圖,其係繪示根據本發明之一實施例之音樂推薦 方法的流程示意圖。 第2圖係繪示根據本發明之一實施例之特徵擷取步驟 的流程不意圖。 第3a圖和第3b圖係繪示第2圖中步驟112a至步驟 112f的示意圖。 第4圖係繪示第2圖中步驟112g至步驟112h的示意 圖。 第5圖係繪示根據本發明一實施例之資料列表的結構 不意圖。 第6圖係繪示根據本發明一實施例之喜好類型探勘步 驟的流程示意圖。 第7圖係繪示根據本發明一實施例之資料喜好度預測 步驟的流程示意圖。 第8圖係繪示根據本發明之一實施例之狀態比較步驟 的流程示意圖。 第9圖係繪示根據本發明之一實施例之無用特徵類型 過遽步驟的流程示意圖。 第10圖係繪示根據本發明一實施例之候選資料之特 徵化資料的結構示意圖。 第11圖係繪示候選資料之特徵片段所包含的特徵類 型。 r 23 201109944 第12圖係繪示對候選資料進行評分之歷史使用者的 資料列表。 第13圖係繪示目前使用者之資料列表。 第14圖係繪示正評價特徵類型、負評價特徵類型和高 度相關特徵類型之示意圖。 第15圖係繪示候選資料之匹配特徵類型。 第16圖係繪示每個特徵類型所對應之TFIDF值。 【主要元件符號說明】
110 :離線處理階段 112a〜112h :步驟 122 :喜好類型探勘步驟 124 :資料喜好度預測步驟 130 :候選資料庫 150 :評分資料庫 170 :推薦資料清單 220 :子資料 240 .基礎樣本 400 :資料列表 810〜830 :步驟 CD1〜CD5 :候選資料 112 :特徵擷取步驟 120 :線上處理階段 122a〜122i :步驟 124a〜124b :步驟 140 :特徵化資料庫 160 :使用者環境狀態 210 :候選資料 230 :子資料序列 310 :候選資料 800 :特徵類型過濾步驟 900〜930 :步驟 E1〜E12 :環境狀態 24

Claims (1)

  1. 201109944 七、申請專利範園: 1. 一種音樂推薦方法,包含: 獲得複數個候選資料與每一該些候選資料之複數個評 分資料,其中每一該些評分資料係對應至一歷史使用者環 境狀態,該歷史使用者環境狀態包含至少一歷史使用者狀 態值,該些歷史使用者狀態值分別屬於複數個環境狀態類 別; 獲得一使用者之一使用者環境狀態,其中該使用者環 φ 境狀態包含至少一使用者狀態值,該些使用者狀態值分別 屬於該些環境狀態類別; 進行一離線處理階段,以將該些候選資料一對一轉換 為複數個特徵化資料,其中每一該些特徵化資料包含複數 個特徵片段,該些特徵化資料之全部的特徵片段分別屬於 複數個特徵類型,該離線處理階段包含: 根據一預設單位時間來將每一該些候選資料依序 切割為複數個子資料; _ 利用一特徵擷取演算法來擷取每一該些候選資料 之每一該些子資料之至少一特徵參數; 根據每一該些候選資料之每一該些子資料之該至 少一特徵參數,利用—第一分群演算法來將全部子資 料分為複數個子資料群組,其中該些子資料群組係一 對一對應至複數個參數類型; 根據每-該些候選資料之每一該些子資料所對應 之該子:貝料群組來決定每一該些候選資料之每一該些 子資料所對應之該參數類型; 根攄一預設數量來將每一該些候選資料之該些子「 25 201109944 資料依序分為複數個子資料序列; 利用一序列相似度演算法來比較全部子資料序列 之相似度,並獲得每一該些候選資料之每一該些子資 料序列之一序列相似度值; 根據每一該些候選資料之每一該些子資料之該些 子資料序列之該些序列相似度值,利用一第二分群 演算法來將全部子資料序列分為複數個序列群組, 其中該些序列群組係一對一對應至複數個序列類 型; 提供一預設切割視窗與該預設切割視窗之一預設 移動距離,其中該預設切割視窗具有一視窗長度,該 切割視窗之該視窗長度和該預設移動距離為該預設單 位時間之長度的倍數;以及 利用該切割視窗來於每一該些候選資料之該些子 資料序列上依序移動該預設移動距離,以從該些候選 資料之全部子資料序列中取出該些特徵片段; 進行一線上處理階段,以根據該些特徵類型來決定每 一該些候選資料之一使用者喜好度,其中該線上處理階段 包含: 進行一狀態比較步驟,以利用一預設差異度閥值 來比較該使用者環境狀態與每一該些評分資料所對應 之該歷史使用者環境狀態的相似度,而從該些評分資 料中決定複數筆相關評分資料; 根據該些相關評分資料,來從該些候選資料中決 定複數個相關候選資料,其中該些相關候選資料係一 對一對應至該些相關評分資料; r 26 201109944 根據該些相關候選資料來從該些特徵類型中決定 複數個相關特徵類型,其中該些相關特徵類型係對應 至該些特徵片段之複數個相關特徵片段,而該些相關 特徵片段係構成該些相關候選資料; 計算每一該些相關特徵類型於每一該些相關候選 資料中所包含的特徵片段的個數,以獲得每一該些相 關特徵類型之複數個相關特徵片段個數; 根據每一該些相關特徵類型之該些相關特徵片段 個數,來決定每一該些相關特徵類型之一特徵正評價 和一特徵負評價; 根據一正評價閥值和每一該些相關特徵類型之該 特徵正評價,來從該些相關特徵類型中,決定至少一 正評價特徵類型; 根據一負評價閥值和每一該些相關特徵類型之該 特徵負評價,來從該些相關特徵類型中,決定至少一 負評價特徵類型; 根據該至少一正評價類型和該至少一負評價類 型,來從該些相關特徵類型中,決定至少一高度相關 特徵類型,其中該至少一高度相關特徵類型為該些相 關特徵類型中屬於該正評價類型之至少一者,或為該 些相關特徵類型中屬於該負評價類型之至少一者; 根據每一該些高度相關特徵類型之該特徵負評價 和該特徵正評價之一評價差值,來決定每一該至少一 高度相關特徵類型之一預測評價;以及 根據該些候選資料之該些特徵片段和每一該至少 一高度相關特徵類型之該預測評價,來決定每一該些. 27 201109944 候選資料之該使用者喜好度。 2. 如申請專利範圍第1項所述之音樂推薦方法,更 包含: 根據該些相關評分資料來計算每一該些相關候選資料 所對應之一正評價個數和一負評價個數;以及 將該些相關候選資料之該些正評價個數加總,以得到 該正評價閥值。 3. 如申請專利範圍第1項所述之音樂推薦方法,更 包含: 根據該些相關評分資料來計算每一該些相關候選資料 所對應之一負評價個數;以及 將該些相關候選資料之該些負評價個數加總,以得到 該負評價閥值。 4. 如申請專利範圍第1項所述之音樂推薦方法,其 中決定每一該些候選資料之該使用者喜好度之步驟包含: 根據該候選資料所對應之該些特徵片段,來從該至少 一高度相關特徵類型中,決定至少一匹配特徵類型,其中 該至少一匹配特徵類型包含該候選資料所對應之該些特徵 片段之至少一者;以及 根據每一該至少一匹配特徵類型之該預測評價和每一 該至少一匹配特徵類型所包含的特徵片段個數來決定該候 選資料之該使用者喜好度。 28 201109944 包含:5.如申請專利第w所述之音樂推薦方法,更 計算每一特徵類型所對應之一特徵片段個數. 根據-出現次數閥值來決定該些特徵類之 無用特徵類型,中每一咳黾少一 |田枯微 u ^ 、甲母°哀至夕無用特徵片段所對應之 u特徵片段個數係大於該出現次數閥值;以及 從該些特徵類型中,將該至少一無用特徵類型刪除。 6. 如申凊專利範圍第1項所述之音樂推薦方法,其 中該特徵擷取演算法為改良型離散餘弦轉換演算法 (Modified discrete cosine transform; MDCT)。 7. 如申請專利範圍第1項所述之音樂推薦方法,其 中該第一分群演算法為密度分群法(Density-Based Spatial Clustering of Applications with Noise; DBSCAN)、K 中數分 群法(K-mean clustering)、多代表點分群法(CURE)或平衡式 反覆化簡和分群法(BIRCH)。 8. 如申請專利範圍第1項所述之音樂推薦方法,其 中該第二分群演算法為密度分群法(Density-Based Spatial Clustering of Applications with Noise; DBSCAN)、K 中數叢 聚法(K-mean clustering)、多代表點分群法(CURE)或平衡式 反覆化簡和分群法(BIRCH)。 9. 如申請專利範圍第1項所述之音樂推薦方法’其 中該序列相似度演算法為基因序列比對演算法° [ 29 201109944 10·如申請專利範圍第1項所述之音樂推薦方法,其 中,該些候選資料之格式為MPEG-1 Layer ΙΠ(ΜΡ3)格式, 而該些子資料之格式為脈衝編碼調變(Pulse_c〇de modulation,PCM)格式。 U.如申請專利範圍第1項所述之音樂推薦方法,其 中該狀態比較步驟包含: 利用一相似度演算法來計算該歷史使用者環境狀態之 母"亥些歷史使用者狀態值與相應之該使用者狀態值之差 值,以得到複數個狀態差異度,其中該錄態差異度係一 對一對應至該些差異度閥值; 判斷該些狀態差異度之和是否小於該差異度閥值,以 提供一判斷結果;以及 當該判斷結果為是時,決定該歷史使用者環境狀態所 對應之該評分資料為該相關評分資料。 12.如申請專利範圍第丨項所述之音樂推薦方法,更 包含將該使时對該㈣選詩之複數铺增評分加入至 該些評分資料中。 _ ㈣腦程式產品,經由—電腦載人該程式並 打後,該電腦可進行如巾料鋪項所述之音 薦方法。 、
TW98130262A 2009-09-08 2009-09-08 音樂推薦方法與其程式產品 TWI410811B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
TW98130262A TWI410811B (zh) 2009-09-08 2009-09-08 音樂推薦方法與其程式產品

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
TW98130262A TWI410811B (zh) 2009-09-08 2009-09-08 音樂推薦方法與其程式產品

Publications (2)

Publication Number Publication Date
TW201109944A true TW201109944A (en) 2011-03-16
TWI410811B TWI410811B (zh) 2013-10-01

Family

ID=44836119

Family Applications (1)

Application Number Title Priority Date Filing Date
TW98130262A TWI410811B (zh) 2009-09-08 2009-09-08 音樂推薦方法與其程式產品

Country Status (1)

Country Link
TW (1) TWI410811B (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI499290B (zh) * 2012-11-30 2015-09-01 Ind Tech Res Inst 資訊推薦方法及系統
TWI584139B (zh) * 2016-09-09 2017-05-21 Speech recognition system and its information processing method applied to non - real - time signal source
TWI613606B (zh) * 2016-12-16 2018-02-01 財團法人工業技術研究院 使用者喜好之預測方法
TWI614703B (zh) * 2012-03-27 2018-02-11 Alibaba Group Services Ltd 資訊推薦方法及資訊推薦裝置
TWI703515B (zh) * 2018-07-18 2020-09-01 香港商阿里巴巴集團服務有限公司 訓練改編水準評價模型、評價改編水準的方法及裝置

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104991900A (zh) * 2015-06-09 2015-10-21 腾讯科技(深圳)有限公司 一种音乐数据推送方法及装置

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7081579B2 (en) * 2002-10-03 2006-07-25 Polyphonic Human Media Interface, S.L. Method and system for music recommendation
TW200606681A (en) * 2004-08-13 2006-02-16 Parasoft Corp Music recommendation system and method

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI614703B (zh) * 2012-03-27 2018-02-11 Alibaba Group Services Ltd 資訊推薦方法及資訊推薦裝置
TWI499290B (zh) * 2012-11-30 2015-09-01 Ind Tech Res Inst 資訊推薦方法及系統
TWI584139B (zh) * 2016-09-09 2017-05-21 Speech recognition system and its information processing method applied to non - real - time signal source
TWI613606B (zh) * 2016-12-16 2018-02-01 財團法人工業技術研究院 使用者喜好之預測方法
TWI703515B (zh) * 2018-07-18 2020-09-01 香港商阿里巴巴集團服務有限公司 訓練改編水準評價模型、評價改編水準的方法及裝置
US11074897B2 (en) 2018-07-18 2021-07-27 Advanced New Technologies Co., Ltd. Method and apparatus for training adaptation quality evaluation model, and method and apparatus for evaluating adaptation quality
US11367424B2 (en) 2018-07-18 2022-06-21 Advanced New Technologies Co., Ltd. Method and apparatus for training adaptation quality evaluation model, and method and apparatus for evaluating adaptation quality

Also Published As

Publication number Publication date
TWI410811B (zh) 2013-10-01

Similar Documents

Publication Publication Date Title
JP4678546B2 (ja) 推薦装置および方法、プログラム、並びに記録媒体
US8463717B2 (en) Method and apparatus for predicting preference rating for content, and method and apparatus for selecting sample content
WO2017096877A1 (zh) 一种推荐方法和装置
Bogdanov et al. How much metadata do we need in music recommendation?: A subjective evaluation using preference sets
US20060217828A1 (en) Music searching system and method
US8543529B2 (en) Content selection based on consumer interactions
TW201109944A (en) Music recommendation method and program product thereof
US20090089265A1 (en) Information processing apparatus, information processing method, and program
US8611676B2 (en) Information processing apparatus, feature extraction method, recording media, and program
JP2010061601A (ja) 推薦装置および方法、プログラム、並びに記録媒体
EP2976727A1 (en) Cross media recommendation
JP5553232B2 (ja) 楽曲再生システム
US20080195661A1 (en) Digital media recognition using metadata
TW201104466A (en) Digital data processing method for personalized information retrieval and computer readable storage medium and information retrieval system thereof
JP2007058842A (ja) 情報処理装置、特徴抽出方法、記録媒体、および、プログラム
JP2011145742A (ja) 情報処理装置、情報処理方法、およびプログラム
JP5481295B2 (ja) オブジェクト推薦装置、オブジェクト推薦方法、オブジェクト推薦プログラムおよびオブジェクト推薦システム
Chou et al. Evaluating music recommendation in a real-world setting: On data splitting and evaluation metrics
KR101102823B1 (ko) 무드에 따른 상황추론 사례기반 음악추천시스템 및 그 방법
JP2013033376A (ja) 情報処理装置、情報処理方法、および、プログラム
JP5013161B2 (ja) 情報処理装置および情報処理方法、提供装置および提供方法、並びにプログラム
JP4594701B2 (ja) 情報検索装置、情報検索方法及び情報検索用プログラム並びに情報記録媒体
JP2007115222A (ja) 情報処理装置および方法、並びにプログラム
Bogdanov et al. Taking advantage of editorial metadata to recommend music
Girsang et al. Song recommendation system using collaborative filtering methods

Legal Events

Date Code Title Description
MM4A Annulment or lapse of patent due to non-payment of fees