TWI556123B - News tracking and recommendation method - Google Patents

News tracking and recommendation method Download PDF

Info

Publication number
TWI556123B
TWI556123B TW104125641A TW104125641A TWI556123B TW I556123 B TWI556123 B TW I556123B TW 104125641 A TW104125641 A TW 104125641A TW 104125641 A TW104125641 A TW 104125641A TW I556123 B TWI556123 B TW I556123B
Authority
TW
Taiwan
Prior art keywords
user
news
article
similarity
articles
Prior art date
Application number
TW104125641A
Other languages
English (en)
Other versions
TW201706880A (zh
Inventor
zhao-rong Zheng
Jing-Yan Chen
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed filed Critical
Priority to TW104125641A priority Critical patent/TWI556123B/zh
Application granted granted Critical
Publication of TWI556123B publication Critical patent/TWI556123B/zh
Publication of TW201706880A publication Critical patent/TW201706880A/zh

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

新聞追蹤及推薦方法
本發明是有關於一種新聞推薦方法,特別是指一種社群網路環境中個人化的新聞追蹤及推薦方法。
隨著資訊與網路的發展,近年來大多數人都是藉由網路新聞來關心新聞事件,或是藉由社群網站來分享、發表其對於新聞事件的看法。現今有許多新聞業者皆藉由其所建立的新聞網站,如蘋果日報、民視即時新聞、中央社即時新聞、東森新聞雲及華視新聞網等來提供網路新聞,在數量繁多的網路新聞中,使用者往往需要花費大量的時間來搜尋其所關心的新聞事件。實有必要尋求一新聞追蹤及推薦方法以減少使用者搜尋及追蹤新聞所耗費的時間。
現有的新聞推薦方法大多是藉由一處理單元根據多個關鍵字來搜尋當天的焦點新聞,並將搜尋到的焦點新聞提供給使用者,以作為至少一推薦新聞。還有一種推薦方法為藉由該處理單元根據網路新聞文章中正面評價的數量,獲得一熱門新聞文章,並將所獲得的熱門新聞文章提供給使用者,以作為至少一推薦新聞。然 而,上述新聞推薦方法皆未考量使用者的新聞偏好傾向而無法提供使用者個人化的新聞推薦。
因此,本發明之目的,即在提供一種可提供個人化推薦的新聞追蹤及推薦方法。
於是,本新聞追蹤及推薦方法,藉由一與多個新聞伺服端及一社群伺服端經由一網路而連接的使用端來實施,該新聞追蹤及推薦方法包含下列步驟:(A)自每一對應於一新聞網站之新聞伺服端,獲得對應的多篇相關於一第一時間區間的第一新聞文章;(B)根據多篇對應於一先前於該第一時間區間之第二時間區間,且分別屬於多個不同歷史事件的第二新聞文章,將每一第一新聞文章標記為該等歷史事件及一新事件之其中一者;(C)自對應於一第一使用者U 1及多個相關於該第一使用者U 1之第二使用者U 2之該社群伺服端,獲得一相關於該第一使用者U 1及該等第二使用者U 2的使用者資料;(D)根據該使用者資料,獲得該第一使用者U 1相對於每一第二使用者針對該等歷史事件及該新事件N的一瀏覽相似度S i ; (E)根據每一瀏覽相似度S i ,選取每一第二使用者中其瀏覽相似度S i 大於一瀏覽門檻值之第二使用者;(F)根據該使用者資料,獲得每一第二使用者相對於該等歷史事件及該新事件之每一者N k 的一評價值及該第一使用者U 1相對於該等歷史事件及該新事件之每一者N k 的一評價值;及(G)根據步驟(F)所獲得之該等評價值E 1E 2及該第一使用者U 1相對於每一第二使用者的該瀏覽相似度S j ,擷取該等歷史事件及該新事件N的至少一者,以作為對應於該第一使用者U 1的至少一推薦事件。
本發明之功效在於,藉由該使用端自每一新聞伺服端獲得對應的該等第一新聞文章,並將每一第一新聞文章標記為該等歷史事件及該新事件之其中一者,且藉由該使用端自該社群伺服端獲得該使用者資料,並根據該使用者資料獲得該等瀏覽相似度S及該等評價值E 1E 2,進而根據該等評價值E 1E 2及該等瀏覽相似度S擷取該推薦事件,以推薦給該第一使用者U 1。其中,該推薦事件中包含多篇彼此相關連的新聞文章,可便於使用者追蹤新聞。
1‧‧‧使用端
2‧‧‧新聞伺服端
3‧‧‧社群伺服端
4‧‧‧網路
51~59‧‧‧步驟
521~526‧‧‧子步驟
541~548‧‧‧子步驟
本發明之其他的特徵及功效,將於參照圖式的實施方式中清楚地呈現,其中: 圖1是一方塊圖,說明實施本發明新聞追蹤及推薦方法之一使用端經由一網路與多個新聞伺服端及一社群伺服端連接;圖2是一流程圖,說明本發明新聞追蹤及推薦方法之實施例;圖3是一流程圖,說明該使用端如何將每一第一新聞文章標記為多個歷史事件及一新事件之其中一者;及圖4是一流程圖,說明該使用端如何獲得一第一使用者相對於每一第二使用者針對該等歷史事件及該新事件的一瀏覽相似度。
參閱圖1與圖2,本發明新聞追蹤及推薦方法之實施例藉由一與多個新聞伺服端2及一社群伺服端3經由一網路4而連接的使用端1來實施。在本實施例中,該新聞追蹤及推薦方法係用以推薦語言類別為中文的新聞文章。
該等新聞伺服端2分別提供多個不同新聞網站,如蘋果日報、民視即時新聞、中央社即時新聞、東森新聞雲及華視新聞網等,且儲存有多篇新聞文章。每一新聞網站上包含多個相關於該等新聞文章的新聞網頁。
該社群伺服端3,如臉書(Facebook)或推特(Twitter)等對應於一第一使用者U 1及多個相關於該第一使用者U 1之第二使 用者U 2,且儲存有相關於該第一使用者U 1及該等第二使用者U 2的使用者資料。
該使用端1,如個人電腦、筆記型電腦、平板電腦或智慧型手機等安裝有一包含多個指令之軟體應用程式以實施本發明之新聞追蹤及推薦方法之實施例。
參閱圖1與圖2,本發明之新聞追蹤及推薦方法之實施例包含下列步驟。
在步驟51中,該使用端1利用一網路爬蟲(Web Crawler)技術,自每一對應於一新聞網站之新聞伺服端2,獲得對應的多篇相關於一第一時間區間的第一新聞文章。
值得特別說明的是,由於每一新聞網站的搜尋引擎最佳化(Search Engine Optimization,簡稱SEO)規則都不盡相同,尤其每一新聞網站所對應的一新聞標題標籤(Tag)、新聞內容標籤等的標籤都不相同,如表1所示,蘋果日報的新聞標題標籤為h1標籤,而民視即時新聞的新聞標題標籤則是span標籤,所以針對不同網站的SEO規則,該使用端1利用不同的網路爬蟲規則獲得來自於每一新聞網站的該等第一新聞文章。
在步驟52中,該使用端1根據多篇對應於一先前於該第一時間區間之第二時間區間,且分別屬於多個不同歷史事件的第二新聞文章,將每一第一新聞文章標記為該等歷史事件及一新事件之其中一者。
值得一提的是,每一新聞伺服端2所儲存的該等新聞文章包含對應的該等第一新聞文章。該使用端1還自該等新聞伺服端2獲得對應之相關於該第二時間區間的該等第二新聞文章。每一新聞伺服端2所儲存的該等新聞文章還包含對應的該等第二新聞文章。在本實施例中,該第二時間區間之長度例如為1週,該第一時間區間之長度例如為1天。該使用端1係於該第二時間區間內自每一新聞伺服端2獲得對應之該等第二新聞文章。
值得一提的是,該使用端1係藉由執行以下子步驟521~526(見圖3),以將每一第一新聞文章標記為該等歷史事件及該新事件之其中一者。
在子步驟521中,該使用端1根據一斷詞方法將每一第一新聞文章分割為對應的多個第一字詞,並將每一第二新聞文章分割為對應的多個第二字詞。在本實施例中,該斷詞方法為一相關於中文知識資訊處理(Chinese Knowledge Information Processing,簡稱CKIP)的斷詞方法。
在子步驟522中,該使用端1根據每一第一新聞文章對應的該等第一字詞及每一第二新聞文章對應的該等第二字詞,利用一詞頻反向文件頻率(Term Frequency-Inverse Document Frequency,簡稱TF-IDF)方法,獲得該第一新聞文章對應的多個第一關鍵字及該第二新聞文章對應的多個第二關鍵字。
在子步驟523中,該使用端1根據每一第一新聞文章對應的該等第一關鍵字及每一第二新聞文章對應的該等第二關鍵字,計算同一第一新聞文章相對於每一第二新聞文章的一類型相似度。在本實施例中,該使用端1係利用一餘弦相似度公式來計算該類型相似度。
在子步驟524中,該使用端1根據每一第一新聞文章所對應的該等類型相似度,判定該第一新聞文章所對應的該等類型相似度之其中一者是否大於一類型門檻值。當判定結果為是時,進行子步驟525,否則,進行子步驟526。
在子步驟525中,該使用端1根據該第一新聞文章對應的該等類型相似度,將該第一新聞文章標記為類型相似度最高之第二新聞文章所屬的歷史事件。
在子步驟526中,該使用端1將該第一新聞文章標記為該新事件。
在步驟53中,該使用端1自對應於一第一使用者U 1及多個相關於該第一使用者U 1之第二使用者U 2之該社群伺服端3,獲得一相關於該第一使用者U 1及該等第二使用者U 2的使用者資料。
在步驟54中,該使用端1根據該使用者資料,獲得該第一使用者U 1相對於每一第二使用者針對該等歷史事件及該新事件N的一瀏覽相似度S i ,令該等第二使用者U 2之數目為I,1 i I
值得一提的是,該使用端1係藉由執行以下子步驟541~548(見圖4),以獲得該第一使用者U 1相對於每一第二使用者針對該等歷史事件及該新事件N的一瀏覽相似度S i
在子步驟541中,該使用端1根據該使用者資料,獲得相關於該第一使用者U 1及該等第二使用者U 2之至少一者的多篇使用者文章。
在子步驟542中,該使用端1根據一斷詞方法將每一使用者文章分割為對應的多個使用者字詞。在本實施例中,該斷詞方法亦為相關於中文知識資訊處理的該斷詞方法。
在子步驟543中,該使用端1根據每一使用者文章對應的該等使用者字詞,利用該詞頻反向文件頻率方法,獲得該使用者文章對應的多個使用者關鍵字。
在子步驟544中,該使用端1根據每一使用者文章對應的該等使用者關鍵字、每一第一新聞文章對應的該等第一關鍵字及每一第二新聞文章對應的該等第二關鍵字,計算同一使用者文章相對於該等第一新聞文章及該等第二新聞文章之每一者的一文章相似度。
在子步驟545中,該使用端1根據每一使用者文章所對應之該等文章相似度,判定該使用者文章所對應的該等文章相似度之其中一者是否大於一使用門檻值。當判定結果為是時,則進行子步驟546,否則,進行子步驟547。
值得一提的是,該使用者資料中所包含的該等使用者文章可與不同主題,如食記、遊記或新聞等相關。然而,該使用端1在獲得該第一使用者U 1相對於每一第二使用者的該瀏覽相似度S i 時,該使用端1僅須根據與該等歷史事件或該新事件N相關的使用者文章來獲得,不須根據與該等歷史事件或該新事件N無關(如與食記或遊記相關)的使用者文章來獲得。因此,該使用端1計算出每一使用者文章相對於該等第一新聞文章及該等第二新聞文章之每一者的該文章相似度,並判定所計算出的每一使用者文章所對應 之該等文章相似度之其中一者是否大於該使用門檻值,由於該等第一新聞文章及該等第二新聞文章皆屬於與該等歷史事件或該新事件N相關的文章,故當每一使用者文章所對應的該等文章相似度之其中一者大於該使用門檻值時,該使用端1判定該使用者文章係與該等歷史事件及該新事件N相關。
在子步驟546中,該使用端1根據該使用者文章所對應的該等文章相似度,將該使用者文章標記為該等歷史事件及該新事件N之其中一者,以獲得該第一使用者U 1及該等第二使用者U 2相對於該等歷史事件及該新事件N之一對映關係表。在本實施例中,該使用端1係根據該使用者文章所對應的該等文章相似度,將該使用者文章標記為文章相似度最高之該第一及第二新聞文章之其中一者所屬的新事件及歷史事件之其中一者。
舉例來說,若與新聞相關的該等使用者文章A共有7篇,該等第二使用者U 2共有6人,該等歷史事件及該新事件N共有8件,且該等使用者文章A與該等歷史事件及該新事件N之關係為:A1被標記為N1、A2被標記為N2、A3被標記為N3、A4被標記為N4、A5被標記為N5、A6被標記為N6、A7被標記為N7,沒有任何使用者文章被標記為N8,且該等使用者文章A與該第一使用者U 1及該等第二使用者U 2之關係如下表2所示,當第一及第二使用者U 1U 2對應於使用者文章A之值為1即代表第一及第二使用者U 1U 2與使用者 文章A相關,當第一及第二使用者U 1U 2對應於使用者文章A之值為0即代表第一及第二使用者U 1U 2與使用者文章A無關,則該對映關係表即如下表3所示,當第一及第二使用者U 1U 2對應於事件N之值為1即代表第一及第二使用者U 1U 2與事件N相關,當第一及第二使用者U 1U 2對應於事件N之值為0即代表第一及第二使用者U 1U 2與事件N無關。
在子步驟547中,該使用端1判定該使用者文章與該等歷史事件或該新事件N無關。
在子步驟548中,該使用端1根據該對映關係表利用一餘弦相似度公式來獲得該第一使用者U 1相對於每一第二使用者針對該等歷史事件及該新事件N的一瀏覽相似度S i
在步驟55中,該使用端1根據每一瀏覽相似度S i ,選取每一第二使用者中其瀏覽相似度S i 大於一瀏覽門檻值例如0.1之第二使用者,令被選取出之第二使用者U 2之數目為J,1 j JJ I
在步驟56中,該使用端1根據該使用者資料,獲得每一第二使用者相對於該等歷史事件及該新事件之每一者N k 的一評價值及該第一使用者U 1相對於該等歷史事件及該新事件之每一者N k 的一評價值,令該等歷史事件及該新事件之數目為K,K 3,1 k K
在本實施例中,每一評價值係藉由包含於該使用者資料中,且相關於該第一使用者U 1針對該等使用者文章之每一者A t 之瀏覽行為的一瀏覽紀錄,例如瀏覽日期及瀏覽頻率並配合以下公式(1)而獲得,每一評價值係藉由包含於該使用者資料中,且相關於每一第二使用者針對該等使用者文章之每一者A t 之瀏覽行為的一瀏覽紀錄,例如瀏覽日期及瀏覽頻率並配合以下公式(2)而獲得。以表3的例子來說,若該第一使用者U 1瀏覽該等使用者文章之其中一者A1的瀏覽日期與目前日期之差為1天且瀏覽頻率為6,且該使用者文章A1被分類為N1,則該第一使用者U 1相對於該事件N1的評價值即為,若該第一使用者U 1無瀏覽該等使用者文章之其中一者A2,故R值及F值皆為0,且該使用者文章A2被分類為N2,則該第一使用者U 1相對於該事件N2的評價值即為0。
R代表對應於不同瀏覽日期的不同分數值,當瀏覽日期與目前日期之差為0~3天時,分數值R為4;當瀏覽日期與目前日期之差為4天時,分數值R為3.2;當瀏覽日期與目前日期之差為5天時,分數值R為2.4;當瀏覽日期與目前日期之差為6天時,分數值R為1.2;當瀏覽日期與目前日期之差為7天以上時,分數值R為0。F代表瀏覽頻率,瀏覽頻率F為目前日期至前6天之瀏覽次數與7之 比值。在本實施例中,對應於不同瀏覽日期的不同分數值R,及瀏覽頻率對應於的取樣次數與取樣時間亦可視需求變動,並不限於本實施例所揭示之數值。
在步驟57中,該使用端1根據步驟56所獲得之該等評價值E 1E 2,及該第一使用者U 1相對於每一第二使用者的該瀏覽相似度S j ,擷取該等歷史事件及該新事件N的至少一者,以作為對應於該第一使用者U 1的至少一推薦事件。在本實施例中,該使用端1係利用一協同過濾演算法來擷取。
值得特別說明的是,該協同過濾演算法係藉由以下公式(3)計算出該等歷史事件及該新事件N之每一者的一推薦值pref(U 1,N k ),並根據所計算出的該等推薦值pref(U 1,N)及該等評價值E 1擷取與該第一使用者U 1無關且推薦值例如為前兩高的該等歷史事件及該新事件N之至少一者,以作為該推薦事件,所述的前兩高僅是舉例,在本發明之其他實施例中亦可取推薦值最高或前三高的該等歷史事件及該新事件N之至少一者,以作為該推薦事件,並不以此為限。
舉例來說,若每一第二使用者,1 i II=6中其瀏覽相似度S i 大於該瀏覽門檻值例如0.1之第二使用者,1 j JJ=2分別為,且該第一使用者U 1相對於該第二使用者的該瀏覽相似度S 1為0.8,該第一使用者U 1相對於該第二使用者的該瀏覽相似度S 1為1,且該第一使用者U 1N 1N 3N 4N 5相關,且該第二使用者相對於該等歷史事件及該新事件之每一者N k ,1 k KK=8的一評價值,該第二使用者相對於該等歷史事件及該新事件之每一者N k 的一評價值,則事件N 1之推薦值pref(U 1,N 1)即為,以此類推,N 2之推薦值pref(U 1,N 2)為3,N 3之推薦值pref(U 1,N 3)為2.44,N 4之推薦值pref(U 1,N 4)為2.77,N 5之推薦值pref(U 1,N 5)為1.33,N 6之推薦值pref(U 1,N 6)為1.66,N 7之推薦值pref(U 1,N 7)為0.88,N 8之推薦值pref(U 1,N 8)為0,故與該第一使用者U 1無關且推薦值例如為前兩高的事件即為N 2N 6
在步驟58中,該使用端1根據包含於該推薦事件中的第一新聞文章與第二新聞文章之每一者所對應的一相關於多個留言者的留言資料,及一包含多個相關於負面評價的負面詞彙的詞彙資料,獲得每一留言資料所包含之多個留言字詞中符合該等負面詞彙的一數目。
在本實施例中,該使用端1係先利用相關於中文知識資訊處理的該斷詞方法,將該推薦事件中的第一新聞文章與第二新聞文章之每一者所對應的該留言資料分割為對應的該等留言字詞,再獲得每一留言資料所包含之該等留言字詞中符合該等負面詞彙的該數目。
在步驟59中,該使用端1根據每一留言資料所對應的該數目,獲得該推薦事件中的第一新聞文章與第二新聞文章之每一者所對應的一排序,其中,對應有最小數目的第一新聞文章與第二新聞文章之其中一者享有該排序的第一順位,對應有最大數目的第一新聞文章與第二新聞文章之其中一者享有該排序的最後順位。該使用端1係根據該排序呈現該推薦事件中的第一新聞文章與第二新聞文章之呈現順序。
值得特別說明的是,每一留言資料所包含之該等留言字詞中符合該等負面詞彙的該數目可作為一指示出該留言資料所對應的第一新聞文章或第二新聞文章之可信度的參考,當該數目越大時,即代表其所對應之第一新聞文章或第二新聞文章的可信度越低;當該數目越小時,即代表其所對應之第一新聞文章或第二新聞文章的可信度越高。
綜上所述,藉由該使用端1自每一新聞伺服端2獲得對應的該等第一新聞文章,並將每一第一新聞文章標記為該等歷史事 件及該新事件之其中一者,且藉由該使用端1自該社群伺服端3獲得該使用者資料,並根據該使用者資料獲得該等瀏覽相似度S及該等評價值E 1E 2,進而根據該等評價值E 1E 2及該等瀏覽相似度S擷取該推薦事件,以推薦給該第一使用者U 1,藉由本發明新聞追蹤及推薦方法所推薦之推薦事件為個人化的推薦,可有效減少該第一使用者搜尋新聞所耗費的時間,此外,藉由本發明新聞追蹤及推薦方法所推薦之新聞並非單一篇新聞文章而是該推薦事件,該推薦事件中可包含多篇彼此相關連的新聞文章,藉此,該第一使用者可一次獲得所有相關的新聞文章,進而提升使用者追蹤新聞的便利性,故確實能達成本發明之目的。
惟以上所述者,僅為本發明之實施例而已,當不能以此限定本發明實施之範圍,凡是依本發明申請專利範圍及專利說明書內容所作之簡單的等效變化與修飾,皆仍屬本發明專利涵蓋之範圍內。
51~59‧‧‧步驟

Claims (6)

  1. 一種新聞追蹤及推薦方法,藉由一與多個新聞伺服端及一社群伺服端經由一網路而連接的使用端來實施,該新聞追蹤及推薦方法包含下列步驟:(A)自每一對應於一新聞網站之新聞伺服端,獲得對應的多篇相關於一第一時間區間的第一新聞文章;(B)根據多篇對應於一先前於該第一時間區間之第二時間區間,且分別屬於多個不同歷史事件的第二新聞文章,將每一第一新聞文章標記為該等歷史事件及一新事件之其中一者,步驟(B)包括下列子步驟:(B-1)根據一斷詞方法將每一第一新聞文章分割為對應的多個第一字詞,並將每一第二新聞文章分割為對應的多個第二字詞,(B-2)根據每一第一新聞文章對應的該等第一字詞及每一第二新聞文章對應的該等第二字詞,利用一詞頻反向文件頻率方法,獲得該第一新聞文章對應的多個第一關鍵字及該第二新聞文章對應的多個第二關鍵字,(B-3)根據每一第一新聞文章對應的該等第一關鍵字及每一第二新聞文章對應的該等第二關鍵字,利用一餘弦相似度公式來計算同一第一新聞文章相對於每一第二新聞文章的一類型相似度,及 (B-4)根據每一第一新聞文章對應的該等類型相似度,將該第一新聞文章標記為類型相似度最高之第二新聞文章所屬的歷史事件及該新事件之其中一者;(C)自對應於一第一使用者U 1及多個相關於該第一使用者U 1之第二使用者U 2之該社群伺服端,獲得一相關於該第一使用者U 1及該等第二使用者U 2的使用者資料;(D)根據該使用者資料,獲得該第一使用者U 1相對於每一第二使用者針對該等歷史事件及該新事件N的一瀏覽相似度S i ,步驟(D)包括下列子步驟:(D-1)根據該使用者資料,獲得相關於該第一使用者U 1及該等第二使用者U 2之至少一者的多篇使用者文章,(D-2)根據該斷詞方法將每一使用者文章分割為對應的多個使用者字詞,(D-3)根據每一使用者文章對應的該等使用者字詞,利用該詞頻反向文件頻率方法,獲得該使用者文章對應的多個使用者關鍵字,(D-4)根據每一使用者文章對應的該等使用者關鍵字、每一第一新聞文章對應的該等第一關鍵字及每一第二新聞文章對應的該等第二關鍵字,計算同一使用者文章相對於該等第一新聞文章及該等第二新聞文章之每一者的一文章相似度, (D-5)根據每一使用者文章所對應之該等文章相似度,判定該使用者文章所對應的該等文章相似度之其中一者是否大於一使用門檻值,(D-6)當該使用者文章所對應的該等文章相似度之其中一者大於該使用門檻值時,根據該使用者文章所對應的該等文章相似度將該使用者文章標記為該等歷史事件及該新事件N之其中一者,以獲得該第一使用者U 1及該等第二使用者U 2相對於該等歷史事件及該新事件N之一對映關係表,及(D-7)根據該對映關係表利用該餘弦相似度公式來獲得該第一使用者U 1相對於每一第二使用者針對該等歷史事件及該新事件N的該瀏覽相似度S i ;(E)根據每一瀏覽相似度S i ,選取每一第二使用者中其瀏覽相似度S i 大於一瀏覽門檻值之第二使用者;(F)根據該使用者資料,獲得每一第二使用者相對於該等歷史事件及該新事件之每一者N k 的一評價值及該第一使用者U 1相對於該等歷史事件及該新事件之每一者N k 的一評價值;及(G)根據步驟(F)所獲得之該等評價值E 1E 2及該第一使用者U 1相對於每一第二使用者的該瀏覽相似度S j ,擷取該等歷史事件及該新事件N的至少一者,以作為對應於該第一使用者U 1的至少一推薦事件。
  2. 如請求項1所述的新聞追蹤及推薦方法,其中,在步驟(A)中,該等第一新聞文章係利用一網路爬蟲技術來獲得。
  3. 如請求項1所述的新聞追蹤及推薦方法,其中,在步驟(B-1)中,每一第一新聞文章及每一第二新聞文章所屬之語言皆為中文,且該斷詞方法為一相關於中文知識資訊處理的斷詞方法。
  4. 如請求項1所述的新聞追蹤及推薦方法,其中,在步驟(F)中,每一評價值係藉由包含於該使用者資料中,且相關於該第一使用者U 1針對該等使用者文章之每一者之瀏覽行為的一瀏覽紀錄而獲得,每一評價值係藉由包含於該使用者資料中,且相關於每一第二使用者針對該等使用者文章之每一者之瀏覽行為的一瀏覽紀錄而獲得。
  5. 如請求項1所述的新聞追蹤及推薦方法,其中,在步驟(G)中,該推薦事件係藉由一協同過濾演算法來擷取。
  6. 如請求項1所述的新聞追蹤及推薦方法,在步驟(G)之後,還包含以下步驟:(H)根據包含於該推薦事件中的第一新聞文章與第二新聞文章之每一者所對應的一相關於多個留言者的留言資料,及一包含多個相關於負面評價的負面詞彙的詞彙資料,獲得每一留言資料所包含之多個留言字詞中符合該等負面詞彙的一數目;及(I)根據每一留言資料所對應的該數目,獲得該推薦事件中的第一新聞文章與第二新聞文章之每一者所對應的一排序,其中,對應有最小數目的第一新聞文章與第二新聞文章之其中一者享有該排序的第一順位,對應有最大數 目的第一新聞文章與第二新聞文章之其中一者享有該排序的最後順位。
TW104125641A 2015-08-06 2015-08-06 News tracking and recommendation method TWI556123B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
TW104125641A TWI556123B (zh) 2015-08-06 2015-08-06 News tracking and recommendation method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
TW104125641A TWI556123B (zh) 2015-08-06 2015-08-06 News tracking and recommendation method

Publications (2)

Publication Number Publication Date
TWI556123B true TWI556123B (zh) 2016-11-01
TW201706880A TW201706880A (zh) 2017-02-16

Family

ID=57851442

Family Applications (1)

Application Number Title Priority Date Filing Date
TW104125641A TWI556123B (zh) 2015-08-06 2015-08-06 News tracking and recommendation method

Country Status (1)

Country Link
TW (1) TWI556123B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI660279B (zh) * 2017-09-06 2019-05-21 品原顧問有限公司 網路文章推薦方法及應用其的系統
TWI687823B (zh) * 2018-01-08 2020-03-11 香港商阿里巴巴集團服務有限公司 內容推薦方法及裝置
CN112613296A (zh) * 2020-12-07 2021-04-06 深圳价值在线信息科技股份有限公司 新闻的重要程度获取方法、装置、终端设备及存储介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102890692A (zh) * 2011-07-22 2013-01-23 阿里巴巴集团控股有限公司 一种网页信息抽取方法及抽取系统
TW201507411A (zh) * 2013-08-12 2015-02-16 Esobi Inc 一種分散式採集、混搭與發佈新聞之方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102890692A (zh) * 2011-07-22 2013-01-23 阿里巴巴集团控股有限公司 一种网页信息抽取方法及抽取系统
TW201507411A (zh) * 2013-08-12 2015-02-16 Esobi Inc 一種分散式採集、混搭與發佈新聞之方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
阮一峰,TF-IDF與餘弦相似性的應用(二):找出相似文章,2013年3月21日,http://www.ruanyifeng.com/blog/2013/03/cosine_similarity.html *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI660279B (zh) * 2017-09-06 2019-05-21 品原顧問有限公司 網路文章推薦方法及應用其的系統
TWI687823B (zh) * 2018-01-08 2020-03-11 香港商阿里巴巴集團服務有限公司 內容推薦方法及裝置
CN112613296A (zh) * 2020-12-07 2021-04-06 深圳价值在线信息科技股份有限公司 新闻的重要程度获取方法、装置、终端设备及存储介质

Also Published As

Publication number Publication date
TW201706880A (zh) 2017-02-16

Similar Documents

Publication Publication Date Title
US11347752B2 (en) Personalized user feed based on monitored activities
US20190266257A1 (en) Vector similarity search in an embedded space
TWI636416B (zh) 內容個人化之多相排序方法和系統
US8495058B2 (en) Filtering social search results
US20240220554A1 (en) Enhanced search to generate a feed based on a user's interests
US20180246899A1 (en) Generate an index for enhanced search based on user interests
WO2016000555A1 (zh) 基于社交网络的内容、新闻推荐方法和系统
US20190325062A1 (en) Web crawling intake processing enhancements
US11080287B2 (en) Methods, systems and techniques for ranking blended content retrieved from multiple disparate content sources
CN104866554B (zh) 一种基于社会化标注的个性化搜索方法及系统
US20200294071A1 (en) Determining user intents related to websites based on site search user behavior
US9864768B2 (en) Surfacing actions from social data
US11232522B2 (en) Methods, systems and techniques for blending online content from multiple disparate content sources including a personal content source or a semi-personal content source
US20140229487A1 (en) System and method for user preference augmentation through social network inner-circle knowledge discovery
US10127322B2 (en) Efficient retrieval of fresh internet content
US20160299951A1 (en) Processing a search query and retrieving targeted records from a networked database system
US20160012130A1 (en) Aiding composition of themed articles about popular and novel topics and offering users a navigable experience of associated content
Chen et al. Tag recommendation by machine learning with textual and social features
WO2018013400A1 (en) Contextual based image search results
TWI556123B (zh) News tracking and recommendation method
US8498979B1 (en) System and method for semantic analysis of social network user activities
US20140229488A1 (en) Apparatus, Method, and Computer Program Product For Ranking Data Objects
JP2017068547A (ja) 情報提供装置、プログラム及び情報提供方法
US9824149B2 (en) Opportunistically solving search use cases
JP6422544B1 (ja) 情報処理装置、情報処理方法および情報処理プログラム

Legal Events

Date Code Title Description
MM4A Annulment or lapse of patent due to non-payment of fees