TWI784913B - 一種頻道節目熱點偵測系統、方法及其電腦可讀媒介 - Google Patents
一種頻道節目熱點偵測系統、方法及其電腦可讀媒介 Download PDFInfo
- Publication number
- TWI784913B TWI784913B TW111119497A TW111119497A TWI784913B TW I784913 B TWI784913 B TW I784913B TW 111119497 A TW111119497 A TW 111119497A TW 111119497 A TW111119497 A TW 111119497A TW I784913 B TWI784913 B TW I784913B
- Authority
- TW
- Taiwan
- Prior art keywords
- plural
- time intervals
- keywords
- program
- adjacent
- Prior art date
Links
Images
Landscapes
- Time-Division Multiplex Systems (AREA)
- Mobile Radio Communication Systems (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
Abstract
本發明係提供一種頻道節目熱點偵測系統、方法及其電腦可讀媒介,係包括複數使用端裝置及影音服務裝置,其中,該複數使用端裝置依據複數用戶於對話平台上的文字產生及傳送複數訊息內容,而該影音服務裝置接收該複數訊息內容後,萃取出複數關鍵字。再者,該影音服務裝置計算出於複數第一時間區間中之複數關鍵字之分數以進行關鍵字變異性分析,俾形成複數第二時間區間,藉此從複數第二時間區間偵測出熱點關鍵字及其相對應之熱門片段。是以,本發明能大幅降低人工作業所花費的人事及時間成本,且快速地提供熱點關鍵字及其熱門片段給用戶搜尋及點閱,以提升用戶的觀看體驗。
Description
本發明關於一種熱點偵測技術,尤其指一種頻道節目熱點偵測系統、方法及其電腦可讀媒介。
在觀賞運動賽事或頒獎典禮這類播出時間較長的節目時,針對回看的用戶,有時用戶可能不想完整收看,只想找尋精彩的片段來觀賞。甚至,有些用戶可能是事後看到新聞報導或其他消息來源,想透過回看影片,快速找到本次節目中某些被熱烈討論的特定片段來觀看。
再者,在觀賞上述這類較具話題性的直播節目時,許多用戶也喜歡開啟論壇或聊天室,看看其他人對節目內容的回應,或是與其他觀賞者一同討論節目內容。
然而,以往的節目聊天室與節目本身時間並無關聯,導致節目播出結束後,當用戶在瀏覽節目聊天室內容發現有興趣的議題時,還要額外自行去找尋有興趣的討論話題在影片的哪一個時間點,才能觀看。甚至,用戶也沒辦法快速查找到特定影片段落。
因此,如何提供一種頻道節目熱點偵測技術,能自動提供用戶熱點關鍵字及其熱門片段,使用戶能更快的享受到節目的精彩畫面,遂成為業界亟待解決的課題。
為解決前述習知的技術問題或提供相關之功效,本發明提供一種頻道節目熱點偵測系統,係包括:複數使用端裝置,係分別提供複數用戶觀看一頻道節目,且供該複數用戶於一對話平台上留言,以將該複數用戶於觀看該頻道節目後所產生之留言內容形成複數訊息內容;以及一影音服務裝置,係包括:一傳輸模組,係通訊連接該複數使用端裝置,以接收該複數訊息內容,且將該複數訊息內容儲存於一資料庫中;及一熱點分析模組,係通訊連接該資料庫,以取得該複數訊息內容,由該熱點分析模組將該頻道節目之播放時長切分為複數第一時間區間後,將該複數訊息內容中之留言內容匹配於相對應之該複數第一時間區間中,再由該熱點分析模組利用一斷詞模型將該複數第一時間區間中之留言內容進行斷詞,以分別萃取出該複數第一時間區間中之複數關鍵字,且進行關鍵字變異性分析,俾將相似及相鄰的複數第一時間區間進行合併而形成複數第二時間區間,其中,由該熱點分析模組依據該複數第二時間區間中之複數關鍵字之分數以取得至少一熱點關鍵字,再依據該至少一熱點關鍵字取得其相對應之第二時間區間,以將該第二時間區間作為至少一熱門片段。
本發明復提供一種頻道節目熱點偵測方法,係包括:由複數使用端裝置分別提供複數用戶觀看一頻道節目,且供該複數用戶於一對話平台上留言,以將該複數用戶於觀看該頻道節目後所產生之留言內容形成複數訊息內容;
由一影音服務裝置接收及儲存來自該複數使用端裝置之該複數訊息內容;由該影音服務裝置將該頻道節目之播放時長切分為複數第一時間區間,且將該複數訊息內容中之留言內容匹配於相對應之該複數第一時間區間中;由該影音服務裝置利用一斷詞模型將該複數第一時間區間中之留言內容進行斷詞,以分別萃取出該複數第一時間區間中之複數關鍵字,且進行關鍵字變異性分析,俾將相似及相鄰的複數第一時間區間進行合併而形成複數第二時間區間;以及由該影音服務裝置依據該複數第二時間區間中之複數關鍵字之分數取得至少一熱點關鍵字,再由該影音服務裝置依據該至少一熱點關鍵字取得其相對應之第二時間區間,以將該第二時間區間作為至少一熱門片段。
於一實施例中,該熱點分析模組計算於該複數第一時間區間中之複數關鍵字之分數,以依據該複數關鍵字之分數進行關鍵字變異性分析,再由該熱點分析模組利用該複數關鍵字之分數判斷相鄰的該複數第一時間區間是否為相似,將相鄰及相似的該複數第一時間區間中之至少兩者進行合併,以形成該複數第二時間區間。
於一實施例中,該熱點分析模組利用詞頻演算法計算出於該複數第一時間區間中之複數關鍵字之分數,以於該熱點分析模組比較出相鄰的該複數第一時間區間中之最高分數的關鍵字係為相同時,將相鄰的該複數第一時間區間進行合併,以形成該複數第二時間區間。
於一實施例中,該熱點分析模組利用主題模型計算出於該複數第一時間區間中之複數關鍵字的分佈機率以作為其分數,再利用分佈差異度量方法依據相鄰的該複數第一時間區間中之分數,計算出相鄰的該複數第一時間區間之間的分布差異值,且於相鄰的該複數第一時間區間之間的分布差異值小於
一差異門檻值時,將相鄰的該複數第一時間區間進行合併,以形成該複數第二時間區間。
於一實施例中,該影音服務裝置更包括一斷詞訓練模組,係提供設定該頻道節目之複數節目目標詞,且依據該複數節目目標詞檢索複數衍生目標詞,再利用該複數節目目標詞及該複數衍生目標詞建立出一節目目標詞集,以由該斷詞訓練模組依據該節目目標詞集對該斷詞模型進行深度學習訓練,俾令經訓練之該斷詞模型萃取出該複數訊息內容中之留言內容的該複數關鍵字。
本發明又提供一種電腦可讀媒介,應用於具有處理器及/或記憶體的電腦或計算裝置中,該電腦或該計算裝置透過處理器及/或記憶體執行一目標程式及電腦可讀媒介,並用於執行電腦可讀媒介時執行如上所述之頻道節目熱點偵測方法。
由上述可知,本發明之頻道節目熱點偵測系統、方法及其電腦可讀媒介,主要透過經訓練之斷詞模型從複數用戶之留言內容準確地萃取出複數關鍵字,且計算出於複數第一時間區間中之複數關鍵字之分數進行關鍵字變異性分析,以依據複數關鍵字之分數將相似及相鄰的複數第一時間區間進行合併,俾形成複數第二時間區間,藉此從複數第二時間區間偵測出熱點關鍵字及其相對應之熱門片段,故本發明能大幅降低人工作業所花費的人事及時間成本,且快速地提供熱點關鍵字及其熱門片段給用戶搜尋及點閱,以提升用戶的觀看體驗。
1:頻道節目熱點偵測系統
10:使用端裝置
20:影音服務裝置
21:斷詞訓練模組
22:傳輸模組
23:資料庫
24:熱點分析模組
8:使用者介面
81:播放畫面
82:對話平台
t 1~t n :第一時間區間
k 1~k n :關鍵字
T 1~T n :第二時間區間
S31至S34、S51至S56:步驟
圖1係為本發明之頻道節目熱點偵測系統架構示意圖。
圖2係為本發明之使用者介面之示意圖。
圖3係為本發明之斷詞模型訓練流程示意圖。
圖4-1係為本發明之複數第一時間區間之示意圖。
圖4-2係為本發明之複數第一時間區間合併為複數第二時間區間之示意圖。
圖5係為本發明之節目熱點偵測方法之流程示意圖。
以下藉由特定的具體實施例說明本發明之實施方式,熟悉此技藝之人士可由本說明書所揭示之內容輕易地瞭解本發明之其他優點及功效。
須知,本說明書所附圖式所繪示之結構、比例、大小等,均僅用以配合說明書所揭示之內容,以供熟悉此技藝之人士之瞭解與閱讀,並非用以限定本發明可實施之限定條件,故不具技術上之實質意義,任何結構之修飾、比例關係之改變或大小之調整,在不影響本發明所能產生之功效及所能達成之目的下,均應仍落在本發明所揭示之技術內容得能涵蓋之範圍內。同時,本說明書中所引用之如「一」、「第一」、「第二」、「上」及「下」等之用語,亦僅為便於敘述之明瞭,而非用以限定本發明可實施之範圍,其相對關係之改變或調整,在無實質變更技術內容下,當視為本發明可實施之範疇。
圖1係為本發明之頻道節目熱點偵測系統1架構示意圖,包括:複數使用端裝置10及一影音服務裝置20,其中,影音服務裝置20包括一斷詞訓練模組21、一傳輸模組22、一資料庫23及一熱點分析模組24。
具體而言,複數使用端裝置10皆可為具有機上盒之電視、智慧型電視、智慧型手機、平板電腦、個人電腦或其他電子裝置等,但不限於上述。再
者,影音服務裝置20係指提供一OTT影音服務(Over-the-top media services)之服務提供設備,且影音服務裝置20建立於伺服器(如通用型伺服器、檔案型伺服器、儲存單元型伺服器等)及電腦等具有適當演算機制之電子設備中,其中,複數使用端裝置10與影音服務裝置20中之各個模組均可為軟體、硬體或韌體;若為硬體,則可為具有資料處理與運算能力之處理單元、處理器、電腦或伺服器;若為軟體或韌體,則可包括處理單元、處理器、電腦或伺服器可執行之指令,且可安裝於同一硬體裝置或分布於不同的複數硬體裝置。另一方面,複數使用端裝置10藉由機上盒或是網路通訊連接影音服務裝置20。
所述之複數使用端裝置10,係提供一具有播放畫面81及對話平台(如聊天室或通話軟體等)82之使用者介面8給複數用戶(如圖2所示),使複數用戶於播放畫面81觀看一頻道節目,且供複數用戶於對話平台82上留言,以產生複數訊息內容,俾由複數使用端裝置10將複數用戶之複數訊息內容分別傳送至影音服務裝置20,其中,複數訊息內容皆包括但不限於節目ID(或稱節目識別碼)、用戶ID(或稱用戶識別碼)、留言內容及留言時間等,且留言時間係定義為複數使用端裝置10擷取留言內容發送當下,所對應之節目播放時間。此外,於此亦不限播放畫面81及對話平台82於使用者介面8上之佈局方式。
所述之斷詞訓練模組21,係利用深度學習方式訓練一斷詞模型,以使斷詞模型依據不同的頻道節目提供相對應之複數關鍵字,如圖3所示,其訓練步驟包含步驟S31至步驟S34:
於步驟S31中,斷詞訓練模組21提供一維運人員設定一頻道節目之複數節目目標詞。
於步驟S32中,斷詞訓練模組21依據複數節目目標詞檢索複數衍生目標詞。於另一實施例中,斷詞訓練模組21亦可供維運人員自行設定複數衍生目標詞。
於步驟S33中,斷詞訓練模組21依據複數節目目標詞及複數衍生目標詞建立一節目目標詞集。
於步驟S34中,斷詞訓練模組21依據節目目標詞集對斷詞模型進行深度學習訓練,其中,斷詞模型係可由支援自定義辭典的任一斷詞模型工具所建立之,例如:Jieba、CkipTagger、GKIPtagger等。
舉例而言,以羽球比賽直播節目來說,維運人員透過斷詞訓練模組21設定複數節目目標詞,例如:複數節目目標詞包含羽球比賽直播節目會出現的人名(如:戴資穎)、羽球比賽直播節目相關詞彙(羽球相關專業術語)等。再者,斷詞訓練模組21連結外部網頁(如https://pttpedia.fandom.com/zh/wiki/PTT棒球員綽號列表#.E4.B8.AD.E8.81.B7、https://pttpedia.fandom.com/zh/wiki/PTT運動員綽號列表),以利用爬蟲技術自動依據複數目標詞自動檢索複數衍生目標詞,例如:複數衍生目標詞包含人名綽號(如:小戴)、鄉民用語等,藉此斷詞訓練模組21依據複數節目目標詞(如:戴資穎、羽球相關專業術語等)及複數衍生目標詞(如小戴等)建立節目目標詞集。
之後,斷詞訓練模組21依據節目目標詞集訓練斷詞模型,以使斷詞模型能從用戶在對話平台82的留言內容中明確地萃取出複數關鍵字。
所述之傳輸模組22及資料庫23,傳輸模組22分別通訊連接複數使用端裝置10以接收來自複數使用端裝置10之複數訊息內容,且資料庫23儲存複數訊息內容。舉例而言,複數訊息內容如下表1所示。
所述之熱點分析模組24,係從資料庫23中取得複數訊息內容,其中,熱點分析模組24將頻道節目之播放時長切分為複數第一時間區間,且將複數訊息內容中之留言內容依據其留言時間匹配於相對應之複數第一時間區間中,再利用斷詞模型將複數第一時間區間中之留言內容進行斷詞,以分別萃取出複數第一時間區間中之複數關鍵字。具言之,熱點分析模組24透過經斷詞訓練模組21所訓練後的斷詞模型從複數訊息內容中之留言內容分別萃取出複數訊息內容中之複數關鍵字。例如:一用戶之留言內容為「戴資穎跌倒」,斷詞訓練模組21利用訓練後的斷詞模型將「戴資穎跌倒」切分為「戴資穎」及「跌倒」之關鍵字。
再者,由熱點分析模組24計算於複數第一時間區間中之複數關鍵字之分數,以依據複數關鍵字之分數進行關鍵字變異性分析,俾依據該複數關鍵字之分數判斷相鄰的該複數第一時間區間是否為相似,再將相鄰及相似的該複數第一時間區間中之至少兩者進行合併,以形成該複數第二時間區間。須說明之,若複數第一時間區間中之至少一者在進行關鍵字變異性分析時無法與其他第一時間區間合併,則當完成關鍵字變異性分析後(亦即完成時間區間合併後),未被合併的複數第一時間區間中之至少一者亦被定義為第二時間區間。
在一實施例中,熱點分析模組24利用詞頻演算法(如TF-IDF演算法)計算出於複數第一時間區間中之複數關鍵字之分數,藉此進行關鍵字變異性分析,由熱點分析模組24比較相鄰的複數第一時間區間中之最高分數的關鍵字,當相鄰的複數第一時間區間中之最高分數的關鍵字係為相同時,將相鄰的複數第一時間區間進行合併,以形成第二時間區間。
舉例而言,熱點分析模組24依據複數第一時間區間,將分別複數第一時間區間中之留言內容組成相對應之文件。詳言之,如表1所示,若第一時間區間以每1分鐘為基準進行切割,則會形成文件t1[戴資穎跌倒了,希望沒受傷]、文件t2[跌倒了,小戴]等複數文件。再者,熱點分析模組24將複數文件(如文件t1及文件t2)透過斷詞模型進行斷詞,以得到複數文件中之複數關鍵字,例如:文件t1[戴資穎,跌倒,了,希望,沒,受傷]及文件t2[跌倒,了,小戴]。
之後,熱點分析模組24利用詞頻演算法(如TF-IDF)計算出複數關鍵字對於其文件的重要程度,分數越高越表示重要,例如:文件t1[戴資穎:0.5,跌倒:0.8,了:0.1,沒:0.3受傷:0.7,小戴:0.1]及文件t2[戴資穎:0.1,跌倒:0.9,了:0.1,沒:0.0,受傷:0.0,小戴:0.6],其中,文件t1最高分數的關鍵字(跌倒:0.8)與文件t2最高分數的關鍵字(跌倒:0.8)係為相同,故熱點分析模組24將文件t1及文件t2所位於之第一時間區間進行合併,以形成第二時間區間。
在一實施例中,熱點分析模組24利用主題模型(如隱含狄利克雷分布,英文:Latent Dirichlet allocation,簡稱:LDA)計算出於複數第一時間區間中之複數關鍵字的分佈機率以作為其分數,再利用分佈差異度量方法(如KL散度)依據相鄰的兩個第一時間區間中之分數,以計算出相鄰的兩個第一時間區間之間的分布差異值,藉此進行關鍵字變異性分析,當相鄰的兩個第一時間區間之間的
分布差異值小於一差異門檻值時,由熱點分析模組24將相鄰的兩個第一時間區間進行合併,以形成第二時間區間。於另一實施例中,熱點分析模組24逐一計算出所有兩兩相鄰的第一時間區間之間的分布差異值,若分布差異值小於差異門檻值,則將兩兩相鄰的第一時間區間進行合併,直到所有相鄰的第一時間區間之間分布差異值都超過差異門檻值時,結束時間區間的合併。
舉例而言,如上述實施例所述,熱點分析模組24形成複數文件(如文件t1[戴資穎跌倒了,希望沒受傷]、文件t2[跌倒了,小戴]),且透過斷詞模型進行斷詞,以得到複數文件中之複數關鍵字,例如:文件t1[戴資穎,跌倒,了,希望,沒,受傷]及文件t2[跌倒,了,小戴]。
之後,熱點分析模組24利用主題模型演算法從複數文件(如文件t1、文件t2及其他文件)之複數關鍵字中分析出複數主題(即關鍵字的機率分佈),再將複數文件以主題的機率分佈表示,例如:從複數文件(包含文件t1及文件t2)之複數關鍵字中分析出「跌倒」、「小戴(或戴資穎)」及「受傷」之三個主題,其中,文件t1中「跌倒」之機率為0.8、「小戴(或戴資穎)」之機率為0.2及「受傷」之機率為0.0,而文件t2中「跌倒」之機率為0.7、「小戴(或戴資穎)」之機率為0.2及「受傷」之機率為0.1,再由熱點分析模組24利用分佈差異度量方法計算出文件t1及文件t2的相似度(即分佈差異度量值),當文件t1及文件t2之分佈差異度量值小於一門檻值時,表示文件t1及文件t2之主題相似,故熱點分析模組24將文件t1及文件t2所位於之第一時間區間進行合併,以形成第二時間區間。另一方面,門檻值可依據需求設定其大小,於此不限門檻值之數值。
圖4-1及圖4-2係為本發明之複數第一時間區間及其合併為複數第二時間區間之示意圖,且一併參閱圖1說明之。
如圖4-1所示,熱點分析模組24將一頻道節目之播放時長切分為複數第一時間區間t 1~t n ,且複數第一時間區間t 1~t n 分別具有相對應之複數關鍵字,例如:第一時間區間t 1具有關鍵字k 1 ,k 2,而第一時間區間t 2具有關鍵字k 3 ,k 4 ,k 5、第一時間區間t 3具有關鍵字k 3 ,k 5。再者,如圖4-2所示,由熱點分析模組24計算於複數第一時間區間t 1~t n 中之複數關鍵字k 1~k n 之分數,其中,當熱點分析模組24利用詞頻演算法計算出複數第一時間區間t 1~t n 中之複數關鍵字k 1~k n 之分數時,比較出第一時間區間t 2及第一時間區間t 3中相鄰的至少兩者中之最高分數的關鍵字(如關鍵字k 3)係為相同,並將第一時間區間t 2及第一時間區間t 3合併形成第二時間區間T 2;或是,當熱點分析模組24利用主題模型計算出於複數第一時間區間t 1~t n 中之複數關鍵字k 1~k n 的分佈機率以作為其分數,且利用分佈差異度量方法比對出第一時間區間t 2的分數及第一時間區間t 3的分數之間的分布差異值小於一差異門檻值時,將第一時間區間t 2及第一時間區間t 3合併形成第二時間區間T 2。
在一實施例中,熱點分析模組24依據複數第二時間區間中之複數關鍵字之分數以取得至少一熱點關鍵字及其至少一熱門片段。舉理而言,熱點分析模組24將複數第二時間區間中之複數關鍵字之分數比對一熱點門檻值,若複數關鍵字中之至少一者之分數大於熱點門檻值時,該複數關鍵字中之至少一者係作為一熱點關鍵字,藉此熱點分析模組24偵測出該複數關鍵字中的熱點關鍵字,以及由熱點分析模組24將熱點關鍵字相對應之第二時間區間係作為一熱門片段,再將熱點關鍵字及熱門片段儲存於資料庫23中。另一方面,熱點門檻值可依據需求設定其大小,於此不限熱點門檻值之數值。
換言之,當複數關鍵字之至少一者的分數大於熱點門檻值時,代表複數關鍵字(或主題)之至少一者具有區別性可被偵測為熱點,故可將其相對應之第二時間區間作為熱門片段。此外,熱點分析模組24也能設定取固定個數之熱門片段,具言之,熱點分析模組24分別取得複數第二時間區間中各自最高分數之關鍵字,以將複數第二時間區間依據其各自最高分數之關鍵字進行排序後,且從最高分數之第二時間區間開始挑選出固定個數之第二時間區間以作為熱門片段,例如:挑出前5個最高分數之第二時間區間作為熱門片段。
於另一實施例中,影音服務裝置20將熱點關鍵字及熱門片段透過傳輸模組22傳送至複數使用端裝置10,以顯示於複數使用端裝置10之使用者介面8上,供複數用戶點擊收看熱門片段。於又一實施例中,複數使用端裝置10供複數用戶於使用者介面8上搜尋關鍵字,以將複數用戶所搜尋之關鍵字傳送至影音服務裝置20,再由影音服務裝置20依據所搜尋之關鍵字從資料庫23中取得相對應之熱點關鍵字及其熱門片段,以透過傳輸模組22將熱點關鍵字及其熱門片段顯示於複數使用端裝置10之使用者介面8上,以提供給複數用戶。
圖5係為本發明之節目熱點偵測方法之流程示意圖,且一併參閱圖1說明之,其中,該方法流程包含下列步驟S51至步驟S56:
於步驟S51中,複數使用端裝置10提供一具有播放畫面81及對話平台82之使用者介面8給複數用戶,使複數用戶觀看一頻道節目時可於對話平台82上留言,以產生複數訊息內容,俾由複數使用端裝置10將複數用戶之複數訊息內容分別傳送至影音服務裝置20。
於步驟S52中,影音服務裝置20中之傳輸模組22接收來自複數使用端裝置10之複數訊息內容,且影音服務裝置20中之資料庫23儲存複數訊息內容。
於步驟S53中,影音服務裝置20中之熱點分析模組24將頻道節目之播放時長切分為複數第一時間區間,且將複數訊息內容中之留言內容依據其留言時間匹配於相對應之複數第一時間區間中。
於步驟S54中,熱點分析模組24利用一斷詞模型將複數第一時間區間中之留言內容進行斷詞,以分別萃取出複數第一時間區間中之複數關鍵字。
於步驟S55中,熱點分析模組24計算於複數第一時間區間中之複數關鍵字之分數,以依據複數關鍵字之分數進行關鍵字變異性分析,俾依據複數關鍵字之分數將複數關鍵字相似且相鄰的複數第一時間區間進行合併後,形成複數第二時間區間。
於步驟S56中,熱點分析模組24利用複數第二時間區間中之複數關鍵字之分數,以從複數第二時間區間中之複數關鍵字中偵測出至少一熱點關鍵字,且再依據至少一熱點關鍵字得到相對應之第二時間區間,並作為至少一熱門片段。
此外,本發明還揭示一種電腦可讀媒介,係應用於具有處理器(例如,CPU、GPU等)及/或記憶體的計算裝置或電腦中,且儲存有指令,並可利用此計算裝置或電腦透過處理器及/或記憶體執行此電腦可讀媒介,以於執行此電腦可讀媒介時執行上述之方法及各步驟。
綜上所述,本發明之頻道節目熱點偵測系統、方法及其電腦可讀媒介,藉由經訓練後的斷詞模型從複數用戶之留言內容準確地萃取出複數關鍵
字,且計算出於複數第一時間區間中之複數關鍵字之分數進行關鍵字變異性分析,以依據複數關鍵字之分數將相似及相鄰的複數第一時間區間進行合併,俾形成複數第二時間區間,藉此從複數第二時間區間偵測出熱點關鍵字及其相對應之熱門片段,故相較於現有技術僅能透過人工方式剪輯節目以提供熱門片段,本發明能大幅降低人工作業所花費的人事及時間成本,且快速地提供熱點關鍵字及其熱門片段給用戶搜尋及點閱,以提升用戶的觀看體驗。
此外,本發明之頻道節目熱點偵測系統、方法及其電腦可讀媒介,係具備下列優點或技術功效:
一、本發明藉由複數用戶之留言內容自動的偵測出頻道節目影片中的熱點關鍵字及其熱門片段,以提供用戶回看服務,使用戶可以直接透過搜尋熱點關鍵字快速查找到感興趣的熱門片段,而無須用戶自行在影片中尋找感興趣的熱門片段。
二、本發明藉由複數用戶之留言內容偵自動的偵測出頻道節目影片中的熱點關鍵字及其熱門片段,也大幅節省人工標注熱點或精彩片段的維運成本,以及提升建立熱點關鍵字及其熱門片段效率。
三、本發明特點在於藉由建立自定義辭典(即節目目標詞集)之方式,如系統可讓維護人員手動輸入或/及系統自動檢索相關詞彙以建立專屬的節目目標詞集,進而利用節目目標詞集訓練斷詞模型。藉此,透過預先訓練過之斷詞模型能從複數用戶之留言內容準確地萃取出有意義的複數關鍵字,以避免習知技術在對留言內容進行斷詞時造成關鍵字切分錯誤(例如:「戴資穎」切分成「戴」、「資」及「穎」),而無法作為關鍵字,並提升熱點關鍵字及其熱門片段之建立的精準度。
上述實施形態僅例示性說明本發明之原理及其功效,而非用於限制本發明。任何熟習此項技藝之人士均可在不違背本發明之精神及範疇下,對上述實施形態進行修飾與改變。因此,本發明之權利保護範圍應如申請專利範圍所列。
1:頻道節目熱點偵測系統
10:使用端裝置
20:影音服務裝置
21:斷詞訓練模組
22:傳輸模組
23:資料庫
24:熱點分析模組
Claims (9)
- 一種頻道節目熱點偵測系統,係包括:複數使用端裝置,係分別提供複數用戶觀看一頻道節目,且供該複數用戶於一對話平台上留言,以將該複數用戶於觀看該頻道節目後所產生之留言內容形成複數訊息內容;以及一影音服務裝置,係包括:一斷詞訓練模組,係提供設定該頻道節目之複數節目目標詞,且依據該複數節目目標詞檢索出複數衍生目標詞,再利用該複數節目目標詞及該複數衍生目標詞建立出一節目目標詞集,以由該斷詞訓練模組依據該節目目標詞集對一斷詞模型進行深度學習訓練;一傳輸模組,係通訊連接該複數使用端裝置,以接收該複數訊息內容,且將該複數訊息內容儲存於一資料庫中;及一熱點分析模組,係通訊連接該資料庫,以取得該複數訊息內容,由該熱點分析模組將該頻道節目之播放時長切分為複數第一時間區間後,將該複數訊息內容中之留言內容匹配於相對應之該複數第一時間區間中,再由該熱點分析模組利用該斷詞模型將該複數第一時間區間中之留言內容進行斷詞,以分別萃取出該複數第一時間區間中之複數關鍵字,且進行關鍵字變異性分析,俾將相似及相鄰的複數第一時間區間進行合併而形成複數第二時間區間,其中,由該熱點分析模組依據該複數第二時間區間中之複數關鍵字之分數取得至少一熱點關鍵字,再依據該至少一熱點關鍵字取得其相對應之第二時間區間,以將該第二時間區間作為至少一熱門片段。
- 如請求項1所述之頻道節目熱點偵測系統,其中,該熱點分析模組計算於該複數第一時間區間中之複數關鍵字之分數,以依據該複數關鍵字之分數進行關鍵字變異性分析,再由該熱點分析模組利用該複數關鍵字之分數判斷相鄰的該複數第一時間區間是否為相似,將相鄰及相似的該複數第一時間區間中之至少兩者進行合併,以形成該複數第二時間區間。
- 如請求項2所述之頻道節目熱點偵測系統,其中,該熱點分析模組利用詞頻演算法計算出於該複數第一時間區間中之複數關鍵字之分數,以於該熱點分析模組比較出相鄰的該複數第一時間區間中之最高分數的關鍵字係為相同時,將相鄰的該複數第一時間區間進行合併,以形成該複數第二時間區間。
- 如請求項2所述之頻道節目熱點偵測系統,其中,該熱點分析模組利用主題模型計算出於該複數第一時間區間中之複數關鍵字的分佈機率以作為其分數,再利用分佈差異度量方法依據相鄰的該複數第一時間區間中之分數,計算出相鄰的該複數第一時間區間之間的分布差異值,且於相鄰的該複數第一時間區間之間的分布差異值小於一差異門檻值時,將相鄰的該複數第一時間區間進行合併,以形成該複數第二時間區間。
- 一種頻道節目熱點偵測方法,係包括:由一影音服務裝置係提供設定一頻道節目之複數節目目標詞;由該影音服務裝置依據該複數節目目標詞檢索複數衍生目標詞;由該影音服務裝置利用該複數節目目標詞及該複數衍生目標詞建立出一節目目標詞集;由該影音服務裝置依據該節目目標詞集對一斷詞模型進行深度學習訓練; 由複數使用端裝置分別提供複數用戶觀看該頻道節目,且供該複數用戶於一對話平台上留言,以將該複數用戶於觀看該頻道節目後所產生之留言內容形成複數訊息內容;由該影音服務裝置接收及儲存來自該複數使用端裝置之該複數訊息內容;由該影音服務裝置將該頻道節目之播放時長切分為複數第一時間區間,且將該複數訊息內容中之留言內容匹配於相對應之該複數第一時間區間中;由該影音服務裝置利用該斷詞模型將該複數第一時間區間中之留言內容進行斷詞,以分別萃取出該複數第一時間區間中之複數關鍵字,且進行關鍵字變異性分析,俾將相似及相鄰的複數第一時間區間進行合併而形成複數第二時間區間;以及由該影音服務裝置依據該複數第二時間區間中之複數關鍵字之分數取得至少一熱點關鍵字,再由該影音服務裝置依據該至少一熱點關鍵字取得其相對應之第二時間區間,以將該第二時間區間作為至少一熱門片段。
- 如請求項5所述之頻道節目熱點偵測方法,更包括由該影音服務裝置計算於該複數第一時間區間中之複數關鍵字之分數,以依據該複數關鍵字之分數進行關鍵字變異性分析,並由該影音服務裝置利用該複數關鍵字之分數判斷相鄰的該複數第一時間區間是否為相似,再將相鄰及相似的該複數第一時間區間中之至少兩者進行合併,以形成該複數第二時間區間。
- 如請求項6所述之頻道節目熱點偵測方法,其中,由該影音服務裝置利用詞頻演算法計算出於該複數第一時間區間中之複數關鍵字之分數,以於該熱點分析模組比較出相鄰的該複數第一時間區間中之最高分數的關鍵字 係為相同時,將相鄰的該複數第一時間區間進行合併,以形成該複數第二時間區間。
- 如請求項6所述之頻道節目熱點偵測方法,其中,由該影音服務裝置利用主題模型計算出於該複數第一時間區間中之複數關鍵字的分佈機率以作為其分數,再利用分佈差異度量方法依據相鄰的該複數第一時間區間中之分數,以計算出相鄰的該複數第一時間區間之間的分布差異值,且於相鄰的該複數第一時間區間之間的分布差異值小於一差異門檻值時,將相鄰的該複數第一時間區間進行合併,以形成該複數第二時間區間。
- 一種電腦可讀媒介,應用於計算裝置或電腦中,係儲存有指令,以執行如請求項5至8之任一者所述之頻道節目熱點偵測方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
TW111119497A TWI784913B (zh) | 2022-05-25 | 2022-05-25 | 一種頻道節目熱點偵測系統、方法及其電腦可讀媒介 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
TW111119497A TWI784913B (zh) | 2022-05-25 | 2022-05-25 | 一種頻道節目熱點偵測系統、方法及其電腦可讀媒介 |
Publications (2)
Publication Number | Publication Date |
---|---|
TWI784913B true TWI784913B (zh) | 2022-11-21 |
TW202348039A TW202348039A (zh) | 2023-12-01 |
Family
ID=85794710
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW111119497A TWI784913B (zh) | 2022-05-25 | 2022-05-25 | 一種頻道節目熱點偵測系統、方法及其電腦可讀媒介 |
Country Status (1)
Country | Link |
---|---|
TW (1) | TWI784913B (zh) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TWI223162B (en) * | 2002-03-25 | 2004-11-01 | Hsin-Chia Fu | Method and computer system for automatic generation of multimedia WWW news contents from broadcast news video |
CN103745000A (zh) * | 2014-01-24 | 2014-04-23 | 福州大学 | 一种中文微博客的热点话题检测方法 |
TW201839628A (zh) * | 2017-04-26 | 2018-11-01 | 慧科訊業有限公司 | 一種基於網路媒體資料流程發現並跟蹤熱點話題的方法、系統和裝置 |
US20190303682A1 (en) * | 2018-03-27 | 2019-10-03 | International Business Machines Corporation | Automatic video summary generation |
-
2022
- 2022-05-25 TW TW111119497A patent/TWI784913B/zh active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TWI223162B (en) * | 2002-03-25 | 2004-11-01 | Hsin-Chia Fu | Method and computer system for automatic generation of multimedia WWW news contents from broadcast news video |
CN103745000A (zh) * | 2014-01-24 | 2014-04-23 | 福州大学 | 一种中文微博客的热点话题检测方法 |
TW201839628A (zh) * | 2017-04-26 | 2018-11-01 | 慧科訊業有限公司 | 一種基於網路媒體資料流程發現並跟蹤熱點話題的方法、系統和裝置 |
US20190303682A1 (en) * | 2018-03-27 | 2019-10-03 | International Business Machines Corporation | Automatic video summary generation |
Also Published As
Publication number | Publication date |
---|---|
TW202348039A (zh) | 2023-12-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11915266B2 (en) | Optimized content generation method and system | |
US9008489B2 (en) | Keyword-tagging of scenes of interest within video content | |
CN110209843B (zh) | 多媒体资源播放方法、装置、设备及存储介质 | |
CN110072152B (zh) | 识别和呈现因特网可访问内容的方法和设备 | |
US9202523B2 (en) | Method and apparatus for providing information related to broadcast programs | |
US8909625B1 (en) | Image search | |
US20160014482A1 (en) | Systems and Methods for Generating Video Summary Sequences From One or More Video Segments | |
US8706675B1 (en) | Video content claiming classifier | |
US8994311B1 (en) | System, method, and computer program for segmenting a content stream | |
US9681173B2 (en) | Method of and system for processing a user request for a web resource, the web resource being associated with sequentially semantically linked documents | |
US20180352280A1 (en) | Apparatus and method for programming advertisement | |
TWI784913B (zh) | 一種頻道節目熱點偵測系統、方法及其電腦可讀媒介 | |
JP5389234B1 (ja) | 関連文書抽出装置、関連文書抽出方法及び関連文書抽出プログラム | |
KR101402339B1 (ko) | 문서 관리 시스템 및 문서 관리 방법 | |
JP6530002B2 (ja) | コンテンツ探索装置、コンテンツ探索方法、プログラム | |
JP6381107B2 (ja) | リンク情報生成装置およびリンク情報生成プログラム | |
JP2018180915A (ja) | 違法コンテンツ探索装置、違法コンテンツ探索方法、及びプログラム | |
Hirota et al. | Real-time tweet selection for TV news programs | |
JP2019008607A (ja) | 映像管理サーバー及び映像管理システム |