TWM617933U - 新聞及公眾意見分析系統 - Google Patents

新聞及公眾意見分析系統 Download PDF

Info

Publication number
TWM617933U
TWM617933U TW110207720U TW110207720U TWM617933U TW M617933 U TWM617933 U TW M617933U TW 110207720 U TW110207720 U TW 110207720U TW 110207720 U TW110207720 U TW 110207720U TW M617933 U TWM617933 U TW M617933U
Authority
TW
Taiwan
Prior art keywords
news
information
unit
article
public
Prior art date
Application number
TW110207720U
Other languages
English (en)
Inventor
丘祐瑋
欒百祥
林宇軒
陳河穆
許展源
Original Assignee
大數軟體有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 大數軟體有限公司 filed Critical 大數軟體有限公司
Priority to TW110207720U priority Critical patent/TWM617933U/zh
Publication of TWM617933U publication Critical patent/TWM617933U/zh

Links

Images

Landscapes

  • Information Transfer Between Computers (AREA)

Abstract

本創作提供了一個“新聞輿情分析系統(新聞及公眾意見分析系統)”。新聞輿情分析系統包括資訊分析服務器和資訊收集單元。資訊收集單元收集多條新聞文章和多條新聞文章對應的多個輿論(公眾意見)。資料分析服務器負責以下三件任務:首先、對收集到的新聞和輿情進行語義分析。其次、為新聞文章和相應的輿論貼標。最後,根據分析結果呈現統計圖表。

Description

新聞及公眾意見分析系統
本創作有關於一種分析系統,尤指一種用以對新聞及公眾意見進行分析及評價的新聞及公眾意見分析系統。
隨著網際網路的進步,媒體監測已從過往的著重在報章雜誌、新聞媒體等線下的媒體渠道做監測分析,到現今的網路媒體監測,包括各大論壇、部落格、網路新聞媒體、社群平台等等網路渠道。媒體監測所彙整出的報告不僅能幫助品牌、企業能夠即時掌握媒體信息、輿情的重要來源,同時也能夠作為未來的各項廣告、公關、行銷等決策的重要參考依據。因此,近幾年媒體監測已在許多企業中成為不可或缺的一部分。
然而,要如何自動化地分析所收集到的各種新聞、媒體消息及相應的民眾回應(公眾意見)逐漸成為本領域人員致力發展的議題。
本創作提供一種新聞及公眾意見分析系統,其可分析所收集到的新聞及對應的公眾意見,以有效率地獲得公眾對於新聞的評價及情緒反應。
本創作提供一種新聞及公眾意見分析系統。所述新聞及公眾意見分析系統包括資訊分析伺服器以及資訊收集單元。所述資訊收集單元用以接收多個新聞文章及分別對應所述多個新聞文章的多個公眾意見,其中所述多個新聞文章及分別對應所述多個新聞文章的所述多個公眾意見被傳送至所述資訊分析伺服器。所述資訊分析伺服器用以辨識所述多個新聞文章中的一第一新聞文章及對應所述第一新聞文章的多個第一公眾意見。此外,所述資訊分析伺服器更用以對所述第一新聞文章及所述多個第一公眾意見執行一語意分析操作,其中所述資訊分析伺服器更用以對所述第一新聞文章及所述多個第一公眾意見執行一語意標籤附加操作,以附加多個第一語意標籤至所述第一新聞文章中並且附加多個第二語意標籤至所述多個第一公眾意見中,其中所述資訊分析伺服器更用以根據所述第一語意標籤及所述多個第二語意標籤來顯示對應所述第一新聞文章及所述多個第一公眾意見的第一統計資料。
基於上述,本創作的實施例所提供之新聞及公眾意見分析系統,可對所述多個新聞文章中的第一新聞文章及對應的多個第一公眾意見執行一語意分析操作,並且對所述第一新聞文章及所述多個第一公眾意見執行一語意標籤附加操作,以根據所附加至所述多個第一公眾意見的多個語意標籤來顯示對應所述第一新聞文章的統計資訊,其中所述多個語意標籤至少可反應出公眾對於所述第一新聞文章的整體評價/情緒。如此一來,相關人員除了可藉由所述新聞及公眾意見分析系統來有效率地分析公眾對於所述新聞文章的整體評價/情緒,同時也可以節省人力與時間於新聞分析工作中,更可避免帶入相關人員個人的主觀意識而影響了對於新聞文章的分析判斷。
圖1為根據本創作的一實施例所繪示之新聞及公眾意見分析系統的方塊示意圖。
請參閱第1圖,在本實施例中,新聞及公眾意見分析系統1包括資訊收集單元10與資訊分析伺服器20。在本實施例中,新聞及公眾意見分析系統1可經由資訊收集單元10收集新聞N1及公眾意見P1。在一實施例中,用戶的客戶端30可與所述新聞及公眾意見分析系統1建立網路連線C1,以藉由所述網路連線C1傳送資料。
在一實施例中,所述資訊分析伺服器20可分析所述新聞N1及公眾意見P1來產生相應的客製化輿情結果R1,並且將所述客製化輿情結果R1傳送給訂閱端S1。在一實施例中,客製化輿情結果R1可經由資訊分析伺服器20利用通訊單元來利用社群應用程式或是電子郵件、簡訊等方式來傳送至訂閱端S1。所述客製化輿情結果R1包括任何訂閱用戶所指定的不同類型的資訊集合,例如是網友熱議之新聞文章、最新新聞文章、觸及最高之新聞文章等。此外,所述客製化輿情結果R1內可具有對應不同新聞文章的網路連結,以讓用戶可點擊新聞文章的網路連結來直接閱讀對應的新聞文章。所述訂閱端S1及客戶端30例如是智慧型手機、智慧型手錶、個人電腦、平板、筆記型電腦等電子裝置。訂閱用戶可經由訂閱端S1來接收客製化輿情結果R1,以即時地獲得所欲得知的新聞文章。在一實施例中,訂閱端S1及客戶端30可為同一個用戶的同一電子裝置或不同電子裝置。
應注意的是,在另一實施例中,所述資訊收集單元10亦可被整合至資訊分析伺服器20中。
圖2為根據本創作的一實施例所繪示之資訊收集單元的方塊示意圖。
請參閱圖2,更詳細來說,在本實施例中,資訊收集單元10包括第一控制單元110、網頁擷取單元120、影像擷取單元130、第一儲存單元140及音訊擷取單元150。所述第一控制單元110用以控制所述資訊收集單元10的整體運作。所述網頁擷取單元120可從所連線的網路平台PS1經由擷取網頁或網路爬蟲的方式來收集/抓取新聞文章N1及對應的公眾意見P1。所述影像擷取單元130可從所連線的影像訊號源NS1來下載以影像/影片/視訊形式來呈現的新聞N2,並且對所述影像/影片/視訊執行影像擷取操作,以擷取影像。所述第一儲存單元140用以儲存資料。所述音訊擷取單元150,可從所連接的聲音訊號源SS1來獲得聲音訊號/聲音檔案/音訊串流(亦可稱為聲音資訊),以對所述聲音資訊執行語音辨識操作(如,經由辨識人類聲紋特徵等方式),來辨識於所述聲音資訊中的語音及所述語音的意義,進而獲得對應所述聲音資訊的語音訊息資訊(如,以語音形式所呈現的新聞文章N3及對應的公眾意見P2)。所述聲音訊號源SS1例如是廣播頻道、語音聊天室或應用程式/網頁的聲音訊號源。所接收的聲音訊號/聲音檔案/音訊串流亦可被儲存至第一儲存單元140,以備之後的檢索需求。
在一實施例中,所述網路平台PS1、影像訊號源NS1及聲音訊號源SS1亦可被統稱為資訊來源或資訊頻道。所述資訊來源包括平面媒體(如各類報章雜誌)、新聞平台(如,國內外各新聞媒體所架設的網路平台)、社群平台(如,PTT、FB、Dcard、Youtube、Twitter、IG 、Clubhouse等)、網路論壇(如,Mobile01、伊利、巴哈姆特、FashionGuide、卡提諾等)、網路部落格(如,痞客邦、UDN、Medium)、應用程式(如,對應各個資訊來源的應用程式/APP);廣播;電子期刊;以及影視頻道(如,以有線或無線形式所發送的各種影視頻道)。
若資訊來源為平面媒體(如報紙),影像擷取單元130可為掃描器,以掃描所述報紙上的新聞文章以獲得為對應的影像。此外,若資訊來源是非網頁形式,如,應用程式,所述網頁擷取單元120也可針對所連接的應用程式來從所述應用程式的畫面中來擷取其中的文字內容,以收集/抓取新聞文章N1及對應的公眾意見P1。
圖3為根據本創作的一實施例所繪示之資訊分析伺服器的方塊示意圖。
請參閱圖3,更詳細來說,在本實施例中,資訊分析伺服器20包括第二控制單元210、資訊分析單元220、檢索單元230、第二儲存單元240及通訊單元250。所述第二控制單元210用以控制所述資訊分析伺服器20的整體運作。所述資訊分析單元220用以分析資訊。所述檢索單元230用以檢索資訊。所述第二儲存單元240用以儲存資料。此外,在本實施例中,所述第二儲存單元240儲存用戶資料庫241、關鍵字資料庫242、分析模型資料庫243及文章存檔資料庫244。所述通訊單元250用以輸出資訊。
所述用戶資料庫241用以儲存使用新聞及公眾意見分析系統1的相關用戶的資料,例如訂閱用戶清單(或用戶清單)、用戶資料,其中訂閱用戶清單(或用戶清單)用以記錄對應訂閱端的訂閱用戶的資料接收方式、欲訂閱的資訊類型及相關的用戶身分資料;用戶資料用以記錄有權限使用新聞及公眾意見分析系統1的每個用戶的身分資料、驗證資料、檢索用資料、分析用資料。所述身分資料用以記錄對應的用戶的姓名、電話、電子郵件等個人資訊。所述驗證資料用以驗證用戶在登入階段的資料,如,登入名稱及登入密碼。所述檢索用資料用以記錄可被檢索單元230所使用的資料,如,用戶所設定的檢索條件。所述分析用資料用以記錄可被資訊分析單元220所使用的資料,如用戶關注字串、用戶關注資訊來源、欲使用之分析模型(或分析功能)及對應的客製化分析參數。
在一實施例中,所述通訊單元250根據所述用戶資料庫241的訂閱用戶清單來發送客製化輿情結果R1至對應所述訂閱用戶清單的多個訂閱端S1,其中所述客製化輿情結果可包括多個已排序新聞文章(及對應的多個新聞評價)。
所述關鍵字資料庫242用以儲存多種關鍵字。所述多種關鍵字包括但不限於:預定新聞關鍵字、預定公眾意見關鍵字、新聞類型關鍵字、日常用語關鍵字、特定用語關鍵字等。
所述分析模型資料庫243用以儲存可執行多種資料視覺化操作的監督式學習模型。所述多種資料視覺化操作包括:網路聲量趨勢分析、熱門討論頻道/議題分析、發文情緒分析、聲量來源分析、擴散度分析、熱詞分析、熱門議題分析、競品分析、發文位置分析、意見領袖分析、多維度分析、新聞評價/情緒分析等等。所述資訊分析單元220可從分析模型資料庫243存取監督式學習模型及欲使用的資料視覺化操作來分析所獲得的資訊,以顯示出最終的已分析的統計資訊。
所述文章存檔資料庫244用以儲存多個文章存檔,其中每個文章存檔例如是所爬取/擷取的網頁的整體文字內容及一部影音/音訊檔案中的整體的文字內容(可對應影音/音訊的多個區段)。
在本實施例中,所述第一儲存單元140、第二儲存單元240可以是任何型態的硬碟機(hard disk drive,HDD)或非揮發性記憶體儲存裝置(如,固態硬碟)。
所述通訊單元250用以建立網路連線(如,電信網路、網際網路),以傳輸資料。所述通訊單元250例如是網路介面卡、無線通訊模組等提供通訊功能的電路單元或硬件模組。在本實施例中,無線通訊模組是支援WiFi通訊協定。然而,本發明不限於此,無線通訊模組亦可同時支援其他通訊協定。例如,藍芽(Bluetooth)、3G、4G、5G行動通訊標準等。應注意的是,在一實施例中,資訊收集單元10也可包括一通訊單元電路模組,以提供資訊收集單元10連線至網際網路、影像訊號源NS1、聲音訊號源SS1及網路平台PS1的能力。
第一控制單元110及第二控制單元210為具備運算能力的硬體(例如晶片組、處理器等),用以各自管理資訊收集單元10及資訊分析伺服器20的整體運作。在本實施例中,第一控制單元110及第二控制單元210,例如是一核心或多核心的中央處理單元(Central Processing Unit,CPU)、微處理器(micro-processor)、或是其他可程式化之處理單元、數位訊號處理器(Digital Signal Processor,DSP)、可程式化控制器、特殊應用積體電路(Application Specific Integrated Circuits,ASIC)、可程式化邏輯裝置(Programmable Logic Device,PLD)或其他類似裝置。
圖4為根據本創作的一實施例所繪示之新聞及公眾意見分析方法的流程圖。
請參閱圖4,在步驟S41中,所述資訊收集單元10接收多個新聞文章及分別對應所述多個新聞文章的多個公眾意見。其中,所述多個新聞文章及分別對應所述多個新聞文章的所述多個公眾意見被傳送至所述資訊分析伺服器20。在本實施例中,對應一個新聞文章的多個公眾意見例如是在相關於所述新聞文章的留言區的多筆留言。
接著,在步驟S42中,所述資訊分析伺服器20用以辨識所述多個新聞文章中的一第一新聞文章及對應所述第一新聞文章的多個第一公眾意見。所述第一新聞文章例如是符合特定用戶的特定需求/條件的新聞文章。
更詳細來說,在辨識所述多個新聞文章中的所述第一新聞文章的運作中,所述資訊分析單元220根據所述用戶資料庫241中的第一用戶資料,獲得一或多個第一用戶關注字串。此外,所述資訊分析單元220從所述多個新聞文章中選擇具有所述一或多個第一用戶關注字串的所述第一新聞文章。
舉例來說,假設所述一或多個第一用戶關注字串為“疫情”及“疫苗”。所述資訊分析單元220可從所述多個新聞文章中選擇具有“疫情”及“疫苗”的第一新聞文章。換言之,藉由第一用戶關注字串,所述資訊分析單元220可從大量的新聞文章中挑選出第一用戶想要關注的新聞文章。應注意的是,所述一或多個第一用戶關注字串可被第一用戶預先設定或是透過檢索單元230來即時地被第一用戶所設定(即,可視為第一用戶的檢索字串)。
接著,在步驟S43中,所述資訊分析伺服器20對所述第一新聞文章及所述多個第一公眾意見執行一語意分析操作。
更詳細來說,所述資訊分析單元220從所述分析模型資料庫243存取對應新聞文章的領域的監督式學習模型,以執行所述語意分析操作。在一實施例中,所述監督式學習模型可經由機器學習的方式來建立。例如,針對一個文章,可經由該領域的專業人員來對所述文章進行該領域的語意分析操作,以讓對應的監督式學習模型可以經由所述語意分析操作的結果來學習語意分析。所述語意分析可包括文章分詞、辨識出詞性、辨識專有名詞、統計字詞出現數量以及關鍵詞出現數量。此外,在另一實施例中,所述語意分析操作更可包括:斷句判定、斷詞判定、詞性標註判定、識別專有名詞(人事時地物)、識別關鍵詞(在這邊文章較為重要的詞)、詞類消疑、同義詞處理。
在本實施例中,所述資訊分析單元220經由所述監督式學習模型辨識所述第一新聞文章中的多個第一文章字詞、並且辨識所述多個第一文章字詞各自的詞性;經由所述監督式學習模型辨識所述多個第一公眾意見中的多個第一意見字詞、並且辨識所述多個第一意見字詞各自的詞性。此外,所述資訊分析單元220更可經由所述監督式學習模型辨識所述第一文章字詞及所述多個第一意見字詞中的多個第一專有名詞。所述多個第一專有名詞可經由對應該領域的所述監督式學習模型的內建資料庫或是關鍵字資料庫來被辨識。另一方面,所述資訊分析單元220更可統計所述多個第一文章字詞及所述多個第一意見字詞的總數量,以及統計所述第一新聞文章中的多個第一關鍵詞的總數量,其中所述多個第一關鍵詞相符於所述一或多個第一用戶關注字串。在另一實施例中,所述資訊分析單元220更可統計已經被建立的各種類別的多個語意標籤的總數量。例如,用戶可以查詢於特定日子中出現了多少關於廠商A的特定產品的新聞文章/公眾意見,其中所述廠商A的特定產品可藉由被建立於多個新聞文章中的對應的產品標籤來被查詢。
接著,在步驟S44中,所述資訊分析伺服器20對所述第一新聞文章及所述多個第一公眾意見執行一語意標籤附加操作,以附加多個第一語意標籤至所述第一新聞文章中並且附加多個第二語意標籤至所述多個第一公眾意見中。更詳細來說,在本實施例中,所述資訊分析單元220可經由所述監督式學習模型建立分別對應至所述多個第一文章字詞的多個第一文章語意標籤,以及建立分別對應至所述多個第一意見字詞的多個第一意見語意標籤。
在一實施例中,所述監督式學習模型是經由機器學習的方法來學習將不同的語意標籤附加至不同的字串/字詞上的條件規則。例如,針對單一領域的多個文章,可先經由該領域的專業人員來對所述多個文章進行該領域的語意標籤的附加操作,以讓對應的監督式學習模型可以經由所述語意標籤的附加操作的結果來學習語意標籤的附加規則。如,特定字詞的組合是否表示著正面或負面的情緒/評價,再更進一步地判定文章的整體"評價”。又例如,雖然不同新聞文章可具有同一個專業名詞,但經由所述不同文章中的多個特定字詞的組合,所述不同文章可被判斷出不同的文章類型。舉例來說,標題為“鴻海收購夏普正式簽約郭台銘:全球高科技產業最棒的一天”的新聞文章被歸類為財經類型;標題為“嘉玲採果,郭台銘美人柑到手”的新聞文章被歸類為娛樂類型;標題為“憶起「馬習會」 郭台銘爆氣飆罵:Stupid!”的新聞文章被歸類為政治類型。雖然上述三個新聞標題皆具有“郭台銘”的特定字詞,但監督式學習模型可經由所述多個標題各自的多個字串的組合,來正確地判定出每個新聞文章所應對應的類型/領域。
在本實施例中,所述監督式學習模型可經由Naïve Bayes, SVM, 深度學習(BERT)等演算法來建立模型。
應注意的是,在本實施例中,所述多個第一文章語意標籤及所述多個第一意見語意標籤的類型包括:情緒標籤;產品標籤;廣告標籤;事實查核標籤;文章類別標籤;以及用戶關聯性標籤。所述情緒標籤亦可被稱為評價標籤,其用以表示正面情緒(如,肯定、支持、讚賞、開心、快樂、羨慕等情緒)、負面情緒(如,否定、反對、咒罵、傷心、悲傷、嘲笑等情緒)。所述產品標籤可作為用戶對產品滿意度分析之用。產品標籤指在一字句中是否有提到相關產品。例如,於“拍片神器 Sony ZV-1 上手實拍!你要的側翻螢幕、超快速對焦、美顏模式、防手震這台 Vlog 神機通通有!”的句子中, “Sony ZV-1”可預先被建立為廠商“Sony”的產品標籤。所述廣告標籤用以存放廣告商的廣告資訊/連結,以讓用戶可經由附加在特定字詞上的所述廣告標籤來獲得相應的廣告資訊/連結。所述事實查核標籤用以表示所對應的新聞文章是否被證實為事實或假新聞。所述文章類別標籤用以表示所對應的新聞文章的領域/類型。所述用戶關聯性標籤用以表示新聞文章與所關聯的用戶之間的關聯性。
接著,在步驟S45中,所述資訊分析伺服器20根據所述第一語意標籤及所述多個第二語意標籤來顯示對應所述第一新聞文章及所述多個第一公眾意見的第一統計資料。更詳細來說,所述第一統計資料的類型可包括:發文位置;新聞評價;支持/反對數;讀者反應;文章數量;以及網路聲量。
資料分析伺服器20除了可以去分析靜態的新聞文章之外,也可以對動態的影片/視頻/視訊/影音來進行分析。
具體來說,所述影像擷取單元130可從影像訊號源NS1接收第一影音,所述影像擷取單元130根據一預定時間框來擷取所述第一影音中的多個第一影像。在一實施例中,所述多個第一影像可被儲存於所述第一儲存單元140,以讓用戶存取。
此外,所述第一控制單元110可對每個第一影像執行字元辨識操作,以辨識出所述多個第一影像各自所具有的多個第一影像字元。接著,所述第一控制單元110傳送對應所述多個第一影像的所述多個第一影像字元至所述資訊分析伺服器20。
所述資訊分析單元220可根據所述多個第一影像的所述多個第一影像字元,辨識出所述多個第一影像所具有的多個第一影像字串,並且辨識所述多個第一影像字串中的多個第一影像關鍵字。如此一來,在辨識出所述多個第一影像關鍵字後,所述資訊分析單元220便可進一步對所述多個第一影像關鍵字進行資訊分析操作,以達成自動化監測影音資訊中的新聞資訊/公眾意見的功用。
除了上述自動化地分析所接收到的資訊的功用之外,資訊分析伺服器20也可接受用戶的指令來進行對於資訊的檢索操作。
具體來說,在一實施例中,客戶端30可經由網路連線C1,連線至所述資訊分析伺服器20。用戶可透過所述客戶端30可經由所述網路連線C1發送檢索條件至所述檢索單元230。
所述檢索單元230根據所接收到的所述檢索條件,從所述多個新聞文章中,選擇出相符於所述檢索條件的一或多個第二新聞文章,並且顯示所述一或多個第二新聞文章及所述一或多個第二新聞文章各自的統計資訊。所述檢索條件包括:資訊來源類別、關鍵字、搜尋範圍(如標題或內文)、文章排序規則、欲排除的資訊來源、欲排除的關鍵字、期望的情緒類別、文章的發表時間區間、文章的發表地區等。
所述統計資訊包括且不限於下列資訊中的一或多者:發文位置(用以表示新聞文章的發文地理位置或IP);新聞評價(用以表示公眾對於此新聞文章的評價);支持/反對數(用以表示支持或反對此新聞文章的公眾數量);文章數量(用以表示此新聞文章被散佈的網路平台數量);以及網路聲量(用以表示此新聞文章的觸擊率/點擊率/討論熱度)。此外,在另一實施例中,統計資訊更包括:文章標題、文章內容、發文時間、作者名稱、資料來源、文章類別、文章地區、網友回文、回文者、按讚數、噓數、回文數、使用者反應(笑臉, 哈哈, 加油等情緒表情符號)、分享數。另一方面,所述統計資訊更可包括對所顯示的第二新聞文章進行分析後的結果,所述結果包括:文章摘要、文章標籤、第二新聞文章的整體是屬於正面情緒/評價或負面情緒/評價、對應的公眾意見的整體是屬於正面情緒/評價或負面情緒/評價。
如此一來,用戶可藉由檢索單元230來主動地利用調整檢索條件的方式來找尋想要的新聞文章,並且可同時看到所找到的新聞文章相關的統計資訊。此外,在一實施例中,用戶可設定特定的檢索關鍵字,以從已辨識的多個第一影像字串中相符的特定第一影像字串來找出對應的第一影像的特定片段。
應注意的是,上述網頁擷取單元120、影像擷取單元130、音訊擷取單元150、資訊分析單元220、檢索單元230、通訊單元250是利用硬體形式的電路架構來實現。但,在其他實施例中,亦可以軟體的方式來實現,以被第一控制單元110、第二控制單元210存取且執行,進而執行相關的操作。
基於上述,本創作的實施例所提供之新聞及公眾意見分析系統,可對所述多個新聞文章中的第一新聞文章及對應的多個第一公眾意見執行一語意分析操作,並且對所述第一新聞文章及所述多個第一公眾意見執行一語意標籤附加操作,以根據所附加至所述多個第一公眾意見的多個語意標籤來顯示對應所述第一新聞文章的統計資訊,其中所述多個語意標籤至少可反應出公眾對於所述第一新聞文章的整體評價/情緒。如此一來,相關人員除了可藉由所述新聞及公眾意見分析系統來有效率地分析公眾對於所述新聞文章的整體評價/情緒,同時也可以節省人力與時間於新聞分析工作中,更可避免帶入相關人員個人的主觀意識而影響了對於新聞文章的分析判斷。
雖然本新型創作已以實施例揭露如上,然其並非用以限定本新型創作,任何所屬技術領域中具有通常知識者,在不脫離本新型創作的精神和範圍內,當可作些許的更動與潤飾,故本新型創作的保護範圍當視後附的申請專利範圍所界定者為準。
1:新聞及公眾意見分析系統 10:資訊收集單元 20:資訊分析伺服器 30:客戶端 S1:訂閱端 N1、N2、N3:新聞/新聞文章/影音 P1、P2:公眾意見 R1:客製化輿情結果 C1:網路連線 110:第一控制單元 120:網頁擷取單元 130:影像擷取單元 140:第一儲存單元 150:音訊擷取單元 PS1:網路平台 NS1:影像訊號源 SS1:聲音訊號源 210:第二控制單元 220:資訊分析單元 230:檢索單元 240:第二儲存單元 241:用戶資料庫 242:關鍵字資料庫 243:分析模型資料庫 244:文章存檔資料庫 250:通訊單元 S41、S42、S43、S44、S45:新聞及公眾意見分析方法的流程步驟
圖1為根據本創作的一實施例所繪示之新聞及公眾意見分析系統的方塊示意圖。 圖2為根據本創作的一實施例所繪示之資訊收集單元的方塊示意圖。 圖3為根據本創作的一實施例所繪示之資訊分析伺服器的方塊示意圖。 圖4為根據本創作的一實施例所繪示之新聞及公眾意見分析方法的流程圖。
1:新聞及公眾意見分析系統
10:資訊收集單元
20:資訊分析伺服器
30:客戶端
S1:訂閱端
N1:新聞/新聞文章/影音
P1:公眾意見
R1:客製化輿情結果
C1:網路連線

Claims (12)

  1. 一種新聞及公眾意見分析系統,包括: 一資訊分析伺服器;以及 一資訊收集單元, 其中所述資訊收集單元用以接收多個新聞文章及分別對應所述多個新聞文章的多個公眾意見,其中所述多個新聞文章及分別對應所述多個新聞文章的所述多個公眾意見被傳送至所述資訊分析伺服器, 其中所述資訊分析伺服器用以辨識所述多個新聞文章中的一第一新聞文章及對應所述第一新聞文章的多個第一公眾意見, 其中所述資訊分析伺服器更用以對所述第一新聞文章及所述多個第一公眾意見執行一語意分析操作, 其中所述資訊分析伺服器更用以對所述第一新聞文章及所述多個第一公眾意見執行一語意標籤附加操作,以附加多個第一語意標籤至所述第一新聞文章中並且附加多個第二語意標籤至所述多個第一公眾意見中, 其中所述資訊分析伺服器更用以根據所述第一語意標籤及所述多個第二語意標籤來顯示對應所述第一新聞文章及所述多個第一公眾意見的第一統計資料。
  2. 如請求項1所述之新聞及公眾意見分析系統,其中所述資訊收集單元從多個資訊來源接收所述多個新聞文章及對應的所述多個公眾意見,其中所述多個資訊來源的類型包括: 平面媒體; 新聞平台; 社群平台; 網路論壇; 網路部落格; 應用程式; 廣播; 電子期刊;以及 影視頻道。
  3. 如請求項2所述之新聞及公眾意見分析系統,其中所述資訊收集單元包括: 一第一控制單元,用以控制所述資訊收集單元; 一網頁擷取單元,用以擷取網頁; 一影像擷取單元,用以擷取影像; 一音訊擷取單元,用以擷取語音訊號;以及 一第一儲存單元,用以儲存資料,其中所述第一控制單元耦接至所述網頁擷取單元、所述影像擷取單元、所述音訊擷取單元及所述第一儲存單元, 其中所述資訊分析伺服器包括: 一第二控制單元,用以控制所述資訊分析伺服器; 一資訊分析單元,用以分析資訊; 一檢索單元,用以檢索資訊; 一第二儲存單元,用以儲存資料,其中所述資料包括一用戶資料庫、一關鍵字資料庫、一分析模型資料庫及一文章存檔資料庫;以及 一通訊單元,用以傳輸資訊。
  4. 如請求項3所述之新聞及公眾意見分析系統,其中在辨識所述多個新聞文章中的所述第一新聞文章的運作中, 所述資訊分析單元根據所述用戶資料庫中的一第一用戶資料,獲得一或多個第一用戶關注字串, 其中所述資訊分析單元從所述多個新聞文章中選擇具有所述一或多個第一用戶關注字串的所述第一新聞文章。
  5. 如請求項4所述之新聞及公眾意見分析系統,其中在對所述第一新聞文章及所述多個第一公眾意見執行所述語意分析操作的運作中, 所述資訊分析單元從所述分析模型資料庫存取一監督式學習模型,以執行所述語意分析操作。
  6. 如請求項5所述之新聞及公眾意見分析系統,其中在所述語意分析操作中, 所述資訊分析單元經由所述監督式學習模型辨識所述第一新聞文章中的多個第一文章字詞、並且辨識所述多個第一文章字詞各自的詞性, 其中所述資訊分析單元經由所述監督式學習模型辨識所述多個第一公眾意見中的多個第一意見字詞、並且辨識所述多個第一意見字詞各自的詞性, 其中所述資訊分析單元更經由所述監督式學習模型辨識所述第一文章字詞及所述多個第一意見字詞中的多個第一專有名詞, 其中所述資訊分析單元更統計所述多個第一文章字詞及所述多個第一意見字詞的總數量, 其中所述資訊分析單元更統計所述第一新聞文章中的多個第一關鍵詞的總數量,其中所述多個第一關鍵詞相符於所述一或多個第一用戶關注字串。
  7. 如請求項6所述之新聞及公眾意見分析系統,其中在所述語意標籤附加操作中, 所述資訊分析單元經由所述監督式學習模型建立分別對應至所述多個第一文章字詞的多個第一文章語意標籤,以及建立分別對應至所述多個第一意見字詞的多個第一意見語意標籤。
  8. 如請求項7所述之新聞及公眾意見分析系統,其中所述多個第一文章語意標籤及所述多個第一意見語意標籤的類型包括: 情緒標籤; 產品標籤; 廣告標籤; 事實查核標籤; 文章類別標籤;以及 用戶關聯性標籤。
  9. 如請求項3所述之新聞及公眾意見分析系統,其中 所述影像擷取單元從一影像訊號源接收一第一影音, 其中所述影像擷取單元根據一預定時間框來擷取所述第一影音中的多個第一影像, 其中所述多個第一影像被儲存於所述第一儲存單元, 其中所述第一控制單元,對每個第一影像執行字元辨識操作,以辨識出所述多個第一影像各自所具有的多個第一影像字元, 其中所述第一控制單元傳送對應所述多個第一影像的所述多個第一影像字元至所述資訊分析伺服器, 其中所述資訊分析單元根據所述多個第一影像的所述多個第一影像字元,辨識出所述多個第一影像所具有的多個第一影像字串,並且辨識所述多個第一影像字串中的多個第一影像關鍵字。
  10. 如請求項3所述之新聞及公眾意見分析系統,其中 所述音訊擷取單元從所連接的聲音訊號源來獲得聲音資訊, 其中所述音訊擷取單元對所述聲音資訊執行語音辨識操作,以獲得對應所述聲音資訊的語音訊息資訊。
  11. 如請求項3所述之新聞及公眾意見分析系統,其中一客戶端可經由一網路連線,連線至所述資訊分析伺服器, 其中所述客戶端可經由所述網路連線發送一檢索條件至所述檢索單元, 其中所述檢索單元根據所接收到的所述檢索條件,從所述多個新聞文章中,選擇出相符於所述檢索條件的一或多個第二新聞文章,並且顯示所述一或多個第二新聞文章及所述一或多個第二新聞文章各自的統計資訊,其中所述統計資訊包括下列資訊中的一或多者: 發文位置; 新聞評價; 支持/反對數; 讀者反應; 文章數量;以及 網路聲量。
  12. 如請求項3所述之新聞及公眾意見分析系統,其中 所述通訊單元根據所述用戶資料庫的訂閱用戶清單來發送一客製化輿情結果至對應所述訂閱用戶清單的多個訂閱端,其中所述客製化輿情結果包括多個已排序新聞文章及對應的多個新聞評價。
TW110207720U 2021-07-02 2021-07-02 新聞及公眾意見分析系統 TWM617933U (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
TW110207720U TWM617933U (zh) 2021-07-02 2021-07-02 新聞及公眾意見分析系統

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
TW110207720U TWM617933U (zh) 2021-07-02 2021-07-02 新聞及公眾意見分析系統

Publications (1)

Publication Number Publication Date
TWM617933U true TWM617933U (zh) 2021-10-01

Family

ID=79603166

Family Applications (1)

Application Number Title Priority Date Filing Date
TW110207720U TWM617933U (zh) 2021-07-02 2021-07-02 新聞及公眾意見分析系統

Country Status (1)

Country Link
TW (1) TWM617933U (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023082698A1 (zh) * 2021-11-10 2023-05-19 上海蜜度信息技术有限公司 公众满意度的分析方法、存储介质及电子设备

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023082698A1 (zh) * 2021-11-10 2023-05-19 上海蜜度信息技术有限公司 公众满意度的分析方法、存储介质及电子设备

Similar Documents

Publication Publication Date Title
US11775494B2 (en) Multi-service business platform system having entity resolution systems and methods
US10796093B2 (en) Automatic generation of statement-response sets from conversational text using natural language processing
US9704185B2 (en) Product recommendation using sentiment and semantic analysis
US20110179114A1 (en) User communication analysis systems and methods
US11087202B2 (en) System and method for using deep learning to identify purchase stages from a microblog post
US9892109B2 (en) Automatically coding fact check results in a web page
US8762302B1 (en) System and method for revealing correlations between data streams
CN108369715B (zh) 基于视频内容特性的交互式评述
US20170017638A1 (en) Meme detection in digital chatter analysis
US20150379571A1 (en) Systems and methods for search retargeting using directed distributed query word representations
US10825449B1 (en) Systems and methods for analyzing a characteristic of a communication using disjoint classification models for parsing and evaluation of the communication
US11562013B2 (en) Systems and methods for improvements to user experience testing
EP3905177A1 (en) Recommending that an entity in an online system create content describing an item associated with a topic having at least a threshold value of a performance metric and to add a tag describing the item to the content
WO2020223409A1 (en) Systems and methods for improvements to user experience testing
TWM617933U (zh) 新聞及公眾意見分析系統
US20180150467A1 (en) System and method for determining a contextual insight and generating an interface with recommendations based thereon
US20230316186A1 (en) Multi-service business platform system having entity resolution systems and methods
US20160314477A1 (en) Identifying entities trending in a professional community
US20200210497A1 (en) Advanced analysis of online user experience studies
CN111400437A (zh) 互联网信息响应方法、装置、电子设备和计算机可读介质
CN113535940A (zh) 事件摘要生成方法、装置及电子设备
TWM551710U (zh) 用戶資料蒐集系統
EP4375912A1 (en) Systems and methods for improved user experience results analysis
WO2022026416A1 (en) System and method for addressing disinformation
JP2023169091A (ja) 評価装置、評価プログラム、評価方法