TW202018535A - 文章的回應預測裝置及方法 - Google Patents
文章的回應預測裝置及方法 Download PDFInfo
- Publication number
- TW202018535A TW202018535A TW107138819A TW107138819A TW202018535A TW 202018535 A TW202018535 A TW 202018535A TW 107138819 A TW107138819 A TW 107138819A TW 107138819 A TW107138819 A TW 107138819A TW 202018535 A TW202018535 A TW 202018535A
- Authority
- TW
- Taiwan
- Prior art keywords
- article
- response
- emotion
- response prediction
- sample
- Prior art date
Links
- 230000004044 response Effects 0.000 title claims abstract description 204
- 238000000034 method Methods 0.000 title claims abstract description 69
- 230000008451 emotion Effects 0.000 claims description 123
- 230000002996 emotional effect Effects 0.000 claims description 45
- 238000010801 machine learning Methods 0.000 claims description 21
- 230000008569 process Effects 0.000 claims description 20
- 230000011218 segmentation Effects 0.000 claims description 10
- 230000036651 mood Effects 0.000 claims description 6
- 238000012360 testing method Methods 0.000 abstract description 19
- 238000005516 engineering process Methods 0.000 description 9
- 230000006870 function Effects 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 3
- 238000010276 construction Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 230000006855 networking Effects 0.000 description 2
- 230000001568 sexual effect Effects 0.000 description 2
- 208000003028 Stuttering Diseases 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000003796 beauty Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000010219 correlation analysis Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000009792 diffusion process Methods 0.000 description 1
- 230000006397 emotional response Effects 0.000 description 1
- 238000013467 fragmentation Methods 0.000 description 1
- 238000006062 fragmentation reaction Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000012549 training Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/15—Correlation function computation including computation of convolution operations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/01—Social networking
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Software Systems (AREA)
- Business, Economics & Management (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Data Mining & Analysis (AREA)
- Mathematical Physics (AREA)
- Computing Systems (AREA)
- Computational Linguistics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Resources & Organizations (AREA)
- Strategic Management (AREA)
- Economics (AREA)
- Pure & Applied Mathematics (AREA)
- Mathematical Optimization (AREA)
- Mathematical Analysis (AREA)
- Computational Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Computation (AREA)
- Medical Informatics (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Tourism & Hospitality (AREA)
- Databases & Information Systems (AREA)
- Algebra (AREA)
- Game Theory and Decision Science (AREA)
- Development Economics (AREA)
- Primary Health Care (AREA)
- Entrepreneurship & Innovation (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Machine Translation (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
一種文章的回應預測裝置及方法。該裝置包含一儲存器、一輸入介面及一處理器。該儲存器儲存一回應預測模型,該輸入介面用以接收一待測文章。該處理器電性連接至該儲存器及該輸入介面,且執行下列運作:分析該待測文章以取得一待測文章內容;根據該回應預測模型以及該待測文章內容預測該待測文章被閱讀後所產生的一回應;以及根據該回應產生一回應資料。
Description
本發明係關於一種文章的回應預測裝置及方法。具體而言,本發明係關於一種分析文章內容以判斷文章可能產生之回應之裝置及方法。
隨著社群網路的快速發展,各種社群平台(例如:臉書)蓬勃的發展,品牌企業或公關公司需要在各種的社群平台上經營關於其品牌之內容(例如:粉絲專頁),並藉由社群平台上發表的文章,快速累積品牌的人氣及客源。
各種社群平台對於平台上所發表文章,提供了更多元的評價/回應方式給用戶做選擇。舉例而言,社群平台臉書提供給用戶的回應方式,除了常見的「讚」之外,更提供了五種表情符號(分別為愛心、難過、高興、驚嚇、生氣)。在一些相關的研究中指出,比起一般「讚」的數量或是分析回覆文字的語意,用戶所回應的表情符號(例如:臉書表情符號)通常更能有效的代表用戶對這篇文章的共鳴情緒。因此,若發表的文章可以獲得到用戶更多的回應或共鳴情緒,即更能引起用戶的關注,提高發表文章的擴散效益。
然而,一般經營粉絲專業的管理者,在撰寫完文章後,缺乏
一個有效的方法估測擬發表該文章可能獲得之回應(例如:愛心、難過、高興、驚嚇、生氣等等反應情緒的回應),使得大型品牌公司、整合行銷/數位公司、媒體代操業者及公關公司等在經營社群時難以評估是否能達到其預期引起之回應。
有鑑於此,如何提供一種能夠預測文章內容可能產生之回應的技術,乃業界亟需努力之目標。
為了解決上述問題,本發明的某些實施例提供了一種文章的回應預測裝置。該文章的回應預測裝置包含一儲存器、一輸入介面及一處理器,該處理器電性連接至該儲存器及該輸入介面。該儲存器儲存一回應預測模型,該輸入介面用以接收一待測文章。該處理器用以分析該待測文章以取得一待測文章內容。該處理器還用以根據該回應預測模型以及該待測文章內容預測該待測文章被閱讀後所產生的一回應,並根據該回應產生一回應資料。
為了解決上述問題,本發明的某些實施例還提供了一種文章的回應預測方法。該方法適用於一文章的回應預測裝置,該文章的回應預測裝置包含一儲存器、一輸入介面及一處理器,該儲存器儲存一回應預測模型,該輸入介面用以接收一待測文章。該文章的回應預測方法由該處理器所執行且包含下列步驟:分析該待測文章以取得一待測文章內容;根據該回應預測模型以及該待測文章內容預測該待測文章被閱讀後所產生的一回應;以及根據該回應產生一回應資料。
本發明所提供之一種文章的回應預測技術(至少包含裝置及
方法),根據待測文章之一待測文章內容,透過一回應預測模型來預測該待測文章被閱讀後可能產生之回應。該回應預測模型係根據分析大量具有不同類型、且已被評價之樣本文章所產生。透過前述運作,將能預測待測文章被閱讀後可能產生之回應,因而解決習知技術無法預測文章所可能產生之回應的問題。
以下將結合圖式闡述本發明之詳細技術及實施方式,俾使本發明所屬技術領域中具有通常知識者能理解所請求保護之發明之技術特徵。
1‧‧‧文章的回應預測裝置
11‧‧‧儲存器
13‧‧‧輸入介面
15‧‧‧處理器
133‧‧‧待測文章
135‧‧‧文章類別
201-215‧‧‧運作
S301-S305‧‧‧步驟
第1圖係描繪依據本發明一實施例之文章的回應預測裝置之架構示意圖;第2A圖係描繪依據本發明一實施例之建置回應預測模型之流程示意圖;第2B圖及第2C圖係分別描繪依據本發明一實施例之一加權情緒量值估算範例;以及第3圖係描繪依據本發明第二實施方式之文章的回應預測之方法之流程圖。
以下將透過多個實施例來說明本發明,惟這些實施例並非用以限制本發明只能根據所述操作、環境、應用、結構、流程或步驟來實施。於圖式中,與本發明非直接相關的元件皆已省略。於圖式中,各元件之間的尺寸關係僅為了易於說明本發明,而非用以限制本發明的實際比例。除了特
別說明之外,在以下內容中,相同(或相近)的元件符號可對應至相同(或相近)的元件。
第1圖例示了在本發明的某些實施例中的一種文章的回應預測裝置(以下簡稱「預測裝置」)1。第1圖所示內容僅是為了舉例說明本發明的實施例,而非為了限制本發明。
參照第1圖,預測裝置1可包含一儲存器11、一輸入介面13及一處理器15,該處理器15電性連接至該儲存器11及該輸入介面13。除了儲存器11及處理器13之外,於某些實施例中,預測裝置1還可包含其他元件,例如但不限於:輸出元件、聯網元件等等。預測裝置1所包含的所有元件都相互連接,且任二個元間之間可以是直接連接(即,未經由其他功能元件而相互連接),也可以是間接連接(即,經由其他功能元件而相互連接)。預測裝置1可以是各種具有計算、儲存、通訊、聯網等功能的計算機,例如但不限於:桌上型電腦、可攜式電腦、移動式裝置等等。
儲存器11可包含第一級記憶體(又稱主記憶體或內部記憶體),且處理器15可直接讀取儲存在第一級記憶體內的指令集,並在需要時執行這些指令集。儲存器11還可包含第二級記憶體(又稱外部記憶體或輔助記憶體),且此記憶體可透過資料緩衝器將儲存的資料傳送至第一級記憶體。舉例而言,第二級記憶體可以是但不限於:硬碟、光碟等。儲存器11還可包含第三級記憶體,亦即,可直接插入或自電腦拔除的儲存裝置,例如隨身硬碟。輸入介面13可為一種接收輸入資料之元件,或是任何一種本發明所屬技術領域中具有通常知識者所知悉之其他能接收輸入資料之介面。
處理器15可包含微處理器(microprocessor)或微控制器
(microcontroller),用以在預測裝置1中執行各種運算程序。微處理器或微控制器是一種可程式化的特殊積體電路,其具有運算、儲存、輸出/輸入等能力,且可接受並處理各種編碼指令,藉以進行各種邏輯運算與算術運算,並輸出相應的運算結果。
於本發明之第一實施例中,處理器15透過輸入介面13接收使用者欲分析的待測文章。接著,為了準確的產生回應資料(例如:待測文章可能引起之情緒),處理器15分析待測文章以取得與判斷該回應資料相關之待測文章內容。最後,處理器15將取得的待測文章內容,透過預先建立好的一回應預測模型,預測該待測文章被閱讀後可能產生的回應,根據該回應產生一回應資料。使用者可根據該回應資料,了解該待測文章可能產生之反應,以下段落將詳細說明與本發明相關之實施細節。
於本實施例中,儲存器11儲存一回應預測模型(未繪示)。需說明者,該回應預測模型可由預測裝置1本身建置,亦可自外部裝置直接接收,關於該回應預測模型的建置方式及其內容將在後面段落另詳細說明。
於本實施例中,輸入介面13用以接收一待測文章133。接著,當接收到待測文章133時,處理器15分析該待測文章133以取得一待測文章內容。舉例而言,待測文章裡的一段文字「很多東西碎裂了是很難彌補的」,處理器15分析可能與待測文章133被閱讀後產生之回應有關之內容(例如:關於情緒的關鍵字,擷取「碎裂」及「彌補」作為待測文章內容)。須說明者,本發明未限制有關擷取該待測文章的形式,可以擷取為一段句子、字詞或是任何足以代表語句意思的內容,也可以擷取待測文章的全部內容來作為待測文章內容。此外,如何擷取文章內容的方法非本發明之重點,本發明
所屬技術領域中具有通常知識者應可理解其內容,故不贅言。
隨後,處理器15根據該回應預測模型以及該待測文章內容預測該待測文章被閱讀後所產生的一回應,並根據該回應產生一回應資料。舉例而言,該回應預測模型產生之該回應資料可為該待測文章之所命中之情緒(例如:悲傷、生氣等等),使用者可根據該回應資料,了解該待測文章被閱讀後可能產生之反應。須說明者,該回應資料亦可為表情符號、心情、情緒或是所屬領域具有通常知識者理解可用以評價文章內容之方式,本發明未限制其保護的範圍。
為了方便說明,以下將以臉書所提供之五種表情符號(分別為愛心、難過、高興、驚嚇、生氣等情緒)作為建置回應預測模型的基礎且將該等表情符號作為該回應資料之內容,其謹易於說明本發明,而非用以限制本發明的內容。
於預測裝置1本身建置回應預測模型的實施例中,儲存器11更儲存多個第一樣本文章(例如:收集自各個社群平台之文章)以及分別與該多組情緒量值相關的多組情緒量值(例如:多個用戶對於該等文章所回應之表情符號數)用來建置該回應預測模型。
該回應預測模型可根據以下運作建置。首先,為了判斷各該第一樣本文章分別代表何種引起之情緒,處理器15針對各該第一樣本文章,根據相應的該組情緒量值決定一情緒標籤。例如,處理器15可以根據統計各該第一樣本文章所佔的比例最高之表情符號,將該表情符號作為代表該第一樣本文章之情緒標籤。接著,處理器15根據該等情緒標籤與該等第一樣本文章,透過機器學習建立該回應預測模型。
於某些實施例中,處理器15可根據相應的該情緒標籤,針對各該第一樣本文章進行一斷詞處理以及一詞性標註處理,以取得多個特定字詞。接著,處理器15再透過機器學習建立全部特定字詞與該等情緒標籤的關聯。最後,處理器15根據該關聯,建立該回應預測模型。
舉例而言,處理器15將情緒標籤為悲傷之第一樣本文章,透過斷詞處理及詞性標註處理(例如:結巴斷詞器),篩選該第一樣本文章之內容,以取得多個特定字詞(例如:與悲傷情緒較為相關之字詞)。該詞性可包含特定類型的名詞、動詞、形容詞、副詞等等常用之情緒字詞。接著,處理器15將所有第一樣本文章之特定字詞,透過機器學習建立全部特定字詞與該等情緒標籤的關聯。舉例而言,若某一字詞特別屬於某種情緒標籤,則該字詞與該情緒標籤之關聯性較高,若某一字詞同時與兩種以上情緒標籤相關,則該字詞與該等情緒標籤之關聯性較低。處理器15透過機器學習(例如:深度學習演算法)建立全部特定字詞與該等情緒標籤的關聯後,即可產生情緒標籤與特定字詞之對應關係,根據該等對應關係達到預測之功能。
須說明者,本發明未限制有關該特定字詞的形式,可以擷取為一段句子、字詞或是任何可以代表該文章意思的內容。此外,本技術領域具有通常知識者應可理解如何針對前述內容施行斷詞處理、詞性標註處理及根據機器學習建立關聯之方法,故不贅言。
於某些實施例中,處理器15更進一步根據第一樣本的文章類別建置回應預測模型。如第1圖所示,當輸入介面13接收待測文章133時,輸入介面13更接收該待測文章133之一待測文章類別135,且回應預測模型對應至該待測文章類別135。需說明者,待測文章類別135指示待測文章133屬
於何種文章類別(例如:政治、兩性心情、美妝保養等等),由於相同用語在不同之文章類別可能會有不同之意思/效果,在之後的預測運作中,處理器15會一併將該待測文章133之待測文章類別135輸入該回應預測模型,使得對於待測文章的133預測更準確。
舉例而言,處理器15針對文章類別為「兩性心情」的樣本文章,根據各樣本文章之情緒標籤及其特定字詞,透過機器學習建立對應至「兩性心情」文章類別的回應預測模型,對於文章類別為「政治」的樣本文章,亦施行相同之操作。接著,當輸入待測文章133的待測文章內容及文章類別135時,回應預測模型即可根據該待測文章內容及文章類別135,先判斷與那個文章類別相關,再判斷與該文章類別相關之特定字詞與該待測文章內容之相似度,並根據該特定字詞對應之情緒標籤,預測待測文章133可能產生之回應。須說明者,本技術領域具有通常知識者應可根據上述內容理解關於模型訓練的方法,故不贅言。
於某些實施例中,儲存器15更儲存分別與該等第一樣本文章相關的多組留言內容,例如:用戶針對該樣本文章之文字評論等。關於前述建立回應預測模型中,處理器15更根據下列運作決定各該第一樣本文章之情緒標籤。首先,處理器15針對各該第一樣本文章,根據相應的該組留言內容計算一正向情緒分數、一負向情緒分數及一留言熱度指數。接著,處理器15針對各該第一樣本文章,根據相應的該留言熱度指數與相應的該正向情緒分數,計算一正向情緒加權分數,且根據相應的該留言熱度指數與相應的該負向情緒分數,計算一負向情緒加權分數。
隨後,處理器15針對各該第一樣本文章,計算相應的該組情
緒量值與相應的該正向情緒分數及相應的該組情緒量值與相應的該負向情緒分數之間的相關性。隨後,處理器15針對各該第一樣本文章,根據相應的該相關性、相應的該正向情緒加權分數與相應的該負向情緒加權分數與一組預設情緒量值,計算出相應的該組情緒量值。最後,處理器15將各該第一樣本文章之該等加權後情緒量值作為該組情緒量值,以決定各該第一樣本文章之該情緒標籤。
為便於理解,第2A圖係以一示意圖描繪本發明一實施例建置回應預測模型之流程。參照第2A圖,處理器15執行運作201以輸入樣本文章。接著,執行運作203以分析文章留言內容。隨後,處理器15分別執行運作205的相關性分析以及運作207計算正負情緒加權分數。接著,處理器15執行運作209以加權情緒量值。接著,處理器15執行運作211決定各樣本文章之情緒標籤。最後,處理器15執行運作213以進行機器學習,以及執行運作215以產生一回應預測模型。
以第2B圖及2C圖為一範例來進一步說明。第2B圖例示了之樣本文章1、樣本文章2及樣本文章3對應之留言內容評價(包含正向情緒分數XPi、負向情緒分數XNi、留言熱度指數Hi)及一組預設的/初始的情緒量值(包含各個表情符號所獲得之數量)。正向情緒分數係由處理器15計算代表各樣本文章之留言內容具有正向情緒之分數(例如:正向留言之比例),而負向情緒分數代表各樣本文章之留言內容具有負向情緒之分數,留言熱度指數代表留言之熱度(例如:該篇文章的留言數佔樣本文章留言總數的比例比例)。接著,處理器15計算正向情緒分數與正向表情符號(例如:愛心、高興)之相關性以及負向情緒分數與負向表情符號(例如:難過、生氣)之
相關性。舉例而言,處理器15分別計算樣本文章1、樣本文章2及樣本文章3之正向表情符號愛心與正向情緒分數的正相關關係,產生各自之一相關值。
接著,處理器15可判斷情緒量值中,正向表情符號與負向表情符號中分別具有最高相關性之情緒量值且其相關性大於一預設門檻值之表情符號進行加權。處理器15可根據下列公式(1)計算正向情緒加權分數,且根據公式(2)計算負向情緒加權分數。
W i =X Pi ×H i (1)
W i =X Ni ×H i (2)
上述公式(1)及公式(2)中,公式(1)為正向情緒加權分數W i 、公式(2)為負向情緒加權分數W i 。變數i為第i篇文章,X Pi 為第i篇文章之正向情緒分數,X Ni 為第i篇文章之負向情緒分數,H i 為第i篇文章之留言熱度指數。
以樣本文章1為例,如第2B圖所示,因處理器15判斷正向表情符號愛心之相關性最高,故加權該組情緒量值中關於愛心之表情符號量值;且因處理器15判斷負向表情符號生氣之相關性最高,故加權該組情緒量值中關於生氣之表情符號量值。因此,如第2C圖所示,樣本文章1之正向情緒加權分數為0.657(即,0.73×0.9=0.657),加權後樣本文章1的愛心之表情符號量值為414(即,250×(1+0.657)=414)。因為加權後的情緒量值中愛心之表情符號的數值最高,故處理器15可決定樣本文章1的情緒標籤為愛心。
於某些實施例中,該處理器15所產生之回應資料更包含多個
情緒信心值以及分別與該多個情緒信心值相關的多組情緒字詞。情緒信心值可用以評斷該預測之強度,舉例而言,該回應資料可包含「難過」、「生氣」、「高興」,且分別對應至情緒信心值85分、75分及30分,該情緒信心值指示待測文章具有難過及生氣的可能性較大。另外,使用者亦可預設一情緒信心值門檻,使該回應預測模型僅輸出大於該情緒信心值門檻之結果。
另外,於某些實施例中,儲存器11更儲存一情緒關鍵字推薦模型。該輸入介面更接收一回應目標(例如:使用者希望待測文章命中之情緒)。接著,處理器15判斷回應資料是否與該回應目標相符。若該回應資料不符合該回應目標,則處理器15則根據該情緒關鍵字推薦模型,產生推薦資料,其中該推薦資料與該回應目標相關。舉例而言,當使用者期望待測文章可以命中悲傷之情緒,當待測文章133所預測得到之情緒與預期之悲傷不相符時,處理器15可根據情緒關鍵字推薦模型,推薦關於悲傷的情緒關鍵字(例如:「沮喪」、「流淚」),以輔助使用者撰寫文章。
需說明者,該情緒關鍵字推薦模型可由預測裝置1本身建置,亦可自外部裝置直接接收。於預測裝置1本身建置情緒關鍵字推薦模型的實施例中,該情緒關鍵字推薦模型係由下列運作建立。儲存器11還儲存多個第二樣本文章以及分別與該多組情緒量值相關的多組情緒量值。接著,處理器15針對各該第二樣本文章,根據相應的該組情緒量值決定一情緒標籤。處理器15根據該等情緒標籤與該等第二樣本文章,透過機器學習建立該情緒關鍵字推薦模型。須說明者,於某些實施例中,處理器15亦可加入詞頻、期望因子等參數來篩選情緒關鍵字。需說明者,本發明未限制該第二樣本文章與第一樣本文章相同,可視其需求決定樣本文章的內容。
於某些實施例中,處理器15針對各該第二樣本文章,根據相應的該情緒標籤進行一斷詞處理以及一詞性標註處理,以取得多個特定字詞。接著,處理器15可依據前述計算方式建立全部特定字詞與該等情緒標籤的關聯。在此實施例中,可不用機器學習方案建立關聯,透過關鍵字出現在同一情緒標籤第二樣本文章的文章數和該關鍵字的詞頻進行加權計算,以計算出該關鍵字屬於能刺激出某一情緒的期望值,依此建立關聯。最後,處理器15根據該關聯,建立該情緒關鍵字推薦模型。具體而言,前述回應預測模型係輸入一待測文章之待測文章內容,根據該待測文章內容預測該待測文章被閱讀後所產生的一回應,而情緒關鍵字推薦模型則是輸入一回應目標,根據該回應目標產生與該回應目標相關之推薦資料(例如,情緒關鍵字)。本發明所屬技術領域中具有通常知識者可根據前述回應預測模型的建置方式,理解情緒關鍵字推薦模型之建置方式,故不贅言。
於某些實施例中,回應預測模型與情緒關鍵字推薦模型可被整合為單一模型,且該單一模型是根據複數第一參考文章而被建立的。於某些實施例中,回應預測模型與情緒關鍵字推薦模型是二個獨立的模型,且回應預測模型是根據複數第一參考文章而被建立的,而情緒關鍵字推薦模型是根據複數第二參考文章而被建立的。
於某些實施例中,該推薦資料包含符合該回應目標的關鍵字、文章、與發文型態其中至少一項。舉例而言,除了推薦推薦關於悲傷的情緒關鍵字,處理器15更可根據該情緒關鍵字推薦模型,推薦具有該等情緒關鍵字之樣本文章或是其發文型態等等,以輔助使用者撰寫文章。
由上述說明可知,本發明所提供之一種文章的回應預測技
術,根據待測文章之一待測文章內容,透過一回應預測模型來預測該待測文章被閱讀後可能產生之回應,由於該回應預測模型係根據分析大量具有不同類型、且已被評價之樣本文章所產生。透過前述運作,故能達到預測待測文章被閱讀後可能產生之回應,因而解決習知技術無法預測文章所可能產生之回應的技術。此外,當待測文章不符合使用者預期回應目標時,本發明更提供一種推薦技術給使用者與該回應目標相關之推薦資料,以輔助使用者撰寫文章。
本發明之第二實施方式為一文章的回應預測方法,其流程圖係描繪於第3圖。該文章的回應預測方法適用於第一實施方式所述之文章的回應預測裝置1。該文章的回應預測裝置包含一儲存器、一輸入介面及一處理器,該儲存器儲存一回應預測模型(例如:第一實施方式之回應預測模型),該輸入介面用以接收一待測文章,該文章的回應預測方法由該處理器所執行。該文章的回應預測方法透過步驟S301至步驟S305產生一回應資料。
於步驟S301,由該電子裝置分析該待測文章以取得一待測文章內容。接著,於步驟S303,由該電子裝置根據該回應預測模型以及該待測文章內容預測該待測文章被閱讀後所產生的一回應。隨後,於步驟S305,由該電子裝置根據該回應產生一回應資料。
於第3圖中所示的步驟S301、步驟S303與步驟S305的順序並非限制。在仍可以實現本發明的情況下,該順序可以被調整。
於某些實施例中,文章的回應預測方法更包含由該輸入介面,接收該待測文章之一待測文章類別,且回應預測模型對應至該待測文章類別。
於某些實施例中,該儲存器還儲存多個第一樣本文章以及分別與該多組情緒量值相關的多組情緒量值。除了步驟S301、步驟S303及步驟S305之外,該文章的回應預測方法更包含下列步驟:針對各該第一樣本文章,根據相應的該組情緒量值決定一情緒標籤;以及根據該等情緒標籤與該等第一樣本文章,透過機器學習建立該回應預測模型。
於某些實施例中,該文章的回應預測方法更包含下列步驟:針對各該第一樣本文章,根據相應的該情緒標籤進行一斷詞處理以及一詞性標註處理,以取得多個特定字詞;透過機器學習建立全部特定字詞與該等情緒標籤的關聯;以及根據該關聯,建立該回應預測模型。
於某些實施例中,該儲存器還儲存分別與該等第一樣本文章相關的多組留言內容,且該文章的回應預測方法更包含下列步驟:針對各該第一樣本文章,根據相應的該組留言內容計算一正向情緒分數、一負向情緒分數及一留言熱度指數;針對各該第一樣本文章,根據相應的該留言熱度指數與相應的該正向情緒分數,計算一正向情緒加權分數,且根據相應的該留言熱度指數與相應的該負向情緒分數,計算一負向情緒加權分數;針對各該第一樣本文章,計算相應的該組情緒量值與相應的該正向情緒分數及相應的該組情緒量值與相應的該負向情緒分數之間的相關性;以及針對各該第一樣本文章,根據相應的該相關性、相應的該正向情緒加權分數與相應的該負向情緒加權分數與一組預設情緒量值,計算出相應的該組情緒量值。
於某些實施例中,其中該回應資料包含多個情緒信心值以及分別與該多個情緒信心值相關的多組情緒字詞。
於某些實施例中,其中該儲存器還用以儲存一情緒關鍵字推
薦模型,該輸入介面還用以接收一回應目標,且該文章的回應預測方法更包含下列步驟:判斷該回應資料是否符合該回應目標;以及若該回應資料不符合該回應目標,則根據該情緒關鍵字推薦模型,產生推薦資料,其中該推薦資料與該回應目標相關。
於某些實施例中,其中該儲存器還儲存多個第二樣本文章以及分別與該多組情緒量值相關的多組情緒量值,且該文章的回應預測方法更包含下列步驟:針對各該第二樣本文章,根據相應的該組情緒量值決定一情緒標籤;以及根據該等情緒標籤與該等第二樣本文章,透過機器學習建立該情緒關鍵字推薦模型。
於某些實施例中,該文章的回應預測方法更包含下列步驟:針對各該第二樣本文章,根據相應的該情緒標籤進行一斷詞處理以及一詞性標註處理,以取得多個特定字詞;透過機器學習建立全部特定字詞與該等情緒標籤的關聯;以及根據該關聯,建立該情緒關鍵字推薦模型。
於某些實施例中,其中該推薦資料包含符合該回應目標的關鍵字、文章、與發文型態其中至少一項。
除了上述步驟,第二實施方式亦能執行第一實施方式所描述之預測裝置1之所有運作及步驟,具有同樣之功能,且達到同樣之技術效果。本發明所屬技術領域中具有通常知識者可直接瞭解第二實施方式如何基於上述第一實施方式以執行此等運作及步驟,具有同樣之功能,並達到同樣之技術效果,故不贅述。
需說明者,於本發明專利說明書及申請專利範圍中,某些用語(例如:樣本文章)前被冠以「第一」或「第二」,該等「第一」及「第
二」僅用來區分不同之用語。
綜上所述,本發明所提供之一種文章的回應預測技術(至少包含裝置及方法),根據待測文章之一待測文章內容,透過一回應預測模型來預測該待測文章被閱讀後可能產生之回應,由於該回應預測模型係根據分析大量具有不同類型、且已被評價之樣本文章所產生。透過前述運作,故能達到預測待測文章被閱讀後可能產生之回應,因而解決習知技術無法預測文章所可能產生之回應的技術。此外,當待測文章不符合使用者預期回應目標時,本發明更提供一種推薦技術給使用者與該回應目標相關之推薦資料,以輔助使用者撰寫文章。。
上述實施方式僅用來例舉本發明之部分實施態樣,以及闡釋本發明之技術特徵,而非用來限制本發明之保護範疇及範圍。任何本發明所屬技術領域中具有通常知識者可輕易完成之改變或均等性之安排均屬於本發明所主張之範圍,而本發明之權利保護範圍以申請專利範圍為準。
S301~S305‧‧‧步驟
Claims (20)
- 一種文章的回應預測裝置,包含:一儲存器,儲存一回應預測模型;一輸入介面,用以接收一待測文章;以及一處理器,電性連接至該儲存器及該輸入介面,用以:分析該待測文章以取得一待測文章內容;以及根據該回應預測模型以及該待測文章內容預測該待測文章被閱讀後所產生的一回應,並根據預測的該回應產生一回應資料。
- 如請求項1所述之文章的回應預測裝置,其中該輸入介面更用以接收該待測文章之一待測文章類別,且回應預測模型對應至該待測文章類別。
- 如請求項1所述之文章的回應預測裝置,其中該儲存器還儲存多個第一樣本文章以及分別與該多組情緒量值相關的多組情緒量值,且該處理器還用以:針對各該第一樣本文章,根據相應的該組情緒量值決定一情緒標籤;以及根據該等情緒標籤與該等第一樣本文章,透過機器學習建立該回應預測模型。
- 如請求項3所述之文章的回應預測裝置,其中該處理器還用以:針對各該第一樣本文章,根據相應的該情緒標籤進行一斷詞處理以及一詞性標註處理,以取得多個特定字詞;透過機器學習建立全部特定字詞與該等情緒標籤的關聯;以及根據該關聯,建立該回應預測模型。
- 如請求項3所述之文章的回應預測裝置,其中該儲存器還儲存分別與該等第一樣本文章相關的多組留言內容,且該處理器還用以:針對各該第一樣本文章,根據相應的該組留言內容計算一正向情緒分數、一負向情緒分數及一留言熱度指數;針對各該第一樣本文章,根據相應的該留言熱度指數與相應的該正向情緒分數,計算一正向情緒加權分數,且根據相應的該留言熱度指數與相應的該負向情緒分數,計算一負向情緒加權分數;針對各該第一樣本文章,計算相應的該組情緒量值與相應的該正向情緒分數及相應的該組情緒量值與相應的該負向情緒分數之間的相關性;以及針對各該第一樣本文章,根據相應的該相關性、相應的該正向情緒加權分數與相應的該負向情緒加權分數與一組預設情緒量值,計算出相應的該組情緒量值。
- 如請求項1所述之文章的回應預測裝置,其中該回應資料包含多個情緒信心值以及分別與該多個情緒信心值相關的多組情緒字詞。
- 如請求項1所述之文章的回應預測裝置,其中:該儲存器還用以儲存一情緒關鍵字推薦模型;該輸入介面還用以接收一回應目標;以及該處理器還用以:判斷該回應資料是否符合該回應目標;以及若該回應資料不符合該回應目標,則根據該情緒關鍵字推薦模型,產生推薦資料,其中該推薦資料與該回應目標相關。
- 如請求項7所述之文章的回應預測裝置,其中該儲存器還儲存多個第二樣本文章以及分別與該多組情緒量值相關的多組情緒量值,且該處理器還用以:針對各該第二樣本文章,根據相應的該組情緒量值決定一情緒標籤;以及根據該等情緒標籤與該等第二樣本文章,透過機器學習建立該情緒關鍵字推薦模型。
- 如請求項8所述之文章的回應預測裝置,其中該處理器還用以:針對各該第二樣本文章,根據相應的該情緒標籤進行一斷詞處理以及一詞性標註處理,以取得多個特定字詞;透過機器學習建立全部特定字詞與該等情緒標籤的關聯;以及根據該關聯,建立該情緒關鍵字推薦模型。
- 如請求項7所述之文章的回應預測裝置,其中該推薦資料包含符合該回應目標的關鍵字、文章、與發文型態其中至少一項。
- 一種文章的回應預測方法,適用於一文章的回應預測裝置,該文章的回應預測裝置包含一儲存器、一輸入介面及一處理器,該儲存器儲存一回應預測模型,該輸入介面用以接收一待測文章,該文章的回應預測方法由該處理器所執行且包含下列步驟:分析該待測文章以取得一待測文章內容;以及根據該回應預測模型以及該待測文章內容預測該待測文章被閱讀後所產生的一回應,並根據預測的該回應產生一回應資料。
- 如請求項11所述之文章的回應預測方法,其中該文章的回應預測方法更 包含下列步驟:由該輸入介面,接收該待測文章之一待測文章類別,且回應預測模型對應至該待測文章類別。
- 如請求項11所述之文章的回應預測方法,其中該儲存器還儲存多個第一樣本文章以及分別與該多組情緒量值相關的多組情緒量值,且該文章的回應預測方法更包含下列步驟:針對各該第一樣本文章,根據相應的該組情緒量值決定一情緒標籤;以及根據該等情緒標籤與該等第一樣本文章,透過機器學習建立該回應預測模型。
- 如請求項13所述之文章的回應預測方法,其中該文章的回應預測方法更包含下列步驟:針對各該第一樣本文章,根據相應的該情緒標籤進行一斷詞處理以及一詞性標註處理,以取得多個特定字詞;透過機器學習建立全部特定字詞與該等情緒標籤的關聯;以及根據該關聯,建立該回應預測模型。
- 如請求項13所述之文章的回應預測方法,其中該儲存器還儲存分別與該等第一樣本文章相關的多組留言內容,且該文章的回應預測方法更包含下列步驟:針對各該第一樣本文章,根據相應的該組留言內容計算一正向情緒分數、一負向情緒分數及一留言熱度指數;針對各該第一樣本文章,根據相應的該留言熱度指數與相應的該正 向情緒分數,計算一正向情緒加權分數,且根據相應的該留言熱度指數與相應的該負向情緒分數,計算一負向情緒加權分數;針對各該第一樣本文章,計算相應的該組情緒量值與相應的該正向情緒分數及相應的該組情緒量值與相應的該負向情緒分數之間的相關性;以及針對各該第一樣本文章,根據相應的該相關性、相應的該正向情緒加權分數與相應的該負向情緒加權分數與一組預設情緒量值,計算出相應的該組情緒量值。
- 如請求項11所述之文章的回應預測方法,其中該回應資料包含多個情緒信心值以及分別與該多個情緒信心值相關的多組情緒字詞。
- 如請求項11所述之文章的回應預測方法,其中該儲存器還用以儲存一情緒關鍵字推薦模型,該輸入介面還用以接收一回應目標,且該文章的回應預測方法更包含下列步驟:判斷該回應資料是否符合該回應目標;以及若該回應資料不符合該回應目標,則根據該情緒關鍵字推薦模型,產生推薦資料,其中該推薦資料與該回應目標相關。
- 如請求項17所述之文章的回應預測方法,其中該儲存器還儲存多個第二樣本文章以及分別與該多組情緒量值相關的多組情緒量值,且該文章的回應預測方法更包含下列步驟:針對各該第二樣本文章,根據相應的該組情緒量值決定一情緒標籤;以及根據該等情緒標籤與該等第二樣本文章,透過機器學習建立該情緒 關鍵字推薦模型。
- 如請求項18所述之文章的回應預測方法,該文章的回應預測方法更包含下列步驟:針對各該第二樣本文章,根據相應的該情緒標籤進行一斷詞處理以及一詞性標註處理,以取得多個特定字詞;透過機器學習建立全部特定字詞與該等情緒標籤的關聯;以及根據該關聯,建立該情緒關鍵字推薦模型。
- 如請求項17所述之文章的回應預測方法,其中該推薦資料包含符合該回應目標的關鍵字、文章、與發文型態其中至少一項。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
TW107138819A TWI681308B (zh) | 2018-11-01 | 2018-11-01 | 文章的回應預測裝置及方法 |
CN201811342518.8A CN111126033A (zh) | 2018-11-01 | 2018-11-13 | 文章的回应预测装置及方法 |
US16/203,564 US20200142963A1 (en) | 2018-11-01 | 2018-11-28 | Apparatus and method for predicting response to an article |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
TW107138819A TWI681308B (zh) | 2018-11-01 | 2018-11-01 | 文章的回應預測裝置及方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
TWI681308B TWI681308B (zh) | 2020-01-01 |
TW202018535A true TW202018535A (zh) | 2020-05-16 |
Family
ID=69942396
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW107138819A TWI681308B (zh) | 2018-11-01 | 2018-11-01 | 文章的回應預測裝置及方法 |
Country Status (3)
Country | Link |
---|---|
US (1) | US20200142963A1 (zh) |
CN (1) | CN111126033A (zh) |
TW (1) | TWI681308B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11604927B2 (en) * | 2019-03-07 | 2023-03-14 | Verint Americas Inc. | System and method for adapting sentiment analysis to user profiles to reduce bias |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TWI395201B (zh) * | 2010-05-10 | 2013-05-01 | Univ Nat Cheng Kung | 情緒語音辨識方法及系統 |
US9852239B2 (en) * | 2012-09-24 | 2017-12-26 | Adobe Systems Incorporated | Method and apparatus for prediction of community reaction to a post |
US20180260860A1 (en) * | 2015-09-23 | 2018-09-13 | Giridhari Devanathan | A computer-implemented method and system for analyzing and evaluating user reviews |
CN106055596A (zh) * | 2016-05-23 | 2016-10-26 | 南开大学 | 一种多标签在线新闻读者情绪预测方法 |
US11580350B2 (en) * | 2016-12-21 | 2023-02-14 | Microsoft Technology Licensing, Llc | Systems and methods for an emotionally intelligent chat bot |
CN107315797A (zh) * | 2017-06-19 | 2017-11-03 | 江西洪都航空工业集团有限责任公司 | 一种网络新闻获取及文本情感预测系统 |
CN108121799A (zh) * | 2017-12-21 | 2018-06-05 | 广东欧珀移动通信有限公司 | 回复语句的推荐方法、装置、存储介质及移动终端 |
CN108573411B (zh) * | 2018-04-17 | 2021-09-21 | 重庆理工大学 | 基于用户评论的深度情感分析和多源推荐视图融合的混合推荐方法 |
-
2018
- 2018-11-01 TW TW107138819A patent/TWI681308B/zh active
- 2018-11-13 CN CN201811342518.8A patent/CN111126033A/zh active Pending
- 2018-11-28 US US16/203,564 patent/US20200142963A1/en not_active Abandoned
Also Published As
Publication number | Publication date |
---|---|
US20200142963A1 (en) | 2020-05-07 |
CN111126033A (zh) | 2020-05-08 |
TWI681308B (zh) | 2020-01-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108647205B (zh) | 细粒度情感分析模型构建方法、设备及可读存储介质 | |
KR102288249B1 (ko) | 정보 처리 방법, 단말기, 및 컴퓨터 저장 매체 | |
Seerat et al. | Opinion Mining: Issues and Challenges(A survey) | |
Jusoh et al. | Techniques, applications and challenging issue in text mining | |
Stamatatos | Authorship Verification: A Review of Recent Advances. | |
AU2014204091B2 (en) | Determining product categories by mining chat transcripts | |
Yiran et al. | Aspect-based Sentiment Analysis on mobile phone reviews with LDA | |
Le et al. | Aspect analysis for opinion mining of Vietnamese text | |
WO2023129339A1 (en) | Extracting and classifying entities from digital content items | |
Castillo et al. | Text analysis using different graph-based representations | |
CN115795030A (zh) | 文本分类方法、装置、计算机设备和存储介质 | |
CN113821588A (zh) | 文本处理方法、装置、电子设备及存储介质 | |
Addepalli et al. | A proposed framework for measuring customer satisfaction and product recommendation for ecommerce | |
TWI681308B (zh) | 文章的回應預測裝置及方法 | |
US20230351121A1 (en) | Method and system for generating conversation flows | |
Xu et al. | Product features mining based on Conditional Random Fields model | |
Zhu et al. | Intelligent product redesign strategy with ontology-based fine-grained sentiment analysis | |
Li et al. | Confidence estimation and reputation analysis in aspect extraction | |
Israeli et al. | Unsupervised discovery of non-trivial similarities between online communities | |
Chuttur et al. | Analysing and Plotting Online Customer Emotions Using a Lexicon-Based Approach | |
US10776587B2 (en) | Claim generation | |
Kamineni et al. | Advancements and challenges of using natural language processing in the healthcare sector | |
Samory et al. | Content attribution ignoring content | |
Alsini | Analysis of Real Time Twitter Sentiments using Deep Learning Models | |
Islam et al. | Developing an intelligent system for recommending products |