TWI765645B - 財經文本的投資評分方法 - Google Patents

財經文本的投資評分方法 Download PDF

Info

Publication number
TWI765645B
TWI765645B TW110112579A TW110112579A TWI765645B TW I765645 B TWI765645 B TW I765645B TW 110112579 A TW110112579 A TW 110112579A TW 110112579 A TW110112579 A TW 110112579A TW I765645 B TWI765645 B TW I765645B
Authority
TW
Taiwan
Prior art keywords
financial
positive
texts
investment
negative
Prior art date
Application number
TW110112579A
Other languages
English (en)
Other versions
TW202240514A (zh
Inventor
禹良治
彭志翔
Original Assignee
元智大學
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 元智大學 filed Critical 元智大學
Priority to TW110112579A priority Critical patent/TWI765645B/zh
Application granted granted Critical
Publication of TWI765645B publication Critical patent/TWI765645B/zh
Publication of TW202240514A publication Critical patent/TW202240514A/zh

Links

Images

Landscapes

  • Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
  • Machine Translation (AREA)

Abstract

本發明公開一種財經文本的投資評分方法,包含以下步驟:建立情感資料庫,儲存不同的多個財經詞彙及其正負向資料;蒐集多個財經文本,擷取財經文本的財經標題的內容;將財經標題的內容與情感資料庫的多個財經詞彙比較,以分析出各財經文本的財經標題含有哪些財經詞彙;從情感資料庫,取得各財經文本的財經標題的所有財經詞彙的正負向資料;以及依據取得的正負向資料,將財經文本分類為正向還是負向。

Description

財經文本的投資評分方法
本發明涉及金融投資,特別是涉及一種財經文本的投資評分方法。
目前常見的投資理財工具包括了股票、基金、定存、外幣、黃金、期貨及其他衍生性金融商品。種類繁多的理財金融商品各具特性及風險,在這個高度專業化的社會環境中,民眾無法花太多時間研究、分析產業或區域的發展,也難以掌握精深的金融專業知識。
網路投資訊息更新頻率快速,訊息發布端與接受端達到同步狀態,使得投資大眾便利取得且樂於使用,造成網路時代的投資市場資訊流動快速,投資大眾間交流頻繁,但一般人通常沒有能力及時間,即時且完整地掌握網路上大量投資訊息,所以多數投資人最後都會成為雜訊交易者(noise trader),道聽塗說做為投資依據。
本發明所要解決的技術問題在於,針對現有技術的不足提供一種財經文本的投資評分方法,包含以下步驟:建立情感資料庫,儲存不同的多個財經詞彙以及各財經詞彙的正負向資料;蒐集在一日期範圍內的多個財經文本,擷取各財經文本的財經標題的內容;將從財經文本擷取的各財經標 題的內容與情感資料庫的多個財經詞彙比較,以分析出各財經標題含有哪些財經詞彙;取得各財經標題含有的所有財經詞彙的正負向資料,據以判斷各財經詞彙的字意上屬正向還是負向;評估各財經標題的所有財經詞彙屬正向還是負向,以將各財經文本分類為正向或負向;以及綜合分析多個財經文本的分類結果,評估在日期範圍屬於正向還是負向,作為是否進行投資的評估依據。
在一實施方案中,所述財經文本的投資評估方法更包含以下步驟:在情感資料庫中,儲存多個市場區域關鍵字以及各市場區域關鍵字對應的市場區域資料;從情感資料庫查找與各財經文本的財經標題所含有的詞彙相同的市場區域關鍵字,以取得對應的市場區域資料;以及依據所取得的多個市場區域資料,將多個財經文本歸類至不同市場區域。
在一實施方案中,所述財經文本的投資評估方法更包含以下步驟:計算蒐集到的多個財經文本量的總量;計算蒐集到的正向財經文本的數量;以及將正向財經文本的數量,除以蒐集到的多個財經文本量的總量。
在一實施方案中,所述財經文本的投資評估方法更包含以下步驟:依據各財經標題含有的所有財經詞彙的正負向資料,判斷各財經詞彙的文意上屬正向、負向或中立;以及綜合評估各財經標題的所有財經詞彙的文意上屬正向、負向或中立,以將各財經文本分類為正向、負向或中立。
在一實施方案中,所述財經文本的投資評估方法更包含以下步驟:在情感資料庫中,儲存多個財經詞彙分別的多個投資分數;在各財經標題僅含有單個財經詞彙時,取得財經詞彙的投資分數作為具有財經標題的財經文本的分數;以及在各財經標題含有多個財經詞彙時,將多個財經詞彙分別的多個投資分數進行運算,以計算出各財經標題的投資分數。
在一實施方案中,所述財經文本的投資評估方法更包含以下步 驟:依據多個財經詞彙的字意,定義多個財經詞彙分別的多個正負向分數,儲存在情感資料庫中,其中多個正負向分數分別代表多個財經詞彙的正向或負向的程度;計算所有正向的財經文本的正負向分數的總和以取得第一運算值;計算所有負向的財經文本的正負向分數的總和以取得第二運算值;將第一運算值與第二運算值加總以取得第三運算值;以及將第三運算值除以所蒐集的財經文本的數量以計算出投資分數。
在一實施方案中,所述財經文本的投資評估方法更包含以下步驟:依據多個財經詞彙的字意,定義多個財經詞彙分別的多個正負向分數以及分別的多個激動冷靜程度分數,儲存在情感資料庫中,其中多個正負向分數分別代表多個財經詞彙的正向或負向的程度,多個激動冷靜程度分數分別代表多個財經詞彙的冷靜或激動程度;從情感資料庫,查找與正向的各財經文本的財經標題的詞彙相同的財經詞彙,取得所查找到的財經詞彙對應的正負向分數和激動冷靜程度分數;將正向的各財經文本的正負向分數與激動冷靜程度分數相乘以取得第一乘積值;加總所有正向的多個財經文本分別的多個第一乘積值,以取得第一運算總和值;從情感資料庫,查找與負向的各財經文本的財經標題的詞彙相同的財經詞彙對應的正負向分數和激動冷靜程度分數;將負向的各財經文本的正負向分數與激動冷靜程度分數相乘以取得第二乘積值;加總所有負向的多個財經文本分別的多個第二乘積值,以取得第二運算總和值;以及將第一運算總和值與第二運算總和值相加,以計算出投資分數。
在一實施方案中,所述財經文本的投資評估方法更包含以下步驟:從歷史資料集,取得多個歷史多維度投資分數中的最大值和最小值;將多個歷史多維度投資分數中的最大值和最小值相減以取得第一標準化值;將目前計算的投資分數與多個歷史投資分數中的最小值相減以取得第二標準化 值;以及將第二標準化值除以第一標準化值以計算出投資分數。
在一實施方案中,所述財經文本的投資評估方法更包含以下步驟:分析最後計算出的投資分數與所評估的市場區域的參考指數的漲跌點或漲跌幅度的相關性,屬於低度相關、中度相關、高度相關還是完全相關。
在一實施方案中,所述財經文本的投資評估方法更包含以下步驟:採用皮爾森相關係數,計算在日期範圍內所蒐集的多個財經文本的投資分數與所評估的市場區域的參考指數的漲跌點或漲跌幅度的相關度。
S101~S121、S201~S211、S301~S307、S401~S413、S501~S523:步驟
DT:日期
V:Valence值
A:Arousal值
Posnum:正向財經文本量
Negnum:負向財經文本量
PosV:正向財經文本的Valence值
PosA:正向財經文本的Arousal值
NegV:負向財經文本的Valence值
NegA:負向財經文本的Arousal值
PosVA:正向財經文本的Valence和Arousal的乘積值
NegVA:負向財經文本的Valence和Arousal的乘積值
圖1為本發明實施例的財經文本的投資評分方法將財經文本歸類為正向、中立還是負向的步驟流程圖。
圖2為本發明實施例的財經文本的投資評分方法的歸類財經文本所屬的市場區域的步驟流程圖。
圖3為本發明實施例的財經文本的投資評分方法採用類別型情感分析的步驟流程圖。
圖4為本發明實施例的財經文本的投資評分方法採用單維度情感分析的步驟流程圖。
圖5為本發明實施例的財經文本的投資評分方法採用多維度情感分析的步驟流程圖。
圖6為本發明實施例的財經文本的投資評分方法所定義的二維度情感模型的Valence數值的示意圖。
圖7為本發明實施例的財經文本的投資評分方法財蒐集每日的Valence及Arousal數值的表。
請參閱圖1,其為本發明實施例的財經文本的投資評分方法將財經文本歸類為正向、中立還是負向的步驟流程圖。應理解,本文所述步驟可依據實際應用調整步驟內容、執行順序或適當省略步驟。
在步驟S101,建立情感資料庫。
在步驟S103,在情感資料庫中,儲存不同的多個財經詞彙以及各財經詞彙的正負向資料,例如但不限於股市「上漲」財經詞彙屬於正向的資料,以及股市「下跌」財經詞彙屬於負向的資料。
在步驟S105,蒐集不同財經新聞的多個財經文本。
在步驟S107,擷取所蒐集的每個財經文本(例如但不限於電子文本)的財經標題的內容。
在步驟S109,查找情感資料庫。
在步驟S111,將從各財經文本擷取的財經標題的內容與情感資料庫的多個財經詞彙逐一比較,以分析出各財經文本的財經標題中的詞彙是否屬於財經詞彙、各財經標題含有哪些財經詞彙,計算每個財經文本的財經標題所含的財經詞彙量。
在步驟S113,從情感資料庫,取得各財經文本的財經標題含有的所有財經詞彙的正負向資料。
在步驟S115,依據所取得的正負向資料,判斷各財經詞彙的字意上屬正向(positive)或負向(negative),又或是中立(neutural)。
在步驟S117,當各財經標題的財經標題含有多個財經詞彙時,綜合評估各財經標題的所有財經詞彙屬正向或負向,又或是中立。
在步驟S119~S121,將各財經文本分類為正向或負向,又或是中立,作為是否進行投資的評估依據。可將在一日期範圍內,綜合評估所有財經文本的正負向資料,以評估此日期範圍屬於正向或負向,又或是中立。
在金融投資實務上,以「週」作為觀察週期是最佳選擇,因此本實施例採用的日期範圍是以「週」作為單位,但本發明不以此為限。
請參閱圖1和圖2,其中圖2為本發明實施例的財經文本的投資評分方法的歸類財經文本所屬的市場區域的步驟流程圖。
在步驟S201,在情感資料庫儲存不同的多個市場區域關鍵字,以及指示每個市場區域關鍵字屬於哪一市場區域的市場區域資料。所述多個市場區域關鍵字例如但不限於台股、美股、那斯達克、道瓊、標普、陸股、港股、歐股等。所述多個市場區域例如但不限於台灣、美國、大中華區域、亞洲太平洋區域、新興市場以及歐洲。
在步驟S203,將情感資料庫的多個市場區域關鍵字與各財經文本的財經標題的詞彙逐一比對,以分析各財經文本的財經標題含有哪些市場區域關鍵字。
在步驟S205,從情感資料庫查找與各財經文本的財經標題所含有的市場區域關鍵字相對應的市場區域資料。
在步驟S207,依據所取得的多個市場區域資料,將蒐集到的多個財經文本分別歸類至不同市場區域。
在步驟S209,選擇欲分析的市場區域。
在步驟S211,整理出所選擇的市場區域的多個財經文本,並對這些財經文本執行前述步驟S113~S121,以評估屬正向或負向,又或是中立。
請參閱圖3,其中圖3為本發明實施例的財經文本的投資評分方法採用類別型情感分析的步驟流程圖。
在執行步驟S101~S121將蒐集到的所有財經文本分類至正向或負向後,可接著執行以下步驟S301~S307。
在步驟S301,決定採用類別型分析方式。
在步驟S303,計算蒐集到的財經文本的總量。
在步驟S305,計算分類為正向的財經文本的數量。
在步驟S307,將所有正向的財經文本量除以總量,以計算出投資分數。類別型分析方式代表的涵意是,在一日期範圍內的正向財經文本數量占蒐集到的財經文本總量的比例,如果數值越高代表此日期範圍內的大眾投資心態越正向樂觀,此時市場越會出現漲勢。
上述步驟S301~S307所執行的計算可以下列方程式表示:
Figure 110112579-A0305-02-0009-1
其中,SC代表正向的財經文本量占蒐集到的財經文本總量的比例,
Figure 110112579-A0305-02-0009-9
代表正向的財經文本的數量,
Figure 110112579-A0305-02-0009-10
代表負向的財經文本的數量。
上述定義的類別型分析方式,只將情感區分為正向及負向,不考慮正向及負向的程度問題。為了能更準確地評估市場趨勢例如股價走勢,如下更進一步依據正向及負向的程度,在情感資料庫中儲存多個財經詞彙分別的多個投資分數。在各財經標題僅含有單個財經詞彙時,取得財經詞彙的投資分數作為具有財經標題的財經文本的分數。在各財經標題含有多個財經詞彙時,將多個財經詞彙分別的多個投資分數進行運算,如下詳細說明。
請參閱圖4、圖6和圖7,其中圖4為本發明實施例的財經文本的投資評分方法採用單維度情感分析的步驟流程圖。在執行步驟S101~S121將蒐集到的所有財經文本分類至正向或負向後,可接著執行以下步驟S401~S413。
在步驟S401,在情感資料庫中,儲存多個財經詞彙分別的多個投資分數,例如圖6所示的Valence值(正負向分數),Valence值1和9分別表示最負向和最正向的情緒表現,值5表示沒有特定傾向的中性情緒表現。
在步驟S403,決定採用單維度分析方式。本實施例所定義的單維度型投資溫度是以Valence值做為情感區分的依據,Valence值越接近0代表 投資越負向悲觀,例如市場越會出現跌勢,數值越接近1代表投資心態越正向樂觀,例如市場越會出現漲勢。
在步驟S405,計算在一日期範圍(例如一週)內的所有正向的財經文本的Valence值的總和以取得第一運算值。
在步驟S407,計算在此日期範圍內的所有負向的財經文本的Valence值的總和以取得第二運算值。
在步驟S409,將第一運算值加上第二運算值以取得第三運算值。
在步驟S411,將第三運算值除以財經文本的總量,以計算出投資分數。
以圖7所舉例的數據為例,將每日正向財經文本量Posnum乘以代表正向財經文本的Valence值的PosV值,接著將7日正向的乘積值相加:19.8+12.4+122.9+68.805+109.944+120.04+0=453.889,將代表每日的負向財經文本量的Negnum值乘以代表負向財經文本的Valence值的NegV,接著將7日負向的乘積值相加:6.8+0+14.4+7.15+7.2+0+0=35.55,接著將上述兩結果值相加:453.889+35.55=489.439,將此結果值除以正向和負向財經文本量(即Posnum與Negnum欄位值7日總值)以計算出投資分數:489.439÷83=5.897。
若有需要,在執行步驟S411之後,可執行步驟S413,以將步驟S411所計算的第三運算總和值標準化為0至1的數值。上述以下方公式表示:
Figure 110112579-A0305-02-0010-2
其中,SCV代表採用單維度分析方式所計算出的分數值,
Figure 110112579-A0305-02-0010-11
代表正向的財經文本的數量,PosV i 代表正向的Valence值,
Figure 110112579-A0305-02-0010-12
代表負向的財經文本的數量,NegV i 代表負向的Valence值,X為一預設值,此預設值可取決於評估的日期範圍的天數,用於將計算出的SCV值標準化為0至1數值,例如評估的日期範圍為一週時,X設定為8。
請參閱圖5至圖7,其中圖5為本發明實施例的財經文本的投資評分方法採用多維度情感分析的步驟流程圖。在執行步驟S101~S121將蒐集到的所有財經文本分類至正向或負向後,可接著執行以下步驟S501~S523。
在步驟S501,決定採用多維度分析方式。
在步驟S503,在情感資料庫中,儲存多個財經詞彙分別的多個投資分數。舉例而言,本實施例的情感資料庫採用中文情感字典(The Chinese Valence-Arousal Words,CVAW),儲存二維情感模型。
在二維情感模型中,儲存多個財經詞彙以及分別取得於多個財經詞彙的字意的多個投資分數,每個詞彙的投資分數可包含Valence值(即正負向分數)以及Arousal值(即激動冷靜程度分數)。Valence值如前所述。Arousal的範圍例如但不限於定義為1至9,Arousal值1和9時分別表示最平靜或最激動。
以「台股狂瀉近700點」為例,Valence值為1.5,Arousal值為8.5,呈現激動負向的情緒。另外,以「台股重新衝牛市」為例,Valence值為9,Arousal值為8.3,呈現激動正向的情緒。
在步驟S505,查找情感資料庫中,與正向的每個財經文本的財經標題所含有的詞彙相同的財經詞彙,並取得查找到的財經詞彙相對應的Valence值。
在步驟S507,查找情感資料庫中,與正向的財經文本的財經標題所含有的財經詞彙相對應的Arousal值。
在步驟S509,將每個正向財經文本的Valence值與Arousal值相乘,以取得一乘積值。
在步驟S511,加總所有正向財經文本的Valence值與Arousal值的乘積值以計算出第一運算總和值。
在步驟S513,查找情感資料庫中與負向的財經文本的財經標題 所含有的財經詞彙相對應的Valence值。
在步驟S515,查找情感資料庫中與負向的財經文本的財經標題所含有的財經詞彙相對應的Arousal值。
在步驟S517,將每個負向財經文本的Valence值與Arousal值相乘,以取得一乘積值。
在步驟S519,加總所有負向財經文本的Valence值與Arousal值的乘積值以取得第二運算總和值。
在步驟S521,將第一運算總和值與第二運算總和值加總,以計算出投資分數。
上述步驟S505~S521的運算可以下列公式表示:
Figure 110112579-A0305-02-0012-3
其中,X代表採用多維度分析所計算出的投資分數,n為所蒐集的財經文本數量,V代表正向財經文本的Valence值,A代表正向財經文本的Arousal值,PosVA i 代表第一運算總和值,NegVA i 代表第二運算總和值。
在步驟S523,從歷史資料集取得多個歷史多維度投資分數值,例如在所評估的日期範圍(例如當週)以前的多個週分別的多個歷史多維度投資分數。接著,將多個歷史多維度投資分數值中的最大值與最小值相減,以計算出第一標準化值。接著,將目前所評估的日期範圍的多維度投資分數值與多個歷史多維度投資分數中的最小值相減,以計算出第二標準化值。接著,將第一標準化值除以第二標準化值,取得標準化的投資分數。
上述步驟S523的運算可以下列公式表示:
Figure 110112579-A0305-02-0012-4
其中,χ norm 代表標準化的投資分數,χ代表投資分數,χ min χ max 分別代表多個歷史多維度投資分數中的最小值和最大值。
舉例而言,以圖7所列舉的資料為例,計算7日的PosVA的總和值:27.2+10.44+106.475+71.61+110.023+92.458+0=418.206,以及計算7日的NegVA的總和值:-18.64+0+(-27.02)+(-10.905)+(-11.88)+0+0=-68.445。接著,將PosVA的總和值與NegVA的總和值相加:418.206+(-68.445)=349.761。接著,將多個歷史多維度投資分數值中的最大值與最小值相減:341.746-(-2038.1161)=3379.8621以計算出第一標準化值。接著,將此投資分數與最小值與相減:349.761-(-2038.1161)=2387.8771以計算出第二標準化值,將第二標準化值除以第一標準化值:2387.8771÷3379.8621=0.707,得出標準化投資分數為0.707。
最後,可將上述採用類別型、單維度和多維度分析方法所計算出的投資分數與所評估的市場區域的參考指數的漲跌點或漲跌幅度的相關性,屬於低度相關、中度相關、高度相關還是完全相關,以判斷不同分析方法所計算出的投資分數的評估準度。
例如,採用皮爾森相關係數(Pearson product-moment correlation coefficient),計算出投資分數與所評估的市場區域的參考指數的漲跌點或漲跌幅度的相關度,如下公式:
Figure 110112579-A0305-02-0013-5
其中,r代表皮爾森相關係數,Xi為所評估的市場區域的參考指數的漲跌幅或漲跌點,Yi為上述計算出的投資分數,n為取樣的筆數。
皮爾森相關係數的絕對值越趨近於1時,相關性越強,趨近於0時相關性越弱,相關係數為0時,代表兩個變量無關係。例如,相關係數為1.00時,判斷為完全相關;相關係數介於0.70至0.99的範圍內時,判斷為高度相關; 相關係數介於0.40至0.69的範圍內時,判斷為中度相關;相關係數介於0.10至0.39的範圍內時,判斷為低度相關;相關係數小於0.10時,則為微弱或無相關。
經大數據的相關係數運算,可判斷採用多維度分析方法最佳(高度相關),而單維度分析方法又優於類別型分析方法。
綜上所述,本發明提供一種財經文本的投資評分方法,其可協助投資者整理大量財經文本,擷取財經文本的標題內容,並以不同分析方法計算財經文本的正向/負向分數以及冷靜/激動分數,作為預測市場走勢例如股價走勢的依據,投資者可依據分數值評估是否進行投資。
S101~S121:步驟

Claims (4)

  1. 一種財經文本的投資評分方法,適用於協助投資者整理多個財經文本、計算該多個財經文本的投資分數、分析各該財經文本的投資分數與一參考指數的漲跌點或漲跌幅度的相關度,提供給投資者是否進行投資的評估依據,所述的財經文本的投資評分方法包含以下步驟:一情感資料庫儲存不同的多個財經詞彙以及各該財經詞彙的一正負向資料;該情感資料庫儲存依據該多個財經詞彙的字意而定義的該多個財經詞彙分別的多個正負向分數,其中該多個正負向分數分別代表該多個財經詞彙的正向或負向的程度;該情感資料庫更儲存多個市場區域關鍵字以及各該市場區域關鍵字對應的一市場區域資料;擷取各該財經文本的一財經標題的內容;將從該財經文本擷取的各該財經標題的內容與該情感資料庫的該多個財經詞彙比較,以分析出各該財經標題含有哪些該財經詞彙;從該情感資料庫,擷取與各該財經文本的該財經標題的內容所含有的詞彙相同的該市場區域關鍵字對應的該市場區域資料;依據所擷取的該多個財經文本分別的該多個市場區域資料,將該多個財經文本歸類至不同的多個市場區域;取得歸類至欲評估的其中一該市場區域的各該財經標題含有的所有該財經詞彙的該正負向資料,據以判斷各該財經詞彙的字意上屬正向還是負向;評估各該財經標題的所有該財經詞彙屬正向還是負向,以將各該財經文本分類為正向或負向;以及綜合分析該多個財經文本的分類結果,評估在該日期範圍屬 於正向還是負向,提供給投資者作為是否進行投資的評估依據;依據各該財經文本的該財經標題中的各該財經詞彙的字意的正向或負向的程度,從該情感資料庫中取得各該財經文本的各該財經詞彙的該正負向分數,依據該多個財經文本的多個該詞彙的該多個正負向分數以計算出該多個財經文本的投資分數;以下列公式,計算各該財經文本的一皮爾森相關係數:
    Figure 110112579-A0305-02-0016-6
    其中,r代表該皮爾森相關係數,Xi為所評估的該市場區域的一參考指數的漲跌幅或漲跌點,Yi為該多個財經文本的投資分數,n為該多個財經文本取樣的筆數;以及依據各該財經文本的該皮爾森相關係數,分析最後計算出的該多個財經文本的投資分數與所評估的該市場區域的該參考指數的漲跌點或漲跌幅度的相關性,屬於低度相關、中度相關、高度相關還是完全相關,提供給投資者作為是否進行投資的評估依據。
  2. 如請求項1所述的財經文本的投資評分方法,更包含以下步驟:計算所有正向的該財經文本的該正負向分數的總和以取得一第一運算值;計算所有負向的該財經文本的該正負向分數的總和以取得一第二運算值;將該第一運算值與該第二運算值加總以取得一第三運算值;以及 將該第三運算值除以所蒐集的該財經文本的數量以計算出該多個財經文本的投資分數,提供給投資者作為是否進行投資的評估依據。
  3. 如請求項1所述的財經文本的投資評分方法,更包含以下步驟:該情感資料庫儲存依據該多個財經詞彙的字意所定義的該多個財經詞彙分別的多個激動冷靜程度分數,其中該多個激動冷靜程度分數分別代表該多個財經詞彙的冷靜或激動程度;從該情感資料庫,查找與正向的各該財經文本的該財經標題的詞彙相同的該財經詞彙,取得所查找到的該財經詞彙對應的該正負向分數和該激動冷靜程度分數;將正向的各該財經文本的該正負向分數與該激動冷靜程度分數相乘以取得一第一乘積值;加總所有正向的該多個財經文本分別的多個該第一乘積值,以取得一第一運算總和值;從該情感資料庫,查找與負向的各該財經文本的該財經標題的詞彙相同的該財經詞彙對應的該正負向分數和該激動冷靜程度分數;將負向的各該財經文本的該正負向分數與該激動冷靜程度分數相乘以取得一第二乘積值;加總所有負向的該多個財經文本分別的多個該第二乘積值,以取得一第二運算總和值;以及將該第一運算總和值與該第二運算總和值相加,以計算出投資分數,提供給投資者作為是否進行投資的評估依據。
  4. 如請求項3所述的財經文本的投資評分方法,更包含以下步驟:從一歷史資料集,取得多個歷史多維度投資分數中的最大值 和最小值;將該多個歷史多維度投資分數中的最大值和最小值相減以取得一第一標準化值;將目前計算的投資分數與該多個歷史投資分數中的最小值相減以取得一第二標準化值;以及將該第二標準化值除以該第一標準化值以計算出投資分數,提供給投資者作為是否進行投資的評估依據。
TW110112579A 2021-04-07 2021-04-07 財經文本的投資評分方法 TWI765645B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
TW110112579A TWI765645B (zh) 2021-04-07 2021-04-07 財經文本的投資評分方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
TW110112579A TWI765645B (zh) 2021-04-07 2021-04-07 財經文本的投資評分方法

Publications (2)

Publication Number Publication Date
TWI765645B true TWI765645B (zh) 2022-05-21
TW202240514A TW202240514A (zh) 2022-10-16

Family

ID=82594359

Family Applications (1)

Application Number Title Priority Date Filing Date
TW110112579A TWI765645B (zh) 2021-04-07 2021-04-07 財經文本的投資評分方法

Country Status (1)

Country Link
TW (1) TWI765645B (zh)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI409714B (zh) * 2009-12-28 2013-09-21
CN104115178A (zh) * 2011-11-30 2014-10-22 汤姆森路透社全球资源公司 基于新闻和情绪分析来预测市场行为的方法和系统
CN107357860A (zh) * 2017-06-30 2017-11-17 中山大学 一种基于新闻数据的个股情绪汇聚方法
TWI643076B (zh) * 2017-10-13 2018-12-01 Yuan Ze University 金融非結構化文本分析系統及其方法
TW201913516A (zh) * 2017-08-28 2019-04-01 楊少銘 一種金融商品自動化投資分析決策系統及方法
TWI659321B (zh) * 2018-01-19 2019-05-11 Yuan Ze University 產業關聯性分析系統與方法
TWM606390U (zh) * 2020-08-05 2021-01-11 元大證券投資信託股份有限公司 投資組合選擇系統

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI409714B (zh) * 2009-12-28 2013-09-21
CN104115178A (zh) * 2011-11-30 2014-10-22 汤姆森路透社全球资源公司 基于新闻和情绪分析来预测市场行为的方法和系统
CN107357860A (zh) * 2017-06-30 2017-11-17 中山大学 一种基于新闻数据的个股情绪汇聚方法
TW201913516A (zh) * 2017-08-28 2019-04-01 楊少銘 一種金融商品自動化投資分析決策系統及方法
TWI643076B (zh) * 2017-10-13 2018-12-01 Yuan Ze University 金融非結構化文本分析系統及其方法
TWI659321B (zh) * 2018-01-19 2019-05-11 Yuan Ze University 產業關聯性分析系統與方法
TWM606390U (zh) * 2020-08-05 2021-01-11 元大證券投資信託股份有限公司 投資組合選擇系統

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
期刊 彭志翔、禹良治 情感分析於投資溫度評分之應用 第三十二屆自然語言與語音處理研討會Pages 275~289 第三十二屆自然語言與語音處理研討會 2020年9月24~26日 Pages 275~289 *

Also Published As

Publication number Publication date
TW202240514A (zh) 2022-10-16

Similar Documents

Publication Publication Date Title
CN108388660B (zh) 一种改进的电商产品痛点分析方法
CN108509629B (zh) 一种基于情感词典和支持向量机的文本情感分析方法
Kalra et al. Efficacy of news sentiment for stock market prediction
CN112818661B (zh) 一种专利技术关键词非监督提取方法
CN110674296B (zh) 一种基于关键词的资讯摘要提取方法及系统
Urolagin Text mining of tweet for sentiment classification and association with stock prices
CN112419029B (zh) 类金融机构风险监控方法、风险模拟系统及存储介质
CN111738856A (zh) 一种股票舆情投资决策分析方法及装置
Gao et al. Sentiment classification for stock news
Peng Analysis of investor sentiment and stock market volatility trend based on big data strategy
Heyer et al. Modeling the dynamics of domain specific terminology in diachronic corpora
TWI765645B (zh) 財經文本的投資評分方法
Chen et al. A quantitative investment model based on random forest and sentiment analysis
Alamsyah et al. Analyzing employee voice using real-time feedback
CN111598691B (zh) 信用债发债主体违约风险评估方法、系统及装置
CN111209375B (zh) 一种通用的条款与文档匹配方法
Aue et al. Predicting Companies' ESG Ratings from News Articles Using Multivariate Timeseries Analysis
CN111241399A (zh) 一种上市公司关注度的评估方法
Klejdysz et al. Shifts in ECB communication: a text mining approach
Bani-Ismail et al. The effect of full word, stem, and root as index-term on Arabic information retrieval
Afrinanda et al. Comparison of Machine Learning Algorithm Models in Bitcoin Price Sentiment Analysis
Nazar Investor Sentiment Stock Price on Indonesia Stock Exchange
Minhas et al. Linguistic correlates of deception in financial text a corpus linguistics based approach
Cosh Current research themes in software engineering: An application of text mining
ElDin et al. SentiNeural: A Depression Clustering Technique for Egyptian Women Sentiments