TWI808015B - 用於判斷網路帳號操控真實性之系統與方法以及用於揭露網路真實評論之系統與方法 - Google Patents

用於判斷網路帳號操控真實性之系統與方法以及用於揭露網路真實評論之系統與方法 Download PDF

Info

Publication number
TWI808015B
TWI808015B TW111137139A TW111137139A TWI808015B TW I808015 B TWI808015 B TW I808015B TW 111137139 A TW111137139 A TW 111137139A TW 111137139 A TW111137139 A TW 111137139A TW I808015 B TWI808015 B TW I808015B
Authority
TW
Taiwan
Prior art keywords
account
manipulation
data
accounts
judgment
Prior art date
Application number
TW111137139A
Other languages
English (en)
Other versions
TW202416159A (zh
Inventor
張博仲
賴威宇
Original Assignee
大數據股份有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 大數據股份有限公司 filed Critical 大數據股份有限公司
Priority to TW111137139A priority Critical patent/TWI808015B/zh
Application granted granted Critical
Publication of TWI808015B publication Critical patent/TWI808015B/zh
Publication of TW202416159A publication Critical patent/TW202416159A/zh

Links

Images

Landscapes

  • Information Transfer Between Computers (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

一種用於揭露網路真實評論之技術(包含系統與方法),係結合一種用於判斷網路帳號操控真實性之技術加以實施。在該方法中,首先擷取用以發佈一網路文章之一目標網路帳號之至少一帳號資料進行分析以初步判斷目標網路帳號是否為非真實性操控帳號;若目標網路帳號在初步判斷時仍未被認定為非真實性操控帳號,則進一步利用與其相關之正向關聯帳號中被判斷為該非真實性操控帳號的比例來進一步確認目標網路帳號是否為非真實性操控帳號。在複數個已註冊帳號被判斷是否為非真實性操控帳號後,消除非真實性操控帳號的留言資料,保留真實留言資料作為至少一網路真實評論。

Description

用於判斷網路帳號操控真實性之系統與方法以及用於揭露網路真實評論之系統與方法
本發明係有關於一種判斷並提升網路資訊真實性的技術,尤其是指一種用於判斷網路帳號操控真實性之系統與方法以及一種用於揭露網路真實評論之方法。
由於網路與社群應用軟體的普及,許多使用者不僅可以將自己對特定事件的評論上傳至網路與社會大眾分享,還可自網路上獲悉社會大眾對於該事件的評論,藉以作為對該事件進行判斷的參考依據。然而,卻也造成部分有心人士藉機企圖利用自己個人單方面的言論影響網路大眾對該事件的看法,進而帶動社會輿論而謀取利益。長此以往,將容易造成社會大眾被不實的言論所蒙蔽而無法真正獲悉該事件的原貌。
在實務上,這些有心人士,經常會在註冊多個網路帳號,並且開發特定的操控軟體來操控多個網路帳號在短時間內批次性大量上傳立場或想法相同或相近的留言(即所謂的洗版或刷版),讓社會大眾將其個人言論誤以為是大多數人的社會輿論,藉此達到其操控輿情的目的。
雖然這樣的問題屢見不鮮,社會大眾也已慢慢習慣這樣的網路評論環境,但是任由其發展,輕者可能會因衍生出更多網路霸凌事件而對心理抗壓性不足的人造成嚴重的心理性傷害,甚至因而輕生;重則可能因為輿論認知的落差,導致政府官員或數會大眾誤判國內外局勢而在不知情或對實情誤解的情況下,作出不當的選擇或決定而影響整個社會未來的健全發展。
以上問題之所以會對社會造成如此大的負面影響,歸究其主因在於現有技術中並不僅未普及性地發展出一種自動過濾非真實性操控帳號的手段,更缺乏有效的留言過濾手段來刪除非真實性操控帳號的所濫發的留言來還原真實輿情。
有鑒於在先前技術中,普遍存在缺乏自動過濾非真實性操控帳號的技術,以及缺乏有效的留言過濾手段來刪除非真實性操控帳號的所濫發的留言來還原真實輿情。為了從根本上有效解決上述種種問題,本案發明人認為不僅有必要開發出一種可判斷網路帳號操控真實性之判斷技術讓所有已註冊帳號的操控真實性可被普及性地廣為社會大眾所知悉,更有必要開發出一種可自動過濾非真實性操控帳號所上傳的留言資料揭露網路真實評論,藉以還原真實的社會輿論,以供社會大眾更客觀地判讀。
具體而言,本發明為了解決先前技術所存在的問題所採用的第一個必要技術手段係提供一種用於判斷網路帳號操控真實性之系統,該系統包含一帳號資料擷取模組、一判斷選擇設定單元、一帳號資料分析模組與一正向關聯帳號分析模組。
帳號資料擷取模組係用以依據一網路文章連結路徑連結至所對應之一網路文章,並擷取用以發佈該網路文章之一目標網路帳號與其至少一帳號資料。判斷選擇設定單元係供一使用者選擇設定一判斷選擇。
帳號資料分析模組係通信連結於帳號資料擷取模組與判斷選擇設定單元以接收判斷選擇,並且包含一資料判斷單元與一支援向量機(support vector machine,SVM)。資料判斷單元係預先建立一基本資料評分規則,其中包含複數個評分項目與一判斷標準分數。在判斷選擇為利用資料判斷單元進行判斷時,係依據帳號資料而分析出對應於所有評分項目之複數個分項得分,將所有分項得分累加成一評估總分,並在評估總分小於判斷標準分數時,將目標網路帳號標記為一非真實性操控帳號。
SVM係具有一分類器,並在判斷選擇為利用SVM進行判斷時,利用分類器對帳號資料進行分類判斷,並在判斷出帳號資料之一分類係屬於高風險類別時,將目標網路帳號標記為非真實性操控帳號。
正向關聯帳號分析模組係通信連結於帳號資料擷取模組與帳號資料分析模組,並用以在目標網路帳號未被帳號資料分析模組標記為屬於非真實性操控帳號時,自帳號資料中擷取L個正向關聯帳號,並在分析出L個正向關聯帳號中被標記為非真實性操控帳號的數量超過一預設判斷比例時,將目標網路帳號亦標記為非真實性操控帳號。
上述的L為任意自然數,目標網路帳號與L個正向關聯帳號皆屬於已進行註冊之複數個已註冊帳號中之一部分。上述的正向關聯帳號包含將目標網路帳號設定為好友、關注、訂閱或追蹤對象之上述已註冊帳號,且所有已註冊帳號中之複數個未被標記為非真實性操控帳號者,係標記為複數個真實性操控帳號。
本發明為了解決先前技術所存在的問題所採用的第二個必要技術手段還提供一種用於判斷網路帳號操控真實性之方法。在該方法中,首先係建構一帳號資料分析模組,並使帳號資料分析模組包含一資料判斷單元與一支援向量機(support vector machine,SVM)。資料判斷單元係預先建立一基本資料評分規則,且基本資料評分規則中包含複數個評分項目與一判斷標準分數。支援向量機(support vector machine,SVM)具有一分類器。
接著,利用一帳號資料擷取模組依據一網路文章連結路徑連結至所對應之一網路文章,並擷取用以發佈該網路文章之一目標網路帳號與其至少一帳號資料。
緊接著,利用帳號資料分析模組依據一判斷選擇而選擇性地利用資料判斷單元或支援向量機判斷出目標網路帳號之一操控真實性。當判斷選擇為利用資料判斷單元進行判斷時,資料判斷單元係依據帳號資料而分析出對應於所有評分項目之複數個分項得分,將分項得分累加成一評估總分,並在評估總分小於判斷標準分數時,將目標網路帳號標記為一非真實性操控帳號。
或者,當判斷選擇為利用SVM進行判斷時,SVM之分類器會自動對帳號資料進行分類判斷,並在判斷出帳號資料之一分類係屬於高風險帳號類別時,將目標網路帳號標記為非真實性操控帳號。
在完成以上的初步判斷後,若目標網路帳號仍未被標記為屬於非真實性操控帳號時,可進續進行以下步驟進一步確認目標網路帳號的操控真實性。在此步驟中,係利用一正向關聯帳號分析模組自帳號資料中擷取L個正向關聯帳號,並在分析出L個正向關聯帳號中被標記為非真實性操控帳號的數量超過一第一預設判斷比例時,將目標網路帳號亦標記為非真實性操控帳號。關於數量L、正向關聯帳號與已註冊帳號的定義,與以上描述者相同,不再予以贅述。
在以上所揭露的第一與第二個必要技術手段的基礎上,可進一步衍生出以下選擇性附屬技術手段。帳號資料擷取模組所擷取之帳號資料包含友人數、追蹤人數、追蹤社群或粉絲專頁、性別資料、暱稱、帳號背景圖片、大頭照、相片數量、電子郵件信箱、手機號碼、居住地址、感情狀態、就讀學校、工作經歷、社群軟體帳號、發文被點讚數、發文被分享數與發文平均字數中之至少一者。
在利用資料判斷單元進行判斷時,所採用的評分項目包含好友人數、追蹤人數、是否追蹤社群或粉絲專頁、是否提供性別資料、是否提供暱稱、是否提供帳號背景圖片、是否提供大頭照、ssr-net模型是否偵測出大頭照為真人、相簿中的相片數量、是否填寫email電子郵件信箱、是否填寫手機號碼、是否填寫居住地址、是否填寫感情狀態、是否填寫就讀學校、是否填寫工作經歷、是否填寫社群軟體帳號、發文被點讚數、發文被分享數與發文平均字數中之至少一者。
在利用SVM之分類器進行判斷時,係依據複分類判斷項目進行分類判斷,所述的分類判斷項目包含好友人數、追蹤人數、是否追蹤社群或粉絲專頁、是否提供性別資料、是否提供暱稱、是否提供帳號背景圖片、是否提供大頭照、ssr-net模型是否偵測出大頭照為真人、公開照片數量、是否填寫email電子郵件信箱、是否填寫手機號碼、是否填寫居住地址、是否填寫感情狀態、是否填寫家人資訊、是否填寫就讀學校、是否填寫工作經歷、是否填寫社群軟體帳號、發文平均被點讚數、發文平均被分享數與發文平均字數與發文平均簡體字數中之至少一者。
較佳者,上述之用於判斷網路帳號操控真實性之系統,更可包含一帳號判斷紀錄資料庫,藉以將所有已標記為非真實性操控帳號與真實性操控帳號之已註冊帳號加以記錄。
更佳者,上述之用於判斷網路帳號操控真實性之系統與方法中,也可進一步再結合以下手段進行更精確地判斷。該手段係利用一帳號活動追蹤模組追蹤目標網路帳號曾在複數個其他網路文章留言之至少一留言資料,目標網路帳號曾留言之其他網路文章係定義為複數個曾留言網路文章,帳號活動追蹤模組更在該些曾留言網路文章的複數個曾留言資料中,比對出曾上傳該些曾留言資料之M個行為相似帳號,並在分析出M個行為相似帳號中被標記為非真實性操控帳號的數量超過一第二預設判斷比例時,將目標網路帳號標記為非真實性操控帳號,其中,行為相似帳號係指在該些曾留言網路文章中,曾與目標帳號同樣有至少K個行為相似留言資料之上述已註冊帳號,該行為相似留言資料係指與目標帳號對於同一上述曾留言網路文章之上述曾留言資料,呈現出相同或相似的情緒,且留言時間差距在T分鐘內之另一上述曾留言資料,且M、K與T皆為任意自然數。
另外,本發明為了解決先前技術所存在的問題所採用的第三個必要技術手段係提供一種用於揭露網路真實評論之系統,其係結合上述之用於判斷網路帳號操控真實性之系統加以實施,並且包含一留言資料擷取模組、一留言資料分析模組、一留言過濾模組與一真實評論資料生成模組。
該留言資料擷取模組係依據網路文章連結路徑連結至所對應之網路文章,並擷取網路文章之複數個原始留言資料。留言資料分析模組係通信連結於留言資料擷取模組,用以分析出上傳原始留言資料之複數個上述已註冊帳號,並加以定義為複數個留言帳號。
留言過濾模組係通信連結於留言資料分析模組,用以消除被標記為非真實性操控帳號之留言帳號所上傳之一部分上述原始留言資料,若經消除後仍有剩餘另一部分之原始留言資料,則將剩餘另一部分之原始留言資料定義為至少一真實留言資料。真實評論資料生成模組,係通信連結於留言過濾模組,用以依據真實留言資料生成至少一真實評論資料以作為至少一網路真實評論。
此外,本發明為了解決先前技術所存在的問題所採用的第四個必要技術手段係提供一種用於揭露網路真實評論之方法,該方法可結合上述的用於判斷網路帳號操控真實性之技術(包含系統及方法)加以實施。在此方法,首先係利用一留言資料擷取模組依據網路文章連結路徑連結至所對應之網路文章,並擷取網路文章之複數個原始留言資料。接著,利用一留言資料分析模組分析出上傳原始留言資料之複數個上述已註冊帳號,並加以定義為複數個留言帳號。
然後,利用一留言過濾模組消除被標記為非真實性操控帳號之留言帳號所上傳之一部分上述原始留言資料,若經消除後仍有剩餘另一部分之上述原始留言資料,則將剩餘另一部分之上述原始留言資料定義為至少一真實留言資料。最後,利用一真實評論資料生成模組依據該至少一真實留言資料生成至少一真實評論資料以作為至少一網路真實評論。
由以上敘述可知,在本發明所提供之用於判斷網路帳號操控真實性之技術(包含系統與方法)中,不僅針對帳號資料本身進行判斷,更結合正向關聯帳號(設定為好友、關注、訂閱或追蹤對象的已註冊帳號),或再進一步結合帳號活動追蹤模組追蹤曾在留言網路文章的已註冊帳號的操控真實性來進行交叉判斷,因此,不僅可自動判斷出許多已註冊帳號的操控真實性,更可藉由累積大量交叉判斷的次數而大幅提升判斷結果的精確性與可信度。
此外,在針對越來越多已註冊帳號完成操控真實性的判斷之後,本發明可進一步將被標記為非真實性操控帳號之留言帳號所上傳之一部分原始留言資料加以消除後,所剩餘的另一部分之原始留言資料都將會是由眾多使用者依照正常操控程序完成上傳的真實留言資料,以真實留言資料所生成之真實評論資料作為網路真實評論,必然也能反映出更真實的社會輿情,進而避免社會大眾對於所關注之事件產生輿情誤判的的機率。
藉由以上較佳具體實施例之詳述,係希望能更加清楚描述本發明之特徵與精神,而並非以上述所揭露的較佳具體實施例來對本發明之範疇加以限制。相反地,其目的是希望能涵蓋各種改變及具相等性的安排於本發明所欲申請之專利範圍的範疇內。
由於本發明所提供之用於判斷網路帳號操控真實性與用於揭露網路真實評論之技術,可廣泛應用於對多種網路平台,其組合實施方式更是不勝枚舉,故在此不再一一贅述,僅列舉其中較佳的四個實施例來加以具體說明。
請參閱第一圖,其係顯示本發明第一實施例所提供之用於判斷網路帳號操控真實性之系統之功能方塊圖。如第一圖所示,一種用於判斷網路帳號操控真實性之系統(以下簡稱「判斷系統」)1包含一帳號資料擷取模組11、一判斷選擇設定單元12、一帳號資料分析模組13、一正向關聯帳號分析模組14、一帳號活動追蹤模組15與一帳號判斷紀錄資料庫16。
帳號資料擷取模組11係用以依據一網路文章連結路徑經由一網際網路100連結至一網頁伺服器200,藉以連結至網路文章連結路徑所對應之一網路文章201,每一網路文章下可能有複數個原始留言資料202,也可能只有一個原始留言資料,也可能完全沒有任何原始留言資料。帳號資料擷取模組11更用以擷取用以發佈網路文章201之一目標網路帳號與其至少一帳號資料。具體而言,帳號資料擷取模組11可為網路爬蟲軟體,如:selenium、scrapy、或API服務蒐集資訊軟體。
較佳者,帳號資料擷取模組11所擷取之帳號資料包含友人數、追蹤人數、追蹤社群或粉絲專頁、性別資料、暱稱、帳號背景圖片、大頭照、相片數量、電子郵件信箱、手機號碼、居住地址、感情狀態、就讀學校、工作經歷、社群軟體帳號、發文被點讚數、發文被分享數與發文平均字數中之至少一者。
判斷選擇設定單元12,可為一判斷選擇方式輸入介面,以供一使用者輸入設定一判斷選擇。帳號資料分析模組13係通信連結於帳號資料擷取模組11與判斷選擇設定單元12以接收使用者所輸入設定之判斷選擇,並且包含一資料判斷單元131與一支援向量機(support vector machine,SVM)132。
資料判斷單元131係預先建立一基本資料評分規則1311,其中包含複數個評分項目與一判斷標準分數。較佳者,評分項目好友人數、追蹤人數、是否追蹤社群或粉絲專頁、是否提供性別資料、是否提供暱稱、是否提供帳號背景圖片、是否提供大頭照、ssr-net模型是否偵測出大頭照為真人、相簿中的相片數量、是否填寫email電子郵件信箱、是否填寫手機號碼、是否填寫居住地址、是否填寫感情狀態、是否填寫就讀學校、是否填寫工作經歷、是否填寫社群軟體帳號、發文被點讚數、發文被分享數與發文平均字數中之至少一者。
在判斷選擇為利用資料判斷單元131進行判斷時,係依據帳號資料而分析出對應於所有評分項目之複數個分項得分。各分項得分可參考表一:
表一:評分項目計分標準
評分項目 計分標準
好友數 +數量*0.5分
追蹤人數 +數量*0.5分
追蹤社群數 +數量*0.1分
追蹤粉專數 +數量*0.1分
相片數量 +Min(數量*5, 30)分
是否填寫生日 若是,+3分
是否填寫性別 若是,+3分
是否填寫暱稱 若是,+3分
是否填設置背景圖片 若是,+10分
是否設置大頭照 若是,+5分
是否被centerface和ssr-net視為真人大頭照 若是,+35分
是否填寫email 若是,+50分
是否填寫手機號碼 若是,+50分
是否填寫地址 若是,+50分
是否填寫感情狀態 若是,+3分
是否填寫感情關係人帳號 若是,+15分
是否填寫家人資訊 若是,+15分
是否填寫居住地 若是,+10分
是否填寫就讀學校 若是,+10分
是否填寫工作經歷 若是,+10分
是否填寫社群軟體帳號 若是,+20分
發文平均按讚數、留言數、分享數 Min(平均按讚數*0.5+平均留言數*1.5+平均分享數*1.5, 20)分
發文平均按讚數與好友數之比例是否低於5% 若是,-好友數量*0.5分
是否包含簡體字 若是,-10分
以下條件是否都成立 (1.)平均發文字數低於1個字 (2.)相片數量少於6 (3.)按讚粉絲專頁數量少於37 若是,-(74+好友數*0.5分+追蹤數*0.5分)分
在資料判斷單元131分析出對應於所有評分項目之分項得分後,資料判斷單元131會將所有分項得分累加成一評估總分,並在評估總分小於判斷標準分數時,將目標網路帳號標記為一非真實性操控帳號,在本實施例中,判斷標準分數可為32分。換言之,在資料判斷單元131判斷出評估總分低於32分時,資料判斷單元131就會將目標網路帳號標記為一非真實性操控帳號。
SVM 132係具有一分類器1321,並在判斷選擇為利用SVM 132進行判斷時,利用分類器1321對帳號資料進行分類判斷,並在判斷出帳號資料之一分類係屬於高風險類別(如非理性類別)時,將目標網路帳號標記為非真實性操控帳號。
在利用SVM 132之分類器1321進行判斷時,係依據複分類判斷項目進行分類判斷,所述的分類判斷項目包含好友人數、追蹤人數、是否追蹤社群或粉絲專頁、是否提供性別資料、是否提供暱稱、是否提供帳號背景圖片、是否提供大頭照、ssr-net模型是否偵測出大頭照為真人、公開照片數量、是否填寫email電子郵件信箱、是否填寫手機號碼、是否填寫居住地址、是否填寫感情狀態、是否填寫家人資訊、是否填寫就讀學校、是否填寫工作經歷、是否填寫社群軟體帳號、發文平均被點讚數、發文平均被分享數與發文平均字數與發文平均簡體字數中之至少一者。由於利用SVM進行分類已是目前常用的現有分類技術,其具體分類方式不再予以贅述。
正向關聯帳號分析模組14係通信連結於帳號資料擷取模組11與帳號資料分析模組13,並用以在目標網路帳號未被帳號資料分析模組13標記為屬於非真實性操控帳號時,自帳號資料中擷取L個正向關聯帳號,並在分析出L個正向關聯帳號中被標記為非真實性操控帳號的數量超過一第一預設判斷比例時,將目標網路帳號亦標記為非真實性操控帳號。
其中,L為任意自然數,目標網路帳號與L個正向關聯帳號皆屬於已進行註冊之複數個已註冊帳號中之一部分。所謂的正向關聯帳號是指與目標網路帳號的使用者,在思想觀念上相似或相近(正相關)可能性較高的帳號,因此,上述的正向關聯帳號包含將目標網路帳號設定為好友、關注、訂閱或追蹤對象之上述已註冊帳號。較佳者,第一預設判斷比例可為50%。實際上,第一預設判斷比例可由使用者依照判斷嚴謹度進行設定,若從嚴認定則可調降第一預設判斷比例,若從寬認定可調升第一預設判斷比例。
舉例而言,若將目標網路帳號設定為好友、關注、訂閱或追蹤對象的已註冊帳號共有100個,只要其中有超過50%的已註冊帳號,也就是其中有超過50個已註冊帳號已被標記為非真實性操控帳號,表示目標網路帳號也極可能是非真實性操控帳號,所以在滿足此條件下,正向關聯帳號分析模組14也會將目標網路帳號標記為非真實性操控帳號。
帳號活動追蹤模組15係追蹤目標網路帳號曾在複數個其他網路文章留言之至少一留言資料,目標網路帳號曾留言之其他網路文章係定義為複數個曾留言網路文章。帳號活動追蹤模組15更在該些曾留言網路文章的複數個曾留言資料中,找出M個行為相似帳號。
所謂的行為相似帳號是指在該些曾留言網路文章中,曾與目標帳號同樣有至少K個行為相似留言資料之已註冊帳號。所謂的行為相似留言資料係指與目標帳號對於同一曾留言網路文章的曾留言資料中,呈現出相同或相似的情緒,且留言時間差距在T分鐘之內的留言資料。接著,在分析出該M個上述行為相似帳號中,被標記為非真實性操控帳號的數量超過一第二預設判斷比例時,將該目標網路帳號標記為非真實性操控帳號,M、K、T為任意自然數。
較佳者,第二預設判斷比例可為50%。實際上,第二預設判斷比例以及K、T可由使用者依照判斷嚴謹度進行設定,若從嚴認定,則可調降第二預設判斷比例,調升K與調降T;反之,若從寬認定可調升第二預設判斷比例,調降K與調升T。
以M=30、K=5與T=10為例,若一個目標網路帳號曾在20篇不同的網路文章底下留言而產生20筆曾留言資料,帳號活動追蹤模組15會分析與目標帳號在時間與文章位置相似的曾留言資料。行為相似留言資料是指任二曾留言資料之間的時間差距相近,以及是否對同一篇文章留言,並有相同或相似的情緒。若兩曾留言資料的留言時間差距在10分鐘內,且是對同一篇文章留言,且經BERT分析模型判斷為相同的非中立情緒,則將此兩曾留言資視同為行為相似留言資料。帳號活動追蹤模組15在上述20筆曾留言資料中分析出5筆曾留言資料滿足以上條件,就表示存在5筆行為相似留言資料,並將存在5筆行為相似留言資料所對應的帳號定義為行為相似帳號。在本實施例中,M=30表示有30個以註冊帳號滿足以上條件而被定義為行為相似帳號。若在30個行為相似帳號中,有超過15個行為相似帳號被標記為非真實性操控帳號,則目標帳號也被標記為非真實性操控帳號。
反之,若經過以上重重分析判斷,目標網路帳號仍未被標記為非真實性操控帳號,則將目標網路帳號標記為真實性操控帳號。以上所述的非真實性操控帳號,是指被自動操控軟體或手段所批次性大量操控的眾多帳號中的一者。由於其極可能是網軍或網路側翼團體用以帶動網路輿論(即俗稱「帶風向」)的網路帳號,故應被快速、有效且精確地判斷出來。反之,若經過以上層層分析判斷,目標網路帳號仍未被標記為非真實性操控帳號,則表示目標網路帳號極可能是由該目標網路帳號的使用者依據其個人意志,透過正常操控方式進行操控的帳號,故應標記為真實性操控帳號。
帳號判斷紀錄資料庫16,係通信連結於帳號資料分析模組13、正向關聯帳號分析模組14與帳號活動追蹤模組15,並用以將已標記為非真實性操控帳號與真實性操控帳號之已註冊帳號加以記錄,因此,在進行越來越多次判斷後,帳號判斷紀錄資料庫16中或記錄越來越多已註冊帳號的操控真實性,以作為後續交叉分析比對之用,或提供給其他分析手段引用判斷結果。
請一併參閱第一圖以及第二A圖至第二C圖,第二A圖至第二C圖係顯示本發明第二實施例所提供之用於判斷網路帳號操控真實性之方法之流程圖。在本發明第二實施例所提供的一種用於判斷網路帳號操控真實性之方法(以下簡稱「判斷方法」)中,首先,係建構一帳號資料分析模組13,並使帳號資料分析模組13包含一資料判斷單元131與一支援向量機(support vector machine,SVM)132。資料判斷單元131係預先建立一基本資料評分規則1311,且基本資料評分規則中包含複數個評分項目與一判斷標準分數。支援向量機(support vector machine,SVM)132具有一分類器1321(步驟S110)。
接著,利用一帳號資料擷取模組11依據一網路文章連結路徑連結至所對應之一網路文章,並擷取用以發佈該網路文章之一目標網路帳號與其至少一帳號資料(步驟S120)。
緊接著,利用帳號資料分析模組13依據一判斷選擇而選擇性地利用資料判斷單元131或SVM 132中判斷出目標網路帳號之一操控真實性。首先,先判斷是否利用資料判斷單元131進行判斷?(步驟S130)若是,則資料判斷單元131係依據帳號資料而分析出對應於所有評分項目之複數個分項得分,將分項得分累加成一評估總分(步驟S140),並判斷評估總分是否小於判斷標準分數?(步驟S150)若評估總分小於判斷標準分數,則將目標網路帳號標記為一非真實性操控帳號(步驟S160)。
回到步驟S130,若不是利用資料判斷單元131進行判斷,則表示使用者選擇利用SVM 132進行判斷,此時,SVM之分類器會自動對帳號資料進行分類判斷(步驟S170),並進一步判斷帳號資料之一分類是否屬於高風險帳號類別?(步驟S180)在判斷出帳號資料之一分類是屬於高風險帳號類別時,將目標網路帳號標記為非真實性操控帳號(步驟S160)。
在完成以上的初步判斷後,若目標網路帳號仍未被標記為屬於非真實性操控帳號時,也就是步驟S150或S180的判斷為否時,可繼續進行後續步驟以進一步確認目標網路帳號的操控真實性。接著,利用一正向關聯帳號分析模組14自帳號資料中擷取L個正向關聯帳號,並分析出L個正向關聯帳號中被標記為非真實性操控帳號的數量(步驟S190),並判斷數量是否超過一第第一預設判斷比例?(步驟S200)若數量超過一第一預設判斷比例,則將目標網路帳號亦標記為非真實性操控帳號(步驟S160)。
若數量未超過第一預設判斷比例,利用帳號活動追蹤模組15追蹤目標網路帳號曾在複數個其他網路文章留言之至少一留言資料,目標網路帳號曾留言之其他網路文章係定義為複數個曾留言網路文章,帳號活動追蹤模組15更在任一曾留言網路文章的複數個曾留言資料中比對出曾上傳該些曾留言資料之M個行為相似帳號,並在分析出M個行為相似帳號中被標記為非真實性操控帳號的數量(步驟S210),並判斷數量是否超過一第二預設判斷比例?(步驟S220)若數量是超過一第二預設判斷比例,則將目標網路帳號亦標記為非真實性操控帳號(步驟S160)。反之,若數量未超過一第二預設判斷比例,則將目標網路帳號標記為真實性操控帳號(步驟S230)。
關於本實施例中所述之帳號資料、判斷標準分數、分項得分、評估總分、SVM 132之分類器1321判斷技術、數量L、數量M、正向關聯帳號、已註冊帳號、行為相似帳號、第一預設判斷比例與第二預設判斷比例等定義,與第一實施例中所描述者相同,以下不再予以贅述。此外,雖然在本實施例中有執行步驟210與步驟220以利用帳號活動追蹤模組15進行進一步的判斷與確認;然而,在實務上,也可選擇不執行步驟210與步驟220。換句話說,在步驟S200中,若數量未超過第一預設判斷比例,也可直接執行步驟S230而將目標網路帳號標記為真實性操控帳號。
請繼續參閱第三圖,其係顯示本發明第三實施例所提供之用於揭露網路真實評論之系統之功能方塊圖。一種用於揭露網路真實評論之系統(以下簡稱「揭露系統」)2係結合上述之判斷系統1加以實施,並且包含一留言資料擷取模組21、一留言資料分析模組22、一留言過濾模組23與一真實評論資料生成模組24。
留言資料擷取模組21係依據一網路文章連結路徑經由一網際網路100連結至一網頁伺服器200,藉以連結至網路文章連結路徑所對應之一網路文章201,每一網路文章下可能有複數個原始留言資料202,也可能只有一個原始留言資料,也可能完全沒有任何原始留言資料。留言資料擷取模組21更擷取複數個原始留言資料202,若只有一個原始留言資料或完全沒有任何原始留言資料時,則缺乏分析意義。
留言資料分析模組22係通信連結於留言資料擷取模組21,用以分析出上傳原始留言資料之複數個已註冊帳號,並加以定義為複數個留言帳號。關於已註冊帳號的定義,係與第一與第二實施例中所定義者相同。
留言過濾模組23係通信連結於留言資料分析模組22,用以消除被判斷系統1標記為非真實性操控帳號(包含被帳號資料分析模組13、正向關聯帳號分析模組14或帳號活動追蹤模組15標記為非真實性操控帳號者)之留言帳號所上傳之一部分原始留言資料,若消除後仍有剩餘另一部分之原始留言資料,留言過濾模組23則會將剩餘另一部分之原始留言資料定義為至少一真實留言資料。真實評論資料生成模組24,係通信連結於留言過濾模組23,用以接收並依據真實留言資料生成至少一真實評論資料以作為至少一網路真實評論而加以揭露。
請繼續參閱第三圖與第四圖,第四圖係顯示本發明第四實施例所提供之用於揭露網路真實評論之系統之流程圖。在本發明第四實施例所提供的一種用於揭露網路真實評論之方法(以下簡稱「揭露方法」)中,係利用留言資料擷取模組21依據網路文章連結路徑連結至所對應之網路文章,並擷取網路文章之複數個原始留言資料(步驟S310)。
接著,利用留言資料分析模組22分析出上傳該些原始留言資料之複數個已註冊帳號,並加以定義為複數個留言帳號(步驟S320)。然後,利用留言過濾模組23消除被標記為非真實性操控帳號之留言帳號所上傳之一部分上述原始留言資料(步驟S330)。
緊接著,判斷仍有剩餘另一部分之原始留言資料(步驟S340)?若仍有剩餘另一部分之上述原始留言資料,則留言過濾模組23將剩餘另一部分之上述原始留言資料定義為至少一真實留言資料(步驟S350)。最後,並利用一真實評論資料生成模組接收並依據真實留言資料生成至少一真實評論資料以作為至少一網路真實評論而加以揭露(步驟S360)。反之,若在(步驟S340)判斷沒有剩餘任何原始留言資料,則視同該網路文章無任何網路真實評論(步驟S370)。
以上所述之判斷系統1與揭露系統2皆可為設置於一電腦裝置或一電腦外接裝置之應用軟體,或可為安裝有相關應用軟體之一電腦裝置或一電腦外接裝置。以上所述之帳號資料擷取模組11、判斷選擇設定單元12、帳號資料分析模組13、資料判斷單元131、基本資料評分規則1311、SVM 132、分類器1321、正向關聯帳號分析模組14、帳號活動追蹤模組15、帳號判斷紀錄資料庫16、留言資料擷取模組21、留言資料分析模組22、留言過濾模組23與真實評論資料生成模組24皆可為該應用軟體中的副程式,或為電腦裝置或電腦外接裝置之局部韌體。
由以上敘述可知,在本發明所提供之用於判斷網路帳號操控真實性之技術(包含上述之判斷系統1與判斷方法)中,不僅針對帳號資料本身進行判斷,更結合正向關聯帳號(設定為好友、關注、訂閱或追蹤對象的已註冊帳號),或再進一步結合帳號活動追蹤模組追蹤曾在留言網路文章的已註冊帳號的操控真實性來進行交叉判斷,因此,不僅可自動判斷出許多已註冊帳號的操控真實性,更可藉由累積大量交叉判斷的次數而大幅提升判斷結果的精確性與可信度。
此外,在針對越來越多已註冊帳號完成操控真實性的判斷之後,本發明所提供的用於揭露網路真實評論之技術(包含揭露系統2與揭露方法)可進一步將被標記為非真實性操控帳號之留言帳號所上傳之一部分原始留言資料加以消除後,所剩餘的另一部分之原始留言資料都將會是由眾多使用者依照正常操控程序完成上傳的真實留言資料,以真實留言資料所生成之真實評論資料作為網路真實評論而加以揭露,必然也能反映出更真實的社會輿情,進而降低社會大眾對於所關注之事件產生輿情誤判的機率。
藉由以上較佳具體實施例之詳述,係希望能更加清楚描述本發明之特徵與精神,而並非以上述所揭露的較佳具體實施例來對本發明之範疇加以限制。相反地,其目的是希望能涵蓋各種改變及具相等性的安排於本發明所欲申請之專利範圍的範疇內。
100:網際網路
200:網頁伺服器
201:網路文章
202:原始留言資料
1:判斷系統
11:帳號資料擷取模組
12:判斷選擇設定單元
13:帳號資料分析模組
131:資料判斷單元
1311:基本資料評分規則
132:SVM
1321:分類器
14:正向關聯帳號分析模組
15:帳號活動追蹤模組
16:帳號判斷紀錄資料庫
2:揭露系統
21:留言資料擷取模組
22:留言資料分析模組
23:留言過濾模組
24:真實評論資料生成模組
S110-S370:步驟
第一圖係顯示本發明第一實施例所提供之用於判斷網路帳號操控真實性之系統之功能方塊圖; 第二A圖至第二C圖係顯示本發明第二實施例所提供之用於判斷網路帳號操控真實性之方法之流程圖; 第三圖係顯示本發明第三實施例所提供之用於揭露網路真實評論之系統之功能方塊圖;以及 第四圖係顯示本發明第四實施例所提供之用於揭露網路真實評論之系統之流程圖。
100:網際網路
200:網頁伺服器
201:網路文章
202:原始留言資料
1:判斷系統
11:帳號資料擷取模組
12:判斷選擇設定單元
13:帳號資料分析模組
131:資料判斷單元
1311:基本資料評分規則
132:SVM
1321:分類器
14:正向關聯帳號分析模組
15:帳號活動追蹤模組
16:帳號判斷紀錄資料庫

Claims (11)

  1. 一種用於判斷網路帳號操控真實性之系統,包含: 一帳號資料擷取模組,係用以依據一網路文章連結路徑連結至所對應之一網路文章,並擷取用以發佈該網路文章之一目標網路帳號與該目標網路帳號之至少一帳號資料; 一判斷選擇設定單元,係供一使用者選擇設定一判斷選擇; 一帳號資料分析模組,係通信連結於該帳號資料擷取模組與該判斷選擇設定單元以接收該判斷選擇,包含: 一資料判斷單元,係預先建立一基本資料評分規則,且該基本資料評分規則中包含複數個評分項目與一判斷標準分數,並在該判斷選擇為利用該資料判斷單元進行判斷時,依據該至少一帳號資料而分析出對應於該些評分項目之複數個分項得分,將該些分項得分累加成一評估總分,並在該評估總分小於該判斷標準分數時,將該目標網路帳號標記為一非真實性操控帳號;以及 一支援向量機(support vector machine,SVM),係具有一分類器,並在該判斷選擇為利用該SVM進行判斷時,利用該分類器對該至少一帳號資料進行分類判斷,並在判斷出該至少一帳號資料之一分類係屬於高風險類別時,將該目標網路帳號標記為該非真實性操控帳號; 一正向關聯帳號分析模組,係通信連結於該帳號資料擷取模組與該帳號資料分析模組,並用以在該目標網路帳號未被該帳號資料分析模組標記為屬於該非真實性操控帳號時,自該至少一帳號資料中擷取L個正向關聯帳號,並在分析出該L個正向關聯帳號中被標記為該非真實性操控帳號的數量超過一第一預設判斷比例時,將該目標網路帳號亦標記為該非真實性操控帳號, 其中,L為任意自然數,該目標網路帳號與該L個正向關聯帳號皆屬於已進行註冊之複數個已註冊帳號中之一部分,該些L個正向關聯帳號包含將該目標網路帳號設定為好友、關注、訂閱或追蹤對象之複數個上述已註冊帳號,且該些已註冊帳號中之複數個未被標記為該非真實性操控帳號者,係標記為複數個真實性操控帳號。
  2. 如請求項1所述之用於判斷網路帳號操控真實性之系統,其中,該帳號資料擷取模組所擷取之該至少一帳號資料包含友人數、追蹤人數、追蹤社群或粉絲專頁、性別資料、暱稱、帳號背景圖片、大頭照、相片數量、電子郵件信箱、手機號碼、居住地址、感情狀態、就讀學校、工作經歷、社群軟體帳號、發文被點讚數、發文被分享數與發文平均字數中之至少一者。
  3. 如請求項1所述之用於判斷網路帳號操控真實性之系統,更包含一帳號活動追蹤模組,該帳號活動追蹤模組係追蹤該目標網路帳號曾在複數個其他網路文章留言之至少一留言資料,該目標網路帳號曾留言之該些其他網路文章係定義為複數個曾留言網路文章,該帳號活動追蹤模組更在該些曾留言網路文章的複數個曾留言資料中,比對出曾上傳該些曾留言資料之M個行為相似帳號,並在分析出該M個行為相似帳號中被標記為該非真實性操控帳號的數量超過一第二預設判斷比例時,將該目標網路帳號標記為該非真實性操控帳號,其中,該M個行為相似帳號係指在該些曾留言網路文章中,曾與目標帳號同樣有至少K個行為相似留言資料之上述已註冊帳號,該K個行為相似留言資料係指與該目標帳號對於同一上述曾留言網路文章之上述曾留言資料,呈現出相同或相似的情緒,且留言時間差距在T分鐘內之另一上述曾留言資料,且M、K與T皆為任意自然數。
  4. 如請求項1所述之用於判斷網路帳號操控真實性之系統,更包含一帳號判斷紀錄資料庫,係用以將已標記為該非真實性操控帳號與該真實性操控帳號之該些已註冊帳號加以記錄。
  5. 一種用於揭露網路真實評論之系統,係結合如請求項1至4中之任一者所述之用於判斷網路帳號操控真實性之系統加以實施,並且包含: 一留言資料擷取模組,係依據該網路文章連結路徑連結至所對應之該網路文章,並擷取該網路文章之複數個原始留言資料; 一留言資料分析模組,係通信連結於該留言資料擷取模組,用以分析出上傳該些原始留言資料之複數個上述已註冊帳號,並加以定義為複數個留言帳號; 一留言過濾模組,係通信連結於該留言資料分析模組,用以消除被標記為該非真實性操控帳號之留言帳號所上傳之一部分上述原始留言資料,若經消除後仍有剩餘另一部分之上述原始留言資料,則將剩餘另一部分之上述原始留言資料定義為至少一真實留言資料;以及 一真實評論資料生成模組,係通信連結於該留言過濾模組,用以接收並依據該至少一真實留言資料生成至少一真實評論資料以作為至少一網路真實評論而加以揭露。
  6. 一種用於判斷網路帳號操控真實性之方法,包含以下步驟: (a) 建構一帳號資料分析模組,並使該帳號資料分析模組包含一資料判斷單元與一支援向量機(support vector machine,SVM),該資料判斷單元係預先建立一基本資料評分規則,且該基本資料評分規則中包含複數個評分項目與一判斷標準分數,該支援向量機(support vector machine,SVM)具有一分類器; (b) 利用一帳號資料擷取模組依據一網路文章連結路徑連結至所對應之一網路文章,並擷取用以發佈該網路文章之一目標網路帳號與該目標網路帳號之至少一帳號資料; (c) 該帳號資料分析模組依據一判斷選擇而選擇性地利用該資料判斷單元與該SVM中之一者判斷出該目標網路帳號之一操控真實性;當該判斷選擇為利用該資料判斷單元進行判斷時,該資料判斷單元係依據該至少一帳號資料而分析出對應於該些評分項目之複數個分項得分,將該些分項得分累加成一評估總分,並在該評估總分小於該判斷標準分數時,將該目標網路帳號標記為一非真實性操控帳號;當該判斷選擇為利用該SVM進行判斷時,該SVM之該分類器對該至少一帳號資料進行分類判斷,並在判斷出該至少一帳號資料之一分類係屬於高風險帳號類別時,將該目標網路帳號標記為該非真實性操控帳號;以及 (d) 在步驟(c)中之該目標網路帳號仍未被標記為屬於該非真實性操控帳號時,利用一正向關聯帳號分析模組自該至少一帳號資料中擷取L個正向關聯帳號,並在分析出該L個正向關聯帳號中被標記為該非真實性操控帳號的數量超過一第一預設判斷比例時,將該目標網路帳號亦標記為該非真實性操控帳號; 其中,L為任意自然數,該目標網路帳號與該L個正向關聯帳號皆屬於已進行註冊之複數個已註冊帳號中之一部分,該些正向關聯帳號包含將該目標網路帳號設定為好友、關注、訂閱或追蹤對象之複數個上述已註冊帳號,且該些已註冊帳號中之複數個未被標記為該非真實性操控帳號者,係標記為複數個真實性操控帳號。
  7. 如請求項6所述之用於判斷網路帳號操控真實性之方法,在該步驟(d)包含一步驟(d1),且該步驟(d1)係利用一帳號活動追蹤模組追蹤該目標網路帳號曾在複數個其他網路文章留言之至少一留言資料,該目標網路帳號曾留言之該些其他網路文章係定義為複數個曾留言網路文章,該帳號活動追蹤模組更在該些曾留言網路文章的複數個曾留言資料中,比對出曾上傳該些曾留言資料之M個行為相似帳號,並在分析出該M個行為相似帳號中被標記為該非真實性操控帳號的數量超過一第二預設判斷比例時,將該目標網路帳號標記為該非真實性操控帳號,其中,該M個行為相似帳號係指在該些曾留言網路文章中,曾與目標帳號同樣有至少K個行為相似留言資料之上述已註冊帳號,該K個行為相似留言資料係指與該目標帳號對於同一上述曾留言網路文章之上述曾留言資料,呈現出相同或相似的情緒,且留言時間差距在T分鐘內之另一上述曾留言資料,且M、K與T皆為任意自然數。
  8. 如請求項6所述之用於判斷網路帳號操控真實性之方法,其中,該步驟(b)中之該帳號資料擷取模組所擷取之該至少一帳號資料包含友人數、追蹤人數、追蹤社群或粉絲專頁、性別資料、暱稱、帳號背景圖片、大頭照、相簿中的相片數量、電子郵件信箱、手機號碼、居住地址、感情狀態、就讀學校、工作經歷、社群軟體帳號、發文被點讚數、發文被分享數與發文平均字數中之至少一者。
  9. 如請求項6所述之用於判斷網路帳號操控真實性之方法,其中,該步驟(c)中之該些評分項目包含好友人數、追蹤人數、是否追蹤社群或粉絲專頁、是否提供性別資料、是否提供暱稱、是否提供帳號背景圖片、是否提供大頭照、ssr-net模型是否偵測出大頭照為真人、相簿中的相片數量、是否填寫email電子郵件信箱、是否填寫手機號碼、是否填寫居住地址、是否填寫感情狀態、是否填寫就讀學校、是否填寫工作經歷、是否填寫社群軟體帳號、發文被點讚數、發文被分享數與發文平均字數中之至少一者。
  10. 如請求項6所述之用於判斷網路帳號操控真實性之方法,其中,該步驟(c)中之該分類器係依據複數個分類判斷項目進行分類判斷,且該些分類判斷項目包含好友人數、追蹤人數、是否追蹤社群或粉絲專頁、是否提供性別資料、是否提供暱稱、是否提供帳號背景圖片、是否提供大頭照、ssr-net模型是否偵測出大頭照為真人、公開照片數量、是否填寫email電子郵件信箱、是否填寫手機號碼、是否填寫居住地址、是否填寫感情狀態、是否填寫家人資訊、是否填寫就讀學校、是否填寫工作經歷、是否填寫社群軟體帳號、發文平均被點讚數、發文平均被分享數與發文平均字數與發文平均簡體字數中之至少一者。
  11. 一種用於揭露網路真實評論之方法,係結合如請求項6至10中之任一者所述之用於判斷網路帳號操控真實性之方法加以實施,並且包含以下步驟: (p) 利用一留言資料擷取模組依據該網路文章連結路徑連結至所對應之該網路文章,並擷取該網路文章之複數個原始留言資料; (q) 利用一留言資料分析模組分析出上傳該些原始留言資料之複數個上述已註冊帳號,並加以定義為複數個留言帳號;以及 (r) 利用一留言過濾模組消除被標記為該非真實性操控帳號之留言帳號所上傳之一部分上述原始留言資料,若經消除後仍有剩餘另一部分之上述原始留言資料,則將剩餘另一部分之上述原始留言資料定義為至少一真實留言資料,並利用一真實評論資料生成模組依據該至少一真實留言資料生成至少一真實評論資料以作為至少一網路真實評論而加以揭露。
TW111137139A 2022-09-30 2022-09-30 用於判斷網路帳號操控真實性之系統與方法以及用於揭露網路真實評論之系統與方法 TWI808015B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
TW111137139A TWI808015B (zh) 2022-09-30 2022-09-30 用於判斷網路帳號操控真實性之系統與方法以及用於揭露網路真實評論之系統與方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
TW111137139A TWI808015B (zh) 2022-09-30 2022-09-30 用於判斷網路帳號操控真實性之系統與方法以及用於揭露網路真實評論之系統與方法

Publications (2)

Publication Number Publication Date
TWI808015B true TWI808015B (zh) 2023-07-01
TW202416159A TW202416159A (zh) 2024-04-16

Family

ID=88149191

Family Applications (1)

Application Number Title Priority Date Filing Date
TW111137139A TWI808015B (zh) 2022-09-30 2022-09-30 用於判斷網路帳號操控真實性之系統與方法以及用於揭露網路真實評論之系統與方法

Country Status (1)

Country Link
TW (1) TWI808015B (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105378790A (zh) * 2013-03-15 2016-03-02 索库里公司 使用社交联网数据的风险评估
TWI579786B (zh) * 2011-12-08 2017-04-21 雅虎股份有限公司 身份引擎
TW201725525A (zh) * 2016-01-15 2017-07-16 林慧隆 基於供需候選推薦以發展深度人際社交網絡的社群系統與方法
TW201935369A (zh) * 2018-02-09 2019-09-01 麟數據科技股份有限公司 意見領袖之網路交易管理方法、系統以及儲存媒體
US20200153836A1 (en) * 2018-11-13 2020-05-14 Paypal, Inc. Fictitious account generation on detection of account takeover conditions
CN111291394A (zh) * 2020-01-31 2020-06-16 腾讯科技(深圳)有限公司 一种虚假信息管理方法、装置和存储介质

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI579786B (zh) * 2011-12-08 2017-04-21 雅虎股份有限公司 身份引擎
CN105378790A (zh) * 2013-03-15 2016-03-02 索库里公司 使用社交联网数据的风险评估
TW201725525A (zh) * 2016-01-15 2017-07-16 林慧隆 基於供需候選推薦以發展深度人際社交網絡的社群系統與方法
CN106981029A (zh) * 2016-01-15 2017-07-25 林慧隆 基于供需候选推荐以发展深度人际社交网络的系统与方法
TW201935369A (zh) * 2018-02-09 2019-09-01 麟數據科技股份有限公司 意見領袖之網路交易管理方法、系統以及儲存媒體
US20200153836A1 (en) * 2018-11-13 2020-05-14 Paypal, Inc. Fictitious account generation on detection of account takeover conditions
CN111291394A (zh) * 2020-01-31 2020-06-16 腾讯科技(深圳)有限公司 一种虚假信息管理方法、装置和存储介质

Also Published As

Publication number Publication date
TW202416159A (zh) 2024-04-16

Similar Documents

Publication Publication Date Title
Ross et al. Measuring the reliability of hate speech annotations: The case of the european refugee crisis
Serrano et al. The rise of Germany's AfD: A social media analysis
Yang et al. Arming the public with artificial intelligence to counter social bots
Kumar et al. Disinformation on the web: Impact, characteristics, and detection of wikipedia hoaxes
US20220101203A1 (en) Training data quality for spam classification
US8886580B2 (en) Classification of digital content using aggregate scoring by a grid load balancer configured to assign content to different content analysis engines based on content identifications of a semantics processor
Lumezanu et al. # bias: Measuring the tweeting behavior of propagandists
Qian et al. Fighting cheapfakes: using a digital media literacy intervention to motivate reverse search of out-of-context visual misinformation
WO2012109580A2 (en) Method and system for interacting and servicing users by orientation
Dootson et al. Managing problematic visual media in natural hazard emergencies
Pickett The Stewart retractions: A quantitative and qualitative analysis
Yang et al. How Twitter data sampling biases US voter behavior characterizations
TWI808015B (zh) 用於判斷網路帳號操控真實性之系統與方法以及用於揭露網路真實評論之系統與方法
US20240080280A1 (en) Understanding social media user behavior
Mebane Jr et al. Observing election incidents in the United States via Twitter: Does who observes matter?
US20210019850A1 (en) Postal Mail Assessment System and Method
CN115471036B (zh) 一种热点事件的群体情绪分析方法、存储介质及设备
US10671654B2 (en) Estimating probability of spreading information by users on micro-weblogs
KR101174192B1 (ko) 서비스 모니터링 시스템 및 방법
Pham et al. Ookpik-A Collection of Out-of-Context Image-Caption Pairs
Gao et al. Leveraging side information for speaker identification with the Enron conversational telephone speech collection
US20200043054A1 (en) Understanding social media user behavior
Evans et al. A Tale of Two Elections: Changes in Candidates’ Tweets During the 2022 Midterm Elections in Virginia
Ahmad et al. Features identification for filtering credible content on Twitter using machine learning techniques
Schiff et al. The Liar’s Dividend: How Deepfakes and Fake News Affect Politician Support and Trust in Media