TWI660283B - Election result prediction method based on computer simulation technology - Google Patents
Election result prediction method based on computer simulation technology Download PDFInfo
- Publication number
- TWI660283B TWI660283B TW107104572A TW107104572A TWI660283B TW I660283 B TWI660283 B TW I660283B TW 107104572 A TW107104572 A TW 107104572A TW 107104572 A TW107104572 A TW 107104572A TW I660283 B TWI660283 B TW I660283B
- Authority
- TW
- Taiwan
- Prior art keywords
- election
- voting
- prediction model
- probability
- influence
- Prior art date
Links
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
基於電腦模擬技術的選舉結果預測方法包括:建立資料庫和地理資訊資料庫;構建設置第一和第二影響手段的選舉預測模型;根據選舉地區內選民的情况及第二影響手段,構建用於表徵一個選民的代理實體以得到選民就各選舉對象的投票機率;選舉預測模型根據資料庫、地理資訊資料庫及第一影響手段,獲得代理實體的投票機率;根據投票機率模擬投票過程,獲得模擬投票資料;統計模擬投票資料並據以修改選舉預測模型,直至差別小於閾值;根據模擬投票資料,獲得選舉預測結果。在模型中更可設置變量參數、規則及對應的資料從而幫助分析競選策略的優劣。
Description
本發明係關於一種電腦模擬分析技術,更特別的是關於一種基於電腦模擬技術的選舉結果預測方法。
選舉是一種具有公認規則的程序形式,人們據此而從所有人或一些人中選擇幾個人一個人擔任一定職務。選舉作為一種政治活動現象,從廣義上說,是指一定的社會成員根據自己的意願,按照一定的程序和方法,選拔、推舉代表或者主要負責人的活動。從狹義上說,選舉僅指選民或者代表根據自己的意志,根據法律規定的原則、程序和方式,選出國家代議機關代表和國家權力機關組成人員的行為。當前對於選舉預測結果預測主要依靠民意調查,隨民意調查廣被媒體採納使用,但該調查手段仍存在諸多缺陷,如:民衆不願意接受民意調查帶來的偏差;受到抽樣形式影響導致的抽樣謬誤;民衆在民意調查中撒謊而帶來的偏差;民衆在投票前臨時修改投票行為而帶來的偏差,或者是改變了其支持的黨派和候選人等等。諸多現實和人為因素影響著民意調查的準確性,對於選舉預測結果的預測不具參考價值。
為了克服現有民意調查手段關於準確性存在嚴重不足的缺陷,本發明提出一種基於電腦模擬技術的選舉結果預測方法。本發明採用代理人基模擬(Agent-Based Modeling,ABM)技術,ABM是一種通過電腦技術進行微觀模擬來揭示宏觀規律的研究方法。在本發明之實施例中,我們通過對歷史選舉資料的分析初步建立了一個用於選舉問題的數學模型並對該模型進行了校驗。隨後,我們將最新資料導入系統中,並根據電腦模擬來推算選舉預測結果。在模擬過程中,每一個選民都將對應一個「代理人」 (agent)。而每個代理人都將受到自身的“人口特徵”(如:年齡、性別、教育、收入水平、地理位置等)以及宏觀因素(如:所在選區選民分布、經濟績效、政治版圖等)影響,從而運算得出該代理人的投票機率。後續再通過電腦多次模擬結果的疊加,最終得到一個趨於穩定的選舉預測結果。
本發明之一種實現方式提出了一種基於電腦模擬技術的選舉結果預測方法,包括如下步驟: 建立資料庫和地理資訊資料庫;所述資料庫儲存選舉對象之資料及選舉對象之歷史選舉預測結果的原始客觀資料,所述地理資訊資料庫用於儲存選舉地區之資料及選舉地區之內部區域分布之資料; 構建選舉預測模型,所述預測模型設置第一影響手段和第二影響手段;所述第一影響手段用於模擬影響選舉預測結果的基礎規則,所述第二影響手段用於模擬影響選舉預測結果的宏觀規則; 根據選舉地區內選民的情况及所述第二影響手段,構建代理實體;所述代理實體用於表徵一個選民,以計算得到選民針對每個選舉對象的投票機率; 所述選舉預測模型根據所述資料庫、所述地理資訊資料庫及所述第一影響手段,獲得所述代理實體的投票機率; 根據投票機率模擬投票過程,獲得模擬投票資料; 統計模擬投票資料,並根據模擬投票資料修改所述選舉預測模型,包括修改所述第一影響手段;基於修改的所述選舉預測模型和所述第一影響手段,疊代獲得至少一次所述代理實體的投票機率及模擬投票資料; 計算至少兩次模擬投票資料之間的差別,若差別小於設定的閾值則進行下一步,若差別大於閾值則進一步檢測和修正所述選舉預測模型繼續疊代,直至差別小於閾值; 根據模擬投票資料,獲得選舉預測結果。
在本發明提出的基於電腦模擬技術的選舉結果預測方法之一實施例中,所述代理實體配置有影響投票機率的基本參數,基本參數包括選民的年齡、性別、教育程度、收入水平、選民的地理位置,所述基本參數更包含經所述資料庫的原始客觀資料統計、分析獲得的行為觸發機率及觸發後的屬性變量。
在本發明提出的基於電腦模擬技術的選舉結果預測方法之一實施例中,所述選舉預測模型採用ABM建立,具體構建過程包括如下步驟: 獲取所構建的所述代理實體,讀取所述代理實體所含有影響投票機率的基本參數; 設定規則集,包含所述第一影響手段和所述第二影響手段; 創建循環更新模組,所述循環更新模組配置所述代理實體的更新方式及規則;所述代理實體基於所述循環更新模組的更新方式及規則並依據所述基本參數中行為觸發機率以觸發相應行為,並完成觸發後的屬性變量的數值更新以計算得到選民針對每個選舉對象的投票機率。
在本發明提出的基於電腦模擬技術的選舉結果預測方法之一些實施例中,投票機率以如下公式(1)、(2)和(3)中之至少一者來表示: P(v
i)=
,其中,T(v
i) = αX
i+ βY
i+ γZ
i+ ...;(1) 在公式(1)中,v
i為該代理人的投票對象,X
i、Y
i、Z
i等為v
i的影響變量,α、β及γ等為變量前的決策參數; P(v
i)=
,其中,T(v
i)= αX
i+ βY
i+ γZ
i+ α
1X
iY
i+ α
2X
iZ
i+ β
1Y
iZ
i+β
2X
iY
iZ
i...;(2) 在公式(2)中,X
i、Y
i、Z
i、X
iY
i、X
iZ
i、Y
iZ
i、X
iY
iZ
i等為影響變量,α、β、γ及α
1、α
2、β
1、β
2等分別為變量及變量組合前的決策參數; P(v
i)=
,其中,T(v
i) = Random (αX
i+ βY
i+ γZ
i+ α
1X
iY
i+ α
2X
iZ
i+ β
1Y
iZ
i+β
2X
iY
iZ
i...);(3) 在公式(3)中,其中,X
i、Y
i、Z
i、X
iY
i、X
iZ
i、Y
iZ
ii、X
iY
iZ
i等為影響變量,α、β、γ及α
1、α
2、β
1、β
2等分別為變量及變量組合的權重,Random為隨機變子,Random = {r
1,r
2,r
3,r
4,r
5...r
n},r
i={pre_condition => [n,m]},pre_condition為該規則的觸發條件,[n,m]為觸發該規則後投票傾向的隨機影響區間。
在本發明提出的基於電腦模擬技術的選舉結果預測方法之一實施例中,統計模擬投票資料之後,根據所述第二影響手段預計模擬投票資料的選後影響。
在本發明提出的基於電腦模擬技術的選舉結果預測方法之一實施例中,進一步根據選後影響修改所述第二影響手段。
在本發明提出的基於電腦模擬技術的選舉結果預測方法之一實施例中,所述第二影響手段根據選舉地區的客觀因素設定調節參數,所述調節參數用於改變所述代理實體的投票機率,所述第二影響手段所採用的客觀因素包括:連任影響因素、執政聲望因素、出席投票因素、社會團結因素、執政威信因素、票倉基本假定因素、代際問題因素、選民遷移因素、執政黨層面因素、候選人層面因素、在野黨層面因素;其中,所述調節因素係可調。
在本發明提出的基於電腦模擬技術的選舉結果預測方法之一實施例中,檢測和修正所述選舉預測模型包括如下步驟: 輸入待檢測的選舉預測模型; 輸入用於校驗所述選舉預測模型的樣本資料; 引入模型評價函數,輸入選舉預測模型和樣本資料,獲得模型偏離值; 引入模型修正函數,在所述選舉預測模型中隨機選取和修正一個影響變量,生成新的選舉預測模型並重新評價獲得新的模型偏離值; 模型偏離值小於閾值則採用新的選舉預測模型;若高於閾值則以機率採用新的選舉預測模型。
本發明的有益效果在於:既有的所有對選舉進行預測均依賴選前民意調查。但是,如上所述,依賴選前民意調查來預測選舉面臨著四個不可克服的缺陷,即選擇性偏差、抽樣謬誤、被調查者撒謊(故意、非故意)、投票行為臨時修改。本發明之實施例基於ABM電腦模擬技術,不依賴任何選前民意調查。不僅如此,依賴選前民意調查來預測選舉無法將微觀(選民層面)的因素和宏觀的因素(比如,執政黨的執政績效等等)有機地結合起來。而ABM電腦模擬技術恰好能夠將微觀因素和宏觀因素有機地結合起來,通過模擬受到宏觀因素影響的微觀行為來獲得最終的宏觀結果(即,選舉預測結果)。此外,對於議會的選舉來說,選區內的選民的構成以及其投票偏好的變化同樣重要。而依賴選前民意調查來預測選舉基本不可能捕捉到如此細微的變化。而我們的ABM電腦模擬平臺還融合了地理資訊系統,因而能夠非常方便地將任何一個選區內的選民的構成以及其投票偏好的變化,從而能夠更加精細和精確地預測選舉預測結果。
為充分瞭解本發明之目的、特徵及功效,茲藉由下述具體之實施例,並配合所附之圖式,對本發明做一詳細說明,說明如後:
如圖1所示,本發明之一實施例的基於電腦模擬技術的選舉結果預測方法包括如下步驟:
建立資料庫和地理資訊資料庫;資料庫儲存選舉對象之資料及選舉對象之歷史選舉預測結果的原始客觀資料,地理資訊資料庫用於儲存選舉地區之資料及選舉地區之內部區域分布之資料。
構建選舉預測模型,預測模型設置第一影響手段和第二影響手段;第一影響手段用於模擬影響選舉預測結果的基礎規則,第二影響手段用於模擬影響選舉預測結果的宏觀規則。
根據選舉地區內選民的情况及第二影響手段,構建代理實體,其中代理實體用於表徵一個選民,以計算得到選民針對每個選舉對象的投票機率;選舉地區內選民的情况,例如是指根據人口普查、教育程度、收入分配、或宏觀經濟等至少一種數據,用於構建虛擬的選民及其特徵。
選舉預測模型根據資料庫、地理資訊資料庫及第一影響手段,獲得代理實體的投票機率。
根據投票機率模擬投票過程,獲得模擬投票資料。
統計模擬投票資料,並根據模擬投票資料修改選舉預測模型,包括修改第一影響手段;基於修改的選舉預測模型和第一影響手段,疊代獲得至少一次代理實體的投票機率及模擬投票資料。
計算至少兩次模擬投票資料之間的差別,若差別小於設定的閾值則進行下一步,若差別大於閾值則進一步檢測和修正選舉預測模型繼續疊代,直至差別小於閾值。
根據模擬投票資料,獲得選舉預測結果。針對不同的選舉,可在模型中設置不同的變量參數、規則及對應的資料來模擬出各競選策略下所獲得的可能結果,從而幫助分析競選策略的優劣。該分析結果可直接為政黨、候選人提供選舉參考及相關諮詢服務。
以下結合各步驟的具體實施例,對本發明技術方案之各種實現方式做詳細闡述。
(構建選舉預測模型)
在構建選舉預測模型之前,先建立資料庫和地理資訊資料庫。資料庫儲存選舉對象及其歷史選舉預測結果的原始客觀資料,地理資訊資料庫用於儲存選舉地區及其內部區域分布。
在構建選舉預測模型時,根據選舉的客觀條件可知,包含有全域地圖、地區、政治勢力及選民4種資訊,具體如下表1。 表1 系統組成
角色 | 定義 | 職責 |
全域地圖 | 選舉區域的地圖為全域地圖 | 全域地圖能夠實時統計當前整個地圖中最新的政治勢力變化、選民投票情况以及各項投票指標 |
地區 | 地圖中每一個縣市分區為一個地區 | 每個地區能夠實時統計當前分區的最新的政治勢力變化、選民投票情况及各項投票指標 |
政治勢力 | 在本次模擬中,政治勢力包括A政黨、B政黨及C黨 | 政治勢力反映了每輪投票結束後政黨的綜合權重,並根據該權重計算該投票中的得票比率 |
選民 | 每一個代理人代表一個或等比縮放後的多個選民 | 選民能夠對自己所傾向的政治勢力進行投票 |
在模擬開始前依次初始化上述4種資訊。全域地圖和地區資訊可從地理資訊資料庫中獲取,政治勢力及其歷史選舉預測結果等可從資料庫中讀取。
本發明實施例中,選舉預測模型採用ABM建立,具體構建過程共包括以下3個部分。
獲取所構建的所述代理實體,在電腦系統中,每個代理實體代理人均包含屬性變量、行為(如選民作為代理人時的投票、棄票等行為)、以及行為觸發後對於屬性變量的影響。
設定包含所述第一影響手段和所述第二影響手段的規則集,對於規則集而言,其主要實現於每個代理人的行為及循環(cycle)更新模組的更新介面中。該規則通常以一定的機率觸發,並根據給定的參數及模型影響代理人及循環全域的變量數值。通過每個循環中每個代理人及全域的行為觸發,從而觸發該類規則集,進而影響代理人行為,並在宏觀中得到反映。
創建循環更新模組,所述循環更新模組配置所述代理實體的更新方式及規則;所述代理實體基於所述循環更新模組的更新方式及規則並依據所述基本參數中行為觸發機率以觸發相應行為,並完成觸發後的屬性變量的數值更新以計算得到選民針對每個選舉對象的投票機率。進一步地,循環更新模組還將記錄全域的資料及屬性更新情况。
(創建代理實體代理人)
在初始化選舉預測模型時,將根據真實的選民人口資料來創建相應的代理實體(下稱,代理人)。在代理人創建過程中,將主要考慮該代理人所包含的影響其投票傾向的屬性。
例如,如下為一個代理人屬性樣例,包括選民群體的年齡構成、性別、教育程度、收入水平、地理位置等資訊,上述資訊從資料庫中獲取。每個不同的選舉預測場景將選取與之相適應的屬性作為代理人的屬性值,如以下表2所示。 表2 個人屬性表樣例
選民個人屬性 | 包含值 |
年齡構成 | 20-26歲,27-43歲,44-65歲,66歲以上 |
性別 | 男性、女性 |
教育程度 | 初中以下、高中及大專、本科及以上 |
收入水平(相對平均值) | 極低、低、中、高、極高 |
地理位置 | 所屬地理位置 |
在賦予個人屬性的過程中,為保證模擬的有效性,採用了隨機賦值的方式,即在多次模擬過程中,每個代理人所被賦予的屬性都為隨機獲得。而不同屬性的疊加也為隨機獲得。在此,隨機函數根據需要可以進行不同的修正及再次定義,使之成為帶有偏好的隨機選擇,從而更加適合預測情况。在多次模擬結果疊加之後,最終的選舉預測結果能夠趨於一個穩定值,這個結果能夠綜合各種隨機情况的影響關係。
(第一影響手段和第二影響手段)
投票規則共由至少兩部分組成:(1)第一影響手段,該手段主要根據選民代理人的個人屬性來計算基礎投票機率。(2)第二影響手段,該規則主要根據宏觀指標來影響最終的投票結果。
例如,在某次選舉中,三個政治勢力的一個樣例如下,其數值表示支持者所佔比例。
(1)第一影響手段(如表3所示) 表3 基礎投票規則
勢力A | 勢力B | 其他勢力 | |
年齡構成 | |||
20-26 | 35.56 | 54.72 | 9.72 |
27-43 | 37.28 | 54.14 | 8.58 |
44-65 | 31.24 | 61.43 | 7.33 |
66以上 | 31.64 | 62.50 | 5.86 |
性別 | |||
男性 | 35.77 | 56.51 | 7.72 |
女性 | 31.35 | 61.04 | 7.61 |
教育構成 | |||
初中以下 | 37.83 | 55.22 | 6.96 |
高中及大專 | 30.65 | 60.96 | 8.39 |
本科 | 32.82 | 59.62 | 6.10 |
本科以上 | 31.26 | 62.64 | 6.10 |
(2)第二影響手段
第二影響手段主要根據宏觀政治情况來確立。最終第二影響手段為一個規則集,且每條規則之間可能存在相應的影響關係。對於選前的宏觀規則而言,其主要影響投票的基礎票倉。對於選後的結果而言,其主要對最終結果進行宏觀調節。
如下為第二影響手段的示例及2012年、2014年、2016年的集樣例。
1. 連任影響:執政黨第一次連任,連任優勢,執政黨增加5%,執政黨第二次連任,選民厭煩,執政黨減少10%。如,2012:A政黨增加5%;2014:A政黨減少10%。
2. 執政聲望:執政黨執政聲望調查,高於70%,執政黨增加5%,低於40%-50%間,執政黨減少3%,低於40%,執政黨減少5%。如,2012:A政黨減少3%;2014:A政黨減少5%。
3. 出席投票:投票率高於80%,A政黨支持者增加5%,介於75-80%,A政黨支持者增加3%,少於70%,B政黨支持者增加3%,少於65%,B政黨支持者增加5%,少於60%,B政黨支持者增加10%。如,2012:74.38%,A政黨支持者增加2%;2016:估計65-70間,B政黨支持者增加3%。
4. 社會團結:選前半年出現重大社會危機,執政黨增加5%。如,2012:未出現;2014:未出現。
5. 執政威信:選前3個月中央政府出現重大執政失誤(可歸責執政黨的重大社會事件),執政黨減少5%。如,2012:未出現;2014:未出現。
除以上規則外,可能的影響規則樣例還包括如下部分:
1. 票倉基本假定 a) B政黨或者B政黨支持者陣營擁有30-35%的基本支持。 b) A政黨或者A政黨支持者陣營擁有30-35%的基本支持。 c) 搖擺選民(swing voter)佔據剩下的40-30%的票數。 d) 搖擺選民對兩個陣營的支持先假定為50-50,而最終的投票取决於政黨和具體的候選人。
2. 是否有代際問題:比如,是否需要假定,每隔四年,A政黨支持者陣營的整體支持率都會下降1-2% 或者0.1-0.2%?
3. 選民的遷移 政總票數層面。
4. 執政黨 a) 大醜聞: i. 在核心支持者中損失支持率為5-10% (也就是說,如果B政黨出現了大醜聞,B政黨的核心支持者將會有放棄支持B政黨,但這不意味著轉投對手的票); ii. 搖擺選民將有60-80%會支持在野黨。 b) 經濟不景氣: i. 在核心支持者中損失支持率為10-12%,或者10-15%? ii. 搖擺選民將有55-60%會支持在野黨。 c) 經濟狀態很好: i. 維持核心支持者的支持(比如98%); ii. 搖擺選民將有55-60%會支持執政黨。
5. 在野黨 a) 大醜聞: i. 在核心支持者中損失支持率為5-10%(也就是說,如果B政黨出現了大醜聞,B政黨的核心支持者將會有放棄支持B政黨,但這不意味著轉投對手的票); ii. 搖擺選民將有60-70%會支持執政黨。 b) 經濟不景氣: i. 維持核心支持者的支持(比如98%); ii. 搖擺選民將有55-60%會支持在野黨。 c) 經濟狀態很好: i. 失去一部分核心支持者的支持(比如5-10%); ii. 搖擺選民將有55-60%會支持執政黨。
候選人層面
6. 候選人來自執政黨 a) 執政黨有大醜聞: i. 候選人在核心支持者中損失支持率為5-10% (同樣,這也這不意味著他們會轉投對手的票); ii. 搖擺選民將有60-80%會支持在野黨的候選人。 b) 經濟不景氣: i. 在核心支持者中損失支持率為10-12%,或者10-15%; ii. 搖擺選民將有55-60%會支持在野黨的候選人。 c) 經濟狀態很好: i. 維持核心支持者的支持(比如98%); ii. 搖擺選民將有55-60%會支持執政黨的候選人。
7. 候選人來自在野黨 a) 在野黨大醜聞: i. 候選人在核心支持者中損失支持率為5-10%(同樣,這也這不意味著他們會轉投對手的票); ii. 搖擺選民將有60-70%會支持執政黨的候選人。 b) 經濟不景氣: i. 維持核心支持者的支持(比如98%); ii. 搖擺選民將有55-60%會支持在野黨的候選人。 c) 經濟狀態很好: i. 失去一部分核心支持者的支持(比如5-10%); ii. 搖擺選民將有55-60%會支持執政黨的候選人。
8. 候選人,無論黨派,如果自身出了大醜聞: a) 候選人本身將失去選舉資格; b) 它的對手黨的候選人自動獲得5-10%的優勢。
9. 候選人,無論黨派,如果自身出了小醜聞,或者醜聞: a) 候選人本身不會失去選舉資格; b) 但是,它的對手黨的候選人自動獲得5%的優勢。
10. 候選人如果是“本省人”,而他的對手是“外省人”,前者相對於後者在搖擺選民中自動獲得5%的優勢。
(模擬投票過程)
所有的代理人構建完成後,將會導入已設定的第一影響手段、第二影響手段及原始客觀資料。在每一次模擬分析過程中,每個選民代理人將根據自身的個人屬性及相關的宏觀規則計算出自身的投票機率。隨後,該代理人將根據計算得出的投票機率進行投票。
任何一個選民最終選擇投票的機率由以下幾個因素決定:天氣(惡劣天氣導致某一個體不投票)、不可預見的突發事件(如,遭遇車禍)、選民自行決定不投票(隨機)。
計算公式和選民具體的投票結果的計算公式類似,且同樣包括三種可能的模型,即:(1)完全綫性模型、(2)包括變量間相互作用的綫性模型、(3)包括變量間相互作用的綫性模型加上隨機變子(具體同代理人投票機率計算部分)。所以,投票機率以如下3種模型的一組或其多組的任意組合表示:
1.完全綫性模型
在該形式中,投票傾向為T(v
i) = αX
i+ βY
i+ γZ
i+ ...。其中,v
i為該代理人的投票對象,X
i、Y
i、Z
i等為v
i的影響變量,α、β及γ等為變量前的決策參數。此時,針對v
1..v
n,其投票機率為:P(v
i)=
。
比如,完全綫性模型中,設某一個體是否投票的機率為P(V=0;1) ,其中1為投票,0為不投票。P(V=0;1)受到三個因素的影響:天氣(X)、突發事件(Y)、隨機決定(Z)。P(V=0;1) = αX + βY+ γZ + ...。X、Y、Z等為P(V=0;1)的影響變量,α、β及γ等為變量前的決策參數。
2.包括變量間相互作用的綫性模型
在該形式中,投票機率由變量及變量組合共同作用,該變量組合可為二元及二元以上,其投票傾向計算形式為: T(v
i)= αX
i+ βY
i+ γZ
i+ α
1X
iY
i+ α
2X
iZ
i+ β
1Y
iZ
i+β
2X
iY
iZ
i...; 其中,X
i、Y
i、Z
i、X
iY
i、X
iZ
i、Y
iZ
i、X
iY
iZ
i等為影響變量,α、β、γ及α
1、α
2、β
1、β
2等分別為變量及變量組合前的決策參數。此時,針對v
1…v
n,其投票機率為:P(v
i)=
。
3.包括變量間相互作用的綫性模型加上隨機變子
在該形式中,投票機率由變量、變量組合及隨機變子共同作用,該變量組合可為二元及二元以上,其投票傾向計算形式為: T(v
i) = Random (αX
i+ βY
i+ γZ
i+ α
1X
iY
i+ α
2X
iZ
i+ β
1Y
iZ
i+β
2X
iY
iZ
i...) ; 其中,X
i、Y
i、Z
i、X
iY
i、X
iZ
i、Y
iZ
ii、X
iY
iZ
i等為影響變量,α、β、γ及α
1、α
2、β
1、β
2等分別為變量及變量組合的權重,Random為隨機變子。該隨機變子由規則集組成,對投票傾向産生獨立影響,其定義形式如下: Random = {r
1,r
2,r
3,r
4,r
5...r
n},其中以隨機因子中的某一項(以r
i表示)為例,設定當隨機因子的某一項超過預想設立的出發條件的閥值區間(以[n,m]表示),即r
i={pre_condition => [n,m]},其中pre_condition為該規則的觸發條件,[n,m]為觸發該規則後投票傾向的隨機影響區間,i為1至n中之任一整數。例如,當[n,m]為[1%,3%]時,該規則表明最終的投票傾向將隨機獲得1%-3%的增量。舉例而言,以至少基於αX
i+ βY
i+ γZ
i+ α
1X
iY
i+ α
2X
iZ
i+ β
1Y
iZ
i+β
2X
iY
iZ
i為自變量之隨機變子Random()可以利用任何合適的方程式或函數來實現。例如,T(v
i) = r
1αX
i+ r
2βY
i+ r
3γZ
i+ r
4α
1X
iY
i+α
2X
iZ
i+ r
6β
1Y
iZ
i+β
2X
iY
iZ
i...。又例如,T(v
i) = r
1αX
i+ r
2βY
i+ r
3γZ
i+ r
4α
1X
iY
i+ r
5α
2X
iZ
i+ r
6β
1Y
iZ
i+ r
7β
2X
iY
iZ
i...。然而,本發明之實現並不受上述例子之限制。
此時,針對v
1..v
n,其投票機率為:P(v
i)=
。
根據上述投票機率模擬投票過程,獲得模擬投票資料。
(統計投票)
統計獲得的模擬投票資料,並根據模擬投票資料修正選舉預測模型,使得包括修改第一影響手段;基於修改的選舉預測模型和第一影響手段,疊代獲得至少一次代理實體的投票機率及模擬投票資料;計算至少兩次模擬投票資料之間的差別,若差別小於設定的閾值則進行下一步,若差別大於閾值則進一步檢測和修正選舉預測模型繼續疊代,直至差別小於閾值。
例如,步驟a:根據8中三種模型算出歷史上的某一次選舉的最終的投票結果,將三種模型的不同結果進行相互比較,並且與歷史中的這一次選舉的真實結果進行比較,挑選滿足以下兩個條件的模型:1)與真實的選舉預測結果最為接近;2)模型給出的結果最為穩定地收斂在某一個相對較小的區間。
步驟b:根據三種模型算出歷史上的某一次選舉的最終的投票結果,將三種模型的不同結果進行相互比較,並且與歷史中的這一次選舉的真實結果以及選民投票後的「投票所出口民調」(exit poll)的結果進行比較。如果在某次選舉中,選舉的真實結果與選民投票後的投票所出口民調的結果非常接近,則選民投票後的投票所出口民調的結果可以作為進一步校正預測模型的坐標之一。如果在某次選舉中,選舉的真實結果與選民投票後的投票所出口民調的結果之間的差別超過閾值(本例中,閾值為5%),則不利用選民投票後的投票所出口民調的結果來修正預測模型(因為顯然,許多選民投票後在回答投票所出口民調的問題時撒了謊,因此,投票所出口民調的結果不可靠)。
其中,上述實施例中修正選舉預測模型的過程具體如下所示: 輸入待檢測的選舉預測模型; 輸入用於校驗選舉預測模型的樣本資料; 引入模型評價函數,輸入選舉預測模型和樣本資料,獲得模型偏離值; 引入模型修正函數,在選舉預測模型中隨機選取和修正一個影響變量,生成新的選舉預測模型並重新評價獲得新的模型偏離值;該部分使用最終得票結果的偏差值為評分值,其計算公式如下: Vari(m,d) =
其中m為待評測模型,d為參與評測的樣本資料,d
k為樣本資料中具體投票項的得票情况,vari(m
k,d
k)為該投票情况中模型所計算出的結果與樣本資料結果兩者的方差。
模型修正函數:
模型修正過程中採用機器學習和人工智能方法實現。該部分可採用如下方法訓練得到變量的參數值,具體使用根據實例來選擇。
1)梯度下降
對於方程模型,我們可以通過梯度下降來訓練得到所需的參數。在該過程中,步長、假設函數及損失函數按照如下方法給定: 步長:直接給定或通過綫性搜索算法來確定步長; 假設函數:將上一節內的三種模型中的前兩種作為假設函數。 損失函數:對於綫性回歸,將樣本的輸出值和假設函數值的差取平方作為損失函數;對於非綫性方程,根據其具體特徵來選取損失函數。
求解過程: (1)給定一個步長大小,設為L; (2)任意給定參數的初始數值θ
1、θ
2……θ
n; (3)使用求偏導數的方法來確定下降的方向T; (4)用步長乘以損失函數得到當前的下降距離; (5)根據確定的下降方向及下降距離來更新參數θ
1 、θ
2……θ
n; (6)若梯度下降距離小於閾值ε,則停止下降;若梯度下降高度大於等於閾值ε,則重複步驟5。
最終,我們通過梯度下降算法可以訓練得到一組局部最優解θ
1、θ
2……θ
n。
2)變種梯度下降
在訓練過程中,我們可以通過批量梯度下降、隨機梯度下降等變種梯度下降來優化模型的訓練,如下:
批量梯度下降:在更新θ
1、θ
2……θ
n參數時,使用全部樣本來進行更新,從而得到全域最優化的解。
隨機梯度下降:主體算法和批量梯度下降一致。其特殊地方在於每次從樣本池中選取一個作為梯度求解的對象,從而大大提高訓練速度。
小批量隨機梯度下降:結合了上兩種梯度下降方法,每次從樣本池中選取k個樣本來進行疊代計算,中和了下降的高效性和模型訓練的有效性。
3)蒙地卡羅
模型參數也可由蒙地卡羅方法求解。該方法在函數已有的模型m基礎上,隨機選取一個影響變量,修正其影響因子從而生成新的模型m’,並對新的模型m’重新評估。對於模型偏離值低於閾值S的,將直接接收該模型。對於偏離值高於S的,將以一定機率接收該模型,以在更大的搜索空間上尋找最優模型。該部分的計算方式如下:
(1)vari(m,d)低於S 直接接收模型m’。
(2)vari(m,d)等於或高於S 以一定的機率接收模型m’,其中接收機率Accept(m)為: Accept(m)= 1/ e^S
3)其他算法
在其他實施例中,同樣可以利用決策樹、貝葉斯模型等來輔助模型的構建,增加模型的有效性和準確性。
步驟b中投票所出口民調(exit poll)資料校驗如下。
對於投票所出口民調與選舉預測結果對比誤差在可接收閾值範圍(由用戶設定,通常設為5%以內)內的投票所出口民調資料,將該資料作為一個新的樣本對模型m進行修正。具體修正算法過程同步驟a。
最終,在多次模擬分析中,不斷地重複修正選舉預測模型,以使得選舉預測模型中的隨機因素逐漸達到一個穩定值。較佳地,可以設置一個終止條件,當模擬達到終止條件時,運行終止。例如,規則可設定為當連續10次的模擬結果穩定在0.5%的誤差範圍內後,將認為該結果達到了穩定,得到最終模擬的模擬投票資料,獲得選舉預測結果。
本發明的一個較佳實施例中,在統計模擬投票資料之後,根據第二影響手段預計模擬投票資料的選後影響,並進一步根據選後影響修改第二影響手段。經修改後的第二影響手段可用於調整代理人的投票機率,亦可對最終選舉預測結果産生獨立影響。舉例如下。
(1)影響構建代理人的基礎票倉因素
在宏觀規則層面,可根據選舉基本情况在選舉前確定其對應的基礎票倉。基礎票倉的指定形式為每個參選政黨分配一定比例的選民作為其基礎票倉,該部分被選中的選民在ABM模擬分析過程中將直接投票給其設定的政黨而無需計算其投票機率。
(2)ABM選後宏觀規則
對於ABM中選民投票後的結果,將使用選後宏觀規則集對最終宏觀投票結果産生獨立影響,其定義形式如下:Random = {r
1,r
2,r
3,r
4,r
5...r
n},其中r
i={pre_condition => [n,m]},其中pre_condition為該規則的觸發條件,[n,m]為觸發該規則後投票傾向的隨機影響區間。例如,當[n,m]為[1%,3%]時,該規則表明最終的投票傾向將隨機獲得1%-3%的增量。該部分同代理人個體的Random隨機變子的規則集定義方式相同。
舉例而言,參考圖1的選舉結果預測方法或上述選舉結果預測方法之任一實施例可以實現用於終端裝置中、個人電腦、伺服器或雲端系統中成為應用程式或應用程式的部分,如以程式模組或子模組實現,亦可以硬體及軟體的組合方式來實現;譬如上述任一實施例中之手段、步驟或模組可以由電腦執行之程式模組來實現,亦可分別由兩台或以上的伺服器來實現,或以雲端運算方式以多台伺服器來實現。
如上所述,依據本發明之選舉結果預測方法之實施例能夠更加精細和精確地預測選舉預測結果,故能有效利用電腦或網路運算資訊,以提升模擬處理效率及節省模擬處理之運算成本,從而避免預測結果之不準備而造成電腦或網路運算資訊之浪費。
本發明在上文中已以較佳實施例揭露,然熟習本項技術者應理解的是,該實施例僅用於描繪本發明,而不應解讀為限制本發明之範圍。應注意的是,舉凡與該實施例等效之變化與置換,均應設為涵蓋於本發明之範疇內。因此,本發明之保護範圍當以申請專利範圍所界定者為準。
無。
[圖1]係為基於電腦模擬技術的選舉結果預測方法的流程圖。
Claims (8)
- 一種基於電腦模擬技術的選舉結果預測方法,包括如下步驟: 建立一資料庫和一地理資訊資料庫,其中該資料庫儲存選舉對象之資料及選舉對象之歷史選舉預測結果的原始客觀資料,該地理資訊資料庫用於儲存選舉地區之資料及選舉地區之內部區域分布之資料; 構建一選舉預測模型,其中該預測模型設置一第一影響手段和一第二影響手段;該第一影響手段用於模擬影響選舉預測結果的基礎規則,該第二影響手段用於模擬影響選舉預測結果的宏觀規則; 根據選舉地區內選民的情况及該第二影響手段,構建一代理實體,其中該代理實體用於表徵一個選民,以計算得到選民針對每個選舉對象的投票機率; 該選舉預測模型根據該資料庫、該地理資訊資料庫及該第一影響手段,獲得該代理實體的投票機率; 根據該投票機率模擬投票過程,獲得模擬投票資料; 統計該模擬投票資料,並根據該模擬投票資料修改該選舉預測模型,該步驟包括修改該第一影響手段;及基於修改的該選舉預測模型和該第一影響手段,疊代獲得至少一次該代理實體的投票機率及模擬投票資料; 計算至少兩次模擬投票資料之間的差別,若該差別小於設定的閾值則進行下一步,若該差別大於該閾值則進一步檢測和修正該選舉預測模型繼續疊代,直至該差別小於該閾值; 根據前述疊代獲得之模擬投票資料,獲得選舉預測結果。
- 如請求項1所述的基於電腦模擬技術的選舉結果預測方法,其中,該代理實體配置有影響投票機率的基本參數,該基本參數包括選民的年齡、性別、教育程度、收入水平、選民的地理位置,該基本參數更包含經該資料庫的原始客觀資料統計、分析獲得的行為觸發機率及觸發後的屬性變量。
- 如請求項2所述的基於電腦模擬技術的選舉結果預測方法,其中,該選舉預測模型採用代理人基模擬(Agent-Based Modeling,ABM)建立,建立該選舉預測模型包括如下步驟: 獲取所構建的該代理實體,讀取該代理實體所含有影響投票機率的基本參數; 設定規則集,包含該第一影響手段和該第二影響手段; 創建循環更新模組,該循環更新模組配置該代理實體的更新方式及規則;該代理實體基於該循環更新模組的更新方式及規則並依據該基本參數中行為觸發機率以觸發相應行為,並完成觸發後的屬性變量的數值更新以計算得到選民針對每個選舉對象的投票機率。
- 如請求項3所述的基於電腦模擬技術的選舉結果預測方法,其中,投票機率以如下公式(1)、(2)和(3)中之至少一者來表示: 公式(1): P(v i)= ,其中,T(v i) 之數值係至少基於αX i+ βY i+ γZ i而產生; 在該公式(1)中,v i為該代理人的投票對象,至少 X i、Y i、Z i為v i的影響變量,至少α、β及γ為變量前的決策參數; 公式(2): P(v i)= ,其中,T(v i) 之數值係至少基於 αX i+ βY i+ γZ i+ α 1X iY i+ α 2X iZ i+ β 1Y iZ i+β 2X iY iZ i而產生; 在該公式(2)中,至少X i、Y i、Z i、X iY i、X iZ i、Y iZ i、X iY iZ i為影響變量,至少α、β、γ及α 1、α 2、β 1、β 2分別為變量及變量組合前的決策參數; 公式(3): P(v i)= ,其中,T(v i) 之數值係至少基於αX i+ βY i+γZ i+ α 1X iY i+ α 2X iZ i+ β 1Y iZ i+β 2X iY iZ i為自變量之隨機變子Random()而產生; 在該公式(3)中,至少X i、Y i、Z i、X iY i、X iZ i、Y iZ ii、X iY iZ i為影響變量,至少α、β、γ及α 1、α 2、β 1、β 2分別為變量及變量組合的權重,Random()為隨機變子,Random = {r 1,r 2,r 3,r 4,r 5...r n}, r i={pre_condition => [n,m]},pre_condition為該規則的觸發條件,[n,m]為觸發該規則後投票傾向的隨機影響區間,i為1至n中之任一整數。
- 如請求項1所述的基於電腦模擬技術的選舉結果預測方法,其中,統計該模擬投票資料之後,該方法更包括:根據該第二影響手段預計模擬投票資料的選後影響。
- 如請求項5所述的基於電腦模擬技術的選舉結果預測方法,其中,該方法更包括:進一步根據選後影響修改該第二影響手段。
- 如請求項1、5或6所述的基於電腦模擬技術的選舉結果預測方法,其中,該第二影響手段根據選舉地區的客觀因素設定調節參數,該調節參數用於改變該代理實體的投票機率,該第二影響手段所採用的該客觀因素包括:連任影響因素、執政聲望因素、出席投票因素、社會團結因素、執政威信因素、票倉基本假定因素、代際問題因素、選民遷移因素、執政黨層面因素、候選人層面因素、在野黨層面因素;其中,該調節因素係可調。
- 如請求項1所述的基於電腦模擬技術的選舉結果預測方法,其中,檢測和修正該選舉預測模型包括如下步驟: 輸入待檢測的選舉預測模型; 輸入用於校驗該選舉預測模型的樣本資料; 引入模型評價函數,輸入選舉預測模型和樣本資料,獲得模型偏離值; 引入模型修正函數,在該選舉預測模型中隨機選取和修正一個影響變量,生成新的選舉預測模型並重新評價獲得新的模型偏離值; 模型偏離值小於閾值則採用新的選舉預測模型;若高於閾值則以機率採用新的選舉預測模型; 模型修正過程中採用機器學習和人工智能方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
TW107104572A TWI660283B (zh) | 2018-02-08 | 2018-02-08 | Election result prediction method based on computer simulation technology |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
TW107104572A TWI660283B (zh) | 2018-02-08 | 2018-02-08 | Election result prediction method based on computer simulation technology |
Publications (2)
Publication Number | Publication Date |
---|---|
TWI660283B true TWI660283B (zh) | 2019-05-21 |
TW201935283A TW201935283A (zh) | 2019-09-01 |
Family
ID=67348971
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW107104572A TWI660283B (zh) | 2018-02-08 | 2018-02-08 | Election result prediction method based on computer simulation technology |
Country Status (1)
Country | Link |
---|---|
TW (1) | TWI660283B (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TW200601103A (en) * | 2004-06-23 | 2006-01-01 | Academia Sinica | Opinion exploration method and system based on a quasi-futures contract transaction platform |
US20100280985A1 (en) * | 2008-01-14 | 2010-11-04 | Aptima, Inc. | Method and system to predict the likelihood of topics |
US20130157737A1 (en) * | 2011-12-18 | 2013-06-20 | Mr. Patrick D. Daly | Online Political Prediction Game |
CN104123377A (zh) * | 2014-07-30 | 2014-10-29 | 福州大学 | 一种微博话题热度预测系统及方法 |
US20170308976A1 (en) * | 2016-04-22 | 2017-10-26 | FiscalNote, Inc. | Systems and methods for predicting future event outcomes based on data analysis |
-
2018
- 2018-02-08 TW TW107104572A patent/TWI660283B/zh active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TW200601103A (en) * | 2004-06-23 | 2006-01-01 | Academia Sinica | Opinion exploration method and system based on a quasi-futures contract transaction platform |
US20100280985A1 (en) * | 2008-01-14 | 2010-11-04 | Aptima, Inc. | Method and system to predict the likelihood of topics |
US20130157737A1 (en) * | 2011-12-18 | 2013-06-20 | Mr. Patrick D. Daly | Online Political Prediction Game |
CN104123377A (zh) * | 2014-07-30 | 2014-10-29 | 福州大学 | 一种微博话题热度预测系统及方法 |
US20170308976A1 (en) * | 2016-04-22 | 2017-10-26 | FiscalNote, Inc. | Systems and methods for predicting future event outcomes based on data analysis |
Also Published As
Publication number | Publication date |
---|---|
TW201935283A (zh) | 2019-09-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11070643B2 (en) | Discovering signature of electronic social networks | |
CN112054943B (zh) | 一种移动网络基站流量预测方法 | |
Anand et al. | Framework for modelling multi-stakeholder city logistics domain using the agent based modelling approach | |
Moya et al. | An agent-based model for understanding the influence of the 11-M terrorist attacks on the 2004 Spanish elections | |
CN109299808B (zh) | 基于群体劝说力建模的网民观点演化趋势预测方法 | |
Gokulkumari et al. | Analyze the political preference of a common man by using data mining and machine learning | |
CN116244513B (zh) | 随机群组poi推荐方法、系统、设备及存储介质 | |
CN108345662B (zh) | 一种考虑用户分布区域差异的签到微博数据加权统计方法 | |
CN112365007A (zh) | 模型参数确定方法、装置、设备及存储介质 | |
CN110377846A (zh) | 社交关系挖掘方法、装置、存储介质和计算机设备 | |
CN115221396A (zh) | 基于人工智能的信息推荐方法、装置及电子设备 | |
CN107368499A (zh) | 一种客户标签建模及推荐方法及装置 | |
Santos et al. | Modeling complex social scenarios using culturally infused social networks | |
TWI660283B (zh) | Election result prediction method based on computer simulation technology | |
CN112115908A (zh) | 一种社交能力评估方法及其装置 | |
CN112364468A (zh) | 一种基于agent社会圈子网络的腐败传播模型建模仿真方法 | |
Giunchiglia et al. | Assessing annotation consistency in the wild | |
Mujtaba et al. | Multi-objective optimization of item selection in computerized adaptive testing | |
Bohner | Decision-support systems for sustainable urban planning | |
CN111324509A (zh) | 一种对应用沉迷的识别方法和装置 | |
CN111078969A (zh) | 一种基于ai的异常人群识别方法 | |
CN114417166B (zh) | 基于行为序列和动态社交影响的连续兴趣点推荐方法 | |
CN113326883B (zh) | 充电站功率利用率预测模型的训练方法、装置及介质 | |
CN116796265A (zh) | 对象分类方法、装置、计算机设备和存储介质 | |
Zheng | Research on point of interest recommendation algorithm based on spatial clustering |