CN111125639A - 基于数值回归的双边关系量化分析方法及计算机存储介质 - Google Patents

基于数值回归的双边关系量化分析方法及计算机存储介质 Download PDF

Info

Publication number
CN111125639A
CN111125639A CN201911335383.7A CN201911335383A CN111125639A CN 111125639 A CN111125639 A CN 111125639A CN 201911335383 A CN201911335383 A CN 201911335383A CN 111125639 A CN111125639 A CN 111125639A
Authority
CN
China
Prior art keywords
event
bilateral
score
relation
month
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201911335383.7A
Other languages
English (en)
Inventor
陆辰
王羽
陆宏
姜晓夏
葛唯益
郭成昊
王振宇
荀智德
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
CETC 28 Research Institute
Original Assignee
CETC 28 Research Institute
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by CETC 28 Research Institute filed Critical CETC 28 Research Institute
Priority to CN201911335383.7A priority Critical patent/CN111125639A/zh
Publication of CN111125639A publication Critical patent/CN111125639A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Operations Research (AREA)
  • Probability & Statistics with Applications (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Algebra (AREA)
  • Evolutionary Biology (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于数值回归的双边关系量化分析方法及计算机存储介质,方法包括以下步骤:1)根据以往事件对双边关系影响力的打分数据,使用数值回归的学习方法形成事件打分模型;2)从当月两国交互事件中获得当月两国交互事件分值;3)根据以往双边关系分值及事件数据,结合其中事件分值通过数值回归的学习方法构建双边关系分值计算模型;4)根据当月两国交互事件分值、当月两国交互事件要素、上月双边关系分值和双边关系分值计算模型,进行当月双边关系分值的解算。本发明能够基于当月两国交互事件,结合上月双边关系分值,进行当月双边关系分值的解算,实现两国交互事件及其对双边关系的定量分析,避免专家人工分析带来的主观性影响。

Description

基于数值回归的双边关系量化分析方法及计算机存储介质
技术领域
本发明涉及中外双边关系的量化分析领域,特别是涉及一种基于数值回归的双边关 系量化分析方法及计算机存储介质。
背景技术
针对事件的分析研究最早始于上世纪60年代。其代表性的模型包括阿萨尔(Edward Azar)的“冲突与和平数据库”(Conflict and Peace Data Bank,COPDAB)和麦克里兰 (Charles McClelland)的“世界事件互动测量”(World Event Interaction Survey,WEIS) 等。但当时相关的研究对外交政策并没有产生重大影响。进入90年代之后,美国国家科学基金会资助了“国际关系中的数据发展”(DDIR)项目。马里兰大学的“全球事件 数据体系”(Global Event Data System)就是从这个项目中发展起来,堪萨斯大学开发的 “堪萨斯事件数据系统”(KEDS)也很有影响。这些研究渐渐进入了政策制定领域。本 世纪以来,自然语言处理技术的发展推动了事件抽取的自动化,并直接促成了美国国防 部研制的“全球危机早期预警系统”(ICEWS)。目前该方面最有影响力的工作包括了美 国佐治亚城大学建立的全球新闻整合数据库(Global Database of Events,Languages,and Tone,GDELT),美国国防部构建的ICEWS系统,以及美国Ward Lab等大学机构开展 的相关研究。
GDELT是面向全球的、海量新闻信息分析项目,项目通过监控全世界的广播、报纸、网络新闻及社交媒体,建立了面向全球的海量新闻事件库及知识库;通过构建面向 海量事件数据的多样化可视化服务,实现了海量情报信息的可视化展现,为理解海量情 报信息提供有效支持;通过对海量政治事件的建模分析及关联挖掘,实现了对国际政治 事件的定量研究、趋势预测、分析重演等。
ICEWS通过事件自动提取和编码,形成结构化的事件数据库,基于事件数据,进 行全球政治事件的分析和预测,可以监控、评估、预测可能导致危机(国际和国内危机、 种族和宗教暴力、独立和叛乱等)的主要因素,并为减轻、缓解危机提供建议。
近年来,随着我国地位的上升,我国国际关系学界面临着更大的学术挑战。国内以清华大学国际关系学院为代表,已经在国际关系量化分析方面开展研究工作,但其事件 收集主要依赖人工、事件定量化主要依靠专家打分,通过文本分析等主观判断法加以分 析。然而,该方法自动化程度有限,特别是相关信息系统缺乏。因此创造更多和更可靠 的数据库、研究事件及其对双边关系影响的量化分析方法是提升我国国际关系研究能力 的重要前提。
发明内容
发明目的:本发明要解决的技术问题是提供一种基于数值回归的双边关系量化分析 方法及计算机存储介质,解决了目前缺少自动化分析方法、专家人工进行双边关系分析中主观性和随意性大等问题。
技术方案:本发明所述的基于数值回归的双边关系量化分析方法,包括以下步骤:
(1)根据以往事件对双边关系影响力的打分数据,所述打分数据包括了事件句和事件分值,对事件句进行事件提取和特征选择,结合事件分值使用数值回归的学习方法 形成事件打分模型;
(2)从当月两国交互事件中提取当月两国交互事件要素,进行特征选择,输入到所述事件打分模型中,获得当月两国交互事件分值;
(3)根据以往双边关系分值及事件数据,对其中事件句进行事件提取和特征选择,结合其中事件分值通过数值回归的学习方法构建双边关系分值计算模型;
(4)根据步骤(2)中当月两国交互事件分值、当月两国交互事件要素、上月双边 关系分值和步骤(3)中的双边关系分值计算模型,进行当月双边关系分值的解算。
进一步的,步骤(1)具体为:根据打分数据,将事件发起者的角色和职位、承受 者的角色和职位、事件类型作为影响事件分值的三个要素,将这些要素从事件中抽取出 来,与事件分值建立起对应关系,以事件分值为因变量,发起者的角色和职位、承受者 的角色和职位为自变量,通过最小二乘法,按照事件类型分别进行四元一阶拟合,确定 这些要素的权重和组成关系,进而形成事件打分模型。
进一步的,所述的事件打分模型为,z=ak+bl+cm+dn+e,其中,k为事件发起者的角色,l为事件发起者的职位,m为事件承受者的角色,n为事件承受者的职位,z为事 件分值,a、b、c、d分别为参数的权重,e为事件分值的偏移量。
进一步的,步骤(3)具体为:根据已有的每月双边关系分值以及每月两国交互事件数据库,提取事件要素,结合事件打分模型解算事件分值,从当月不同事件类型发生 次数占比和不同事件分值区间事件次数统计的维度,通过最小二乘法进行多元线性拟合, 构建双边关系分值计算模型。
本发明所述的计算机存储介质,其上存储有计算机程序,所述计算机程序在被计算 机处理器执行时实现上述的方法。
有益效果:本发明能够基于当月两国交互事件,结合上月双边关系分值,进行当月双边关系分值的解算,实现两国交互事件及其对双边关系的定量分析,避免专家人工分 析带来的主观性影响。本发明与现有的国家战略分析软件相结合,能够快速、自动、客 观的根据两国交互事件评估双边关系,降低了个人主观因素对双边关系评估的影响。
附图说明
图1是本实施方式方法的流程图;
图2是事件要素中的事件类型示意图。
具体实施方式
本实施方式的流程如图1所示,首先基于数值回归的学习方法,分别构建事件打分模型、当月双边关系分值解算模型,作为双边关系量化分析的基础。在构建事件打分模 型时,使用专家针对以往事件的打分数据(包含事件句、事件分值)作为依据,将事件 发起者的角色和职位、承受者的角色和职位、事件类型设定为影响事件分值的三个要素, 将这些要素从事件中抽取出来,与事件分值建立起对应关系,输入到数值回归学习算法 中进行训练,进而形成事件打分模型。以已有的每月双边关系分值以及每月两国交互事 件数据库为依据,提取事件要素,结合事件打分模型统计事件类型、分值及次数的统计 信息,与每月双边关系分值建立起对应关系,输入到数值回归学习算法中进行训练,形 成当月双边关系分值解算模型,进而对当月双边关系分值进行解算。具体为:
(1)事件打分模型构建
根据专家针对以往事件的打分数据(包含事件句、事件分值),将事件发起者的角色和职位、承受者的角色和职位、事件类型设定为影响事件分值的三个要素,将这些要 素从事件中抽取出来,与事件分值建立起对应关系,输入到数值回归学习算法中进行训 练,进而形成事件打分模型。其中,由事件发起者、承受者构成的事件参与者,根据属 于单一国家还是跨国分为国内角色和国际间角色两部分,对其分别设计编码,例如表1 和表2所示。
表1国内参与者的角色编码
Figure RE-RE-GDA0002416546890000031
Figure RE-RE-GDA0002416546890000041
表2国际参与者的角色编码
Figure RE-GDA0002416546890000042
对国内、国外事件参与者的职位梳理出共性类型。
事件要素中的事件类型是指人物主体间发生的事件行为,针对实际应用需求,对其 进行裁剪和补充,形成20类事件类型,如图2所示。
将上述事件要素与事件分值建立起对应关系,令事件发起者的角色、职位为k、l,事件承受者的角色、职位为m、n,事件分值为z,a、b、c、d为各要素的权重,e为事 件分值的偏移量,根据z=ak+bl+cm+dn+e,通过最小二乘法进行拟合,确定这些要素的 权重和组成关系,形成事件打分模型。
(2)事件分值解算
对当月两国交互事件,进行事件提取,获得事件发起者的角色和职位、承受者的角色和职位以及事件类型,将其输入到事件打分模型中,获得当月两国交互事件的分值。
(3)双边关系分值计算模型构建
根据已有的每月双边关系分值以及每月两国交互事件数据库,从当月不同事件类型 发生次数占比和不同事件分值区间事件次数统计的维度,共计41个维度,通过最小二乘法进行线性拟合,构建双边关系分值的计算模型。其中,当月不同事件类型发生次数 占比由每一事件类型的当月发生次数除以当月两国交互事件总次数,例如,当月两国交 互事件共有100次,公开声明20次,则公开声明的占比为0.2。另外,事件分值区间在 -10~10之间以1为步长进行设定,即[-10,-9],[-9,-8],[-8,-7],[-7,-6],[-6,-5],[-5,-4], [-4,-3],[-3,-2],[-2,-1],[-1,0],[0,1],[1,2],[2,3],[3,4],[4,5],[5,6],[6,7],[7,8],[8,9], [9,10],每个区间的事件次数根据事件分值解算结果进行统计,例如,当月共发生10个两国交互事件,事件分值分别为7.4、3.6、5.2、6.8、7.5、6.4、-0.2、1.6、-2.6、8.3, 则[-3,-2]区间的事件次数为1,[-1,0]区间的事件次数为1,[1,2]区间的事件次数为1,[3,4] 区间的事件次数为1,[5,6]区间的事件次数为1,[6,7]区间的事件次数为2,[7,8]区间的 事件次数为2,[8,9]区间的事件次数为1,其他区间的事件次数为零。
(4)当月双边关系计算
对当月两国交互各类型事件次数、分值进行统计,将统计信息和上月双边关系分值 输入到当月双边关系分值计算模型中,计算得到当月双边关系分值。
将计算的当月双边关系分值可以提供给现有的国家战略形势分析软件使用,能够展 现国家关系的变化趋势。
本发明实施例如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也 可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实施例的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计 算机、服务器、或者网络设备等)执行本发明各个实施例所述方法的全部或部分。而 前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read Only Memory)、磁碟 或者光盘等各种可以存储程序代码的介质。这样,本发明实例不限制于任何特定的硬件 和软件结合。
相应的,本发明的实施例还提供了一种计算机存储介质,其上存储有计算机程序。当所述计算机程序由处理器执行时,可以实现前述基于数值回归的双边关系量化分析方法。例如,该计算机存储介质为计算机可读存储介质。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面 的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的 计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的 计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每 一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些 计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备 的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的 指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中 指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定 方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指 令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算 机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或 其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

Claims (5)

1.一种基于数值回归的双边关系量化分析方法,其特征在于,包括以下步骤:
(1)根据以往事件对双边关系影响力的打分数据,所述打分数据包括了事件句和事件分值,对事件句进行事件提取和特征选择,结合事件分值使用数值回归的学习方法形成事件打分模型;
(2)从当月两国交互事件中提取当月两国交互事件要素,进行特征选择,输入到所述事件打分模型中,获得当月两国交互事件分值;
(3)根据以往双边关系分值及事件数据,对其中事件句进行事件提取和特征选择,结合其中事件分值通过数值回归的学习方法构建双边关系分值计算模型;
(4)根据步骤(2)中当月两国交互事件分值、当月两国交互事件要素、上月双边关系分值和步骤(3)中的双边关系分值计算模型,进行当月双边关系分值的解算。
2.根据权利要求1所述的基于数值回归的双边关系量化分析方法,其特征在于,步骤(1)具体为:根据打分数据,将事件发起者的角色和职位、承受者的角色和职位、事件类型作为影响事件分值的三个要素,将这些要素从事件中抽取出来,与事件分值建立起对应关系,以事件分值为因变量,发起者的角色和职位、承受者的角色和职位为自变量,通过最小二乘法,按照事件类型分别进行四元一阶拟合,确定这些要素的权重和组成关系,进而形成事件打分模型。
3.根据权利要求2所述的基于数值回归的双边关系量化分析方法,其特征在于:所述的事件打分模型为,z=ak+bl+cm+dn+e,其中,k为事件发起者的角色,l为事件发起者的职位,m为事件承受者的角色,n为事件承受者的职位,z为事件分值,a、b、c、d分别为参数的权重,e为事件分值的偏移量。
4.根据权利要求1所述的基于数值回归的双边关系量化分析方法,其特征在于,步骤(3)具体为:根据已有的每月双边关系分值以及每月两国交互事件数据库,提取事件要素,结合事件打分模型解算事件分值,从当月不同事件类型发生次数占比和不同事件分值区间事件次数统计的维度,通过最小二乘法进行多元线性拟合,构建双边关系分值计算模型。
5.一种计算机存储介质,其上存储有计算机程序,其特征在于:所述计算机程序在被计算机处理器执行时实现权利要求1至4任一项所述的方法。
CN201911335383.7A 2019-12-23 2019-12-23 基于数值回归的双边关系量化分析方法及计算机存储介质 Pending CN111125639A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911335383.7A CN111125639A (zh) 2019-12-23 2019-12-23 基于数值回归的双边关系量化分析方法及计算机存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911335383.7A CN111125639A (zh) 2019-12-23 2019-12-23 基于数值回归的双边关系量化分析方法及计算机存储介质

Publications (1)

Publication Number Publication Date
CN111125639A true CN111125639A (zh) 2020-05-08

Family

ID=70501578

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911335383.7A Pending CN111125639A (zh) 2019-12-23 2019-12-23 基于数值回归的双边关系量化分析方法及计算机存储介质

Country Status (1)

Country Link
CN (1) CN111125639A (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120059771A1 (en) * 2005-06-13 2012-03-08 Von Groll Goetz Financial methodology to valuate and predict the news impact of major events on financial instruments
US20140200958A1 (en) * 2013-01-11 2014-07-17 Sap Ag System and method for categorization of factors to predict demand
WO2016101818A1 (zh) * 2014-12-25 2016-06-30 阿里巴巴集团控股有限公司 一种数据处理方法、装置及系统
CN109299870A (zh) * 2018-09-17 2019-02-01 中国电子科技集团公司第二十八研究所 一种基于事件的国家稳定性评估方法
CN109446513A (zh) * 2018-09-18 2019-03-08 中国电子科技集团公司第二十八研究所 一种基于自然语言理解的文本中事件的抽取方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120059771A1 (en) * 2005-06-13 2012-03-08 Von Groll Goetz Financial methodology to valuate and predict the news impact of major events on financial instruments
US20140200958A1 (en) * 2013-01-11 2014-07-17 Sap Ag System and method for categorization of factors to predict demand
WO2016101818A1 (zh) * 2014-12-25 2016-06-30 阿里巴巴集团控股有限公司 一种数据处理方法、装置及系统
CN109299870A (zh) * 2018-09-17 2019-02-01 中国电子科技集团公司第二十八研究所 一种基于事件的国家稳定性评估方法
CN109446513A (zh) * 2018-09-18 2019-03-08 中国电子科技集团公司第二十八研究所 一种基于自然语言理解的文本中事件的抽取方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
罗学通等: "国家双边关系的定量衡量" *

Similar Documents

Publication Publication Date Title
Liu et al. Exploring livelihood resilience and its impact on livelihood strategy in rural China
Laganà et al. National minorities and their representation in social surveys: which practices make a difference?
Pridemore et al. Reduction in male suicide mortality following the 2006 Russian alcohol policy: an interrupted time series analysis
Neylan Social policy and the authority of evidence
Boo et al. A note on happiness and life satisfaction in Malaysia
Aydin et al. The consequences of ignoring variability in measurement occasions within data collection waves in latent growth models
Rai et al. Estimated verbal IQ and the odds of problem gambling: A population-based study
Walters African population history: Contributions of moral demography
CN105405051B (zh) 金融事件预测方法和装置
ALTAY et al. The impacts of political terrorism on gross domestic product in Eurasia: A spatial data analysis
CN111125639A (zh) 基于数值回归的双边关系量化分析方法及计算机存储介质
Mecatti et al. A special gen (d) re of statistics: Roots, development and methodological prospects of gender statistics
Ramaekers et al. Social class, economic and political grievances and radical left voting: The role of macroeconomic performance
Rayhan et al. Determinants of fertility rate decline in the south asian countries: A panel data approach
CN109698967B (zh) 一种电视台传播效果评估方法及装置
Muhammad et al. Households discrimination in school enrolment in Pakistan: Does gender matter?
Kumar et al. Beyond GDP: Measuring the Value of Wellbeing
Bačík Olympic medalists of the modern summer Olympic games 1896–2016
CN114496253B (zh) 一种大数据体质健康监测系统
Hey Measuring what matters
Kumara et al. Influence of the factors associated with suicides: A case study in the Kelaniya police division in Sri Lanka
Chakraborty Colonial origins and comparative development: Institutions matter
lillian Moshoeshoe et al. The Impact of Economic Growth on Female Labour Force Participation: Evidence from Southern African Countries
Alfani et al. What explains youth unemployment in Morocco? A look at Moroccans not in education, employment, or training
Almamy Factors impacting the adoption in Saudi Arabia of e-government, investigated with the use of fuzzy set qualitative comparative analysis and PLS path modelling

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination