CN112005254A - 事件预测装置及事件预测方法 - Google Patents
事件预测装置及事件预测方法 Download PDFInfo
- Publication number
- CN112005254A CN112005254A CN201980000380.XA CN201980000380A CN112005254A CN 112005254 A CN112005254 A CN 112005254A CN 201980000380 A CN201980000380 A CN 201980000380A CN 112005254 A CN112005254 A CN 112005254A
- Authority
- CN
- China
- Prior art keywords
- prediction
- event
- occurrence
- time
- function
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 31
- 238000010276 construction Methods 0.000 claims abstract description 9
- 230000014509 gene expression Effects 0.000 claims description 20
- 239000011159 matrix material Substances 0.000 claims description 14
- 238000004613 tight binding model Methods 0.000 claims description 6
- 238000013507 mapping Methods 0.000 abstract description 10
- 230000006870 function Effects 0.000 description 60
- 230000000694 effects Effects 0.000 description 8
- 238000010586 diagram Methods 0.000 description 6
- 230000004044 response Effects 0.000 description 4
- 230000005540 biological transmission Effects 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 239000003814 drug Substances 0.000 description 2
- 229940079593 drug Drugs 0.000 description 2
- 230000007613 environmental effect Effects 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 230000003203 everyday effect Effects 0.000 description 2
- 238000009472 formulation Methods 0.000 description 2
- 230000006698 induction Effects 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 101100356682 Caenorhabditis elegans rho-1 gene Proteins 0.000 description 1
- 206010010144 Completed suicide Diseases 0.000 description 1
- 230000002159 abnormal effect Effects 0.000 description 1
- 230000005856 abnormality Effects 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- AGVAZMGAQJOSFJ-WZHZPDAFSA-M cobalt(2+);[(2r,3s,4r,5s)-5-(5,6-dimethylbenzimidazol-1-yl)-4-hydroxy-2-(hydroxymethyl)oxolan-3-yl] [(2r)-1-[3-[(1r,2r,3r,4z,7s,9z,12s,13s,14z,17s,18s,19r)-2,13,18-tris(2-amino-2-oxoethyl)-7,12,17-tris(3-amino-3-oxopropyl)-3,5,8,8,13,15,18,19-octamethyl-2 Chemical compound [Co+2].N#[C-].[N-]([C@@H]1[C@H](CC(N)=O)[C@@]2(C)CCC(=O)NC[C@@H](C)OP(O)(=O)O[C@H]3[C@H]([C@H](O[C@@H]3CO)N3C4=CC(C)=C(C)C=C4N=C3)O)\C2=C(C)/C([C@H](C\2(C)C)CCC(N)=O)=N/C/2=C\C([C@H]([C@@]/2(CC(N)=O)C)CCC(N)=O)=N\C\2=C(C)/C2=N[C@]1(C)[C@@](C)(CC(N)=O)[C@@H]2CCC(N)=O AGVAZMGAQJOSFJ-WZHZPDAFSA-M 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000002354 daily effect Effects 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000006866 deterioration Effects 0.000 description 1
- 230000009429 distress Effects 0.000 description 1
- 210000000987 immune system Anatomy 0.000 description 1
- 208000014674 injury Diseases 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
- 238000005316 response function Methods 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 238000012549 training Methods 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/26—Government or public services
- G06Q50/265—Personal security, identity or safety
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/11—Complex mathematical operations for solving equations, e.g. nonlinear equations, general mathematical optimization problems
- G06F17/13—Differential equations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Pure & Applied Mathematics (AREA)
- Mathematical Optimization (AREA)
- Mathematical Analysis (AREA)
- Computational Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Tourism & Hospitality (AREA)
- Software Systems (AREA)
- General Engineering & Computer Science (AREA)
- Operations Research (AREA)
- Human Resources & Organizations (AREA)
- Databases & Information Systems (AREA)
- Development Economics (AREA)
- Educational Administration (AREA)
- Algebra (AREA)
- Health & Medical Sciences (AREA)
- Economics (AREA)
- General Health & Medical Sciences (AREA)
- Computer Security & Cryptography (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Computation (AREA)
- Medical Informatics (AREA)
- Computing Systems (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明提供一种事件发生预测装置及事件发生预测方法,基于过去发生的特定事件的历史数据来预测特定事件将来的发生密度,即使在数据量较少的情况下预测精度仍能得到提高。事件发生预测装置具有预测式构建部(10)及预测部(30)。预测式构建部(10)通过特定事件的发生时刻t与用于确定特定事件的发生区域的区域确定变量x的函数ρ(t,x)来得到所述特定事件的发生密度,且函数ρ(t,x)由外部因素{f}与函数ρ(t,x)的映射F[ρ(t,x)+{f}]给出,根据过去发生的特定事件的历史数据来求出映射F[ρ(t,x)+{f}],将函数ρ(t,x)表示为发生时刻t与区域确定变量x的函数。预测部(30)对函数ρ输入将来的时刻以及用于确定区域的值,从而预测出特定事件的发生密度。
Description
技术领域
本发明涉及事件预测装置及事件预测方法。
背景技术
美国加利福尼亚州有如下事例:警察通过重点巡逻高犯罪发生率的需要留心的区域来抑制今后犯罪的发生。另外,还存在如下示例:利用为预测地震余震而提出的算法来提高犯罪发生密度的预测精度。
犯罪发生的预测例如利用Self-Exciting Point Process(自激点过程:SEPP)模型来进行。在SEPP模型中,以过去犯罪发生事件所产生的影响的总和来表示特定位置和将来特定时刻下的犯罪发生密度。更具体而言,以所预测的位置与过去犯罪发生的位置之间的距离以及所预测的时刻与过去犯罪发生的时刻之间的时间的函数来表示过去某犯罪发生事件对于犯罪在特定位置及特定时刻下的发生密度的影响。此外,通过将过去发生的犯罪对各自求出的发生密度的影响求和来求出。
若用当前关注的位置、时刻与过去事件的位置、时刻之间的距离Δx及时间Δt(分别用适当的长度、时间为单位标注)将过去的犯罪发生事件对犯罪发生密度的影响记为g(Δt,Δx),则有用g(Δt,Δx)=1/((1+Δt)(1+Δx))来表达的方法(未来热点法)。还存在如下方法:利用最大期望算法(Expectation Maximization Algorithm)根据过去的犯罪发生事件的历史数据来构建过去的犯罪发生事件对犯罪在位置x及时刻t下的发生密度的影响g(Δt,Δx)。
为了提高基于过去发生的事件的历史数据来预测该事件将来的发生密度的精度,存在具备预测式构建部及预测部的方法。预测式构建部利用特定事件的发生时刻t与确定特定事件的发生区域的区域确定变量x的函数ρ(t,x)来得到所述特定事件的发生密度,且函数ρ(t,x)通过外部因素{f}与函数ρ(t,x)的映射F[ρ(t,x)+{f}]来得到,根据过去发生的特定事件的历史数据来求出映射F[ρ(t,x)+{f}],将函数ρ(t,x)表示为发生时刻t与区域确定变量x的函数。预测部对函数ρ输入将来时刻以及用于确定区域的值,从而预测出特定事件的发生密度。
现有技术文献
专利文献
专利文献1:美国专利第8949164号
专利文献2:美国专利第9129219号
专利文献3:WO2017/222030
发明内容
发明所要解决的技术问题
在以特定函数来表示对于与过去发生事件即犯罪的距离差Δx及时间差Δt下的发生密度的影响g(Δt,Δx)的情况下,有时与现实不符,精度未得到提高。另外,在利用最大期望算法来构建影响g(Δt,Δx)的情况下,在以机械学习来进行预测时,若数据量较少则精度可能无法提高。
因此,本发明的目的在于基于过去发生的特定事件的历史数据来预测特定事件将来的发生密度的事件发生预测装置中,即使在数据量较少的情况下预测精度仍得到提高。
解决技术问题所采用的技术方案
为了达成上述目的,本发明涉及基于过去发生的事件的历史数据来预测事件在时刻t的特征向量ρ(t)的事件预测装置,其特征在于,具备预测式构建部及预测部,所述预测式构建部定义如下矩阵c(t):
【数学式1】
【数学式2】
Φ(t)=c(t)c(t=0)-1
求出Φ(t),并求出Φ(t)的拉普拉斯变换Φ(z),利用常数γ求出如下格林函数G(z):
【数学式3】
G(z)=Φ(z)(γΦ(z)+Δt)-1
将该G(z)进行拉普拉斯变换求出G(t),所述预测部利用所述预测式构建部所求出的G(t),在下式输入将来的时刻t,
【数学式4】
求出所述特定事件的特征向量ρ(t)。
另外,本发明涉及基于过去发生的事件的历史数据来预测事件在时刻t的特征向量ρ(t)的事件预测方法,其特征在于,具有预测式构建步骤及预测步骤,在预测式构建步骤中,定义如下矩阵c(t):
【数学式5】
【数学式6】
Φ(t)=c(t)c(t=0)-1
求出Φ(t),并求出Φ(t)的拉普拉斯变换Φ(z),利用常数γ求出如下格林函数G(z):
【数学式7】
G(z)=Φ(z)(γΦ(z)+Δt)-1
将该G(z)进行拉普拉斯变换求出G(t),在所述预测步骤中,利用所述预测式构建部所求出的G(t),在下式输入将来的时刻t,
【数学式8】
求出所述特定事件的特征向量ρ(t)。
另外,本发明还涉及基于过去发生的事件的历史数据来预测事件在时刻t的特征向量ρ(t)的事件预测系统,其特征在于,具有预测式构建部、预测部、终端及服务器,所述预测式构建部定义如下矩阵c(t):
【数学式9】
【数学式10】
Φ(t)=c(t)c(t=0)-1
求出Φ(t),并求出Φ(t)的拉普拉斯变换Φ(z),利用常数γ求出如下格林函数G(z):
【数学式11】
G(z)=Φ(z)(γΦ(z)+Δt)-1
将该G(z)进行拉普拉斯变换求出G(t),所述预测部利用所述预测式构建部所求出的G(t),在下式输入将来的时刻t,
【数学式12】
求出所述特定事件的特征向量ρ(t),所述终端将发生了所述事件这一情况作为所述历史数据进行发送,所述服务器从所述终端接收新的所述历史数据,在获得新的所述历史数据时,使所述预测式构建部再次求出所述G(t)。
发明效果
根据本发明,在基于过去发生的特定事件的历史数据来预测特定事件将来的发生密度的事件发生预测装置中,即使在数据量较少的情况下预测精度仍能得到提高。
附图说明
图1是本发明所涉及的事件发生预测装置的一实施方式的框图。
图2是利用本发明所涉及的事件发生预测装置的一实施方式的事件发生预测方法的流程图。
图3是表示利用本发明所涉及的事件发生预测装置的一实施方式进行犯罪发生率预测时的核函数g的时刻t的依赖性评价例的图。
图4是利用本发明所涉及的事件发生预测装置的一实施方式的犯罪发生率预测结果的等高线。
具体实施方式
参照附图对本发明所涉及的事件发生预测装置的一实施方式进行说明。此外,本实施方式仅为示例,本发明并不限定于此。此外,对同一或类似的结构付上同一标号,并省略重复说明。
图1是本发明所涉及的事件发生预测装置的一实施方式的框图。
本实施方式中,预测在特定时刻及特定区域闯入住宅等犯罪(特定事件)的发生密度。此处,区域表示地图上发生犯罪的位置。预测发生密度的特定事件例如为网络诈骗等犯罪或骚扰电话的情况下,区域表示URL等网络上的位置或电话号码。
事件发生预测装置具有预测式构建部10及预测部30。
预测式构建部10通过特定事件的发生时刻t与用于确定特定事件的发生区域的区域确定变量x的函数ρ(t,x)来得到特定事件的发生密度,且函数ρ(t,x)由外部因素{f}与函数ρ(t,x)的映射F[ρ(t,x)+{f}]给出,根据过去发生的特定事件的历史数据来求出映射F[ρ(t,x)+{f}],将函数ρ(t,x)表示为发生时刻t与区域确定变量x的函数。外部因素{f}是天气条件、地理构造等环境因素、巡逻状况等特定事件的历史数据以外对特定事件的发生密度产生影响的因素。预测式构建部10例如具有历史数据群存储部12、核函数构建部14、核函数存储部16、预测式构建部18、预测式存储部20以及历史数据接收部22。
预测部30利用预测式构建部10所构建的预测式、即函数g(t,x)与数据,以日期时间t、地点x的函数的形式计算出特定事件的发生密度。
事件发生预测装置也可以具备显示部40。显示部40以可识别预测部30所算出的特定事件的发生密度的状态进行显示。显示部40例如将特定事件的发生密度的等高线显示于地图上。
接下来,对本实施方式的特定事件的发生密度的计算方法进行说明。考虑时刻t、区域x下特定事件的发生密度ρ(t,x)。假设该发生密度ρ(t,x)由自身的映射F来表示。即:
ρ(t,x)=F[ρ(t,x)+{f}]…(1)
此处,{f}考虑为季节、环境因素、巡逻状况等外部因素。
预测式构建部10利用过去特定事件的发生历史数据群来求解构建映射F这一问题。此处,特定事件的发生历史数据群是指多个历史数据的集合。历史数据是指发生特定事件的时刻t以及用于确定发生特定事件的区域的区域确定变量x的组。也可以在历史数据中包含表示特定事件的类型的指标。
映射F[ρ(t,x)+{f}]可假定为例如偏微分方程的解。
另外,偏微分方程的解可利用例如核函数(也称为格林函数、响应函数、积分核)来表示。
发生密度ρ(t,x)例如在单变量的情况下,可假定为满足以下方程。
【数学式13】
此处,γ可根据想要表达的现象来决定。
此外,右边第一项的核函数所涉及的ρ(t,x)相关的函数形式或外部因素依赖性和第二项的形式可有多种变化。此处,仅以最简单的一例来展开讨论。
另外,核函数g(t,t’,x,x’)有时也可假定为以过去的事件与当前的时空间的时间差、距离差的函数来表示。例如,演化方程考虑如下形式等。
【数学式14】
例如,在每天发生一件犯罪的状况(稳态解)下,若要求SEPP模型的λ(t,x)的稳态解与ρ(t,x)的稳态解相等,则可以求出γ=log2。一般而言,在某种(例如稳态等的)理想状态下,通过限制ρ(t)与SEPP模型的条件强度λ(t)一致,能唯一确定系数γ。
将该演化方程对区域x进行傅里叶变换,对时刻t进行拉普拉斯变换,则得到如下数学式。
【数学式15】
g(z,k)=Φ(z,k)/(Δt+γΦ(z,k))…(4)
Φ(t,k)=<ρ(t+t0,k)/ρ(t0,k)>t0…(5)
利用过去的犯罪历史数据、即某时刻t、区域k的发生密度ρ(t,k)来求得Φ(t,k)。此处,对过去的时刻t、区域x的发生密度ρ(t,x)取正整数值。对于发生的第i个特定事件,设定发生时刻为ti,发生区域为xi,则在同时刻、同区域未发生其它事件的情况下,ρ(ti,xi)=1。得到Φ(t,k)之后,利用该Φ得到g(z,k)。在求得g(z,k)之后,通过代入自激点过程(SEPP)模型的时空间核函数项,来得到预测犯罪密度λ(t,x)。
以下举出λ(t,x)的计算方法的一示例。
λ(t,x)=Σti<tg(t-ti,x-xi)…(6)
此处,式(6)的和为时刻t之前发生的所有特定事件的和。
图2是表示利用本实施方式的事件发生预测装置的事件发生预测方法的流程图。
该事件发生预测方法分为预测式构建阶段与预测阶段。预测式构建阶段中,通过特定事件的发生时刻t与用于确定特定事件的发生区域的区域确定变量x的函数ρ(t,x)来得到特定事件的发生密度,且函数ρ(t,x)由所述外部因素{f}与所述函数ρ(t,x)的映射F[ρ(t,x)+{f}]来给出,根据过去发生的所述特定事件的历史数据来求出所述映射F[ρ(t,x)+{f}],将函数ρ(t,x)表示为所述发生时刻t与所述区域确定变量x的函数。预测阶段中,利用映射F[ρ(t,x)+{f}]及过去数据来预测所述特定事件的发生密度。下面,进一步具体说明。
预测式构建阶段中,首先,将过去的历史数据储存于历史数据群存储部12(S11)。过去的历史数据也可以是多个。
接着,核函数构建部14利用历史数据群存储部12中存储的过去的历史数据群,从式(3)及式(4)求出核函数g(z,k)(S12)。核函数构建部14所导出的核函数g(z,k)被存储至核函数存储部16。该核函数以离散的时刻z以及用于确定离散的区域的区域确定变量k的值的表格的形式进行存储。
在得到核函数g(z,k)之后,使用拉普拉斯逆变换、傅里叶逆变换,预测式构建部18从式(5)及式(6)构建出用于得到预测特定事件的发生密度的预测犯罪密度λ(t,x)的函数(S13)。预测式构建部18所构建出的预测犯罪密度λ(t,x)被存储至预测式存储部20。该预测犯罪密度λ以离散的时刻z以及用于确定离散的区域的区域确定变量的值的表格的形式进行存储。
在构建出预测犯罪密度λ的函数之后,历史数据接收部22对新输入的历史数据进行监视(S14)。例如,一般用户通过智能手机等移动终端24输入发生犯罪这一事实的情况下,其历史数据将被历史数据接收部22接收。移动终端24中安装有应用程序,以供一般用户目击到犯罪时等情况下,输入新的历史数据,并将该历史数据发送至历史数据接收部22。或者,也可以由警察等具有信息提供机构的警察系统26对历史数据接收部22传输历史数据。
历史数据接收部22在每次有新的历史数据输入时重复上述动作,并持续监视。历史数据接收部22在有新的历史数据输入之后,将该历史数据存储至历史数据群存储部12,并返回步骤S11。其结果是,再次执行步骤S11~步骤S13,构建新的预测犯罪密度λ的函数,并存储至预测式存储部20。
在预测阶段中,首先,设定对预测犯罪密度进行预测的时刻及区域(S21)。进行预测的时刻可以是特定时刻,也可以具有一定范围。预测时间例如设为从当前起的规定期间。进行预测的区域可以是特定位置,也可以具有一定幅员。进行预测的区域例如是为了构建预测式而收集历史数据的整个区域。进行预测的时刻及区域的设定由预测部30执行。
接着,在步骤S21所设定的时刻和区域中,预测部30从预测式存储部20接收预测式,并计算预测犯罪密度λ(S22)。当进行预测的时刻和区域具有一定范围或幅员时,对离散的时刻和区域分别反复地计算预测犯罪密度λ。
计算出的预测犯罪密度λ显示在显示部40中(S23)。以能够被人识别出的方式显示的预测犯罪密度λ可供警察等进行参照,从而成为巡逻工作的参考。或者,显示在移动终端24上的预测犯罪密度λ可以用于使移动终端24的用户避开犯罪的行为。
过去发生的犯罪会在时间上和空间上分离的位置处诱发下一次犯罪。而时间差以及距离越大,诱发的影响度有越小的趋势。例如,若在加利福尼亚州洛杉矶市的非法入侵案件中发生了犯罪,则在之后的1~2天后和7天后,其附近1m范围圈内再次发生犯罪的密度变高。如果认为过去犯罪的历史数据分别会诱发将来某一时刻和某一位置的犯罪,则将来犯罪的发生密度ρ可以作为过去犯罪的发生密度ρ的映射F来给出。因此,在本实施方式中,假设ρ(t,x)=F[ρ(t,x)+{f}],基于历史数据构件犯罪发生密度相对于密度场的核函数。
图3是表示使用本实施方式的事件发生预测装置进行犯罪发生率预测时的核函数g对时刻t的依赖性的评价例的图。图3的横轴为时刻t之间的时间,纵轴为核函数g的值。
如图3所示,随着时间变长,核函数g有减小的趋势。但如图3所示,核函数g与时间并不是单调减小的关系。
图4是表示使用本实施方式的事件发生预测装置得到的犯罪发生预测结果的等高线。
图4是使用某一城市的738件犯罪的历史数据计算出的预测犯罪密度的等高线。预测犯罪密度的计算使用的是到想要预测的那一天的前一天为止的数据。想要预测的那一天的数据并不包含在内。图4中还用标记一并示出了预测的期间(一天)内实际发生的犯罪案件。
如图4所示,可知在预测犯罪密度较高的位置处,实际发生犯罪的情况很多。
图5是将使用本实施方式的事件发生预测装置得到的犯罪发生预测结果与其它预测方法进行比较的表格。
与过去的犯罪发生事件对犯罪的距离Δx(例如用空间分辨率的一半长度进行标记)和时间Δt(例如在7天期间内标记)内的发生密度的影响g
(Δt,Δx)用g(t,Δx)=1/((1+Δt)(1+Δx))来表达的方法(未来热点法)所得到的预测结果的精度、以及EM法得到的预测结果的精度相比,使用本实施方式的事件发生预测装置得到的犯罪发生预测结果的精度在针对例如芝加哥十宗罪(盗窃、殴打、刑事伤害、毒品、其它侵犯、强暴、入室盗窃、机动车盗窃、欺诈、抢劫)时,达到了最高的精度。精度是通过将实际犯罪中被预测到的犯罪件数除以实际犯罪件数来进行比较,预测时,将预测对象区域分割成250m1见方的单元格,并将其中的某一面积比例指定为犯罪危险地段。
由此可知,本实施方式的预测精度要高于未来热点法和EM法。
在上述实施方式中,以犯罪作为特定事件的例子进行了说明,但一般也可以适用于某一事件诱发新的下一个事件而发生级联的现象。尤其是在将该诱发的比例视作为时间t和空间x的函数时,具有时空间相关性,且预测出其在规律性上具有一定程度的稳定性的情况下,可以期待得到更高的精度。作为这样的事件,例如地震的余震现象或空袭的遇难状况等,在过去通常讨论其与级联现象的关联。此外,自杀、瘟疫流行、社交网络服务(SNS)上的教唆、宗教、传销等的宣传、骚扰电话、服饰等的流行、股价、证券的动向、选举投票、免疫系统的异常现象、消费者的购买行为、网站上的广告点击、网络购物等的需求预测、相亲对象等的匹配中的合适度、药物和货币等的走私、网络犯罪、网络恐怖主义等的恐怖袭击预测、基建劣化预测、软件硬件故障和异常检测等,也可以期待考虑使用上述核函数。
上述实施方式中,将一个特定事件作为对象来预测其将来的发生密度,但也可以应用于多个变量相互影响的级联现象的预测。例如,若关注金融数据,则各个国家的不动产买卖、国债、公司债等债权和股票的交易、现实物品的生产和销售、或者通过提供服务等而产生的现金交易等会相互影响,从而外汇交易中的利率(汇率)会发生变化。相比于在交易的瞬间受到的各国不动产的状态的影响,这一变化受到的过去交易状态等的级联式的影响更大。
考虑对n种特定事件预测各自的状态的方法。n为自然数。这里,所谓特定事件的状态,可以是发生密度,也可以是汇率等的值。第i个特定事件的状态变量用函数ρ_i(t)来给出。
考虑用于得到具有n种要素的状态变量的函数向量Ρ(t)={ρ_1(t),…,ρ_i(t),…,ρ_n(t)}。如果是级联现象,则该状态变量向量P(t)可以用该函数向量P(t)和外部因素向量{f}的映射F[Ρ(t)+{f}]来给出。
与上述实施方式一样,预测式构建部可以从过去发生的特定事件的状态值和外部因素的历史数据来求出映射F[Ρ(t)+{f}]。得到函数向量P(t)后,预测部向该函数向量P(t)输入用于确定将来时刻的值,预测特定事件的状态值。
上述实施方式中,限定了函数向量P(t)是时刻t和用于确定特定事件发生区域的区域确定变量x的函数ρ(t,x)。在x是离散的情况下,可以将x所示的各区域的发生密度ρ(t,x)的全体视作为函数向量P(t)。
例如,预测2个特定事件的状态值的情况如下所述。将给出2个特定事件的状态值的状态函数分别设为ρa(t)、ρb(t)。另外,还导入gaa(t)、gab(t)、gba(t)、gbb(t)作为表达出各个特定事件过去的状态对其自身和另一特定事件产生的影响的格林函数。此时,演化方程变成如下所述。
【数学式16】
其中,没有外部因素的影响。另外,为了简化,忽略了表示位置的变量x。γ与单变量的情况相同,若考虑稳态解的条件,则γ=log2。下面,为了简化,省略γ、Δt。
将用于得到特定事件的状态值的状态函数的向量记为特征向量ρ(t),将其公式广义化,可得到以下行列式。
【数学式17】
对上述式(8)进行拉普拉斯变换,得到以下行列式。
【数学式18】
【数学式19】
ρ(z)=(l-G(z))-1 G(z)ρ(t=0)…(10)
这里,导入以下定义。
【数学式20】
Φ(z)=(1-G(z))-1 G(z)…(11)
由此,式(9)的拉普拉斯逆变换可用下式表示。
【数学式21】
ρ(t)=Φ(t)ρ(t=0)…(12)
为了从过去的数据(历史数据)求出Φ(t),首先,将式(11)的要素ρi除以ρj的初始状态。然后,改变初始状态生成多个样本,并取其统计平均值。将各个初始状态的时刻记为t0,则得到下式。
【数学式22】
这里,导入矩阵c。
【数学式23】
使用上述矩阵c,可以得到下式。
【数学式24】
c(t)=Φ(t)c(t=0)…(15)
即,变为下式。
【数学式25】
Φ(t)=c(t)c(t=0)-1…(16)
通过使用该拉普拉斯变换Φ(z)对式(11)进行变形,最终的格林函数如下所示。
【数学式26】
G(z)=Φ(z)(γΦ(z)+Δt)-1…(17)
这里,明确示出了γ与Δt的依赖性。
通过对其进行拉普拉斯逆变换,可以得到G(t)。若使用由此得到的G(t),并将过去的发生密度ρ(t=0)代入式(8),则可得到时刻t的发生密度ρ(t)。
图6是将本实施方式的汇率预测正答率与其它预测方法进行比较后得到的图表。
ddgf是使用本实施方式得到的结果。var是其它预测方法即向量自回归模型所得到的结果。rnn是RNN(循环神经网络)的扩展LSTM多模型长短时间记忆所得到的结果。这里,正答率是指针对最高值+最低值+最终值的平均值即枢轴点比例(PP rate)的前日比的正负而预测的并正确的比率。
图6中示出了本实施方式具有在VAR和LSTM同等以上的精度。
图7是表示本实施方式的汇率正答率的年度变化的图表。
这里,指标1是日元对美元的最终值/初始值的前日比,指标3是澳元对美元的最终值/初始值的前日比。指标1和指标3的正答率在每一年都高于50%。而且,随着过去的历史数据增加,即逐年正答率增长。
图8是将采用本实施方式来预测美国发生恐怖袭击的预测精度与其它预测方法进行比较后得到的图表。
DDGF是使用本实施方式得到的结果。VAR是其它预测方法即向量自回归模型所得到的结果。这里,预测精度是预测到要发生的数量除以实际发生的数量后得到的值。
图8是选择例如美国、伊拉克、阿富汗三个国家在2001年~2015年期间每天发生多少件恐怖袭击的时序数据,使用本实施方式的DDGF法来测定美国发生恐怖袭击的预测精度的结果。例如选择对象期间的数据中的前2/3作为训练数据,选择后1/3作为测试数据。
如图8所示,根据本实施方式,可以得到比现有方法要高的预测精度。
从而,本实施方式也可以用于多个事件的过去状态会相互影响的级联现象的预测。
图9是示意性地表示本实施方式中的多变量DDGF法的概念图。
而且,多变量DDGF法中,G矩阵可以用于解释互不相同的变量之间的影响的传递方式。例如,在变量是日元、美元和欧元这三个变量时,考虑构成图9的G矩阵。第一行第一列中,记载了过去的日元对未来的日元的影响的传递,第一行第二列中,记载了过去的日元对未来的美元的影响的传递。也就是说,通过了解G矩阵的各个要素,可以了解在不同的变量之间是以怎样的时间尺度来传递影响的。
图10是表示本实施方式的事件分析结果的图表集合。
利用数据决定G矩阵也是现象分析的一种工具。例如,在9.11事件前后对伊拉克、美国、阿富汗每天发生恐怖袭击数量的数据进行分割,计算出G矩阵。可知在9.11前后,尤其是阿富汗对伊拉克的影响的传递、阿富汗对阿富汗的影响的传递发生了很大的变化。
图11是表示使用本实施方式分析伊拉克各州和美国全土发生恐怖袭击事件的结果的图。
若在伊拉克各州和美国全土中选择变量,则可以分析伊拉克的哪个州的影响对于USA影响最大。
标号说明
10 预测式构建部;12 历史数据群存储部;14 核函数构建部;16 核函数存储部;18 预测式构建部;20 预测式存储部;22 历史数据接收部;24 移动终端;26 警察系统;30预测部;40 显示部。
Claims (3)
3.一种事件预测系统,基于过去发生的事件的历史数据来预测事件在时刻t的特征向量ρ(t),其特征在于,
包括预测式构建部、预测部、终端和服务器,在所述预测式构建部中,定义如下矩阵c(t):
并求出Φ(t):
Φ(t)=c(t)c(t=0)-1
求出Φ(t)的拉普拉斯变换Φ(z),利用常数γ求出如下格林函数G(z):
G(z)=Φ(z)(γΦ(z)+Δt)-1
对该G(z)进行拉普拉斯变换,从而求出G(t),
在所述预测部中,使用所述预测式构建部求出的G(t),在下式中输入将来的时刻t,
求出所述特定事件的特征向量ρ(t),
所述终端将发生了所述事件这一情况作为所述历史数据进行发送,
所述服务器从所述终端接收新的所述历史数据,在获得新的所述历史数据时,使所述预测式构建部再次求出所述G(t)。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2019/013483 WO2020194642A1 (ja) | 2019-03-27 | 2019-03-27 | 事象予測装置および事象予測方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112005254A true CN112005254A (zh) | 2020-11-27 |
Family
ID=72611184
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201980000380.XA Pending CN112005254A (zh) | 2019-03-27 | 2019-03-27 | 事件预测装置及事件预测方法 |
Country Status (4)
Country | Link |
---|---|
US (1) | US20220179919A1 (zh) |
JP (1) | JP7357316B2 (zh) |
CN (1) | CN112005254A (zh) |
WO (1) | WO2020194642A1 (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113919160A (zh) * | 2021-10-14 | 2022-01-11 | 南京审计大学 | 一种细粒度的城市犯罪预测方法及系统 |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112508237B (zh) * | 2020-11-20 | 2022-07-08 | 北京师范大学 | 基于数据分析的雨型区域划分方法和实时雨型预测方法 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4177228B2 (ja) * | 2003-10-24 | 2008-11-05 | 三菱電機株式会社 | 予測装置 |
JP2011192040A (ja) | 2010-03-15 | 2011-09-29 | Kddi Corp | 予測モデル学習装置、イベント予測装置、予測モデル学習方法およびプログラム |
US8949164B1 (en) | 2011-09-08 | 2015-02-03 | George O. Mohler | Event forecasting system |
US9129219B1 (en) | 2014-06-30 | 2015-09-08 | Palantir Technologies, Inc. | Crime risk forecasting |
WO2017222030A1 (ja) | 2016-06-22 | 2017-12-28 | 真実 梶田 | 事象予測装置および事象予測方法 |
JP7087682B2 (ja) * | 2018-05-30 | 2022-06-21 | 日本電信電話株式会社 | 時空間イベントデータ推定装置、方法、及びプログラム |
-
2019
- 2019-03-27 US US16/337,447 patent/US20220179919A1/en active Pending
- 2019-03-27 JP JP2019518001A patent/JP7357316B2/ja active Active
- 2019-03-27 WO PCT/JP2019/013483 patent/WO2020194642A1/ja active Application Filing
- 2019-03-27 CN CN201980000380.XA patent/CN112005254A/zh active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113919160A (zh) * | 2021-10-14 | 2022-01-11 | 南京审计大学 | 一种细粒度的城市犯罪预测方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
JP7357316B2 (ja) | 2023-10-06 |
JPWO2020194642A1 (zh) | 2020-10-01 |
US20220179919A1 (en) | 2022-06-09 |
WO2020194642A1 (ja) | 2020-10-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11676087B2 (en) | Systems and methods for vulnerability assessment and remedy identification | |
Afriyie et al. | A supervised machine learning algorithm for detecting and predicting fraud in credit card transactions | |
Karpoff et al. | The economics of foreign bribery: Evidence from FCPA enforcement actions | |
US11127025B2 (en) | Predicting economic conditions | |
Li et al. | Credit scoring by incorporating dynamic networked information | |
CN112005254A (zh) | 事件预测装置及事件预测方法 | |
Yadav et al. | Crime prediction using auto regression techniques for time series data | |
Hurlin et al. | Risk measure inference | |
CN113344376A (zh) | 商户风险监测方法、装置、计算机设备和存储介质 | |
JP6935928B2 (ja) | 事象予測装置および事象予測方法 | |
Sidhu | The impact of internet banking on bank performance: Empirical evidence from Indian Banks | |
Patel et al. | Spatio-temporal extreme event modeling of terror insurgencies | |
West et al. | Mining financial statement fraud: An analysis of some experimental issues | |
Kuo et al. | Detection of price manipulation fraud through rational choice theory: evidence for the retail industry in Taiwan | |
Gelbach et al. | Testing for racial discrimination in bail setting using nonparametric estimation of a parametric model | |
Calabrese et al. | Mortgage default decisions in the presence of non-normal, spatially dependent disturbances | |
US9741048B2 (en) | Predicting economic conditions | |
Zhou et al. | Towards robust reputation system based on clustering approach | |
Lv et al. | An interactive system for unfair rating detection models in a customized perspective | |
CN115296840B (zh) | 基于关联节点安全状态的安全预警方法、装置及电子设备 | |
Chen | Predicting Accounting Fraud in Publicly Traded Chinese Firms via A PCA-RF Method | |
Alexopoulos et al. | Detecting anomalies in heterogeneous population-scale VAT networks | |
CN113111284A (zh) | 归类信息展示方法、装置、电子设备和可读存储介质 | |
Nascimento et al. | Improving crime count forecasts in the city of Rio de Janeiro via reconciliation | |
Schechtman | Default matrices: A complete measurement of banks’ consumer credit delinquency |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
WD01 | Invention patent application deemed withdrawn after publication | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20201127 |