CN114240264A - 一种城管事件指标间的因果关系检验方法及装置 - Google Patents

一种城管事件指标间的因果关系检验方法及装置 Download PDF

Info

Publication number
CN114240264A
CN114240264A CN202210171095.8A CN202210171095A CN114240264A CN 114240264 A CN114240264 A CN 114240264A CN 202210171095 A CN202210171095 A CN 202210171095A CN 114240264 A CN114240264 A CN 114240264A
Authority
CN
China
Prior art keywords
time
change
relationship
categories
rate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210171095.8A
Other languages
English (en)
Inventor
李升阳
赵红军
张登辉
胥果
曾丸畅
马华均
印龙兵
刘智勇
张国兵
吕胜
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chengdu Sefon Software Co Ltd
Original Assignee
Chengdu Sefon Software Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chengdu Sefon Software Co Ltd filed Critical Chengdu Sefon Software Co Ltd
Priority to CN202210171095.8A priority Critical patent/CN114240264A/zh
Publication of CN114240264A publication Critical patent/CN114240264A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • G06Q10/06393Score-carding, benchmarking or key performance indicator [KPI] analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/26Government or public services

Landscapes

  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Engineering & Computer Science (AREA)
  • Strategic Management (AREA)
  • Educational Administration (AREA)
  • Economics (AREA)
  • Development Economics (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Primary Health Care (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Game Theory and Decision Science (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种城管事件指标间的因果关系检验方法及装置,主要解决现有城管事件指标上的因果关系常常被忽略的问题。该方法包括的步骤有首先对城管事件中的连续数据集进行预处理,用变化率来描述指标,根据变化率将其归类为正变化率,负变化率且无变化率;其次将其转换为元组形式,再判断指标间是否存在时间关联,若存在,则生成二元规则BRS,并计算两个指标间的关系强度;最终生成精准二元规则SRS;本发明通过类别变化率来描述一个类别对另一个类别的影响,从而提高类别间因果关系检验的准确率。

Description

一种城管事件指标间的因果关系检验方法及装置
技术领域
本发明涉及判别指标因果关系技术领域,具体地说,是涉及一种城管事件指标间的因果关系检验方法及装置。
背景技术
城管事件指标间的因果关系检验是根据历史城管事件数据检验一个指标对另一个指标的影响,从而判断指标间是否存在因果关系。城管事件是智慧城建的重要部分,也是解决城市信息系统的一个关键点。每个城市、每个街道的城管事件都具有特定的复杂性,对于城管事件指标间的因果检验具有十分重要的实际意义。
在大数据背景下,时间序列数据特征具有复杂性以及多样性,寻找指标间的因果关系变得十分具有挑战性。城管事件指标上的因果关系常常被忽略,然而城管事件的因果关系能辅助我们更清晰地建设智慧城市,因此对不同的城管事件的指标加以分析,找出指标间的因果关系刻不容缓。
发明内容
本发明的目的在于提供一种城管事件指标间的因果关系检验方法及装置,以解决现有城管事件指标上的因果关系常常被忽略的问题。
为了解决上述问题,本发明提供如下技术方案:
一种城管事件指标间的因果关系检验方法包括以下步骤:
S1、对城管事件数据预处理后,任选两个类别分别统计其在设定时间单元的发生次数,然后分别计算其在设定时间单元的变化率;
S2、通过设定的变化率类型,将步骤S1中两个类别的变化率分别归类;
S3、根据步骤S2中归类后的两个类别,计算两个类别的因果关系支持值和时间优势比,然后判断是否存在因果关系,是则执行步骤S4和S5,否则结束;
S4、生成二元规则BRS,并计算两个类别的关系强度;
S5、根据步骤S4的二元规则BRS和关系强度生成精准二元规则SRS。
进一步的,步骤S1中变化率的计算公式为:
Figure 910015DEST_PATH_IMAGE001
其中,
Figure 155052DEST_PATH_IMAGE002
表示类别
Figure 747838DEST_PATH_IMAGE003
在第k个时间单元的值,
Figure 785458DEST_PATH_IMAGE004
表示类别
Figure 927726DEST_PATH_IMAGE003
在第k-1个时间单 元的值,
Figure 563238DEST_PATH_IMAGE005
表示类别
Figure 95851DEST_PATH_IMAGE003
在第k年的变化率,i为类别数。
进一步的,步骤S2中将变化率归类的计算公式如下:
Figure 606335DEST_PATH_IMAGE006
其中,
Figure 603110DEST_PATH_IMAGE007
代表变化类型,U为正变化率,D为负变化率, Q为无变化率,
Figure 409523DEST_PATH_IMAGE005
表示类 别
Figure 794544DEST_PATH_IMAGE003
在第k年的变化率,
Figure 859452DEST_PATH_IMAGE008
为设定的变化率。
进一步的,步骤S3的具体过程如下:
S301、将类别
Figure 399149DEST_PATH_IMAGE003
的时间序列转换成一组元组
Figure 156889DEST_PATH_IMAGE009
> ;
其中,类别
Figure 710099DEST_PATH_IMAGE010
是城管事件数据库中的一个类别,
Figure 126168DEST_PATH_IMAGE011
是第k个时间单元,
Figure 97535DEST_PATH_IMAGE012
∊{U, D, Q}表示第k个时间单元类别
Figure 950478DEST_PATH_IMAGE010
的变化为正变化率、负变化率、无变化率中任一项;
S302、步骤S301的元组中滞后类别为l的两个类别
Figure 7296DEST_PATH_IMAGE003
Figure 899160DEST_PATH_IMAGE013
,计算这两者的因果关系 支持值,即计算相同关系的支持比例和相反关系的支持比例;
S303、步骤S301的元组中滞后类别为l的两个类别
Figure 459454DEST_PATH_IMAGE003
Figure 542685DEST_PATH_IMAGE013
,计算这两者的时间优势 比,即计算时间直接优势比和时间逆优势比;
S304、判断是否因果关系支持值大于或等于设定因果关系的支持数阈值,且时间优势比大于或等于时间优势比的阈值,是则存在因果关系,否则结束。
进一步的,步骤S302的具体过程如下:
Figure 634269DEST_PATH_IMAGE014
表示相同关系,定义如下:
Figure 844671DEST_PATH_IMAGE015
即,在l个时间单元后,类别
Figure 714931DEST_PATH_IMAGE003
的变化率与类别
Figure 64004DEST_PATH_IMAGE013
的变化率相同。
Figure 564256DEST_PATH_IMAGE016
表示相同关系的支持数,定义如下:
Figure 296457DEST_PATH_IMAGE017
Figure 831344DEST_PATH_IMAGE018
表示相同关系的支持比例,定义如下:
Figure 757842DEST_PATH_IMAGE019
Figure 745390DEST_PATH_IMAGE020
表示表示逆关系,定义如下:
Figure 284212DEST_PATH_IMAGE021
即,在l个时间单元后,类别
Figure 408026DEST_PATH_IMAGE003
的变化率与
Figure 505426DEST_PATH_IMAGE013
的变化率相反。
Figure 980270DEST_PATH_IMAGE022
表示相反关系的支持数,定义如下:
Figure 319853DEST_PATH_IMAGE023
Figure 563753DEST_PATH_IMAGE024
表示相反关系的支持比例,定义如下:
Figure 566475DEST_PATH_IMAGE025
进一步的,步骤S303的具体过程如下:
Figure 528615DEST_PATH_IMAGE026
表示在l个时间单位后,类别
Figure 420958DEST_PATH_IMAGE003
的无变化率和类别
Figure 784943DEST_PATH_IMAGE013
的正负变化率相 关时,对数的计算方式定义为:
Figure 958567DEST_PATH_IMAGE027
其中
Figure 408003DEST_PATH_IMAGE028
表示中性变化关系,定义如下:
Figure 512225DEST_PATH_IMAGE029
Figure 42301DEST_PATH_IMAGE030
表示在l个时间单位后,类别
Figure 573777DEST_PATH_IMAGE003
的正负变化率和类别
Figure 995662DEST_PATH_IMAGE013
的无变化率相 关时,对数的计算方式定义为:
Figure 231471DEST_PATH_IMAGE031
其中
Figure 556667DEST_PATH_IMAGE032
表示变化中性关系,定义如下:
Figure 586939DEST_PATH_IMAGE033
Figure 496121DEST_PATH_IMAGE034
表示在l个时间单位后,类别
Figure 270042DEST_PATH_IMAGE003
的无变化率和类别
Figure 446814DEST_PATH_IMAGE013
的无变化率相关 时,对数的计算方式定义为:
Figure 647988DEST_PATH_IMAGE035
其中
Figure 44466DEST_PATH_IMAGE036
表示中性关系,定义如下:
Figure 90919DEST_PATH_IMAGE037
时间直接优势比:时间滞后为l的两个类别
Figure 390707DEST_PATH_IMAGE003
和类别
Figure 762782DEST_PATH_IMAGE013
之间的时间直接优势比定 义为:
Figure 646556DEST_PATH_IMAGE038
时间逆优势比:时间滞后为l的两个类别
Figure 762279DEST_PATH_IMAGE003
Figure 913644DEST_PATH_IMAGE013
之间的时间逆优势比定义为:
Figure 456621DEST_PATH_IMAGE039
时间直接优势比和时间逆优势比中
Figure 562111DEST_PATH_IMAGE034
Figure 278263DEST_PATH_IMAGE026
Figure 287064DEST_PATH_IMAGE030
的 值为零时,将其视为1避免无限的时间优势比。
进一步的,步骤S304的具体过程如下:
Figure 942DEST_PATH_IMAGE040
表示设定的所有因果关系的支持数阈值;
Figure 859308DEST_PATH_IMAGE041
表示设定的时间优势比的阈值;
时间直接关联:时间滞后为l的类别
Figure 316834DEST_PATH_IMAGE003
和类别
Figure 177211DEST_PATH_IMAGE013
之间的时间直接关联定义为:
Figure 327570DEST_PATH_IMAGE042
时间逆关联:时间滞后为l的类别
Figure 407652DEST_PATH_IMAGE003
Figure 668869DEST_PATH_IMAGE013
之间的时间逆关联定义为:
Figure 374964DEST_PATH_IMAGE043
判断是否满足时间直接关联或时间逆关联,且
Figure 696224DEST_PATH_IMAGE044
或者
Figure 263603DEST_PATH_IMAGE045
,是则类别
Figure 62932DEST_PATH_IMAGE003
和类别
Figure 897901DEST_PATH_IMAGE013
存在因果关系,否则不存在因果关系。
进一步的,步骤S4的具体过程为:
类别
Figure 390063DEST_PATH_IMAGE003
和类别
Figure 179158DEST_PATH_IMAGE013
存在一个二元因果规则
Figure 782178DEST_PATH_IMAGE046
Figure 740163DEST_PATH_IMAGE047
表示直接因果规则,
Figure 872067DEST_PATH_IMAGE048
表示逆因果规则;
计算关系强度
Figure 414038DEST_PATH_IMAGE049
,其表明类别间所存在的关系强度,类别
Figure 555169DEST_PATH_IMAGE050
和类别
Figure 364731DEST_PATH_IMAGE051
间的关系强 度计算如下:
Figure 933116DEST_PATH_IMAGE052
进一步的,步骤S5的具体过程为:类别
Figure 962383DEST_PATH_IMAGE050
和类别
Figure 907205DEST_PATH_IMAGE051
存在二元规则
Figure 574203DEST_PATH_IMAGE053
并且
Figure 579068DEST_PATH_IMAGE054
时,那么类别
Figure 751424DEST_PATH_IMAGE050
和类别
Figure 985090DEST_PATH_IMAGE051
之间存在精准二元规则
Figure 519977DEST_PATH_IMAGE055
一种城管事件指标间的因果关系检验装置包括存储器:用于存储可执行指令;处理器:用于执行所述存储器中存储的可执行指令,实现一种城管事件指标间的因果关系检验方法。
与现有技术相比,本发明具有以下有益效果:
(1)本发明通过类别变化率,时间序列数据提取因果关系来描述一个类别对另一个类别的影响,从而提高类别间因果关系检验的准确率
(2)本发明定义了时间关联滞后规则以及时间优势比的概念,便于提取各种类别之间的因果关系。
(3)本发明可以生成更为精准的二元因果规则,其关系强度对战略决策具有重要意义。
附图说明
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图,其中:
图1为本发明的流程架构图。
具体实施方式
为了使本发明的目的、技术方案和优点更加清楚,下面将结合图1对本发明作进一步地详细描述,所描述的实施例不应视为对本发明的限制,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
实施例1
如图1所示,一种城管事件指标间的因果关系检验方法通过构建生成精准的分析城管事件中不同类别指标之间的因果关系,从而可以有效地发现大范围内现有的因果关系结构时间序列数据库;首先对本文中所用到的类别进行定义:
U即正变化率,D即负变化率,Q即无变化率
n,即时间序列中的样本数量
z,即数据库P中的指标数量
l,即滞后值
Figure 679431DEST_PATH_IMAGE056
,即最大滞后差值
Figure 666979DEST_PATH_IMAGE057
,即第k个时间单元的值
Figure 704336DEST_PATH_IMAGE058
,即类别
Figure 828150DEST_PATH_IMAGE050
在第k个时间单元的值
Figure 427015DEST_PATH_IMAGE059
,即类别
Figure 167438DEST_PATH_IMAGE050
在第k年的变化率,
一种城管事件指标间的因果关系检验方法的具体步骤如下:
S1、对城管事件数据预处理后,任选两个类别分别统计其在设定时间单元的发生次数,然后分别计算其在设定时间单元的变化率;预处理为去掉明显不合理的数字,如负数;
变化率的计算公式如下:
Figure 742907DEST_PATH_IMAGE060
(1)
S2、通过设定的变化率类型,将步骤S1中两个类别的变化率分别归类;
Figure 986806DEST_PATH_IMAGE061
即类别的变化类型,定义如下:
Figure 753643DEST_PATH_IMAGE062
(2)
S3、根据步骤S2中归类后的两个类别,计算两个类别的因果关系支持值和时间优势比,然后判断是否存在因果关系,是则执行步骤S4和S5,否则结束;具体过程如下:
将类别
Figure 715783DEST_PATH_IMAGE050
的时间序列被转换成一组元组
Figure 94943DEST_PATH_IMAGE063
> ,其中
Figure 927769DEST_PATH_IMAGE057
是第k个时间单 元,
Figure 880156DEST_PATH_IMAGE064
=
Figure 329592DEST_PATH_IMAGE061
∊{U, D, Q}表示第k个时间单元类别
Figure 246863DEST_PATH_IMAGE050
的变化为正、负或无速率。例如,GDP在 1970 年具有正的变化率,那么它可以表示为:<GDP, 1970, U>。
基于上述时间序列结构,将滞后类别为l的两个类别
Figure 465355DEST_PATH_IMAGE050
Figure 573994DEST_PATH_IMAGE051
之间的关系用以下方 式进行定义:
Figure 245147DEST_PATH_IMAGE065
,该类别表示相同关系,定义如下:
Figure 231688DEST_PATH_IMAGE066
(3)
即,在l个时间单元后,类别
Figure 304687DEST_PATH_IMAGE050
的变化率与
Figure 587157DEST_PATH_IMAGE051
的变化率相同。
Figure 745606DEST_PATH_IMAGE067
,即相同关系的支持数,定义如下:
Figure 801418DEST_PATH_IMAGE068
(4)
Figure 197764DEST_PATH_IMAGE069
,即相同关系的支持比例,定义如下:
Figure 444943DEST_PATH_IMAGE070
(5)
Figure 90688DEST_PATH_IMAGE071
,该类别表示逆关系,定义如下:
Figure 153453DEST_PATH_IMAGE072
(6)
即,在l个时间单元后,类别
Figure 201044DEST_PATH_IMAGE050
的变化率与
Figure 825317DEST_PATH_IMAGE051
的变化率相反。
Figure 958358DEST_PATH_IMAGE073
,即相反关系的支持数,定义如下:
Figure 824814DEST_PATH_IMAGE074
(7)
Figure 726911DEST_PATH_IMAGE075
,即相反关系的支持比例,定义如下:
Figure 519155DEST_PATH_IMAGE076
(8)
由于因果关系需要关联,因此使用该方法时,首先考虑类别
Figure 608334DEST_PATH_IMAGE050
Figure 278481DEST_PATH_IMAGE051
间的时间关联, 其中支持数阈值的定义如下:
Figure 35084DEST_PATH_IMAGE077
,即所有因果关系的支持数阈值(一般考虑为70%);
Figure 1159DEST_PATH_IMAGE078
,即时间优势比的阈值(一般考虑为3,由于
Figure 108793DEST_PATH_IMAGE077
设置为70%,因此
Figure 317051DEST_PATH_IMAGE078
考虑设置为3。
时间关联:使用直接或间接关系时间关联可以定义如下:
时间直接关联:时间滞后为l的类别
Figure 928161DEST_PATH_IMAGE050
Figure 327787DEST_PATH_IMAGE051
之间的时间直接关联可以定义为:
Figure 329241DEST_PATH_IMAGE079
时间逆关联:时间滞后为l的类别
Figure 403508DEST_PATH_IMAGE050
Figure 603545DEST_PATH_IMAGE051
之间的时间逆关联可以定义为:
Figure 165283DEST_PATH_IMAGE080
接下来,定义术语来计算时间关联类别的时间优势比,检验时间关联规则
Figure 716350DEST_PATH_IMAGE081
是否也是因果规则。
Figure 531991DEST_PATH_IMAGE082
=在l个时间单位后,类别
Figure 117693DEST_PATH_IMAGE050
的无变化率和
Figure 593542DEST_PATH_IMAGE051
的正负变化率相关时,对 数的计算方式定义为:
Figure 897485DEST_PATH_IMAGE083
(9)
其中
Figure 47975DEST_PATH_IMAGE084
表示中性变化关系,定义如下:
Figure 488183DEST_PATH_IMAGE085
(10)
Figure 403443DEST_PATH_IMAGE086
=在l个时间单位后,类别
Figure 929102DEST_PATH_IMAGE050
的正负变化率和
Figure 86545DEST_PATH_IMAGE051
的无变化率相关时,对 数的计算方式定义为:
Figure 646840DEST_PATH_IMAGE087
(11)
其中
Figure 198913DEST_PATH_IMAGE088
表示变化中性关系,定义如下:
Figure 477447DEST_PATH_IMAGE089
(12)
Figure 438581DEST_PATH_IMAGE090
=在l个时间单位后,类别
Figure 587803DEST_PATH_IMAGE050
的无变化率和
Figure 579286DEST_PATH_IMAGE051
的无变化率相关时,对数 的计算方式定义为:
Figure 79537DEST_PATH_IMAGE091
(13)
其中
Figure 578783DEST_PATH_IMAGE092
表示中性关系,定义如下:
Figure 848090DEST_PATH_IMAGE093
(14)
时间优势比:量化了类别
Figure 273124DEST_PATH_IMAGE050
的变化率对类别
Figure 260672DEST_PATH_IMAGE051
变化率的影响程度,使用上诉等式 对时间优势比的定义如下:
时间直接优势比:时间滞后为l的两个类别
Figure 298029DEST_PATH_IMAGE050
Figure 687422DEST_PATH_IMAGE051
之间的时间直接优势比可以定 义为:
Figure 286287DEST_PATH_IMAGE094
(15)
时间逆优势比:时间滞后为l的两个类别
Figure 495551DEST_PATH_IMAGE050
Figure 336600DEST_PATH_IMAGE051
之间的时间逆优势比可以定义为:
Figure 580499DEST_PATH_IMAGE095
(16)
如果时间直接优势比或时间逆优势比中类别之间的
Figure 347336DEST_PATH_IMAGE090
Figure 309475DEST_PATH_IMAGE082
Figure 688635DEST_PATH_IMAGE086
的值为零,将其视为1以避免无限的时间优势比。
因果关系判定:判断是否满足时间直接关联或时间逆关联,且
Figure 459145DEST_PATH_IMAGE096
或者
Figure 147616DEST_PATH_IMAGE097
,是则类别
Figure 595388DEST_PATH_IMAGE050
和类别
Figure 27507DEST_PATH_IMAGE051
存在因果 关系,否则不存在因果关系。
S4、生成二元规则BRS,并计算两个类别的关系强度;
生成二元规则:如果存在时间关联规则
Figure 731152DEST_PATH_IMAGE081
以及
Figure 856102DEST_PATH_IMAGE096
或者
Figure 510943DEST_PATH_IMAGE097
,那么类别
Figure 746753DEST_PATH_IMAGE050
Figure 304904DEST_PATH_IMAGE051
存在一个二元因果规则
Figure 335177DEST_PATH_IMAGE098
通常用
Figure 745823DEST_PATH_IMAGE099
表示直接因果规则,用
Figure 519744DEST_PATH_IMAGE100
表示逆因果规 则。
计算
Figure 463561DEST_PATH_IMAGE049
,即关系强度,它表明类别间所存在的关系强度。类别
Figure 664735DEST_PATH_IMAGE050
Figure 90906DEST_PATH_IMAGE051
间的关系强度 计算如下:
Figure 668518DEST_PATH_IMAGE052
(17)
S5、根据步骤S4的二元规则BRS和关系强度生成精准二元规则SRS;类别
Figure 466840DEST_PATH_IMAGE050
和类别
Figure 838916DEST_PATH_IMAGE051
存在二元规则
Figure 958575DEST_PATH_IMAGE101
并且
Figure 74299DEST_PATH_IMAGE054
时,那么类别
Figure 461549DEST_PATH_IMAGE050
和类别
Figure 4526DEST_PATH_IMAGE051
之间存在精准二 元规则
Figure 874130DEST_PATH_IMAGE102
实施例2
1、从城管事件数据的z个类别中任意选取两个类别,即市容环境
Figure 527966DEST_PATH_IMAGE103
和街道秩序
Figure 769722DEST_PATH_IMAGE104
, 并统计该类别在2013-2020年的事件发生次数,其发生次数如下表所示:
Figure 483600DEST_PATH_IMAGE106
2、根据发生次数计算市容环境
Figure 577852DEST_PATH_IMAGE103
和街道秩序
Figure 35378DEST_PATH_IMAGE104
在2014-2020年的变化率,结果如 下表所示:
Figure 662799DEST_PATH_IMAGE108
使用变化率正(U)或负(D)作为市容环境
Figure 547579DEST_PATH_IMAGE103
和街道秩序
Figure 126196DEST_PATH_IMAGE104
的时间序列,令
Figure 387414DEST_PATH_IMAGE109
, 根据实施例1中公式(2)对市容环境
Figure 869342DEST_PATH_IMAGE103
和街道秩序
Figure 925022DEST_PATH_IMAGE104
的变化率进行分类,则:
这里我们计算支持值α的滞后值为1。
3、根据实施例1中公式(2)公式(5)和(8)计算因果关系的支持值α以及实施例1中 公式(2)公式(15)和(16)计算时间优势比TOR,得到
Figure 982147DEST_PATH_IMAGE110
,TOR=
Figure 47055DEST_PATH_IMAGE111
4、判断市容环境
Figure 383490DEST_PATH_IMAGE103
和街道秩序
Figure 610072DEST_PATH_IMAGE104
之间是否存在因果关系,由于计算出的
Figure 960019DEST_PATH_IMAGE112
=70%且
Figure 563039DEST_PATH_IMAGE113
,生成结果BRS如下:
Figure 957242DEST_PATH_IMAGE114
该结果表明存在规则
Figure 417042DEST_PATH_IMAGE115
,即在滞后值为1年的情况下,市容环境
Figure 194899DEST_PATH_IMAGE103
和街道秩序
Figure 601609DEST_PATH_IMAGE104
之间存在直接因果关系,即市容环境
Figure 647057DEST_PATH_IMAGE103
在1年之后影响街道秩序
Figure 481021DEST_PATH_IMAGE104
5、根据公式(17)计算出市容环境
Figure 743244DEST_PATH_IMAGE103
和街道秩序
Figure 688066DEST_PATH_IMAGE104
的关系强度
Figure 853599DEST_PATH_IMAGE049
,得到
Figure 858464DEST_PATH_IMAGE049
=70.13。
6、根据上一步算法生成的二元因果规则,在这一步中我们计算出精准的二元因果规则。
Figure 610913DEST_PATH_IMAGE116
Figure 93847DEST_PATH_IMAGE117
分别为类别
Figure 379466DEST_PATH_IMAGE050
Figure 555232DEST_PATH_IMAGE051
的变化率,并且类别间有直接关系。
Figure 792048DEST_PATH_IMAGE118
等于
Figure 813093DEST_PATH_IMAGE050
变化率的最大值,
Figure 953219DEST_PATH_IMAGE119
等于
Figure 34307DEST_PATH_IMAGE051
变化率的最大值,
Figure 761348DEST_PATH_IMAGE120
等于
Figure 851664DEST_PATH_IMAGE050
变化率的最小值,
Figure 846296DEST_PATH_IMAGE121
等于
Figure 363865DEST_PATH_IMAGE051
变化率的最小值。
计算
Figure 732529DEST_PATH_IMAGE122
的区间值(类别
Figure 610224DEST_PATH_IMAGE050
值的增量):
Figure 974209DEST_PATH_IMAGE123
以及
Figure 413412DEST_PATH_IMAGE124
(18)
输入二元规则生成的结果,
Figure 597269DEST_PATH_IMAGE116
以及
Figure 621199DEST_PATH_IMAGE117
;初始化类别
Figure 511795DEST_PATH_IMAGE125
Figure 121899DEST_PATH_IMAGE126
Figure 793052DEST_PATH_IMAGE127
Figure 12549DEST_PATH_IMAGE128
Figure 85548DEST_PATH_IMAGE129
Figure 866553DEST_PATH_IMAGE130
Figure 25002DEST_PATH_IMAGE131
;带入实施例1中公式(2) 公式(5)以及公式(8)计算得到支持度,带入实施例1中公式(2)公式(15)以及公式(16)计算 得到时间优势比,最终得到结果SRS。
Figure 51120DEST_PATH_IMAGE132
该结果表明存在规则
Figure 978625DEST_PATH_IMAGE133
,即在滞后数为1年的情况 下,市容环境
Figure 930531DEST_PATH_IMAGE103
和街道秩序
Figure 576276DEST_PATH_IMAGE104
有直接因果关系,并且如果市容环境
Figure 403156DEST_PATH_IMAGE103
增加1%,那么将会导致 街道秩序
Figure 185167DEST_PATH_IMAGE104
增加2%。
实施例3
一种城管事件指标间的因果关系检验装置包括存储器:用于存储可执行指令;处理器:用于执行所述存储器中存储的可执行指令,实现一种城管事件指标间的因果关系检验方法。
本发明提出了一种在大数据下,时间序列数据提取因果关系的方法,例如二元关系、精准二元关系。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置和方法,也可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,附图中的流程图和框图显示了根据本发明的多个实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现方式中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
另外,在本发明各个实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。
所述功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。

Claims (10)

1.一种城管事件指标间的因果关系检验方法,其特征在于,包括以下步骤:
S1、对城管事件数据预处理后,任选两个类别分别统计其在设定时间单元的发生次数,然后分别计算其在设定时间单元的变化率;
S2、通过设定的变化率类型,将步骤S1中两个类别的变化率分别归类;
S3、根据步骤S2中归类后的两个类别,计算两个类别的因果关系支持值和时间优势比,然后判断是否存在因果关系,是则执行步骤S4和S5,否则结束;
S4、生成二元规则BRS,并计算两个类别的关系强度;
S5、根据步骤S4的二元规则BRS和关系强度生成精准二元规则SRS。
2.根据权利要求1所述的一种城管事件指标间的因果关系检验方法,其特征在于,步骤 S1中变化率的计算公式为:
Figure DEST_PATH_IMAGE001
其中,
Figure 413689DEST_PATH_IMAGE002
表示类别
Figure DEST_PATH_IMAGE003
在第k个时间单元的值,
Figure 516512DEST_PATH_IMAGE004
表示类别
Figure 533010DEST_PATH_IMAGE003
在第k-1个时间单元的 值,
Figure DEST_PATH_IMAGE005
表示类别
Figure 407818DEST_PATH_IMAGE003
在第k年的变化率,i为类别数。
3.根据权利要求2所述的一种城管事件指标间的因果关系检验方法,其特征在于,步骤S2中将变化率归类的计算公式如下:
Figure DEST_PATH_IMAGE007
其中,
Figure 117148DEST_PATH_IMAGE008
代表变化类型,U为正变化率,D为负变化率, Q为无变化率,
Figure 5470DEST_PATH_IMAGE005
表示类别
Figure 825658DEST_PATH_IMAGE003
在 第k年的变化率,
Figure DEST_PATH_IMAGE009
为设定的变化率。
4.根据权利要求3所述的一种城管事件指标间的因果关系检验方法,其特征在于,步骤S3的具体过程如下:
S301、将类别
Figure 552044DEST_PATH_IMAGE003
的时间序列转换成一组元组
Figure 432275DEST_PATH_IMAGE010
> ;
其中,类别
Figure DEST_PATH_IMAGE011
是城管事件数据库中的一个类别,
Figure 247041DEST_PATH_IMAGE012
是第k个时间单元,
Figure DEST_PATH_IMAGE013
∊{U, D, Q}表 示第k个时间单元类别
Figure 543024DEST_PATH_IMAGE011
的变化为正变化率、负变化率、无变化率中任一项;
S302、步骤S301的元组中滞后类别为l的两个类别
Figure 953277DEST_PATH_IMAGE003
Figure 502944DEST_PATH_IMAGE014
,计算这两者的因果关系支持 值,即计算相同关系的支持比例和相反关系的支持比例;
S303、步骤S301的元组中滞后类别为l的两个类别
Figure 428175DEST_PATH_IMAGE003
Figure 590166DEST_PATH_IMAGE014
,计算这两者的时间优势比,即 计算时间直接优势比和时间逆优势比;
S304、判断是否因果关系支持值大于或等于设定因果关系的支持数阈值,且时间优势比大于或等于时间优势比的阈值,是则存在因果关系,否则结束。
5.根据权利要求4所述的一种城管事件指标间的因果关系检验方法,其特征在于,步骤S302的具体过程如下:
Figure DEST_PATH_IMAGE015
表示相同关系,定义如下:
Figure 527029DEST_PATH_IMAGE016
即,在l个时间单元后,类别
Figure 238809DEST_PATH_IMAGE003
的变化率与类别
Figure 589019DEST_PATH_IMAGE014
的变化率相同;
Figure DEST_PATH_IMAGE017
表示相同关系的支持数,定义如下:
Figure 492384DEST_PATH_IMAGE018
Figure DEST_PATH_IMAGE019
表示相同关系的支持比例,定义如下:
Figure 47868DEST_PATH_IMAGE020
Figure DEST_PATH_IMAGE021
表示表示逆关系,定义如下:
Figure 112907DEST_PATH_IMAGE022
即,在l个时间单元后,类别
Figure 451878DEST_PATH_IMAGE003
的变化率与
Figure 17989DEST_PATH_IMAGE014
的变化率相反;
Figure DEST_PATH_IMAGE023
表示相反关系的支持数,定义如下:
Figure 195023DEST_PATH_IMAGE024
Figure DEST_PATH_IMAGE025
表示相反关系的支持比例,定义如下:
Figure 929499DEST_PATH_IMAGE026
6.根据权利要求5所述的一种城管事件指标间的因果关系检验方法,其特征在于,步骤S303的具体过程如下:
Figure DEST_PATH_IMAGE027
表示在l个时间单位后,类别
Figure 191984DEST_PATH_IMAGE003
的无变化率和类别
Figure 499469DEST_PATH_IMAGE014
的正负变化率相关时, 对数的计算方式定义为:
Figure 829212DEST_PATH_IMAGE028
其中
Figure DEST_PATH_IMAGE029
表示中性变化关系,定义如下:
Figure 501633DEST_PATH_IMAGE030
Figure DEST_PATH_IMAGE031
表示在l个时间单位后,类别
Figure 48152DEST_PATH_IMAGE003
的正负变化率和类别
Figure 657863DEST_PATH_IMAGE014
的无变化率相关时, 对数的计算方式定义为:
Figure 606227DEST_PATH_IMAGE032
其中
Figure DEST_PATH_IMAGE033
表示变化中性关系,定义如下:
Figure 449549DEST_PATH_IMAGE034
Figure DEST_PATH_IMAGE035
表示在l个时间单位后,类别
Figure 922512DEST_PATH_IMAGE003
的无变化率和类别
Figure 571800DEST_PATH_IMAGE014
的无变化率相关时,对 数的计算方式定义为:
Figure 374670DEST_PATH_IMAGE036
其中
Figure DEST_PATH_IMAGE037
表示中性关系,定义如下:
Figure 949746DEST_PATH_IMAGE038
时间直接优势比:时间滞后为l的两个类别
Figure 470857DEST_PATH_IMAGE003
和类别
Figure 658256DEST_PATH_IMAGE014
之间的时间直接优势比定义为:
Figure DEST_PATH_IMAGE039
时间逆优势比:时间滞后为l的两个类别
Figure 32079DEST_PATH_IMAGE003
Figure 279521DEST_PATH_IMAGE014
之间的时间逆优势比定义为:
Figure 287928DEST_PATH_IMAGE040
时间直接优势比和时间逆优势比中
Figure 279018DEST_PATH_IMAGE035
Figure 555016DEST_PATH_IMAGE027
Figure 35676DEST_PATH_IMAGE031
的值为 零时,将其视为1避免无限的时间优势比。
7.根据权利要求6所述的一种城管事件指标间的因果关系检验方法,其特征在于,步骤S304的具体过程如下:
Figure DEST_PATH_IMAGE041
表示设定的所有因果关系的支持数阈值;
Figure 203484DEST_PATH_IMAGE042
表示设定的时间优势比的阈值;
时间直接关联:时间滞后为l的类别
Figure 998264DEST_PATH_IMAGE003
和类别
Figure 131699DEST_PATH_IMAGE014
之间的时间直接关联定义为:
Figure DEST_PATH_IMAGE043
时间逆关联:时间滞后为l的类别
Figure 658626DEST_PATH_IMAGE003
Figure 641626DEST_PATH_IMAGE014
之间的时间逆关联定义为:
Figure 473053DEST_PATH_IMAGE044
判断是否满足时间直接关联或时间逆关联,且
Figure DEST_PATH_IMAGE045
或者
Figure 959529DEST_PATH_IMAGE046
,是则类别
Figure 985254DEST_PATH_IMAGE003
和类别
Figure 189971DEST_PATH_IMAGE014
存在因果关系,否则不存在因果关系。
8.根据权利要求7所述的一种城管事件指标间的因果关系检验方法,其特征在于,步骤S4的具体过程为:
类别
Figure 828019DEST_PATH_IMAGE003
和类别
Figure 169001DEST_PATH_IMAGE014
存在一个二元因果规则
Figure 365627DEST_PATH_IMAGE048
Figure DEST_PATH_IMAGE049
表示直 接因果规则,
Figure DEST_PATH_IMAGE051
表示逆因果规则;
计算关系强度
Figure 431541DEST_PATH_IMAGE052
,其表明类别间所存在的关系强度,类别
Figure 168553DEST_PATH_IMAGE003
和类别
Figure 629621DEST_PATH_IMAGE014
间的关系强度计 算如下:
Figure DEST_PATH_IMAGE053
9.根据权利要求8所述的一种城管事件指标间的因果关系检验方法,其特征在于,步骤 S5的具体过程为:类别
Figure 436297DEST_PATH_IMAGE003
和类别
Figure 350026DEST_PATH_IMAGE014
存在二元规则
Figure 828412DEST_PATH_IMAGE054
并且
Figure DEST_PATH_IMAGE055
时,那么类 别
Figure 845784DEST_PATH_IMAGE003
和类别
Figure 180951DEST_PATH_IMAGE014
之间存在精准二元规则
Figure DEST_PATH_IMAGE057
10.一种城管事件指标间的因果关系检验装置,其特征在于,包括
存储器:用于存储可执行指令;
处理器:用于执行所述存储器中存储的可执行指令,实现如权利要求1-9任一项所述的一种城管事件指标间的因果关系检验方法。
CN202210171095.8A 2022-02-24 2022-02-24 一种城管事件指标间的因果关系检验方法及装置 Pending CN114240264A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210171095.8A CN114240264A (zh) 2022-02-24 2022-02-24 一种城管事件指标间的因果关系检验方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210171095.8A CN114240264A (zh) 2022-02-24 2022-02-24 一种城管事件指标间的因果关系检验方法及装置

Publications (1)

Publication Number Publication Date
CN114240264A true CN114240264A (zh) 2022-03-25

Family

ID=80748088

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210171095.8A Pending CN114240264A (zh) 2022-02-24 2022-02-24 一种城管事件指标间的因果关系检验方法及装置

Country Status (1)

Country Link
CN (1) CN114240264A (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2005017652A2 (en) * 2003-08-05 2005-02-24 Rosetta Inpharmatics, Llc Computer systems and methods for inferring causality from cellular constituent abundance data
US20050060403A1 (en) * 2003-09-11 2005-03-17 Bernstein David R. Time-based correlation of non-translative network segments
US20080311572A1 (en) * 2004-11-26 2008-12-18 Ahuja Sunil K Methods and Compositions For Correlating Ccl3l1/Ccr5 Genotypes With Disorders
US20200160189A1 (en) * 2018-11-20 2020-05-21 International Business Machines Corporation System and Method of Discovering Causal Associations Between Events
CN113221096A (zh) * 2021-06-04 2021-08-06 北银金融科技有限责任公司 一种在混沌工程中随机事件相关性分析方法及系统
CN113656906A (zh) * 2021-07-29 2021-11-16 浙江大学 一种面向燃气轮机的非平稳多变量因果关系分析方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2005017652A2 (en) * 2003-08-05 2005-02-24 Rosetta Inpharmatics, Llc Computer systems and methods for inferring causality from cellular constituent abundance data
US20050060403A1 (en) * 2003-09-11 2005-03-17 Bernstein David R. Time-based correlation of non-translative network segments
US20080311572A1 (en) * 2004-11-26 2008-12-18 Ahuja Sunil K Methods and Compositions For Correlating Ccl3l1/Ccr5 Genotypes With Disorders
US20200160189A1 (en) * 2018-11-20 2020-05-21 International Business Machines Corporation System and Method of Discovering Causal Associations Between Events
CN113221096A (zh) * 2021-06-04 2021-08-06 北银金融科技有限责任公司 一种在混沌工程中随机事件相关性分析方法及系统
CN113656906A (zh) * 2021-07-29 2021-11-16 浙江大学 一种面向燃气轮机的非平稳多变量因果关系分析方法

Similar Documents

Publication Publication Date Title
Yang Data preprocessing
US20120254183A1 (en) Method and System for Clustering Data Points
US10417564B2 (en) Goal-oriented process generation
CN112488716B (zh) 一种异常事件检测系统
US20140032611A1 (en) Relationship discovery in business analytics
CN116401232B (zh) 数据库参数配置优化方法、装置、电子设备及存储介质
CN111160959A (zh) 一种用户点击转化预估方法及装置
Dickens et al. Order-invariant cardinality estimators are differentially private
CN109255368B (zh) 随机选取特征的方法、装置、电子设备及存储介质
CN113407425B (zh) 基于BiGAN与OTSU的内部用户行为检测方法
CN110807489A (zh) 二分类任务评价指标的确定方法、装置及电子设备
CN112560105B (zh) 保护多方数据隐私的联合建模方法及装置
CN114240264A (zh) 一种城管事件指标间的因果关系检验方法及装置
Heres Source code plagiarism detection using machine learning
CN111783883A (zh) 一种异常数据的检测方法及装置
Trushkowsky et al. Getting it all from the crowd
Peters et al. Statistical features of persistence and long memory in mortality data
CN114861800A (zh) 模型训练方法、概率确定方法、装置、设备、介质及产品
CN110992043B (zh) 一种风险实体挖掘的方法和装置
CN114238280A (zh) 构建金融敏感信息标准库的方法、装置及电子设备
CN114926082A (zh) 基于人工智能的数据波动预警方法及相关设备
CN112613231A (zh) 一种机器学习中隐私可用均衡的轨迹训练数据扰动机制
WO2019227415A1 (zh) 一种评分卡模型的调整方法、装置、服务器及存储介质
CN112148808A (zh) 关系构建方法、装置和电子设备
Abdullah et al. Tracing significant association rules using critical least association rules model

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20220325