CN111061814A - 一种建模分析方法、装置、电子设备及存储介质 - Google Patents
一种建模分析方法、装置、电子设备及存储介质 Download PDFInfo
- Publication number
- CN111061814A CN111061814A CN201911262991.XA CN201911262991A CN111061814A CN 111061814 A CN111061814 A CN 111061814A CN 201911262991 A CN201911262991 A CN 201911262991A CN 111061814 A CN111061814 A CN 111061814A
- Authority
- CN
- China
- Prior art keywords
- entity
- event
- entities
- user
- obtaining
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000004458 analytical method Methods 0.000 title claims abstract description 126
- 238000000034 method Methods 0.000 claims abstract description 44
- 238000007621 cluster analysis Methods 0.000 claims description 8
- 238000004590 computer program Methods 0.000 claims description 8
- 238000010586 diagram Methods 0.000 description 11
- 230000006870 function Effects 0.000 description 7
- 238000012098 association analyses Methods 0.000 description 4
- 230000004044 response Effects 0.000 description 3
- 230000006399 behavior Effects 0.000 description 2
- 238000012544 monitoring process Methods 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 239000000758 substrate Substances 0.000 description 1
- 238000012549 training Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/28—Databases characterised by their database models, e.g. relational or object models
- G06F16/284—Relational databases
- G06F16/288—Entity relationship models
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/28—Databases characterised by their database models, e.g. relational or object models
- G06F16/284—Relational databases
- G06F16/285—Clustering or classification
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请提供一种建模分析方法、装置、电子设备及存储介质,该方法包括:确定至少一个用户实体;获得与至少一个用户实体相关的至少一个事件实体;对至少一个事件实体进行建模分析。在上述的实现过程中,通过抽象出用户模型和事件模型来进行建模分析,有效地简化了建模分析的流程,从而改善了对数据进行建模分析的流程十分复杂的问题。
Description
技术领域
本申请涉及人工智能和建模分析的技术领域,具体而言,涉及一种建模分析方法、装置、电子设备及存储介质。
背景技术
目前,在使用建模分析平台进行建模分析时,涉及到许多数据处理的细节和流程,这些细节包括:电子表格、数据库、Google Analytics和Salesforce等应用,这些流程例如:数据预处理、特征工程、模型训练、模型评估和模型应用等。对于非专业人士来说,需要学习上述的基本概念和基本操作才能够进行建模分析,而且对数据进行建模分析的流程十分复杂。
发明内容
本申请实施例的目的在于提供一种建模分析方法、装置、电子设备及存储介质,用于改善对数据进行建模分析的流程十分复杂的问题。
本申请实施例提供了一种建模分析方法,包括:确定至少一个用户实体;获得与所述至少一个用户实体相关的至少一个事件实体;对所述至少一个事件实体进行建模分析。在上述的实现过程中,通过抽象出用户模型和事件模型来进行建模分析,有效地简化了建模分析的流程,从而改善了对数据进行建模分析的流程十分复杂的问题。
可选地,在本申请实施例中,所述确定至少一个用户实体,包括:根据第一属性值确定所述至少一个用户实体,所述第一属性值为描述所述用户实体的时间属性的具体值或地点属性的具体值。在上述的实现过程中,通过用户实体的时间属性的具体值或地点属性的具体值确定至少一个用户实体,从而提高了确定用户实体的速度。
可选地,在本申请实施例中,所述获得与所述至少一个用户实体相关的至少一个事件实体,包括:获得所述至少一个用户实体的第一标识值,所述第一标识值为所述用户实体的唯一标识符的具体值;根据所述至少一个用户实体的第一标识值与所述至少一个事件实体预先建立的关联关系,获得所述至少一个事件实体。在上述的实现过程中,通过用户实体的第一标识值与事件实体预先建立的关联关系,来获得至少一个事件实体,从而有效地减少了关联关系所占用的存储空间,并提高了获得事件实体的速度。
可选地,在本申请实施例中,所述对所述至少一个事件实体进行建模分析,包括:获得与所述至少一个事件实体相关的至少一个关联实体,所述关联实体为所述事件实体的作用对象相关的实体;根据所述至少一个关联实体对所述至少一个事件实体进行建模分析。在上述的实现过程中,通过获得事件实体相关的关联实体,并根据关联实体对事件实体进行建模分析,从而扩展了对事件实体进行建模分析的维度。
可选地,在本申请实施例中,所述获得与所述至少一个事件实体相关的至少一个关联实体,包括:获得所述至少一个事件实体的第二标识值,所述第二标识值为所述事件实体的唯一标识符的具体值;根据所述至少一个事件实体的第二标识值与所述至少一个关联实体预先建立的关联关系,获得所述至少一个关联实体。在上述的实现过程中,通过事件实体的第二标识值与关联实体预先建立的关联关系,来获得至少一个关联实体,从而有效地减少了关联关系所占用的存储空间,并提高了获得关联实体的速度。
可选地,在本申请实施例中,所述至少一个事件实体相关为多个事件实体;所述根据所述至少一个关联实体对所述至少一个事件实体进行建模分析,包括:获得所述多个事件实体中的第二属性值相同的事件实体;或者若所述多个事件实体相关的多个关联实体的第二属性值相同,则获得所述第二属性值对应的多个事件实体。在上述的实现过程中,获得第二属性值相同的事件实体,获得与事件实体关联的多个关联实体的第二属性值相同的事件实体,即通过属性值是否相同来进行事件实体的碰撞分析,从而有效地提升了碰撞分析的速度。
可选地,在本申请实施例中,所述至少一个事件实体相关为多个事件实体;所述根据所述至少一个关联实体对所述至少一个事件实体进行建模分析,包括:根据所述多个事件实体中的第三属性值对所述多个事件实体进行分组分析,获得多组事件实体,所述多组事件实体中的每组事件实体的第三属性值是相同的;或者根据所述多个事件实体中的第三属性值对所述多个事件实体进行聚类分析,获得多类事件实体,所述多组事件实体中的每组事件实体的第三属性值是属于同一类的。在上述的实现过程中,通过事件实体中的第三属性值来对事件实体进行分组分析或者聚类分析,从而增加了对事件实体的分析维度。
本申请实施例还提供了一种建模分析装置,包括:用户实体确定模块,用于确定至少一个用户实体;事件实体获得模块,用于获得与所述至少一个用户实体相关的至少一个事件实体;实体建模分析模块,用于对所述至少一个事件实体进行建模分析。在上述的实现过程中,通过抽象出用户模型和事件模型来进行建模分析,有效地简化了建模分析的流程,从而改善了对数据进行建模分析的流程十分复杂的问题。
可选地,在本申请实施例中,所述用户实体确定模块,包括:第一确定模块,用于根据第一属性值确定所述至少一个用户实体,所述第一属性值为描述所述用户实体的时间属性的具体值或地点属性的具体值。
可选地,在本申请实施例中,所述事件实体获得模块,包括:第一获得模块,用于获得所述至少一个用户实体的第一标识值,所述第一标识值为所述用户实体的唯一标识符的具体值;第二获得模块,用于根据所述至少一个用户实体的第一标识值与所述至少一个事件实体预先建立的关联关系,获得所述至少一个事件实体。
可选地,在本申请实施例中,所述实体建模分析模块,包括:第三获得模块,用于获得与所述至少一个事件实体相关的至少一个关联实体,所述关联实体为所述事件实体的作用对象相关的实体;建模分析模块,用于根据所述至少一个关联实体对所述至少一个事件实体进行建模分析。
可选地,在本申请实施例中,所述第三获得模块,包括:第四获得模块,用于获得所述至少一个事件实体的第二标识值,所述第二标识值为所述事件实体的唯一标识符的具体值;第五获得模块,用于根据所述至少一个事件实体的第二标识值与所述至少一个关联实体预先建立的关联关系,获得所述至少一个关联实体。
可选地,在本申请实施例中,所述至少一个事件实体相关为多个事件实体;所述建模分析模块,包括:第六获得模块,用于获得所述多个事件实体中的第二属性值相同的事件实体;或者若所述多个事件实体相关的多个关联实体的第二属性值相同,则获得所述第二属性值对应的多个事件实体。
可选地,在本申请实施例中,所述至少一个事件实体相关为多个事件实体;所述建模分析模块,包括:第七获得模块,用于根据所述多个事件实体中的第三属性值对所述多个事件实体进行分组分析,获得多组事件实体,所述多组事件实体中的每组事件实体的第三属性值是相同的;或者根据所述多个事件实体中的第三属性值对所述多个事件实体进行聚类分析,获得多类事件实体,所述多组事件实体中的每组事件实体的第三属性值是属于同一类的。
本申请实施例还提供了一种电子设备,包括:处理器和存储器,所述存储器存储有所述处理器可执行的机器可读指令,所述机器可读指令被所述处理器执行时执行如上所述的方法。
本申请实施例还提供了一种存储介质,该存储介质上存储有计算机程序,该计算机程序被处理器运行时执行如上所述的方法。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对本申请实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1示出的本申请实施例提供的建模分析方法流程示意图;
图2示出的本申请实施例提供的建模分析方法的分析结果的示意图;
图3示出的本申请实施例提供的建模分析装置的结构示意图;
图4示出的本申请实施例提供的电子设备的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整的描述。
在介绍本申请实施例提供的建模分析方法之前,先介绍本申请实施例所涉及的一些概念,本申请实施例所涉及的一些概念如下:
数据库(DataBase,DB),是指存储电子数据或者电子文件的集合,简而言之可视为电子化的文件柜,用户可以对文件中的数据运行新增、截取、更新、删除等操作。所谓“数据库”是以一定方式储存在一起、能与多个用户共享、具有尽可能小的冗余度、与应用程序彼此独立的数据集合。数据库包括:内存数据库、关系型数据库和非关系型数据库:
内存数据库是指基于随机存储记忆体(Random Access Memory,RAM)查找的数据集合,特点为读写速度快,因此也被称为缓存数据库,常见的内存数据库例如:Memcached和Redis等。
关系型数据库是指采用关系模型来组织数据的数据库,关系型数据库以行和列的形式存储数据,以便于用户理解,关系型数据库这一系列的行和列被称为表,常见的关系型数据库例如:Mysql、PostgreSQL、Oracle和SQLSever等。
非关系型数据库,又被称为NoSQL(Not Only SQL),意为不仅仅是结构化查询语言(Structured QueryLanguage,SQL),非关系型数据库根据结构化方法以及应用场合的不同,主要分为:面向列式存储、面向文档存储和键值对存储的三种非关系型数据库,常见的非关系型数据库包括:grakn知识图谱数据库、Neo4j图数据库、Hadoop子系统HBase、MongoDB和CouchDB等。
服务器是指通过网络提供计算服务的设备,服务器例如:x86服务器以及非x86服务器,非x86服务器包括:大型机、小型机和UNIX服务器。当然在具体的实施过程中,上述的服务器可以具体选择大型机或者小型机,这里的小型机是指采用精简指令集计算(ReducedInstruction Set Computing,RISC)、单字长定点指令平均执行速度(MillionInstructions Per Second,MIPS)等专用处理器,主要支持UNIX操作系统的封闭且专用的提供计算服务的设备;这里的大型机,又名大型主机,是指使用专用的处理器指令集、操作系统和应用软件来提供计算服务的设备。
需要说明的是,本申请实施例提供的建模分析方法可以被电子设备执行,这里的电子设备是指具有执行计算机程序功能的设备终端或者上述的服务器,设备终端例如:智能手机、个人电脑(personal computer,PC)、平板电脑、个人数字助理(personal digitalassistant,PDA)、移动上网设备(mobile Internet device,MID)、网络交换机或网络路由器等。
在介绍本申请实施例提供的建模分析方法之前,先介绍该建模分析方法适用的应用场景,这里的应用场景包括但不限于:使用建模工具对数据进行建模分析、使用关系型数据库或者非关系型数据库对数据进行建模分析、使用该建模分析方法设计数据仓库和设计用户事件数据仓库等场景。
请参见图1示出的本申请实施例提供的建模分析方法的流程示意图;本申请实施例提供了一种建模分析方法,包括:
步骤S110:电子设备确定至少一个用户实体。
实体,是指现实世界中客观存在的并可以相互区分的对象或事物,例如:现实中的一个用户、一个正在发生或者已经发生的事件、或者该事件所关联的对象;具体地,姓名为A1的用户为一个实体,用户A1乘坐飞机可以称之为一个事件实体,该飞机的具体型号为B1,该飞机可以称之为关联实体。
用户实体,是指在数据库设计中,针对用户抽象出来的计算机存储概念,用户实体是对现实世界中的用户进行映射,一个现实中的用户可以对应一个用户实体,例如:姓名为“张三”的用户对应一个唯一标识为A1用户实体等等。在非关系型数据库中,具体例如:在grakn知识图谱数据库中可以使用define指令定义用户实体的名称,以及该用户实体的属性值,也可以增加用户实体的关联关系。在关系型数据库中,可以将用户实体设计为关系型数据库中的数据表,数据库中的字段内容可以存储用户实体的唯一标识和属性值等。当然,在具体的实施过程中,在从关系型数据库或非关系型数据库中获取到用户实体后,也可以使用上述的内存数据库存储上述的用户实体,以提高对用户实体的访问速度。
其中,用户实体的确定方式有很多种,若这里的方法被上述的电子设备执行:第一种方式,接收终端设备发送的用户实体的唯一标识,根据唯一标识确定用户实体;第二种方式,接收终端设备发送的第一属性值,并根据属性值确定;下面分别对这两种方式进行描述:
第一种方式,接收终端设备发送的用户实体的唯一标识,根据唯一标识确定用户实体;上述的确定至少一个用户实体可以包括如下步骤:
步骤S111:电子设备接收终端设备发送的用户实体的唯一标识。
终端设备,是指不同于上述的设备终端,且具有执行计算机程序功能的设备,终端设备例如:智能手机、个人电脑(personal computer,PC)、平板电脑、个人数字助理(personal digital assistant,PDA)、移动上网设备(mobile Internet device,MID)、网络交换机或网络路由器等。
唯一标识(identification,ID),又称唯一标识符,是指能够唯一标识目标的标识符号,这里的目标可以是用户、用户实体、用户实体相关的事件实体,或者是事件实体相关的关联实体,对于用户实体来说,用户实体的唯一标识例如可以是姓名,也可以是身份证号。
上述的电子设备接收终端设备发送的用户实体的唯一标识的实施方式例如:电子设备通过客户端的浏览器请求和服务器响应的方式,即浏览器/服务器(Browser/Server,B/S)方式接收终端设备发送的用户实体的唯一标识;当然也可以采用客户端和服务端(Client/Server,C/S)方式接收终端设备发送的用户实体的唯一标识。
步骤S112:电子设备根据唯一标识确定一个用户实体。
上述的电子设备根据唯一标识确定一个用户实体的实施方式例如:这里的唯一标识可以为姓名A1,根据姓名A1在关系型数据库中查询,获得姓名A1对应的用户实体,具体的SQL语句例如:select*from user where userid=’A1’;或者根据姓名A1在非关系型数据库中匹配,获得获得姓名A1对应的用户实体;或者根据姓名A1在内存数据库中查找,获得获得姓名A1对应的用户实体。
第二种方式,接收终端设备发送的第一属性值,并根据属性值确定;上述的确定至少一个用户实体可以包括如下步骤:
步骤S113:电子设备接收终端设备发送的用户实体的第一属性值。
第一属性值,是指描述用户实体的时间属性的具体值或地点属性的具体值,即第一属性值可以包括:时间属性值和地点属性值,具体地,时间属性值例如:用户出生时间、用户注册时间、用户上一次登录时间和用户上一次支付时间等属性值,地点属性值例如:用户出生地点、用户注册地点和用户上一次登录地点等属性值。
上述的电子设备接收终端设备发送的用户实体的第一属性值的实施原理和实施方式与步骤S111的实施原理和实施方式是相似或类似的,区别仅在于,步骤S111接收的是唯一标识,而该步骤接收的是第一属性值,因此,这里不再对该步骤的实施方式和实施原理进行说明,如有不清楚的地方,可以参考对步骤S111的描述。
步骤S114:根据第一属性值确定至少一个用户实体。
其中,该步骤的实施原理和实施方式与步骤S112的实施原理和实施方式是相似或类似的,因此,这里不再对该步骤的实施方式和实施原理进行说明,如有不清楚的地方,可以参考对步骤S112的描述,这里仅举例说明根据时间属性值确定至少一个用户实体的实施方式:在关系型数据库中,查询出生时间在1990年和1995年之间的用户实体,其具体的SQL语句例如:select*from user where birthday between year(1990)and year(1995);在非关系型数据库中,查询注册地点在北京的用户实体例如:“match$a isauser;$bisaregisterLocation,has name"北京";($a,$b)isa location;get$a;”。
需要说明的是,上述的步骤执行需要根据方法的执行主体来决定的,即上述的方法被电子设备执行,若这里的电子设备为终端设备,那么步骤S110可以只包括步骤S112或步骤S114,即终端设备执行步骤S112或步骤S114,若这里的电子设备为服务器,那么步骤S110可以只包括步骤S111和步骤S112,或者步骤S110包括步骤S113和步骤S114,即服务器执行步骤S111和步骤S112,或者服务器执行步骤S113和步骤S114。在上述的实现过程中,通过用户实体的时间属性的具体值或地点属性的具体值确定至少一个用户实体,从而提高了确定用户实体的速度。
在步骤S110之后,执行步骤S120:电子设备获得与至少一个用户实体相关的至少一个事件实体。
事件实体,与用户实体类似的概念,具体可以参照对用户实体概念的解释,具体例如:姓名为A1的用户为一个实体,用户A1乘坐飞机可以称之为一个事件实体,事件实体可以包括唯一标识和属性值,事件实体的属性值还可以包括:目标主体、事件发生时间、事件发生地点、事件发生方式、事件的具体内容等,这里的目标主体是指参与事件的目标的执行主体,在数据表现中可以是可以用姓名、身份证号码、手机号码、一组不重复的值的作为目标主体的唯一标识;事件发生时间是指该事件发生的时间,时间维度可以精确到毫秒值;事件发生地点比如一座城市、一个车站、一个地址或者一个经纬度坐标等;事件发生方式是指目标主体从事该事件的方式,例如交通工具和沟通工具等;事件的具体内容是描述目标所做该事件的具体内容。具体例如:用户A1在昨天早上九点匆忙地在B机场乘坐飞机,那么目标主体为用户A1,事件发生时间为昨天早上九点,事件发生地点为B机场,事件发生方式为匆忙地,事件的具体内容是用户A1乘坐飞机。
可以理解的是,可以将上述的用户实体和事件实体来描述一个人所产生的各种行为,这里可以将描述一个人所产生的各种行为的过程可以被称为事件模型分析,因此,用户实体和事件实体可以被称为事件模型,即事件模型可以包括事件(Event)和用户(User)两个实体,又被称为Event+User模型。具体的事件模型例如:用户在做做某些事情的时候,会有一个载体或者作用物,比如乘坐的飞机、高铁、入住的酒店和购买的物品等等,因此在模型中加入关联实体(即Item),即可形成Event+User+Item数据结构,使得上述的数据库和数据仓库可以存储任意扩展维度信息。
上述的电子设备获得与至少一个用户实体相关的至少一个事件实体的实施方式可以包括如下步骤:
步骤S121:电子设备获得至少一个用户实体的第一标识值。
其中,第一标识值为用户实体的唯一标识符的具体值,即用户实体的唯一标识,具体例如:上述的用户实体的姓名A1等。
上述的电子设备获得至少一个用户实体的第一标识值的实施方式例如:若至少一个用户实体是通过属性值确定的,那么就需要获得该用户实体的唯一标识,具体例如:在关系型数据库中,查询出生时间在1990年和1995年之间的用户实体的唯一标识,其具体的SQL语句例如:selectuserid from user where birthday between year(1990)and year(1995),获得的出生时间在1990年和1995年之间的用户实体的唯一标识例如为C1和D1。
步骤S122:电子设备根据至少一个用户实体的第一标识值与至少一个事件实体预先建立的关联关系,获得至少一个事件实体。
上述的电子设备根据至少一个用户实体的第一标识值与至少一个事件实体预先建立的关联关系,获得至少一个事件实体的实施方式例如:可以事先在关系型数据库中建立用户实体和事件实体的关联关系表,具体地,用户实体可以为user表,事件实体可以为event表,那么关联关系表为userEvent,userEvent可以包括用户实体的唯一标识和事件实体的唯一标识,用户实体的唯一标识可以是userid,事件实体的唯一标识可以是eventid,获得至少一个事件实体的唯一标识SQL语句例如:selecteventid from userEvent whereuserid in(C1,D1);若获得的事件实体的唯一标识为C2和D2,那么可以根据C2和D2获得事件实体。
在上述的实现过程中,通过用户实体的第一标识值与事件实体预先建立的关联关系,来获得至少一个事件实体,从而有效地减少了关联关系所占用的存储空间,并提高了获得事件实体的速度。
在步骤S120之后,执行步骤S130:电子设备对至少一个事件实体进行建模分析,获得分析结果。
建模分析,是指针对数据建立模型,并针对模型进行分析,例如:建立两类数据之间的关系模型,并针对关系模型进行分析等。常见的建模分析例如:布控和分发;这里的布控是指对建模得到的模板进行监控预警,即按照预设规则设置监控数据的流程,这里的预设规则可以根据情况进行具体设置;这里的分发是指把目标任务转交给其他业务人员进行分析,这里的目标任务例如可以是上述的关系模型。
请参见图2示出的本申请实施例提供的建模分析方法的分析结果的示意图;分析结果,是指电子设备对事件实体进行建模分析获得的分析结果,这里的建模分析可以包括:布控、分发、关联分析、碰撞分析、分组分析和聚类分析等;图中的分析结果是指对事件实体进行关联分析获得的分析结果,这里的关联分析是指挖掘两种数据或者两组数据之间的关联关系,具体的分析过程将在下面的内容中描述,这里的两种数据例如是图中的事件A和事件B,关联分析则可以是发现事件A和事件B,的关联关系。这里的分析结果当然也可以是上述分析结果的组合后再分析获得的结果,例如;先对事件实体进行分组分析,获得分组分析结果,再将分组分析结果进行分发等,获得分发结果,将分发结果作为分析结果。
上述的电子设备对至少一个事件实体进行建模分析的实施方式可以包括如下步骤:
步骤S131:电子设备获得与至少一个事件实体相关的至少一个关联实体。
关联实体,是指与用户实体或者事件实体相关联的实体,关联实体与用户实体类似的概念,具体可以参照对用户实体概念的解释,具体例如:用户A1乘坐飞机可以称之为一个事件实体,该飞机的具体型号为B1,那么这个飞机可以称之为关联实体,关联实体可以包括唯一标识和属性值,属性值例如:飞机型号、起飞时间、落地时间、航班信息、酒店信息和高铁信息等。
上述的电子设备获得与至少一个事件实体相关的至少一个关联实体的实施方式例如:获得至少一个事件实体的第二标识值,这里的第二标识值是指事件实体的唯一标识符的具体值。根据至少一个事件实体的第二标识值与至少一个关联实体预先建立的关联关系,获得至少一个关联实体。其中,这里的实施原理和实施方式与步骤S121和步骤S122的实施原理和实施方式是相似或类似的,区别仅在于,步骤S121和步骤S122是用户实体的第一标识值与事件实体预先建立的关联关系获得事件实体,而这里是根据至事件实体的第二标识值与关联实体预先建立的关联关系获得关联实体,因此,这里不再对该步骤的实施方式和实施原理进行说明,如有不清楚的地方,可以参考对步骤S121和步骤S122的描述。在上述的实现过程中,通过事件实体的第二标识值与关联实体预先建立的关联关系,来获得至少一个关联实体,从而有效地减少了关联关系所占用的存储空间,并提高了获得关联实体的速度。
在步骤S131之后,执行步骤S132:电子设备根据至少一个关联实体对至少一个事件实体进行建模分析。
当然在具体的实施过程中,建模分析除了上述的布控和分发,还可以包括:碰撞分析、分组分析和聚类分析;下面将分别介绍这三种分析,在碰撞分析过程中,上述的至少一个事件实体相关可以为多个事件实体,可以对事件实体的属性值进行碰撞分析,也可以对事件实体相关的关联实体的属性值进行碰撞分析。在上述的实现过程中,通过获得事件实体相关的关联实体,并根据关联实体对事件实体进行建模分析,从而扩展了对事件实体进行建模分析的维度。
若对事件实体的属性值进行碰撞分析,那么上述的电子设备根据至少一个关联实体对至少一个事件实体进行建模分析,即步骤S132可以包括如下步骤:
步骤S133:电子设备获得多个事件实体中的第二属性值相同的事件实体。
第二属性值,是指事件实体的属性值,如上面描述的事件实体可以包括唯一标识和属性值,属性值例如:事件发生时间、事件结束时间和事件影响对象等等。
上述的电子设备获得多个事件实体中的第二属性值相同的事件实体的实施方式例如:用户A1在九点乘坐飞机可以称之为第一事件实体,用户A2在九点乘坐飞机可以称之为第二事件实体,那么可以获得多个事件实体中乘坐时间相同的事件实体,这里的多个事件实体包括:第一事件实体和第二事件实体,具体例如:多个事件实体中乘坐时间均为九点的事件实体包括:第一事件实体和第二事件实体。
或者,若对事件实体相关的关联实体的属性值进行碰撞分析,那么上述的根据至少一个关联实体对至少一个事件实体进行建模分析,可以包括如下步骤:
步骤S134:若多个事件实体相关的多个关联实体的第二属性值相同,则电子设备获得第二属性值对应的多个事件实体。
上述的若多个事件实体相关的多个关联实体的第二属性值相同,则电子设备获得第二属性值对应的多个事件实体的实施方式例如:用户A1乘坐型号为D1的飞机可以称之为第一关联实体,用户A2乘坐型号为D1的飞机可以称之为第二关联实体,那么可以获得多个关联实体中飞机型号相同的关联实体,这里的多个关联实体包括:第一关联实体和第二关联实体,具体例如:多个关联实体中飞机型号均为D1的关联实体包括:第一关联实体和第二关联实体。通过第一关联实体和第二关联实体可以获得第一事件实体和第二事件实体;这里的第一事件实体例如用户A1乘坐飞机,这里的第二事件实体例如用户A2乘坐飞机。
在上述的实现过程中,获得第二属性值相同的事件实体,获得与事件实体关联的多个关联实体的第二属性值相同的事件实体,即通过属性值是否相同来进行事件实体的碰撞分析,从而有效地提升了碰撞分析的速度。
可选地,在本申请实施例中,至少一个事件实体相关为多个事件实体;上述的根据至少一个关联实体对至少一个事件实体进行建模分析,可以包括如下步骤:
步骤S135:电子设备根据多个事件实体中的第三属性值对多个事件实体进行分组分析,获得多组事件实体。
第三属性值,是指事件实体的属性值,第三属性值可以和上述的第二属性值相同,也可以不和第二属性值相同,多组事件实体中的每组事件实体的第三属性值是相同的。
上述的电子设备根据多个事件实体中的第三属性值对多个事件实体进行分组分析,获得多组事件实体的实施方式例如:多个事件实体例如:E1、E2和E3,多个事件实体的第三属性值包括:{[E1:A],[E2:B],[E3:A]},那么分组结果为{[E1,E3],[E2]}。
或者;上述的根据至少一个关联实体对至少一个事件实体进行建模分析,可以包括如下步骤:
步骤S136:电子设备根据多个事件实体中的第三属性值对多个事件实体进行聚类分析,获得多类事件实体。
其中,多组事件实体中的每组事件实体的第三属性值是属于同一类的;上述的电子设备根据多个事件实体中的第三属性值对多个事件实体进行聚类分析,获得多类事件实体的实施方式例如:多个事件实体例如:E1、E2、E3和E4,多个事件实体的第三属性值包括:{[E1:A],[E2:B],[E3:1],[E4:2]},那么分组结果可以为{[E1,E2],[E3,E4]}。在上述的实现过程中,通过事件实体中的第三属性值来对事件实体进行分组分析或者聚类分析,从而增加了对事件实体的分析维度。
在上述的实现过程中,通过抽象出用户模型和事件模型来进行建模分析,有效地简化了建模分析的流程,从而改善了对数据进行建模分析的流程十分复杂的问题。
可选地,在本申请实施例中,在获得分析结果之后,还可以将分析结果发送给终端设备。
在步骤S130之后,执行步骤S140:电子设备向终端设备发送获得的分析结果。
上述的电子设备向终端设备发送获得的分析结果的实施方式例如:电子设备通过超文本传输协议(Hyper Text Transfer Protocol,HTTP)向终端设备发送获得的分析结果,这里的HTTP协议是一个简单的请求响应协议,HTTP协议通常运行在传输控制协议(Transmission Control Protocol,TCP)之上,HTTP协议指定了客户端可能发送给服务器什么样的消息以及得到什么样的响应。
请参见图3示出的本申请实施例提供的建模分析装置的结构示意图;本申请实施例提供了一种建模分析装置300,包括:
用户实体确定模块310,用于确定至少一个用户实体。
事件实体获得模块320,用于获得与至少一个用户实体相关的至少一个事件实体。
实体建模分析模块330,用于对至少一个事件实体进行建模分析。
可选地,在本申请实施例中,用户实体确定模块,包括:
第一确定模块,用于根据第一属性值确定至少一个用户实体,第一属性值为描述用户实体的时间属性的具体值或地点属性的具体值。
可选地,在本申请实施例中,事件实体获得模块,包括:
第一获得模块,用于获得至少一个用户实体的第一标识值,第一标识值为用户实体的唯一标识符的具体值。
第二获得模块,用于根据至少一个用户实体的第一标识值与至少一个事件实体预先建立的关联关系,获得至少一个事件实体。
可选地,在本申请实施例中,实体建模分析模块,包括:
第三获得模块,用于获得与至少一个事件实体相关的至少一个关联实体,关联实体为事件实体的作用对象相关的实体。
建模分析模块,用于根据至少一个关联实体对至少一个事件实体进行建模分析。
可选地,在本申请实施例中,第三获得模块,包括:
第四获得模块,用于获得至少一个事件实体的第二标识值,第二标识值为事件实体的唯一标识符的具体值。
第五获得模块,用于根据至少一个事件实体的第二标识值与至少一个关联实体预先建立的关联关系,获得至少一个关联实体。
可选地,在本申请实施例中,至少一个事件实体相关为多个事件实体;建模分析模块,可以包括:
第六获得模块,用于获得多个事件实体中的第二属性值相同的事件实体;或者若多个事件实体相关的多个关联实体的第二属性值相同,则获得第二属性值对应的多个事件实体。
可选地,在本申请实施例中,至少一个事件实体相关为多个事件实体;建模分析模块,还可以包括:
第七获得模块,用于根据多个事件实体中的第三属性值对多个事件实体进行分组分析,获得多组事件实体,多组事件实体中的每组事件实体的第三属性值是相同的;或者根据多个事件实体中的第三属性值对多个事件实体进行聚类分析,获得多类事件实体,多组事件实体中的每组事件实体的第三属性值是属于同一类的。
应理解的是,该装置与上述的建模分析方法实施例对应,能够执行上述方法实施例涉及的各个步骤,该装置具体的功能可以参见上文中的描述,为避免重复,此处适当省略详细描述。该装置包括至少一个能以软件或固件(firmware)的形式存储于存储器中或固化在装置的操作系统(operating system,OS)中的软件功能模块。
请参见图4示出的本申请实施例提供的电子设备的结构示意图。本申请实施例提供的一种电子设备400,包括:处理器410和存储器420,存储器420存储有处理器410可执行的机器可读指令,机器可读指令被处理器410执行时执行如上的方法。
本申请实施例还提供了一种存储介质430,该存储介质430上存储有计算机程序,该计算机程序被处理器410运行时执行如上的建模分析方法。
其中,存储介质430可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(Static Random Access Memory,简称SRAM),电可擦除可编程只读存储器(Electrically Erasable Programmable Read-Only Memory,简称EEPROM),可擦除可编程只读存储器(Erasable Programmable Read Only Memory,简称EPROM),可编程只读存储器(Programmable Red-Only Memory,简称PROM),只读存储器(Read-Only Memory,简称ROM),磁存储器,快闪存储器,磁盘或光盘。
本申请实施例所提供的几个实施例中,应该理解到,所揭露的装置和方法,也可以通过其他的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,附图中的流程图和框图显示了根据本申请实施例的多个实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现方式中,方框中所标注的功能也可以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
另外,在本申请实施例各个实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。
在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。
以上的描述,仅为本申请实施例的可选实施方式,但本申请实施例的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请实施例揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请实施例的保护范围之内。
Claims (10)
1.一种建模分析方法,其特征在于,包括:
确定至少一个用户实体;
获得与所述至少一个用户实体相关的至少一个事件实体;
对所述至少一个事件实体进行建模分析。
2.根据权利要求1所述的方法,其特征在于,所述确定至少一个用户实体,包括:
根据第一属性值确定所述至少一个用户实体,所述第一属性值为描述所述用户实体的时间属性的具体值或地点属性的具体值。
3.根据权利要求1所述的方法,其特征在于,所述获得与所述至少一个用户实体相关的至少一个事件实体,包括:
获得所述至少一个用户实体的第一标识值,所述第一标识值为所述用户实体的唯一标识符的具体值;
根据所述至少一个用户实体的第一标识值与所述至少一个事件实体预先建立的关联关系,获得所述至少一个事件实体。
4.根据权利要求1所述的方法,其特征在于,所述对所述至少一个事件实体进行建模分析,包括:
获得与所述至少一个事件实体相关的至少一个关联实体,所述关联实体为所述事件实体的作用对象相关的实体;
根据所述至少一个关联实体对所述至少一个事件实体进行建模分析。
5.根据权利要求4所述的方法,其特征在于,所述获得与所述至少一个事件实体相关的至少一个关联实体,包括:
获得所述至少一个事件实体的第二标识值,所述第二标识值为所述事件实体的唯一标识符的具体值;
根据所述至少一个事件实体的第二标识值与所述至少一个关联实体预先建立的关联关系,获得所述至少一个关联实体。
6.根据权利要求4所述的方法,其特征在于,所述至少一个事件实体相关为多个事件实体;所述根据所述至少一个关联实体对所述至少一个事件实体进行建模分析,包括:
获得所述多个事件实体中的第二属性值相同的事件实体;或者
若所述多个事件实体相关的多个关联实体的第二属性值相同,则获得所述第二属性值对应的多个事件实体。
7.根据权利要求4所述的方法,其特征在于,所述至少一个事件实体相关为多个事件实体;所述根据所述至少一个关联实体对所述至少一个事件实体进行建模分析,包括:
根据所述多个事件实体中的第三属性值对所述多个事件实体进行分组分析,获得多组事件实体,所述多组事件实体中的每组事件实体的第三属性值是相同的;或者
根据所述多个事件实体中的第三属性值对所述多个事件实体进行聚类分析,获得多类事件实体,所述多组事件实体中的每组事件实体的第三属性值是属于同一类的。
8.一种建模分析装置,其特征在于,包括:
用户实体确定模块,用于确定至少一个用户实体;
事件实体获得模块,用于获得与所述至少一个用户实体相关的至少一个事件实体;
实体建模分析模块,用于对所述至少一个事件实体进行建模分析。
9.一种电子设备,其特征在于,包括:处理器和存储器,所述存储器存储有所述处理器可执行的机器可读指令,所述机器可读指令被所述处理器执行时执行如权利要求1至7任一所述的方法。
10.一种存储介质,其特征在于,该存储介质上存储有计算机程序,该计算机程序被处理器运行时执行如权利要求1至7任一所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911262991.XA CN111061814A (zh) | 2019-12-10 | 2019-12-10 | 一种建模分析方法、装置、电子设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911262991.XA CN111061814A (zh) | 2019-12-10 | 2019-12-10 | 一种建模分析方法、装置、电子设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111061814A true CN111061814A (zh) | 2020-04-24 |
Family
ID=70300453
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911262991.XA Pending CN111061814A (zh) | 2019-12-10 | 2019-12-10 | 一种建模分析方法、装置、电子设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111061814A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115203172A (zh) * | 2022-06-30 | 2022-10-18 | 北京亚控科技发展有限公司 | 模型构建及模型数据订阅方法、装置、电子设备和介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106991090A (zh) * | 2016-01-20 | 2017-07-28 | 北京国双科技有限公司 | 舆情事件实体的分析方法及装置 |
CN108596439A (zh) * | 2018-03-29 | 2018-09-28 | 北京中兴通网络科技股份有限公司 | 一种基于知识图谱的企业风险预测方法及系统 |
CN109885698A (zh) * | 2019-02-13 | 2019-06-14 | 北京航空航天大学 | 一种知识图谱构建方法及装置、电子设备 |
CN109886318A (zh) * | 2019-01-29 | 2019-06-14 | 北京明略软件系统有限公司 | 一种信息处理方法、装置及计算机可读存储介质 |
EP3800568A1 (en) * | 2019-10-04 | 2021-04-07 | Palantir Technologies Inc. | System event detection system and method |
-
2019
- 2019-12-10 CN CN201911262991.XA patent/CN111061814A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106991090A (zh) * | 2016-01-20 | 2017-07-28 | 北京国双科技有限公司 | 舆情事件实体的分析方法及装置 |
CN108596439A (zh) * | 2018-03-29 | 2018-09-28 | 北京中兴通网络科技股份有限公司 | 一种基于知识图谱的企业风险预测方法及系统 |
CN109886318A (zh) * | 2019-01-29 | 2019-06-14 | 北京明略软件系统有限公司 | 一种信息处理方法、装置及计算机可读存储介质 |
CN109885698A (zh) * | 2019-02-13 | 2019-06-14 | 北京航空航天大学 | 一种知识图谱构建方法及装置、电子设备 |
EP3800568A1 (en) * | 2019-10-04 | 2021-04-07 | Palantir Technologies Inc. | System event detection system and method |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115203172A (zh) * | 2022-06-30 | 2022-10-18 | 北京亚控科技发展有限公司 | 模型构建及模型数据订阅方法、装置、电子设备和介质 |
CN115203172B (zh) * | 2022-06-30 | 2023-11-07 | 北京亚控科技发展有限公司 | 模型构建及模型数据订阅方法、装置、电子设备和介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20210209109A1 (en) | Method, apparatus, device, and storage medium for intention recommendation | |
US10339038B1 (en) | Method and system for generating production data pattern driven test data | |
US20190334789A1 (en) | Generating Specifications for Microservices Implementations of an Application | |
CN111046237B (zh) | 用户行为数据处理方法、装置、电子设备及可读介质 | |
CN110543586A (zh) | 多重用户身份融合方法、装置、设备及存储介质 | |
US10812551B1 (en) | Dynamic detection of data correlations based on realtime data | |
US10318540B1 (en) | Providing an explanation of a missing fact estimate | |
Cheng et al. | Chinese Location Word Recognition Using Service Context Information for Location‐Based Service | |
CN110046155B (zh) | 特征数据库的更新、数据特征的确定方法、装置及设备 | |
CN104050213A (zh) | 包括数据分类的查询处理系统 | |
US10250550B2 (en) | Social message monitoring method and apparatus | |
CN113836128A (zh) | 一种异常数据识别方法、系统、设备及存储介质 | |
CN111586695A (zh) | 短信识别方法及相关设备 | |
EP3332334B1 (en) | Efficient location-based entity record conflation | |
CN114022188A (zh) | 目标人群圈选方法、装置、设备以及存储介质 | |
CN114780606A (zh) | 一种大数据挖掘方法及系统 | |
CN111061814A (zh) | 一种建模分析方法、装置、电子设备及存储介质 | |
CN108509545B (zh) | 一种文章的评论处理方法及系统 | |
CN105843809B (zh) | 数据处理方法和装置 | |
CN115599871A (zh) | 基于湖仓一体的数据处理系统和方法 | |
CN111339170A (zh) | 数据处理方法、装置、计算机设备及存储介质 | |
CN106528795B (zh) | 一种数据挖掘方法及装置 | |
CN112800127B (zh) | 基于交易账单的数据挖掘分析方法及装置 | |
CN110263017B (zh) | 一种基于球面网格遥感数据文件集的键值存储方法及装置 | |
US10997156B1 (en) | Self-management of data applications |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20200424 |