CN107609395B - 一种数值融合模型构建方法及装置 - Google Patents

一种数值融合模型构建方法及装置 Download PDF

Info

Publication number
CN107609395B
CN107609395B CN201710774812.5A CN201710774812A CN107609395B CN 107609395 B CN107609395 B CN 107609395B CN 201710774812 A CN201710774812 A CN 201710774812A CN 107609395 B CN107609395 B CN 107609395B
Authority
CN
China
Prior art keywords
dimension information
dimension
fusion
value
normalization
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710774812.5A
Other languages
English (en)
Other versions
CN107609395A (zh
Inventor
李旸照
刁志刚
耿星
薛岭
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing North Source Software Co ltd
China Three Gorges Corp
Original Assignee
Beijing North Source Software Co ltd
China Three Gorges Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing North Source Software Co ltd, China Three Gorges Corp filed Critical Beijing North Source Software Co ltd
Priority to CN201710774812.5A priority Critical patent/CN107609395B/zh
Publication of CN107609395A publication Critical patent/CN107609395A/zh
Application granted granted Critical
Publication of CN107609395B publication Critical patent/CN107609395B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种数值融合模型构建方法及装置,该方法包括:获取数值融合维度信息;根据数值融合的每个维度信息的数据分布特征,采用与所述每个维度信息对应的归一化算法,计算得到每个维度信息对应的归一化数值;分析各个维度信息的逻辑关系,对满足预设逻辑关系条件的两个维度信息的归一化数值进行维度融合计算,得到维度融合计算值;将所述维度融合计算值与剩余维度信息的归一化数值进行多维度数值融合处理,构建生成数值融合模型。通过本发明实现了非线性归一化处理和多维度综合准确评价的目的。

Description

一种数值融合模型构建方法及装置
技术领域
本发明涉及信息技术领域,特别是涉及一种数值融合模型构建方法及装置。
背景技术
在实际的生活或生产过程中,往往需要对某个人或事进行客观而全面的评价。例如,在公安系统中需要分析某个警员是否存在数据盗取的可能性。通常在进行这种评价时,存在多个相应的精细化的小指标,这些小指标确定以后再根据相应的融合算法计算出综合评价指标,最后由对应的综合评价指标全面、精细、客观地评价人或事。
目前,常用的数值融合算法的处理流程为:确定当前的评价融合维度以后,对每个维度进行归一化,采用的主要方法为最大最小的值的区间线性归一化法;然后采用均值融合算法将上述维度进行融合。但是,这种方法存在明显的缺点,即归一化算法为线性算法无法实现某个维度的非线性需求,刻画维度内关系算法无法体现维度自身的变化差异;采用平均融合算法无法突出各个维度的重要性程度,忽视了维度间的关系。
发明内容
针对于上述问题,本发明提供一种数值融合模型构建方法及装置,实现了非线性归一化处理和多维度综合准确评价的目的。
为了实现上述目的,根据本发明的第一方面,提供了一种数值融合模型构建方法,该方法包括:
获取数值融合的每个维度信息;
根据所述每个维度信息的数据分布特征,采用与所述每个维度信息对应的归一化算法,计算得到所述每个维度信息对应的归一化数值;
分析各个维度信息的逻辑关系,对满足预设逻辑关系条件的两个维度信息对应的归一化数值进行维度融合计算,得到维度融合计算值;
将所述维度融合计算值与剩余维度信息对应的归一化数值进行多维度数值融合处理,构建生成数值融合模型。
优选的,所述根据所述每个维度信息的数据分布特征,采用与所述每个维度信息对应的归一化算法,计算得到每个维度信息对应的归一化数值,包括:
根据所述每个维度信息的数据分布特征,判断所述每个维度信息的数据分布特征是否满足正态分布;
当所述维度信息的数据分布特征满足正态分布时,采用第一归一化算法对满足正态分布的维度信息进行计算,得到对应的归一化数值;
当所述维度信息的数据分布特征不满足正态分布时,采用第二归一化算法进行计算,得到不满足正态分布的维度信息的归一化数值。
优选的,所述分析各个维度信息的逻辑关系,对满足预设逻辑关系条件的两个维度信息对应的归一化数值进行维度融合计算,得到维度融合计算值,包括:
在所述各个维度信息中确定第一维度信息,查找得到与所述第一维度信息具有逻辑关系的第二维度信息;
判断所述第一维度信息和所述第二维度信息的权重信息是否一致,如果是,则采用空间球型算式进行维度融合计算,得到所述第一维度信息与所述第二维度信息的维度融合计算值;如果否,则采用椭球形算式进行维度融合计算,得到所述第一维度信息与所述第二维度信息的维度融合计算值。
优选的,所述将所述维度融合计算值与剩余维度信息对应的归一化数值进行多维度数值融合处理,构建生成数值融合模型,包括:
将所述维度融合计算值与所述剩余维度信息中的第一剩余维度信息对应的归一化数值进行是数值融合处理,得到第一融合计算值;
将所述第一融合计算值与所述剩余维度信息中的第二剩余维度信息对应的归一化数值进行数值融合处理,得到第二融合计算值;
依次完成所述剩余维度信息中的各个维度信息的数值融合处理,得到最终的融合计算值;
根据所述最终的融合计算值,构建生成数值融合模型。
优选的,所述数值融合维度信息包括维度数量和维度数据,其中,所述维度数据为数值统计样本值。
根据本发明的第二方面,提供了一种数值融合模型构建装置,该装置包括:
获取模块,获取数值融合的每个维度信息;
归一化处理模块,用于根据所述每个维度信息的数据分布特征,采用与所述每个维度信息对应的归一化算法,计算得到所述每个维度信息对应的归一化数值;
融合计算模块,用于分析各个维度信息的逻辑关系,对满足预设逻辑关系条件的两个维度信息对应的归一化数值进行维度融合计算,得到维度融合计算值;
构建模块,用于将所述维度融合计算值与剩余维度信息对应的归一化数值进行多维度数值融合处理,构建生成数值融合模型。
优选的,所述归一化模块包括:
判断单元,用于根据所述每个维度信息的数据分布特征,判断所述每个维度信息的数据分布特征是否满足正态分布;
第一归一化单元,用于当所述维度信息的数据分布特征满足正态分布时,采用第一归一化算法对满足正态分布的维度信息进行计算,得到对应的归一化数值;
第二归一化单元,用于当所述维度信息的数据分布特征不满足正态分布时,采用第二归一化算法进行计算,得到不满足正态分布的维度信息的归一化数值。
优选的,所述融合计算模块包括:
查找单元,用于在所述各个维度信息中确定第一维度信息,查找得到与所述第一维度信息具有逻辑关系的第二维度信息;
融合计算单元,用于判断所述第一维度信息和所述第二维度信息的权重信息是否一致,如果是,则采用空间球型算式进行维度融合计算,得到所述第一维度信息与所述第二维度信息的维度融合计算值;如果否,则采用椭球形算式进行维度融合计算,得到所述第一维度信息与所述第二维度信息的维度融合计算值。
优选的,所述构建模型包括:
第一处理单元,用于将所述维度融合计算值与所述剩余维度信息中的第一剩余维度信息对应的归一化数值进行是数值融合处理,得到第一融合计算值;
第二处理单元,用于将所述第一融合计算值与所述剩余维度信息中的第二剩余维度信息对应的归一化数值进行数值融合处理,得到第二融合计算值;
第三处理单元,用于依次完成所述剩余维度信息中的各个维度信息的数值融合处理,得到最终的融合计算值;
构建单元,用于根据所述最终的融合计算值,构建生成数值融合模型。
相较于现有技术,本发明在获取了数值融合维度信息后,通过分析每个维度信息的数据分布特征采用与之对应的归一化算法进行归一化处理,克服了传统的数值融合中的默认所有的数据分布均满足线性分布进而采用统一的归一化算法进行处理的局限性,提高了归一化的精准度,适用于不同的非线性场景,同时,在进行归一化处理之后,通过分析各个维度之间的逻辑关系进行具有逻辑关系的维度数值融合计算,再与其他维度信息进行融合构建数值融合模型,解决了传统均值算法中维度件关系的量化难题,能有效提高不同的重要性程度的维度获得不同的量化标准,进而实现了多维度综合准确评价的目的。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本发明实施例一提供的一种数值融合模型构建方法的流程示意图;
图2为本发明实施例二对应的图1中S12步骤的归一化处理的流程示意图;
图3-a为本发明实施例中维度信息符合正态分布的示意图;
图3-b为本发明实施例中符合正态分布的维度信息归一化处理后的示意图;
图4-a为本发明实施例中维度信息不符合正态分布的示意图;
图4-b为本发明实施例中不符合正态分布的维度信息归一化处理后的示意图;
图5为本发明实施例二对应的图1中S13步骤的两个维度融合处理的流程示意图;
图6为本发明实施例中两两维度3D融合的示意图;
图7为本发明实施例二对应的图1中S14步骤的构建数值融合模型的流程示意图;
图8为本发明实施例中多维度3D融合的示意图;
图9为本发明实施例三提供的数值融合模型构建方法装置的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明的说明书和权利要求书及上述附图中的术语“第一”和“第二”等是用于区别不同的对象,而不是用于描述特定的顺序。此外术语“包括”和“具有”以及他们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有设定于已列出的步骤或单元,而是可包括没有列出的步骤或单元。
实施例一
参见图1为本发明实施例一提供的一种数值融合模型构建方法的流程示意图,该方法包括以下步骤:
S11、获取数值融合的每个维度信息;
可以理解的是,所述数值融合维度信息包括维度数量和维度数据,其中,所述维度数据为数值统计样本值。只有确定了维度数量和维度数据才能进行多维度统计分析。例如,应用于公安数据盗取场景,分析某个警员是否存在数据盗取的可能性时,维度数据包括公安网站的访问次数,网站访问累计时长和公安PKI(Public Key Infrastructure,公钥基础设备)的插拔使用次数,则对应的维度数量为3。
S12、根据所述每个维度信息的数据分布特征,采用与所述每个维度信息对应的归一化算法,计算得到每个维度信息对应的归一化数值;
具体的,在此步骤中主要是针对每个维度信息的维度数据的数据分布特征,选取与之对应的归一化处理算法。例如:维度数据为正态分布或者不满足正态分布;维度数据为线性分布或者为非线性分布,根据数据分布的特点选取对应的归一化算法进行处理,这样维度数据经过归一化处理后可以将数据限制在预设的或者实际需要的一定范围内,为后续的数据融合处理提供了便利条件,保证了处理过程的高效率。
S13、分析各个维度信息的逻辑关系,对满足预设逻辑关系条件的两个维度信息对应的归一化数值进行维度融合计算,得到维度融合计算值;
可以理解的是,在完成了所有维度的维度信息的归一化处理之后,需要将多个维度的数据融合为一个值,并最终到达综合均一的效果,首先需要对其中的两个维度做数值融合处理,在本发明实施例中根据场景的需求将具有较高的相似度的两个维度进行数值融合处理,可以充分考虑各个维度之间的相互关系进行维度间的关系的量化,能够对各个维度的重要性进行充分分析,这样得到的融合结果将更加符合实际更加准确。
S14、将所述维度融合计算值与剩余维度信息对应的归一化数值进行多维度数值融合处理,构建生成数值融合模型。
其中,所述剩余维度信息为所述维度信息中除去进行维度融合计算的两个维度信息后的各个维度信息当完成了两个维度数据融合以后,需要在当前融合的基础维度上增加新的维度,即所述维度信息中除去进行维度融合计算的两个维度信息后的各个维度信息。此时,由于该维度与之前的维度各自独立,所以可以直接进行椭球算式融合,完成最终多维度融合。
通过本发明实施例一公开的技术方案,在获取了数值融合维度信息后,通过分析每个维度信息的数据分布特征采用与之对应的归一化算法进行归一化处理,克服了传统的数值融合中的默认所有的数据分布均满足线性分布进而采用统一的归一化算法进行处理的局限性,提高了归一化的精准度,适用于不同的非线性场景,同时,在进行归一化处理之后,通过分析各个维度之间的逻辑关系进行具有逻辑关系的维度数值融合计算,再与其他维度信息进行融合构建数值融合模型,解决了传统均值算法中维度件关系的量化难题,能有效提高不同的重要性程度的维度获得不同的量化标准,进而实现了多维度综合准确评价的目的。
实施例二
参照本发明实施例一和图1中所描述的S11到S14步骤的具体过程,在本发明中实施例的应用场景针对了公安的数据盗取场景,当然也可以为其他需要进行数值融合分析处理的场景,本发明不做限制,只是以该公安数据盗取场景进行方案说明,其他场景可以参照该场景的处理方法,根据不同场景进行的相应的方法的变更也属于本发明的保护范围。
首先要获取数值融合的维度信息,针对公安的数据盗取场景,由于现场数据采集、数据总量、以及泄密条件等多种因素的限制,在本场景中的维度信息采用了三个维度,即:公安网站的访问次数、访问累计时长和公安PKI的插拔使用次数,这些维度的量化过程主要为累计统计值并按照人工检验进行设计。相应的,可以为更多的维度,本发明对此不做限制。
在获得了数值融合维度信息后,需要对各个维度的维度数据进行归一化处理。可以理解的是,归一化是一种简化计算的方式,即将有量纲的表达式经过变化,化为无量纲的表达式成为标量。进行归一化处理的目的是将需要处理的数据经过归一化算法处理后可以限制在某个范围内,为后续的数据处理提供便利性,并提高数据处理速率。
参见图2,在图1中的步骤S12根据数值融合的每个维度信息的数据分布特征,采用与所述每个维度信息对应的归一化算法,计算得到每个维度信息对应的归一化数值,具体包括以下步骤:
S121、根据所述每个维度信息的数据分布特征,判断所述每个维度信息的数据分布特征是否满足正态分布,如果是,则执行步骤S122,如果否,则执行步骤S123;
S122、采用第一归一化算法对满足正态分布的维度信息进行计算,得到对应的归一化数值;
S122、采用第二归一化算法进行计算,得到不满足正态分布的维度信息的归一化数值。
举例说明,参见图3-a,凡是满足正态分布的维度信息,即所述维度信息中的维度数据实质为数值统计样本值,这些样本值满足图3-a中所示的集中分布于均值附近且最大值或最小值至均值区间内的数据依次递减,直至最终最大值或者最小值出现的频率最低,均可以采用本发明实施例中提供的第一归一化算法,即本发明定义的激化归一化算法。
由于目前常用的归一化算法为线性法和零标准化法,这些方法如果针对满足正态分布的数据进行归一化处理,得到的数据分布过于离散不满足场景需求,因此本发明定义了新的归一化算法即激化归一化算法,主要采用了神经网络中的激化函数思想,形成了激化归一化算法。最终归一化处理得到图3-b中的归一化数值,保证每一个对用数值都在一个位于[0,1]之间的数值与之对应,并保持数值间的大小关系保持不变,相比于通用算法,均一化后数值集中度高,更准确地反映出维度数据的本身场景需求,在低数据段的下限控制和分布平滑。
本发明的激化归一化算法见公式1-1,其中,α为进行归一化前的数值,即维度数值本身,由于场景需求,该维度数值为任意大于等于0的数值,β表示进行归一化后的数值,该数值位于[0,1)之间,将α带入公式1-1中可以求得对应的归一化数值β。可以理解的是,α的数据分布必须服从正态分布,即满足公式1-2,在公式1-2中μ表示α数列的平均值,σ表示α数列的标准差。
Figure BDA0001395710810000091
Figure BDA0001395710810000092
在某些场景中会出现不满足正太分布条件的维度信息,这些维度的分布可能是线性的或者毫无规律测非线性离散分布,可以采用本发明提出的第二归一化算法进行归一化处理,参见图4-a为某个维度的数据分布情况,采用第二归一化算法对其进行归一化处理后,生成图4-b的归一化数值。由于某些维度的数据信息为不满足常见分布的无规律性数值,因此采用传统的分布进行归一化不满足基本场景的需求,导致最终的归一化结果出现偏差。本发明提出了第二归一化算法即采用了非线性拟合归一化算法,详见公式1-3,其中X表示归一化前的数值(该数值大于0),Y标识归一化后的数值,并且该数值位于[0,1)之间,将X带入公式1-3中可以求得对应的归一化数值。其中,最为特别的是X数值不服从正态分布,且无明显分布规律,以公安的数据盗取场景为例,其中的维度信息PKI使用次数最终形成的归一化曲线值需满足以下条件:统计形成了在3-7使用段内归一化值高于其他数值段;随PKI数量增大而控制归一化值减小至接近0。由于特殊场景需求,本发明针对专门设计非线性拟合采用最小二乘法计算获得,最终达到场景需求且归一化曲线平滑的算式,公式1-3中的数值均为针对该场景的数据实际演算获得,其他特殊场景亦需要根据实际数据重新确定新的计算数值。
Y=0.008*X3-0.184*X2+1.068*X-0.901 (1-3)
对所有维度完成了归一化过程以后,由于多个维度的数值间存在逻辑关系场景,所以选用选取其中两个维度进行处理,即参见图5,在图1中的步骤S13分析各个维度信息的逻辑关系,对满足预设逻辑关系条件的两个维度信息的归一化数值进行维度融合计算,得到维度融合计算值,具体包括以下步骤:
S131、在所述各个维度信息中确定第一维度信息,查找得到与所述第一维度信息具有逻辑关系的第二维度信息;
S132、判断所述第一维度信息和所述第二维度信息的权重信息是否一致,如果是,则执行步骤S133,如果否,则执行步骤S134;
S133、采用空间球型算式进行维度融合计算,得到所述第一维度信息与所述第二维度信息的维度融合计算值;
S134、采用椭球形算式进行维度融合计算,得到所述第一维度信息与所述第二维度信息的维度融合计算值。
举例说明,在具体的场景中,例如公安的数据盗取场景中,维度信息为公安网站的访问次数、访问累计时长和公安PKI的插拔使用次数,本发明的实施例中优先选择两两相近的维度进行组合,以高相似度的公安网站的访问次数和访问累计时长为两两同和对象。对于相似性质的数值维度,可以采用空间球型的算式逻辑,一方面保证融合数值位于[0,1)之间,且维度融合以后的空间具有平滑特性。但是在实际的业务场景处理之中,由于两个维度虽然相似,但是各种的重要程度不相同,即权重信息是不同的,此时需要在球型算式的基础上进行变形为椭球形算式,保证了融合后的数据的区间范围不变,又保证了两个维度有各自不同的重要性的特征。参见图6,3D球面融合以后视图向左倾斜形成了左半片面积小于右半片面积的情况,具体的两两融合公式参见1-4,其中,α1和α2分别为进行数据融合处理的第一维度信息的归一化数值和第二维度信息的归一化数值,即本发明提供的公安数据盗取场景中的公安网页的访问次数和访问累计时长;β为融合计算值,在实际的业务场景中包含比例系数,即在公式1-4中的0.002和0.03,这两个比例系数数值是由实际的逻辑场景计算获得的,即本发明提供的公安数据盗取场景中的公安网页的访问次数500次和访问累计时长33分钟这两个数值的倒数求得的。对于其他的应用场景将根据实际情况进行计算,本发明对此不做限制。
Figure BDA0001395710810000111
当完成两个相似的维度数值的融合以后,对其他维度需一个个逐步加入。参见图7,在图1中的步骤S14将所述维度融合计算值与剩余维度信息的归一化数值进行多维度数值融合处理,构建生成数值融合模型,具体包括以下步骤:
S141、将所述维度融合计算值与所述剩余维度信息中的第一剩余维度信息对应的归一化数值进行是数值融合处理,得到第一融合计算值;
S142、将所述第一融合计算值与所述剩余维度信息中的第二剩余维度信息对应的归一化数值进行数值融合处理,得到第二融合计算值;
S143、依次完成所述剩余维度信息中的各个维度信息的数值融合处理,得到最终的融合计算值;
S144根据所述最终的融合计算值,构建生成数值融合模型。
举例说明,在本发明举例的应用场景中只列举了三个维度信息,并且对其中的两个维度信息进行了融合计算,即需要将第三个维度信息加入,可以理解的是,当维度数量大于3时,加入流程一致,本发明不做赘述。在本发明距离的应用场景中在公安网页的访问次数和访问累计时长的数值融合值的基础上增加了第三维度,即PKI的插拔使用次数这个维度。该维度由于与前述两个维度不存在明显相似性,相对独立且考虑该维度具有随时间变化的特性,再加入该维度时仍然以球面模型为基础。此时球面模型中的两个变量由于各自独立且不存在明显的重要性偏差,因此可以直接套用球面公式,此时在公式1-4的基础上变形增加第三维度δ变量,形成公式1-5,此时增加了第三维度后,原椭球面的基础上发生业务场景需求的弯折,即当维度值较大时保证数值反而在变小,形成了明显的弯折面,如图8所示。
将公式1-4进行变形处理得到公式1-5:
Figure BDA0001395710810000121
在本发明举例描述的场景中,将具体数值带入可以将公式1-5进行相应的化简,得到下式:
δ=0.008*(α3)3+0.184*(α3)2+1.068*α3-0.901
需要说明的是,在上述的公式1-1到公式1-5中的具体数值,即相关的比例系数等数值均是以本发明举例说明的公安数据盗取场景进行相应的计算获得的,在其他的场景中需根据实际情况进行设置或计算,本发明不做一一描述。
根据本发明实施例二公开的技术方案,在获取了数值融合维度信息之后,根据各个维度的维度数据的数据分布情况采用不同的归一化算法进行归一化处理,即满足正态分布的数据采用了激化归一化算法进行了归一化处理,对于不满足正态分布或者线性分布的数据采用了对应的非线性拟合归一化算法进行了归一化处理,这样得到的归一化处理的数值信息将更准确,解决了现有技术中采用同一种归一化处理方法导致的方案的局限性;在进行归一化处理后,将具有逻辑关系的两个维度信息进行了融合处理,克服了传统算法中维度间关系的量化难题;最后将其他维度信息进行多维度融合处理,得到了数值融合模型,能有效提高不同的重要性程度的维度获得不同的量化标准,并在实际运算中给出各自的重要性可视化展示。
实施例三
与本发明实施例一和实施例二所公开的数值融合模型构建方法相对应,本发明的实施例三还提供了一种数值同和模型构建装置,参见图9,该装置包括:
获取模块1,用于获取数值融合的每个维度信息;
归一化处理模块2,用于根据所述每个维度信息的数据分布特征,采用与所述每个维度信息对应的归一化算法,计算得到每个维度信息对应的归一化数值;
融合计算模块3,用于分析各个维度信息的逻辑关系,对满足预设逻辑关系条件的两个维度信息对应的归一化数值进行维度融合计算,得到维度融合计算值;
构建模块4,用于将所述维度融合计算值与剩余维度信息的归一化数值进行多维度数值融合处理,构建生成数值融合模型。
具体的,所述归一化模块包括:
判断单元21,用于根据所述每个维度信息的数据分布特征,判断所述各个维度信息的数据分布特征是否满足正态分布;
第一归一化单元22,用于当所述维度信息的数据分布特征满足正态分布时,采用第一归一化算法对满足正态分布的维度信息进行计算,得到对应的归一化数值;
第二归一化单元23,用于当所述维度信息的数据分布特征不满足正态分布时,采用第二归一化算法进行计算,得到不满足正态分布的维度信息的归一化数值。
对应的,所述融合计算模块3包括:
查找单元31,用于在所述各个维度信息中确定第一维度信息,查找得到与所述第一维度信息具有逻辑关系的第二维度信息;
融合计算单元32,用于判断所述第一维度信息和所述第二维度信息的权重信息是否一致,如果是,则采用空间球型算式进行维度融合计算,得到所述第一维度信息与所述第二维度信息的维度融合计算值;如果否,则采用椭球形算式进行维度融合计算,得到所述第一维度信息与所述第二维度信息的维度融合计算值。
对应的,所述构建模块4包括:
第一处理单元41,用于将所述维度融合计算值与所述剩余维度信息中的第一剩余维度信息对应的归一化数值进行是数值融合处理,得到第一融合计算值;
第二处理单元42,用于将所述第一融合计算值与所述剩余维度信息中的第二剩余维度信息对应的归一化数值进行数值融合处理,得到第二融合计算值;
第三处理单元43,用于依次完成所述剩余维度信息中的各个维度信息的数值融合处理,得到最终的融合计算值;
构建单元44,用于根据所述最终的融合计算值,构建生成数值融合模型。
在本发明的实施例三中,通过获取模块得到了维度信息,通过归一化处理模块采用了不同的归一化算法完成各个维度的归一化处理,由于每个维度采用了与之对应的归一化算法,提高了归一化的精确程度,并在融合计算模块中考虑了最具有关联性的两个维度进行了融合计算,克服了传统算法中维度间关系的量化难题,最后在构建模块中将其他维度信息加入,生成了数值融合模型,进而实现了非线性归一化处理和多维度综合准确评价的目的。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (7)

1.一种数值融合模型构建方法,其特征在于,该方法包括:
获取数值融合的每个维度信息;
根据所述每个维度信息的数据分布特征,采用与所述每个维度信息对应的归一化算法,计算得到所述每个维度信息对应的归一化数值;
分析各个维度信息的逻辑关系,对满足预设逻辑关系条件的两个维度信息对应的归一化数值进行维度融合计算,得到维度融合计算值,其中,所述分析各个维度信息的逻辑关系,对满足预设逻辑关系条件的两个维度信息对应的归一化数值进行维度融合计算,得到维度融合计算值,包括:在所述各个维度信息中确定第一维度信息,查找得到与所述第一维度信息具有逻辑关系的第二维度信息;判断所述第一维度信息和所述第二维度信息的权重信息是否一致,如果是,则采用空间球型算式进行维度融合计算,得到所述第一维度信息与所述第二维度信息的维度融合计算值;如果否,则采用椭球形算式进行维度融合计算,得到所述第一维度信息与所述第二维度信息的维度融合计算值其中,所述椭球形算式为
Figure 994778DEST_PATH_IMAGE002
Figure 52864DEST_PATH_IMAGE004
Figure 98180DEST_PATH_IMAGE006
分别为进行数据融合处理的第一维度信息的归一化数值和第二维度信息的归一化数值,
Figure 758969DEST_PATH_IMAGE008
为融合计算值,其中,所述第一维度信息为公安数据盗取场景中的公安网站的访问次数,所述第二维度信息为公安数据盗取场景中的公安网站的访问累计时长;
将所述维度融合计算值与剩余维度信息对应的归一化数值进行多维度数值融合处理,构建生成数值融合模型,所述数值融合模型应用于公安数据盗取场景,用于分析获得警员是否存在数据盗取的分析结果。
2.根据权利要求1所述的方法,其特征在于,所述根据所述每个维度信息的数据分布特征,采用与所述每个维度信息对应的归一化算法,计算得到每个维度信息对应的归一化数值,包括:
根据所述每个维度信息的数据分布特征,判断所述每个维度信息的数据分布特征是否满足正态分布;
当维度信息的数据分布特征满足正态分布时,采用第一归一化算法对满足正态分布的维度信息进行计算,得到对应的归一化数值;
当维度信息的数据分布特征不满足正态分布时,采用第二归一化算法进行计算,得到不满足正态分布的维度信息的归一化数值。
3.根据权利要求1所述的方法,其特征在于,所述将所述维度融合计算值与剩余维度信息对应的归一化数值进行多维度数值融合处理,构建生成数值融合模型,包括:
将所述维度融合计算值与所述剩余维度信息中的第一剩余维度信息对应的归一化数值进行是数值融合处理,得到第一融合计算值;
将所述第一融合计算值与所述剩余维度信息中的第二剩余维度信息对应的归一化数值进行数值融合处理,得到第二融合计算值;
依次完成所述剩余维度信息中的各个维度信息的数值融合处理,得到最终的融合计算值;
根据所述最终的融合计算值,构建生成数值融合模型。
4.根据权利要求1所述的方法,其特征在于,所述数值融合维度信息包括维度数量和维度数据,其中,所述维度数据为数值统计样本值。
5.一种数值融合模型构建装置,其特征在于,该装置包括:
获取模块,获取数值融合的每个维度信息;
归一化处理模块,用于根据所述每个维度信息的数据分布特征,采用与所述每个维度信息对应的归一化算法,计算得到所述每个维度信息对应的归一化数值;
融合计算模块,用于分析各个维度信息的逻辑关系,对满足预设逻辑关系条件的两个维度信息对应的归一化数值进行维度融合计算,得到维度融合计算值,所述融合计算模块包括:查找单元,用于在所述各个维度信息中确定第一维度信息,查找得到与所述第一维度信息具有逻辑关系的第二维度信息;融合计算单元,用于判断所述第一维度信息和所述第二维度信息的权重信息是否一致,如果是,则采用空间球型算式进行维度融合计算,得到所述第一维度信息与所述第二维度信息的维度融合计算值;如果否,则采用椭球形算式进行维度融合计算,得到所述第一维度信息与所述第二维度信息的维度融合计算值,其中,所述椭球形算式为
Figure 838920DEST_PATH_IMAGE002
Figure 317175DEST_PATH_IMAGE004
Figure 849787DEST_PATH_IMAGE006
分别为进行数据融合处理的第一维度信息的归一化数值和第二维度信息的归一化数值,
Figure 455212DEST_PATH_IMAGE008
为融合计算值,其中,所述第一维度信息为公安数据盗取场景中的公安网站的访问次数,所述第二维度信息为公安数据盗取场景中的公安网站的访问累计时长;
构建模块,用于将所述维度融合计算值与剩余维度信息对应的归一化数值进行多维度数值融合处理,构建生成数值融合模型,所述数值融合模型应用于公安数据盗取场景,用于分析获得警员是否存在数据盗取的分析结果。
6.根据权利要求5所述的装置,其特征在于,所述归一化处理模块包括:
判断单元,用于根据所述每个维度信息的数据分布特征,判断所述每个维度信息的数据分布特征是否满足正态分布;
第一归一化单元,用于当维度信息的数据分布特征满足正态分布时,采用第一归一化算法对满足正态分布的维度信息进行计算,得到对应的归一化数值;
第二归一化单元,用于当维度信息的数据分布特征不满足正态分布时,采用第二归一化算法进行计算,得到不满足正态分布的维度信息的归一化数值。
7.根据权利要求5所述的装置,其特征在于,所述构建模块包括:
第一处理单元,用于将所述维度融合计算值与所述剩余维度信息中的第一剩余维度信息对应的归一化数值进行是数值融合处理,得到第一融合计算值;
第二处理单元,用于将所述第一融合计算值与所述剩余维度信息中的第二剩余维度信息对应的归一化数值进行数值融合处理,得到第二融合计算值;
第三处理单元,用于依次完成所述剩余维度信息中的各个维度信息的数值融合处理,得到最终的融合计算值;
构建单元,用于根据所述最终的融合计算值,构建生成数值融合模型。
CN201710774812.5A 2017-08-31 2017-08-31 一种数值融合模型构建方法及装置 Active CN107609395B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710774812.5A CN107609395B (zh) 2017-08-31 2017-08-31 一种数值融合模型构建方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710774812.5A CN107609395B (zh) 2017-08-31 2017-08-31 一种数值融合模型构建方法及装置

Publications (2)

Publication Number Publication Date
CN107609395A CN107609395A (zh) 2018-01-19
CN107609395B true CN107609395B (zh) 2020-10-13

Family

ID=61055678

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710774812.5A Active CN107609395B (zh) 2017-08-31 2017-08-31 一种数值融合模型构建方法及装置

Country Status (1)

Country Link
CN (1) CN107609395B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7412150B2 (ja) * 2019-11-29 2024-01-12 東京エレクトロン株式会社 予測装置、予測方法及び予測プログラム
CN111738325B (zh) * 2020-06-16 2024-05-17 北京百度网讯科技有限公司 图像识别方法、装置、设备以及存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7539659B2 (en) * 2007-06-15 2009-05-26 Microsoft Corporation Multidimensional timeline browsers for broadcast media
CN101694706A (zh) * 2009-09-28 2010-04-14 深圳先进技术研究院 基于多源数据融合的人口时空动态出行特征建模方法
CN104714237A (zh) * 2015-01-30 2015-06-17 哈尔滨工程大学 一种多特征及多方位数据融合鱼类识别方法
CN106126901A (zh) * 2016-06-17 2016-11-16 华南理工大学 一种多维度信息融合的变压器可用状态在线评估方法
CN106897417A (zh) * 2017-02-22 2017-06-27 东南大学 一种基于多源大数据融合的城市空间全息地图的构建方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9661010B2 (en) * 2014-11-21 2017-05-23 Honeywell International Inc. Security log mining devices, methods, and systems

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7539659B2 (en) * 2007-06-15 2009-05-26 Microsoft Corporation Multidimensional timeline browsers for broadcast media
CN101694706A (zh) * 2009-09-28 2010-04-14 深圳先进技术研究院 基于多源数据融合的人口时空动态出行特征建模方法
CN104714237A (zh) * 2015-01-30 2015-06-17 哈尔滨工程大学 一种多特征及多方位数据融合鱼类识别方法
CN106126901A (zh) * 2016-06-17 2016-11-16 华南理工大学 一种多维度信息融合的变压器可用状态在线评估方法
CN106897417A (zh) * 2017-02-22 2017-06-27 东南大学 一种基于多源大数据融合的城市空间全息地图的构建方法

Also Published As

Publication number Publication date
CN107609395A (zh) 2018-01-19

Similar Documents

Publication Publication Date Title
CN113127931B (zh) 基于瑞丽散度进行噪声添加的联邦学习差分隐私保护方法
Zhao et al. A machine learning based trust evaluation framework for online social networks
CN109360028B (zh) 用于推送信息的方法和装置
EP3311311A1 (en) Automatic entity resolution with rules detection and generation system
Mo et al. Fractal-based intrinsic dimension estimation and its application in dimensionality reduction
Ristić et al. A mixed INAR (p) model
Wu An user intention mining model based on fractal time series pattern
CN107609395B (zh) 一种数值融合模型构建方法及装置
CN111062439A (zh) 一种视频清晰度分类方法、装置、设备和存储介质
CN112685799A (zh) 设备指纹生成方法、装置、电子设备和计算机可读介质
CN108700467B (zh) 简化的纹理比较引擎
Martinovič Chaotic behaviour of noisy traffic data
CN117290788B (zh) 一种基于改进小波变换算法的配电网故障辨识方法及系统
US11810001B1 (en) Systems and methods for generating and implementing knowledge graphs for knowledge representation and analysis
CN106779354B (zh) 用于飞行器性能评估的Bayes数据融合评估方法
CN111162945B (zh) 一种告警关联关系的确定方法、装置、设备及存储介质
S. Kumar Robust multi‐view videos face recognition based on particle filter with immune genetic algorithm
Kalantana Intrinsic dimensionality estimation for high-dimensional data sets: New approaches for the computation of correlation dimension
CN112597699B (zh) 一种融入客观赋权法的社交网络谣言源识别方法
CN110020211B (zh) 用户属性影响力的评估方法和装置
Kalantan et al. On the computation of the correlation integral for fractal dimension estimation
JP6950647B2 (ja) データ判定装置、方法、及びプログラム
CN111445430A (zh) 基于差异特征幅值区间融合有效度分布的双模态红外图像融合算法选择方法
JP2007072752A (ja) 類似時系列データ計算方法、類似時系列データ計算装置、および類似時系列データ計算プログラム
CN112527622A (zh) 一种性能测试结果分析方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant