CN115964397A - 一种数据种子植入及溯源追踪方法 - Google Patents

一种数据种子植入及溯源追踪方法 Download PDF

Info

Publication number
CN115964397A
CN115964397A CN202211142994.1A CN202211142994A CN115964397A CN 115964397 A CN115964397 A CN 115964397A CN 202211142994 A CN202211142994 A CN 202211142994A CN 115964397 A CN115964397 A CN 115964397A
Authority
CN
China
Prior art keywords
data
historical
demand
analysis
source
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202211142994.1A
Other languages
English (en)
Other versions
CN115964397B (zh
Inventor
吴鸿钟
李世亮
汪广锐
张桂银
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chengdu Bite Xin'an Technology Co ltd
Original Assignee
Chengdu Bite Xin'an Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chengdu Bite Xin'an Technology Co ltd filed Critical Chengdu Bite Xin'an Technology Co ltd
Priority to CN202211142994.1A priority Critical patent/CN115964397B/zh
Publication of CN115964397A publication Critical patent/CN115964397A/zh
Application granted granted Critical
Publication of CN115964397B publication Critical patent/CN115964397B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Landscapes

  • Data Exchanges In Wide-Area Networks (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提供一种数据种子植入及溯源追踪方法,包括:步骤1:基于需求解决平台收集初始数据,并向所述初始数据导入数据来源地址;步骤2:解析用户需求,确定每个子需求对应匹配的数据包;步骤3:将所述数据来源地址与对应数据包进行一致分析,确定每个数据包的置换可能性;步骤4:根据所述置换可能性,向对应数据包植入相应的追踪种子,实现溯源追踪。通过解析用户需求,并进行数据包与数据来源地址的一致分析,便于有效的向不同的数据包植入不同的追踪种子,方便后续对数据的有效溯源。

Description

一种数据种子植入及溯源追踪方法
技术领域
本发明涉及种子植入以及溯源追踪技术领域,特别涉及一种数据种子植入及溯源追踪方法。
背景技术
数据溯源技术就是在数据库领域得到广泛研究,其基本触发点时帮助人们确定数据仓库中各项数据的来源。
在日常生活中,在根据用户的需求调取数据的过程中,一般是从海量数据库中调取资源,来满足用户需求,但是采用这种方式会不清楚数据的来源,当有些数据出现异常时,由于来源不清楚,导致异常处理的效率低下。
因此,本发明提出一种数据种子植入及溯源追踪方法。
发明内容
本发明提供一种数据种子植入及溯源追踪方法,用以通过解析用户需求,并进行数据包与数据来源地址的一致分析,便于有效的向不同的数据包植入不同的追踪种子,方便后续对数据的有效溯源。
本发明提供一种数据种子植入及溯源追踪方法,包括:
步骤1:基于需求解决平台收集初始数据,并向所述初始数据导入数据来源地址;
步骤2:解析用户需求,确定每个子需求对应匹配的数据包;
步骤3:将所述数据来源地址与对应数据包进行一致分析,确定每个数据包的置换可能性;
步骤4:根据所述置换可能性,向对应数据包植入相应的追踪种子,实现溯源追踪。
优选的,基于需求解决平台收集初始数据,并向所述初始数据导入数据来源地址,包括:
获取所述需求解决平台采集的历史需求、基于每个历史需求的匹配需求数据以及在采集对应历史需求的过程中所述需求解决平台采集到的历史信息;
对所述历史信息进行信息拆分,获取每个拆分信息对应的第一历史来源,同时,确定对应历史需求所对应的匹配需求数据的第二历史来源;
将所述第一历史来源与第二历史来源进行交集处理,得到交集来源;
计算每个历史需求对应的第一历史有效系数;
Figure SMS_1
其中,
Figure SMS_2
表示第一历史来源;
Figure SMS_3
表示第二历史来源;
Figure SMS_4
表示交集来源;
根据获取的每个历史需求所对应的第一历史有效系数,构建系数集合;
提取所述系数集合中的集中系数,并统计每个集中系数对应的集中来源的第一个数;
基于获取的所有第一个数,构建数值阵列,并分析所述数值阵列中趋于平缓的第一数值;
统计所述初始数据的初始来源的第二个数;
当所述第一数值的个数为1个时,将所述第一数值作为第一比较数值;
获取所述第一比较数值与第二个数的第一比值,当第一比值大于第一预设比值时,确定所述初始来源的数据来源地址;
当所述第一数值的个数为多个时,分析每个趋于一致数值的个数,并筛选最大个数对应的第二数值,并作为第二比较数值;
获取所述第二比较数值与第二个数的第二比值,当第二比值大于第二预设比值时,确定所述初始来源的数据来源地址。
优选的,解析用户需求,确定每个子需求对应匹配的数据包,包括:
按照需求解析模型,对所述用户需求进行解析,获取得到若干子需求;
根据每个子需求的需求属性,从属性数据库中匹配得到数据包。
优选的,将所述数据来源地址与对应数据包进行一致分析,确定每个数据包的置换可能性,包括:
确定每个数据包的允许包来源地址;
将每个允许包来源地址都存在一致的数据来源地址,则判定对应数据包的置换可能性为0;
否则,按照地址拆分规则,对不一致的允许包来源地址进行第一拆分,对每个数据来源地址进行第二拆分;
将第一拆分结果分别与每个第二拆分结果进行匹配,构建匹配阵列T;
Figure SMS_5
其中,
Figure SMS_6
表示对应第一拆分结果与第i1个第二拆分结果的匹配值,且i1的取值为1,2,3,...,n1;
筛选匹配阵列T中的最大值
Figure SMS_7
Figure SMS_8
时,将
Figure SMS_9
的结果作为置换可能性;
Figure SMS_10
时,将
Figure SMS_11
的结果作为置换可能性;
否则,将
Figure SMS_12
的结果作为置换可能性。
优选的,还包括:
计算匹配值:
Figure SMS_13
其中,
Figure SMS_14
表示对应第一拆分结果中的j1个结果指标值;
Figure SMS_15
表示对应第i1个第二拆分结果中的j1个结果指标值;sim表示相似度符号;m1表示预先设定存在的结果指标个数。
优选的,根据所述置换可能性,向对应数据包植入相应的追踪种子,实现溯源追踪,包括:
当所述置换可能性不为0时,按照所述置换可能性对应的比较标准,从标准数据库中匹配对应的置换区间,其中,所述置换区间中的每个置换值都存在匹配的追踪种子;
将所述置换可能性与对应置换区间进行匹配,得到对应的追踪种子。
优选的,根据所述置换可能性,向对应数据包植入相应的追踪种子,实现溯源追踪,包括:
当所述置换可能性为0时,根据对应数据包的包类型,从类型-种子数据库调取相应的追踪种子,实现溯源追踪。
优选的,按照需求解析模型,对所述用户需求进行解析,获取得到若干子需求,包括:
获取所述需求解析模型的模型层,并根据历史日志确定对应模型层的历史解析流程以及所述历史解析流程中的解析事件、解析参与度和解析可靠度;
基于所述解析事件、解析参与度以及解析可靠度,判定对应模型层是否需要调整,将对应模型层的需调整信息保留;
根据每个模型层的需要调整信息以及对应模型层的调整因子,确定调整次数;
根据预先设置的所述需求解析模型中每个模型层的层权重,得到最大层权重对应的第一调整次数以及最大调整次数对应的匹配层权重;
当所述匹配层权重大于或等于第一预设权重,此时,按照最大调整次数对对应需求解析模型进行对应次数的优化调整;
否则,按照第一调整次数对对应需求解析模型进行对应次数的优化调整;
基于优化调整后的模型,对用户需求进行解析,得到若干子需求。
本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。
附图说明
附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。在附图中:
图1为本发明实施例中一种数据种子植入及溯源追踪方法的流程图。
具体实施方式
以下结合附图对本发明的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本发明,并不用于限定本发明。
本发明提供一种数据种子植入及溯源追踪方法,如图1所示,包括:
步骤1:基于需求解决平台收集初始数据,并向所述初始数据导入数据来源地址;
步骤2:解析用户需求,确定每个子需求对应匹配的数据包;
步骤3:将所述数据来源地址与对应数据包进行一致分析,确定每个数据包的置换可能性;
步骤4:根据所述置换可能性,向对应数据包植入相应的追踪种子,实现溯源追踪。
该实施例中,需求解决平台主要是为了解决平台接收的不同用户的不同需求,为了该需求匹配相应的资源,且在调取资源的过程中,就需要设置相应的追踪种子,比如,需求解析之后确定存在数据包1、2、3,且数据包是为了调取匹配的资源,且可以从类型区分以及大致的调取位置来区分。
该实施例中,初始数据指的是该平台在接收到用户需求前后时间段内所接收到的所有资源调取的信息,也就是满足用户需求的操作行为所对应的资源信息。
该实施例中,数据来源地址指的是初始数据中每个数据的来源地址,比如,数据1的来源地址为数据库A中的存储块a1中获取得到的。
该实施例中,数据包与用户需求是匹配的,比如子需求1是为了获取消费推荐信息,此时,消费推荐信息是处于数据库B中的,那么对应的数据包为预先预估的可以从某个位置获取得到对应信息来满足需求。
该实施例中,数据来源地址与数据包的一致分析,是为了确定该平台在历史调取过程中经常从对应地址得到相应信息,也就是,如果历史调取以及预估的两者是一致的,则视为置换可能性为0,也就是表明该平台是存在对一致地址溯源的行为事件的。
该实施例中,根据置换可能性可以确定出其对应的置换区间,进而来匹配对应置换值的追踪种子,也就是采用何种方式来对数据调取以及调取之后数据的返回等进行追踪,如果后续该部分数据出现异常,可以根据追踪结果实现对异常的溯源,便于有效的对异常数据的锁定,提高效率。
上述技术方案的有益效果是:通过解析用户需求,并进行数据包与数据来源地址的一致分析,便于有效的向不同的数据包植入不同的追踪种子,方便后续对数据的有效溯源。
本发明提供一种数据种子植入及溯源追踪方法,基于需求解决平台收集初始数据,并向所述初始数据导入数据来源地址,包括:
获取所述需求解决平台采集的历史需求、基于每个历史需求的匹配需求数据以及在采集对应历史需求的过程中所述需求解决平台采集到的历史信息;
对所述历史信息进行信息拆分,获取每个拆分信息对应的第一历史来源,同时,确定对应历史需求所对应的匹配需求数据的第二历史来源;
将所述第一历史来源与第二历史来源进行交集处理,得到交集来源;
计算每个历史需求对应的第一历史有效系数;
Figure SMS_16
其中,
Figure SMS_17
表示第一历史来源;
Figure SMS_18
表示第二历史来源;
Figure SMS_19
表示交集来源;
根据获取的每个历史需求所对应的第一历史有效系数,构建系数集合;
提取所述系数集合中的集中系数,并统计每个集中系数对应的集中来源的第一个数;
基于获取的所有第一个数,构建数值阵列,并分析所述数值阵列中趋于平缓的第一数值;
统计所述初始数据的初始来源的第二个数;
当所述第一数值的个数为1个时,将所述第一数值作为第一比较数值;
获取所述第一比较数值与第二个数的第一比值,当第一比值大于第一预设比值时,确定所述初始来源的数据来源地址;
当所述第一数值的个数为多个时,分析每个趋于一致数值的个数,并筛选最大个数对应的第二数值,并作为第二比较数值;
获取所述第二比较数值与第二个数的第二比值,当第二比值大于第二预设比值时,确定所述初始来源的数据来源地址。
该实施例中,历史需求指的是该平台在获取当下的用户需求之前所获取的需求,也就是历史需求,且每个历史需求都有其对应的匹配需求数据,因为需要基于该平台来实现对需求的解决,所以,会存在匹配需求数据。
该实施例中,在获取历史需求的过程中所采集的历史信息,且历史信息是区别于匹配需求数据的,且历史信息包含的来源是多于对应匹配需求数据对应的来源的。
该实施例中,交集处理指的是针对同个历史需求来处理的。
该实施例中,比如,构建的系数集合为:0.3、0.4、0.5、0.9、0.3、0.4、0.3,此时集中系数为:0.3和0.4,此时,就获取0.3与0.4分别对应的来源,并分别统计每个0.3对应的第一个数以及每个0.4对应的第一个数,且第一个数都是针对来源个数的。
比如,第一个0.3的第一个数为5,第二个0.3对应的第一个数为6,第三个0.3对应的第一个数为4,第一个0.4对应的第一个数为8,第二个0.4对应的第一个数为6,那么构建的数值阵列为5 6 4 8 6,此时,趋于平缓的第一数值可以是6,比如,初始数据的初始来源的第二个数为3,那么通过数值与个数的比较,可以有效的确定出比值,其中,第一预设比值以及第二预设比值都是预先设置好的。
该实施例中,当第一数值的个数为5和6时,且趋于5的个数小于趋于6的个数,此时,就将6作为对应的第二数值。
上述技术方案的有益效果是:通过对平台的历史需求进行分析以及对相应的匹配需求数据和历史信息对应的来源进行交集处理,构建系数集合,并通过进行数值比较,有效的确定数据来源地址,为后续为数据包植入追踪种子提供有效基础。
本发明提供一种数据种子植入及溯源追踪方法,解析用户需求,确定每个子需求对应匹配的数据包,包括:
按照需求解析模型,对所述用户需求进行解析,获取得到若干子需求;
根据每个子需求的需求属性,从属性数据库中匹配得到数据包。
该实施例中,需求解析模型是预先训练好的,且是基于不同的需求以及需求拆分结果为样本训练得到的,因此,可以基于模型对需求解析得到若干子需求。
该实施例中,每个需求都有其需求属性,比如是针对调取资源的类型等,就可以视为属性,属性数据库是包括不同的属性以及与属性匹配的数据包在内的,进而可以得到对应数据包。
上述技术方案的有益效果是:基于模型对需求解析,便于获取子需求,进而根据需求属性,来匹配数据包,为后续植入种子提供基础,提高对异常溯源的效率。
本发明提供一种数据种子植入及溯源追踪方法,将所述数据来源地址与对应数据包进行一致分析,确定每个数据包的置换可能性,包括:
确定每个数据包的允许包来源地址;
将每个允许包来源地址都存在一致的数据来源地址,则判定对应数据包的置换可能性为0;
否则,按照地址拆分规则,对不一致的允许包来源地址进行第一拆分,对每个数据来源地址进行第二拆分;
将第一拆分结果分别与每个第二拆分结果进行匹配,构建匹配阵列T;
Figure SMS_20
其中,
Figure SMS_21
表示对应第一拆分结果与第i1个第二拆分结果的匹配值,且i1的取值为1,2,3,...,n1;
筛选匹配阵列T中的最大值
Figure SMS_22
Figure SMS_23
时,将
Figure SMS_24
的结果作为置换可能性;
Figure SMS_25
时,将
Figure SMS_26
的结果作为置换可能性;
否则,将
Figure SMS_27
的结果作为置换可能性。
该实施例中,b2大于b1,且
Figure SMS_28
0是在0-
Figure SMS_29
之间的。
该实施例中,数据包也就是包含从哪个数据库来获取相关的数据,进而可以确定出允许包来源地址。
该实施例中,如果存在与允许包来源地址一致的数据来源地址,也就表明存在历史溯源的路径,那么就将置换可能性视为0。
该实施例中,地址拆分规则是预先设置好的,比如,前两个字符是大数据库,中间两个字符是大数据库中的某个存储块,最后两个字符是对应存储块的调取位置,那么就可以按照该规则,有效实现对地址的拆分。
该实施例中,对地址进行拆分之后,按照拆分结果进行匹配,可以构建得到阵列,且通过对最大值的范围比较,有效确定不同情况下的置换可能性。
上述技术方案的有益效果是:通过确定允许包来源地址以及数据来源地址,进而根据地址拆分规则对地址拆分,来进行拆分结果的匹配,来筛选最大值,进而通过范围比较,便于确定置换可能性,为后续植入种子提供有效基础。
本发明提供一种数据种子植入及溯源追踪方法,还包括:
计算匹配值:
Figure SMS_30
其中,
Figure SMS_31
表示对应第一拆分结果中的j1个结果指标值;
Figure SMS_32
表示对应第i1个第二拆分结果中的j1个结果指标值;sim表示相似度符号;m1表示预先设定存在的结果指标个数。
上述技术方案的有益效果是:通过将不同拆分结果中的指标进行相似比较,便于获取匹配值,为后续确定置换可能性提供基础。
本发明提供一种数据种子植入及溯源追踪方法,根据所述置换可能性,向对应数据包植入相应的追踪种子,实现溯源追踪,包括:
当所述置换可能性不为0时,按照所述置换可能性对应的比较标准,从标准数据库中匹配对应的置换区间,其中,所述置换区间中的每个置换值都存在匹配的追踪种子;
将所述置换可能性与对应置换区间进行匹配,得到对应的追踪种子。
该实施例中,置换可能性对应的比较标准是基于值的大小比较范围来初步确定的,标准数据库是包括不同的大小比较范围以及对应的置换区间在内的,且置换区间中每个区间数值都设置有追踪种子,且追踪种子的设置主要是为了保证后续对数据的溯源。
该实施例中,置换可能性与置换区间的匹配,相当于是置换可能性与对应区间数值的匹配,进而来获取追踪种子。
上述技术方案的有益效果是:通过进行置换区间的匹配以及置换可能性与区间的匹配,便于得到追踪种子,为后续进行溯源提供基础。
本发明提供一种数据种子植入及溯源追踪方法,根据所述置换可能性,向对应数据包植入相应的追踪种子,实现溯源追踪,包括:
当所述置换可能性为0时,根据对应数据包的包类型,从类型-种子数据库调取相应的追踪种子,实现溯源追踪。
该实施例中,类型-种子数据库是包括不同的包类型以及与类型匹配的种子在内的。
上述技术方案的有益效果是:通过按照包类型直接从数据库调取追踪种子,来实现溯源。
本发明提供一种数据种子植入及溯源追踪方法,按照需求解析模型,对所述用户需求进行解析,获取得到若干子需求,包括:
获取所述需求解析模型的模型层,并根据历史日志确定对应模型层的历史解析流程以及所述历史解析流程中的解析事件、解析参与度和解析可靠度;
基于所述解析事件、解析参与度以及解析可靠度,判定对应模型层是否需要调整,将对应模型层的需调整信息保留;
根据每个模型层的需要调整信息以及对应模型层的调整因子,确定调整次数;
根据预先设置的所述需求解析模型中每个模型层的层权重,得到最大层权重对应的第一调整次数以及最大调整次数对应的匹配层权重;
当所述匹配层权重大于或等于第一预设权重,此时,按照最大调整次数对对应需求解析模型进行对应次数的优化调整;
否则,按照第一调整次数对对应需求解析模型进行对应次数的优化调整;
基于优化调整后的模型,对用户需求进行解析,得到若干子需求。
该实施例中,需求解析模型是预先训练好的,且模型是包括多个模型层在内的,因此,可以根据历史日志,来确定对应模型层的相关参数信息,历史解析流程指的是基于该模型层对需求进行解析的操作步骤,且解析事件指的是操作步骤的具体解析内容,也就是解析事件,进而可以确定出参与度,比如,模型层1存在3个操作步骤,整个模型所有模型层的总操作步骤为10个,那么3/10就可以视为对应的解析参与度。
该实施例中,解析可靠度指的是按照3个操作步骤进行解析的过程中,其解析的有效性,解析的越成功,对应的可靠度越大,最大可靠度为1。
该实施例中,当解析事件、解析参与度以及解析可靠度,都满足对应的解析标准时,则判定对应的模型层不需要调整,否则,判定对应的模型层需要调整。
该实施例中,在判定需要调整时,也是根据不满足对应解析标准的参数进行提取,所获取的相关的调整信息,比如,解析可靠度不合理,那么就对模型的精度进行训练等。
该实施例中,调整因子指的是调整参数,比如,调整精度需要提升,从江都h1调整到精度h2。
该实施例中,比如,每次精度调整会提升b1,那么调整次数为:
Figure SMS_33
,进 而来确定针对调整因子为精度的调整次数,且其余的调整因子对应的调整次数也是通过类 似方法计算得到的。
该实施例中,在模型训练好之后,且每个模型层的权重就已经设定好了,所以,可以直接确定出对应的最大权重。
该实施例中,第一预设权重是预先设置好的。
该实施例中,对应次数的优化调整指的是可以按照不同的样本进行多次优化。
上述技术方案的有益效果是:通过对模型层进行分析,来确定对应的调整因子,进而来确定对模型的优化次数,保证最大程度实现对模型的优化调整,为获取子需求提供有效基础。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (8)

1.一种数据种子植入及溯源追踪方法,其特征在于,包括:
步骤1:基于需求解决平台收集初始数据,并向所述初始数据导入数据来源地址;
步骤2:解析用户需求,确定每个子需求对应匹配的数据包;
步骤3:将所述数据来源地址与对应数据包进行一致分析,确定每个数据包的置换可能性;
步骤4:根据所述置换可能性,向对应数据包植入相应的追踪种子,实现溯源追踪。
2.如权利要求1所述的数据种子植入及溯源追踪方法,其特征在于,基于需求解决平台收集初始数据,并向所述初始数据导入数据来源地址,包括:
获取所述需求解决平台采集的历史需求、基于每个历史需求的匹配需求数据以及在采集对应历史需求的过程中所述需求解决平台采集到的历史信息;
对所述历史信息进行信息拆分,获取每个拆分信息对应的第一历史来源,同时,确定对应历史需求所对应的匹配需求数据的第二历史来源;
将所述第一历史来源与第二历史来源进行交集处理,得到交集来源;
计算每个历史需求对应的第一历史有效系数;
Figure 408935DEST_PATH_IMAGE001
其中,
Figure 927641DEST_PATH_IMAGE002
表示第一历史来源;
Figure 886370DEST_PATH_IMAGE003
表示第二历史来源;
Figure 682287DEST_PATH_IMAGE004
表示交集来源;
根据获取的每个历史需求所对应的第一历史有效系数,构建系数集合;
提取所述系数集合中的集中系数,并统计每个集中系数对应的集中来源的第一个数;
基于获取的所有第一个数,构建数值阵列,并分析所述数值阵列中趋于平缓的第一数值;
统计所述初始数据的初始来源的第二个数;
当所述第一数值的个数为1个时,将所述第一数值作为第一比较数值;
获取所述第一比较数值与第二个数的第一比值,当第一比值大于第一预设比值时,确定所述初始来源的数据来源地址;
当所述第一数值的个数为多个时,分析每个趋于一致数值的个数,并筛选最大个数对应的第二数值,并作为第二比较数值;
获取所述第二比较数值与第二个数的第二比值,当第二比值大于第二预设比值时,确定所述初始来源的数据来源地址。
3.如权利要求1所述的数据种子植入及溯源追踪方法,其特征在于,解析用户需求,确定每个子需求对应匹配的数据包,包括:
按照需求解析模型,对所述用户需求进行解析,获取得到若干子需求;
根据每个子需求的需求属性,从属性数据库中匹配得到数据包。
4.如权利要求1所述的数据种子植入及溯源追踪方法,其特征在于,将所述数据来源地址与对应数据包进行一致分析,确定每个数据包的置换可能性,包括:
确定每个数据包的允许包来源地址;
将每个允许包来源地址都存在一致的数据来源地址,则判定对应数据包的置换可能性为0;
否则,按照地址拆分规则,对不一致的允许包来源地址进行第一拆分,对每个数据来源地址进行第二拆分;
将第一拆分结果分别与每个第二拆分结果进行匹配,构建匹配阵列T;
Figure 576425DEST_PATH_IMAGE005
其中,
Figure 457794DEST_PATH_IMAGE006
表示对应第一拆分结果与第i1个第二拆分结果的匹配值,且i1的取值为1,2,3,...,n1;
筛选匹配阵列T中的最大值
Figure 220213DEST_PATH_IMAGE007
Figure 260850DEST_PATH_IMAGE008
时,将
Figure 184944DEST_PATH_IMAGE009
的结果作为置换可能性;
Figure 819188DEST_PATH_IMAGE010
时,将
Figure 119719DEST_PATH_IMAGE011
的结果作为置换可能性;
否则,将
Figure 269990DEST_PATH_IMAGE012
的结果作为置换可能性。
5.如权利要求4所述的数据种子植入及溯源追踪方法,其特征在于,还包括:
计算匹配值:
Figure 364985DEST_PATH_IMAGE013
其中,
Figure 486524DEST_PATH_IMAGE014
表示对应第一拆分结果中的j1个结果指标值;
Figure 715380DEST_PATH_IMAGE015
表示对应第i1个第二拆分结果中的j1个结果指标值;sim表示相似度符号;m1表示预先设定存在的结果指标个数。
6.如权利要求1所述的数据种子植入及溯源追踪方法,其特征在于,根据所述置换可能性,向对应数据包植入相应的追踪种子,实现溯源追踪,包括:
当所述置换可能性不为0时,按照所述置换可能性对应的比较标准,从标准数据库中匹配对应的置换区间,其中,所述置换区间中的每个置换值都存在匹配的追踪种子;
将所述置换可能性与对应置换区间进行匹配,得到对应的追踪种子。
7.如权利要求1所述的数据种子植入及溯源追踪方法,其特征在于,根据所述置换可能性,向对应数据包植入相应的追踪种子,实现溯源追踪,包括:
当所述置换可能性为0时,根据对应数据包的包类型,从类型-种子数据库调取相应的追踪种子,实现溯源追踪。
8.如权利要求1所述的数据种子植入及溯源追踪方法,其特征在于,按照需求解析模型,对所述用户需求进行解析,获取得到若干子需求,包括:
获取所述需求解析模型的模型层,并根据历史日志确定对应模型层的历史解析流程以及所述历史解析流程中的解析事件、解析参与度和解析可靠度;
基于所述解析事件、解析参与度以及解析可靠度,判定对应模型层是否需要调整,将对应模型层的需调整信息保留;
根据每个模型层的需要调整信息以及对应模型层的调整因子,确定调整次数;
根据预先设置的所述需求解析模型中每个模型层的层权重,得到最大层权重对应的第一调整次数以及最大调整次数对应的匹配层权重;
当所述匹配层权重大于或等于第一预设权重,此时,按照最大调整次数对对应需求解析模型进行对应次数的优化调整;
否则,按照第一调整次数对对应需求解析模型进行对应次数的优化调整;
基于优化调整后的模型,对用户需求进行解析,得到若干子需求。
CN202211142994.1A 2022-09-20 2022-09-20 一种数据种子植入及溯源追踪方法 Active CN115964397B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211142994.1A CN115964397B (zh) 2022-09-20 2022-09-20 一种数据种子植入及溯源追踪方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211142994.1A CN115964397B (zh) 2022-09-20 2022-09-20 一种数据种子植入及溯源追踪方法

Publications (2)

Publication Number Publication Date
CN115964397A true CN115964397A (zh) 2023-04-14
CN115964397B CN115964397B (zh) 2023-09-19

Family

ID=87351733

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211142994.1A Active CN115964397B (zh) 2022-09-20 2022-09-20 一种数据种子植入及溯源追踪方法

Country Status (1)

Country Link
CN (1) CN115964397B (zh)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003140921A (ja) * 2001-10-29 2003-05-16 Sony Corp データ処理システム及びデータ処理方法、並びに記憶媒体
JP2008311909A (ja) * 2007-06-14 2008-12-25 Fujitsu Ltd Ipパケット追跡装置
CN104537552A (zh) * 2014-12-23 2015-04-22 百度在线网络技术(北京)有限公司 通过计算机实现的信息推荐方法及装置
CN104951985A (zh) * 2014-03-28 2015-09-30 新疆维吾尔自治区畜牧科学院科技信息研究所(新疆维吾尔自治区畜牧业经济研究所) 一种数据采集方法
CN106055676A (zh) * 2016-06-03 2016-10-26 电子科技大学 一种基于大数据模型分析平台的数据溯源方法及系统
CN109657110A (zh) * 2018-12-13 2019-04-19 上海达梦数据技术有限公司 一种数据溯源方法以及相应的数据溯源装置
CN113472798A (zh) * 2021-07-07 2021-10-01 国家计算机网络与信息安全管理中心江苏分中心 一种网络数据包的回溯解析方法、装置、设备及介质

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003140921A (ja) * 2001-10-29 2003-05-16 Sony Corp データ処理システム及びデータ処理方法、並びに記憶媒体
JP2008311909A (ja) * 2007-06-14 2008-12-25 Fujitsu Ltd Ipパケット追跡装置
CN104951985A (zh) * 2014-03-28 2015-09-30 新疆维吾尔自治区畜牧科学院科技信息研究所(新疆维吾尔自治区畜牧业经济研究所) 一种数据采集方法
CN104537552A (zh) * 2014-12-23 2015-04-22 百度在线网络技术(北京)有限公司 通过计算机实现的信息推荐方法及装置
CN106055676A (zh) * 2016-06-03 2016-10-26 电子科技大学 一种基于大数据模型分析平台的数据溯源方法及系统
CN109657110A (zh) * 2018-12-13 2019-04-19 上海达梦数据技术有限公司 一种数据溯源方法以及相应的数据溯源装置
CN113472798A (zh) * 2021-07-07 2021-10-01 国家计算机网络与信息安全管理中心江苏分中心 一种网络数据包的回溯解析方法、装置、设备及介质

Also Published As

Publication number Publication date
CN115964397B (zh) 2023-09-19

Similar Documents

Publication Publication Date Title
CN103297435B (zh) 一种基于web日志的异常访问行为检测方法与系统
CN111798312A (zh) 一种基于孤立森林算法的金融交易系统异常识别方法
CN110363387A (zh) 基于大数据的画像分析方法、装置、计算机设备及存储介质
CN111860981B (zh) 一种基于lstm深度学习的企业国民行业类别预测方法及系统
US20140229482A1 (en) Grouping interdependent fields
WO2023093100A1 (zh) 一种api网关异常调用识别的方法、装置、设备及产品
RU2680746C2 (ru) Способ и устройство для создания модели качества веб-страницы
CN112329843B (zh) 基于决策树的呼叫数据处理方法、装置、设备及存储介质
CN110362607B (zh) 异常号码识别方法、装置、计算机设备及存储介质
CN104756113A (zh) 用于检测数据源中的偏差的方法、设备和计算机程序
CN110728301A (zh) 一种个人用户的信用评分方法、装置、终端及存储介质
CN117455417A (zh) 一种智能风控审批策略自动迭代优化方法及系统
CN111177217A (zh) 数据预处理方法、装置、计算机设备及存储介质
CN113221960A (zh) 一种高质量漏洞数据收集模型的构建方法及收集方法
CN114647636B (zh) 大数据异常检测方法及系统
CN115203167A (zh) 数据检测方法、装置、计算机设备和存储介质
CN117520660A (zh) 基于大数据的资讯信息提取推送方法及系统
CN118132732A (zh) 增强式检索用户问答方法、装置、计算机设备及存储介质
CN112199388A (zh) 陌电识别方法、装置、电子设备及存储介质
CN116468271B (zh) 一种基于大数据的企业风险分析方法、系统及介质
CN115964397A (zh) 一种数据种子植入及溯源追踪方法
CN114495137B (zh) 票据异常检测模型生成方法与票据异常检测方法
CN113660147B (zh) 一种基于模糊熵的ip会话序列周期性评估方法
CN110941713A (zh) 基于主题模型的自优化金融资讯版块分类方法
CN112819527B (zh) 一种用户分群处理方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant