CN115712843B - 基于人工智能的数据匹配检测处理方法及系统 - Google Patents
基于人工智能的数据匹配检测处理方法及系统 Download PDFInfo
- Publication number
- CN115712843B CN115712843B CN202211528286.1A CN202211528286A CN115712843B CN 115712843 B CN115712843 B CN 115712843B CN 202211528286 A CN202211528286 A CN 202211528286A CN 115712843 B CN115712843 B CN 115712843B
- Authority
- CN
- China
- Prior art keywords
- service element
- data
- cluster
- algorithm
- target
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 125
- 238000013473 artificial intelligence Methods 0.000 title claims abstract description 32
- 238000003672 processing method Methods 0.000 title claims abstract description 12
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 200
- 230000003993 interaction Effects 0.000 claims abstract description 191
- 238000012545 processing Methods 0.000 claims abstract description 38
- 238000005065 mining Methods 0.000 claims abstract description 31
- 230000001629 suppression Effects 0.000 claims abstract description 7
- 239000013598 vector Substances 0.000 claims description 177
- 238000000034 method Methods 0.000 claims description 47
- 238000013135 deep learning Methods 0.000 claims description 18
- 238000013139 quantization Methods 0.000 claims description 8
- 238000004590 computer program Methods 0.000 claims description 7
- 230000004044 response Effects 0.000 claims description 2
- 238000005406 washing Methods 0.000 claims 1
- 238000004458 analytical method Methods 0.000 abstract description 9
- 230000008569 process Effects 0.000 description 21
- 238000013461 design Methods 0.000 description 11
- 238000010586 diagram Methods 0.000 description 7
- 230000006870 function Effects 0.000 description 7
- 238000004364 calculation method Methods 0.000 description 5
- 238000004140 cleaning Methods 0.000 description 5
- 230000005540 biological transmission Effects 0.000 description 4
- 238000004891 communication Methods 0.000 description 4
- 238000000611 regression analysis Methods 0.000 description 4
- 125000004122 cyclic group Chemical group 0.000 description 3
- 238000003058 natural language processing Methods 0.000 description 3
- 230000003139 buffering effect Effects 0.000 description 2
- 238000013480 data collection Methods 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 230000003340 mental effect Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000000926 separation method Methods 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 101150055297 SET1 gene Proteins 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明提供的基于人工智能的数据匹配检测处理方法及系统,通过噪声抑制方式调试所得的匹配检测决策算法,能够保障所确定的业务主题匹配指示的挖掘分析准确度和合理度,通过调试所得的匹配检测决策算法,对获得的数字化业务交互数据进行匹配检测决策分析,可以准确可靠地挖掘得到数字化业务交互数据中包含的业务主题匹配指示,从而可依据业务主题匹配指示对数字化业务交互数据进行针对性的分配处理,提高数字化业务交互数据的分配精度和可信度,并保障数字化业务交互数据的使用效率。
Description
技术领域
本发明涉及人工智能技术领域,特别涉及一种基于人工智能的数据匹配检测处理方法及系统。
背景技术
人工智能技术通过对人的各种活动的“替代”,不仅能够大大减轻我们的体力负担和脑力负担,甚至可以替代我们完成一些以往需要人的智能才能完成的工作,从而减轻人们智力劳动和脑力劳动的压力,使人们的生活更加便捷化,工作效率更加高效化。在人工智能领域,神经网络模型+数据处理的应用模式越来越广泛,针对数据匹配/分配处理而言,上述应用模式在实际实施时存在匹配检测分析精度低下的问题。
发明内容
为改善相关技术中存在的技术问题,本发明提供了一种基于人工智能的数据匹配检测处理方法及系统。
第一方面,本发明实施例提供了一种基于人工智能的数据匹配检测处理方法,应用于人工智能系统,所述方法包括:响应于数据处理指令,从云共享数据库中获得待进行检测分析的数字化业务交互数据;将所述数字化业务交互数据加载到通过噪声抑制方式调试所得的匹配检测决策算法,得到所述数字化业务交互数据中包含的业务主题匹配指示。
如此设计,通过噪声抑制方式调试所得的匹配检测决策算法,能够保障所确定的业务主题匹配指示的挖掘分析准确度和合理度,通过调试所得的匹配检测决策算法,对获得的数字化业务交互数据进行匹配检测决策分析,可以准确可靠地挖掘得到数字化业务交互数据中包含的业务主题匹配指示,从而可依据业务主题匹配指示对数字化业务交互数据进行针对性的分配处理,提高数字化业务交互数据的分配精度和可信度,并保障数字化业务交互数据的使用效率。
在一些可独立实施的实施例中,所述匹配检测决策算法的调试步骤为:获得第一在线业务互动数据和至少X组第二在线业务互动数据,所述第二在线业务互动数据与所述第一在线业务互动数据携带一致的数据匹配检测知识;通过匹配检测决策算法对所述第一在线业务互动数据进行服务要素挖掘处理,得到第一数据服务要素向量,并通过所述匹配检测决策算法的卷积处理单元,分别对每组所述第二在线业务互动数据进行服务要素挖掘处理,得到至少X个第二数据服务要素向量;依据所述第一数据服务要素向量和每个所述第二数据服务要素向量之间的第一特征共性值,确定第一算法代价指标,并依据所述第一数据服务要素向量与至少部分先验服务要素簇中的第三数据服务要素向量的第二特征共性值,确定第二算法代价指标;每个所述先验服务要素簇中包含的第三数据服务要素向量为在进行当前次调试之前,在剩余次调试中通过剩余第二在线业务互动数据所确定的;依据所述第一算法代价指标和所述第二算法代价指标,确定目标算法代价,并通过所述目标算法代价对所述匹配检测决策算法进行循环调试,直到符合调试结束要求,得到完成调试的匹配检测决策算法。
如此设计,通过从第一在线业务互动数据中挖掘的第一数据服务要素向量和从每组第二在线业务互动数据中挖掘的第二数据服务要素向量之间的第一特征共性值,确定第一算法代价指标,没有必要缓存和调取数据匹配检测知识对应的属性字段,便能够确定算法在估计携带一致数据匹配检测知识的在线业务互动数据时的算法代价,减少了算法调试时的算力负荷。鉴于第三数据服务要素向量为剩余次调试中通过剩余第二在线业务互动数据所确定的,所以第三数据服务要素向量相当于第一数据服务要素向量的扰动信息,而基于第一数据服务要素向量与至少部分先验服务要素簇中的第三数据服务要素向量的第二特征共性值,确定第二算法代价指标,再基于第二算法代价指标确定目标算法代价并通过目标算法代价对算法进行调试,可以实现对扰动信息的抑制,减少扰动信息对算法处理质量的负面影响,提高完成调试的匹配检测决策算法的匹配检测处理准确性和对扰动信息的抵抗性能。
在一些可独立实施的实施例中,所述第一在线业务互动数据和第二在线业务互动数据为数字化业务交互数据,所述匹配检测决策算法为深度学习网络。
如此设计,通过数字化业务交互数据对深度学习网络进行调试,不仅能够减少算法调试时的算力负荷,还可以提高完成调试的深度学习网络的业务主题匹配指示挖掘准确性和对业务主题匹配扰动的抵抗性能。
在一些可独立实施的实施例中,所述依据所述第一数据服务要素向量和每个所述第二数据服务要素向量之间的第一特征共性值,确定第一算法代价指标,包括:从所述至少X个所述第一特征共性值中,确定出第一目标特征共性值,并依据所述第一目标特征共性值和设定的参考值之间的第一比较结果,确定所述第一算法代价指标。
如此设计,由于第一在线业务互动数据和第二在线业务互动数据携带一致数据匹配检测知识,所以第一数据服务要素向量和第二数据服务要素向量之间的特征共性值越大,第二数据服务要素向量与数据匹配检测知识对应的属性字段越类似。通过选取至少X个第一特征共性值中的第一目标特征共性值,能够获得与数据匹配检测知识对应的属性字段最类似的第二数据服务要素向量和第一数据服务要素向量之间的特征共性值,通过该特征共性值确定第一算法代价指标,可以提高所确定的第一算法代价指标的精度。且通过设定的参考值对第一目标特征共性值进行处理,可以提高存在相异类型数据匹配检测知识的在线业务互动数据之间的显著差异性,通过处理后得到的第一比较结果确定第一算法代价指标,并通过基于第一算法代价指标所确定的目标算法代价对匹配检测决策算法进行调试,可以提高匹配检测决策算法在处理存在相异类型数据匹配检测知识的在线业务互动数据时,输出的数据服务要素向量的显著差异性。
在一些可独立实施的实施例中,所述依据所述第一数据服务要素向量与至少部分先验服务要素簇中的第三数据服务要素向量的第二特征共性值,确定第二算法代价指标,包括:对于每个先验服务要素簇,经由该先验服务要素簇中的每个所述第三数据服务要素向量与所述第一数据服务要素向量之间的第二特征共性值,确定该先验服务要素簇对应的第二目标特征共性值;结合每个所述先验服务要素簇的簇类别,从所述先验服务要素簇中确定出所述簇类别与所述第一在线业务互动数据的数据匹配检测知识不相同的目标先验服务要素簇;所述簇类别为用于挖掘所述先验服务要素簇中任一所述第三数据服务要素向量的剩余第二在线业务互动数据的数据匹配检测知识;结合每个所述目标先验服务要素簇分别对应的第二目标特征共性值,确定所述第二算法代价指标。
如此设计,通过各个先验服务要素簇的簇类别与第一在线业务互动数据的数据匹配检测知识,对先验服务要素簇进行确定,可以清洗簇类别与第一在线业务互动数据的数据匹配检测知识一致的先验服务要素簇,减少该先验服务要素簇对算法抵抗性能的负面干扰,此外,可以确定出簇类别与第一在线业务互动数据的数据匹配检测知识不相同的目标先验服务要素簇。通过每个目标先验服务要素簇分别对应的第二目标特征共性值,确定第二算法代价指标,再通过基于第二算法代价指标所确定的目标算法代价对匹配检测决策算法进行调试,可以提高匹配检测决策算法对在线业务互动数据扰动的抵抗性能。
在一些可独立实施的实施例中,在所述依据所述第一数据服务要素向量与至少部分先验服务要素簇中的第三数据服务要素向量的第二特征共性值,确定第二算法代价指标之前,还包括:利用所述第二数据服务要素向量的数目和设定拆解变量,将所述至少X个所述第二数据服务要素向量,迁移到多个当前服务要素簇中;在所述先验服务要素簇和所述当前服务要素簇的数目的和超过设定簇数目的基础上,确定所述数目的和与所述设定簇数目之间的第二比较结果;依据每个所述先验服务要素簇的数字签名的时序优先级,对每个所述先验服务要素簇进行整理,得到每个所述先验服务要素簇的队列编号;清洗队列编号不超过所述第二比较结果的各个所述先验服务要素簇。
如此设计,通过将至少X个个第二数据服务要素向量,迁移到多个当前服务要素簇中,可以实现对应于第一在线业务互动数据的数据匹配检测知识的第一数据服务要素向量、第二数据服务要素向量与对应于其他数据匹配检测知识的第三数据服务要素向量之间的分离。通过清洗队列编号不超过第二比较结果的各个先验服务要素簇,也即实现了对长时间记录的先验服务要素簇的清洗,确保了记录下来的各个服务要素簇中的数据服务要素向量的实时性。
在一些可独立实施的实施例中,在所述清洗队列编号不超过所述第二比较结果的各个所述先验服务要素簇之后,还包括:记录每个所述当前服务要素簇,其中,记录下来的每个所述当前服务要素簇作为后一次调试的先验服务要素簇。
如此设计,通过记录当前服务要素簇,可以实现对实时性最佳的服务要素簇的记录,为后一次循环调试提供时效性和可用性最佳的先验服务要素簇。
在一些可独立实施的实施例中,所述依据所述第一数据服务要素向量与至少部分先验服务要素簇中的第三数据服务要素向量的第二特征共性值,确定第二算法代价指标,包括:结合每个先验服务要素簇的簇类别,从所述先验服务要素簇中确定出所述簇类别与所述第一在线业务互动数据的数据匹配检测知识不相同的目标先验服务要素簇;对于每个目标先验服务要素簇,经由该目标先验服务要素簇中的每个所述第三数据服务要素向量与所述第一数据服务要素向量之间的第二特征共性值,确定该目标先验服务要素簇对应的第二目标特征共性值;结合每个所述目标先验服务要素簇分别对应的第二目标特征共性值,确定所述第二算法代价指标。
如此设计,先通过先验服务要素簇的簇类别和第一在线业务互动数据的数据匹配检测知识,从多个先验服务要素簇中确定出目标先验服务要素簇,再确定目标先验服务要素簇中的每个第三数据服务要素向量与第一数据服务要素向量之间的第二特征共性值,能够简化运算复杂度,提升处理效率。
在一些可独立实施的实施例中,所述结合每个所述目标先验服务要素簇分别对应的第二目标特征共性值,确定所述第二算法代价指标,包括:通过特征调整变量分别对每个所述第二目标特征共性值进行量化调整,结合每个量化调整后的第二目标特征共性值,确定所述第二算法代价指标。
如此设计,通过特征调整变量分别对每个第二目标特征共性值进行量化调整,可以提高特征共性值对应的量化区间,结合每个量化调整后的第二目标特征共性值进行第二算法代价指标的确定,能够保障所确定的第二算法代价指标的精度和可信度,以保证确定出的目标算法代价的精度和可信度。
在一些可独立实施的实施例中,所述依据所述第一算法代价指标和所述第二算法代价指标,确定目标算法代价,包括:确定所述第一算法代价指标和所述第二算法代价指标的代价指标加权结果,并基于第一算法代价指标与所述代价指标加权结果的设定运算结果,确定所述目标算法代价。
如此设计,可以得到准确、完整的目标算法代价。
在一些可独立实施的实施例中,在所述当前次调试为第一次调试的基础上,将所述第二算法代价指标初始化为设定指标值。
如此设计,可以在没有可用的先验服务要素簇的基础上,自适应提供第二算法代价指标用于目标算法代价的确定。
第二方面,本发明还提供了一种人工智能系统,包括处理器和存储器;所述处理器和所述存储器通信连接,所述处理器用于从所述存储器中读取计算机程序并执行,以实现上述的方法。
第三方面,本发明还提供了一种计算机可读存储介质,其上存储有程序,该程序被处理器执行时实现上述的方法。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并于说明书一起用于解释本发明的原理。
图1是本发明实施例提供的一种基于人工智能的数据匹配检测处理方法的流程示意图。
图2是本发明实施例提供的一种基于人工智能的数据匹配检测处理方法的应用环境的通信架构示意图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本发明相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本发明的一些方面相一致的装置和方法的例子。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。
本发明实施例所提供的方法实施例可以在人工智能系统、计算机设备或者类似的运算装置中执行。以运行在人工智能系统上为例,人工智能系统10可以包括一个或多个处理器102(处理器102可以包括但不限于微处理器MCU或可编程逻辑器件FPGA等的处理装置)和用于存储数据的存储器104,可选地,上述人工智能系统还可以包括用于通信功能的传输装置106。本领域普通技术人员可以理解,上述结构仅为示意,其并不对上述人工智能系统的结构造成限定。例如,人工智能系统10还可包括比上述所示更多或者更少的组件,或者具有与上述所示不同的配置。
存储器104可用于存储计算机程序,例如,应用软件的软件程序以及模块,如本发明实施例中的一种基于人工智能的数据匹配检测处理方法对应的计算机程序,处理器102通过运行存储在存储器104内的计算机程序,从而执行各种功能应用以及数据处理,即实现上述的方法。存储器104可包括高速随机存储器,还可包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器104可进一步包括相对于处理器102远程设置的存储器,这些远程存储器可以通过网络连接至人工智能系统10。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
传输装置106用于经由一个网络接收或者发送数据。上述的网络具体实例可包括人工智能系统10的通信供应商提供的无线网络。在一个实例中,传输装置106包括一个网络适配器(Network Interface Controller,简称为NIC),其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中,传输装置106可以为射频(Radio Frequency,简称为RF)模块,其用于通过无线方式与互联网进行通讯。
基于此,请参阅图1,图1是本发明实施例所提供的一种基于人工智能的数据匹配检测处理方法的流程示意图,该方法应用于人工智能系统,进一步可以包括步骤201和步骤202描述的技术方案。
步骤201、响应于数据处理指令,从云共享数据库中获得待进行检测分析的数字化业务交互数据。
在本发明实施例中,待进行检测分析的数字化业务交互数据可以为通过任一数据采集模块采集的包括目标业务服务事件的业务主题的在线业务互动数据。
步骤202、将数字化业务交互数据输入调试所得的匹配检测决策算法,得到数字化业务交互数据中包含的业务主题匹配指示。
这里,匹配检测决策算法可以为深度学习网络,业务主题匹配指示比如可包括目标业务主题分配策略。目标业务主题分配策略为数字化业务交互数据中包含的目标业务服务事件的数据分配规则。比如,业务主题匹配指示可以为:将数字化业务交互数据中的数据集合set1分配给异地业务办理事项caseA。
在实际应用过程中,可以将获得的数字化业务交互数据输入基于所述各实施例提供的调试方法调试所得的深度学习网络,并通过深度学习网络对输入的数字化业务交互数据进行业务主题匹配处理,输出数字化业务交互数据中包含的业务主题匹配指示。
如此,基于所述各实施例提供的调试方法调试所得的深度学习网络,能够确保业务主题匹配决策的准确性,通过完成调试的深度学习网络对获得的待进行检测分析的数字化业务交互数据进行业务主题匹配决策,可以准确可靠地挖掘得到数字化业务交互数据中包含的业务主题匹配指示。
可以理解的是,通过噪声抑制方式调试所得的匹配检测决策算法,能够保障所确定的业务主题匹配指示的挖掘分析准确度和合理度,通过调试所得的匹配检测决策算法,对获得的数字化业务交互数据进行匹配检测决策分析,可以准确可靠地挖掘得到数字化业务交互数据中包含的业务主题匹配指示,从而可依据业务主题匹配指示对数字化业务交互数据进行针对性的分配处理,提高数字化业务交互数据的分配精度和可信度,并保障数字化业务交互数据的使用效率。
在本发明实施例中,通过噪声抑制方式调试所得的匹配检测决策算法是本技术方案的关键,因此后续通过步骤101-步骤104以及相关的子步骤进行匹配检测决策算法调试的介绍。
步骤101、获得第一在线业务互动数据和至少X组第二在线业务互动数据。
其中,第二在线业务互动数据与第一在线业务互动数据携带一致的数据匹配检测知识。进一步地,第一在线业务互动数据、第二在线业务互动数据都可以是通过数据采集模块采集的在线业务互动数据,举例而言,第一在线业务互动数据和第二在线业务互动数据都可以是从已有的互动大数据中获得的在线业务互动数据。X比如可为3、6、9等。在线业务互动数据所涉及的业务领域包括电子商务、云办公、智能政企、区块链、元宇宙等,其对应的数据细节内容可以根据实际需求灵活确定,比如可以包括不同业务用户的会话行为信息、业务操作信息等。
此外,第一在线业务互动数据和第二在线业务互动数据携带一致的数据匹配检测知识(比如可以理解为先验的标签信息或者注释信息),相同数据匹配检测知识下可以包括多组在线业务互动数据。其中,数据匹配检测知识反映在线业务互动数据中包含的业务服务项目的种类。比如,在第一在线业务互动数据和第二在线业务互动数据都是数字化业务交互数据的基础上,第一在线业务互动数据的数据匹配检测知识、以及各个第二在线业务互动数据的数据匹配检测知识都是异地业务办理事项caseA。不同的数据匹配检测知识对应于不同的数据服务要素向量,比如,异地业务办理事项caseA对应于数据服务要素向量Vec1,异地业务办理事项caseB对应于数据服务要素向量Vec2。
在一些示例下,第一在线业务互动数据和第二在线业务互动数据都可以借助匹配检测决策算法进行处理,匹配检测决策算法在获得在线业务互动数据之后,可以对在线业务互动数据进行服务要素挖掘处理(比如特征提取、特征挖掘等),得到在线业务互动数据的数据服务要素向量(反映在线业务互动数据的不同服务项目的特征的信息)。
在一些示例下,第一在线业务互动数据和第二在线业务互动数据为数字化业务交互数据,匹配检测决策算法可以为深度学习网络(DNN)。进一步地,可以从没有权限限制的/可以共享的互动大数据中获得携带一致数据匹配检测知识的第一在线业务互动数据和至少X组第二在线业务互动数据,确保算法调试的样本信息的充足。
在所述内容的基础上,没有权限限制的/可以共享的互动大数据对应的在线业务互动数据可能扰动信息。比如,针对具有异地业务办理事项caseA标签的多组在线业务互动数据而言,多组在线业务互动数据中可能不仅包含异地业务办理事项caseA对应的在线业务互动数据,还存在包括异地业务办理事项caseB、异地业务办理事项caseC等对应的在线业务互动数据。这样一来,异地业务办理事项caseB、异地业务办理事项caseC对应的在线业务互动数据都是具有异地业务办理事项caseA标签的多组在线业务互动数据中的扰动信息。或者,异地业务办理事项caseB、异地业务办理事项caseC对应的在线业务互动数据也可以理解为异地业务办理事项caseA对应的在线业务互动数据的同型扰动。
又比如,互动大数据还可以包括具有事项标识labelB的多组在线业务互动数据,具有事项标识labelC的多组在线业务互动数据,但是具有事项标识labelB的多组在线业务互动数据和具有事项标识labelC的多组在线业务互动数据,可能实际都对应于相同事项标识,比如,都对应于事项标识labelB。基于此,在通过从具有事项标识labelB的多组在线业务互动数据筛选的第一在线业务互动数据和第二在线业务互动数据,对深度学习网络进行调试时,具有事项标识labelC的多组在线业务互动数据,将成为从具有事项标识labelB的多组在线业务互动数据筛选的第一在线业务互动数据和第二在线业务互动数据的扰动信息,可以理解为非同型扰动。
传统的算法调试思路,在通过互动大数据中的数字化业务交互数据,对深度学习网络进行调试时,不仅需记录和调用属性字段(比如不同业务服务事项的特征信息),还会被同型扰动和非同型扰动的所干扰,造成完成调试的深度学习网络对扰动的抵抗性能较差,难以保障网络运行质量。应用本发明实施例,一方面不必调取每个属性字段,另一方面可以规避同型扰动和非同型扰动的干扰,提高了完成调试的深度学习网络对扰动的抵抗性能和业务主题分析准确性。
对于步骤101而言,可以从已有的、带有扰动信息的互动大数据中,确定任一第一在线业务互动数据,并根据该第一在线业务互动数据的数据匹配检测知识,从所述互动大数据中采样至少X组具有该数据匹配检测知识的第二在线业务互动数据。比如,针对第一在线业务互动数据data1,可以采样4组与该第一在线业务互动数据data1携带一致数据匹配检测知识的第一在线业务互动数据data2。
可以理解的是,在每次对匹配检测决策算法进行循环调试的过程中,可以使用多组第一在线业务互动数据,同时针对每组第一在线业务互动数据,都能够采样至少X组与该第一在线业务互动数据携带一致数据匹配检测知识的第二在线业务互动数据。
步骤102、通过匹配检测决策算法对第一在线业务互动数据进行服务要素挖掘处理,得到第一数据服务要素向量,并通过匹配检测决策算法的卷积处理单元,分别对每组第二在线业务互动数据进行服务要素挖掘处理,得到至少X个第二数据服务要素向量。
在本发明实施例中,针对匹配检测决策算法的每轮循环调试过程,其中可以包括多个调试环节H,每个环节H都需要使用获得的第一在线业务互动数据和至少X组第二在线业务互动数据进行调试,每个环节H包括对匹配检测决策算法进行一轮前馈反馈及变量改进。鉴于每个环节H之后都会对匹配检测决策算法的算法配置变量进行改进,所以每个环节H之后从第二在线业务互动数据中挖掘的数据服务要素向量的变化较为明显。为了保证每个服务要素簇中的数据服务要素向量可以近似为同一个匹配检测决策算法挖掘的,可以对每个环节H前后的匹配检测决策算法的算法配置变量进行一个卷积的计算,基于卷积后得到的算法配置变量,确定匹配检测决策算法在该环节H对应的卷积处理单元,并通过卷积处理单元对第二在线业务互动数据进行服务要素挖掘处理,得到第二数据服务要素向量。其中,卷积处理单元可以理解为滑动平均算子。
所述匹配检测决策算法可以包括但不限于深度学习网络。
在实际应用过程中,在每轮循环调试过程中,针对每组第一在线业务互动数据,可以将该第一在线业务互动数据加载到当前次调试对应的深度学习网络,并通过深度学习网络对第一在线业务互动数据进行服务要素挖掘处理,得到该第一在线业务互动数据的第一数据服务要素向量。同时,针对该第一在线业务互动数据对应的每组第二在线业务互动数据,可以分别将每组第二在线业务互动数据加载到深度学习网络的卷积处理单元/卷积层中,通过卷积处理单元/卷积层分别对每组第二在线业务互动数据进行服务要素挖掘处理,得到每组第二在线业务互动数据分别对应的第二数据服务要素向量,从而可以得到至少X个第二数据服务要素向量。
步骤103、基于第一数据服务要素向量和每个第二数据服务要素向量之间的第一特征共性值,确定第一算法代价指标,并基于第一数据服务要素向量与至少部分先验服务要素簇中的第三数据服务要素向量的第二特征共性值,确定第二算法代价指标;每个先验服务要素簇中包含的第三数据服务要素向量为在进行当前次调试之前,在剩余次调试中通过剩余第二在线业务互动数据所确定的。
在本发明实施例中,第一特征共性值为第一数据服务要素向量和第二数据服务要素向量之间的特征共性值(比如可以理解为相似度)。在第二数据服务要素向量包括至少X个的基础上,第一特征共性值也将包括至少X个。第二特征共性值为第一数据服务要素向量和第三数据服务要素向量之间的特征共性值。
所述先验服务要素簇为在进行当前次调试之前,基于剩余次调试中得到的第三数据服务要素向量所确定的,以及基于在当前次调试的当前环节H之前,其他的各个环节H中挖掘的第二在线业务互动数据的第二数据服务要素向量所确定的。所述第三数据服务要素向量为通过剩余次调试过程中得到的卷积处理单元,对该轮调试所使用的第二在线业务互动数据进行服务要素挖掘处理后得到的数据服务要素向量。针对当前次调试从第二在线业务互动数据中提取出的第二数据服务要素向量,可以作为后一次调试中的第三数据服务要素向量。针对在当前次调试的当前环节H挖掘的各个第二数据服务要素向量,可以作为一个环节H对应的第三数据服务要素向量,和/或后一次调试中的第三数据服务要素向量。
进一步地,第一算法代价指标为基于第一特征共性值确定出的Loss function,第二算法代价指标为基于第二特征共性值所确定的Loss function。
可以理解的是,针对当前处理的第一在线业务互动数据和至少X组第二在线业务互动数据,可以计算挖掘的第一在线业务互动数据的第一数据服务要素向量,和挖掘的至少X个第二数据服务要素向量之间的第一特征共性值。举例而言,可以基于相关相似度计算公式(余弦相似度计算公式)确定第一数据服务要素向量和各个第二数据服务要素向量之间的第一特征共性值。之后,可以基于第一特征共性值,确定第一算法代价指标。比如,可以基于各个第一特征共性值的平均化结果,确定第一算法代价指标。
在一些示例下,针对第一次调试的情况,可能没有可用的先验服务要素簇,以用于确定第二算法代价指标。基于此,可以直接将第一次调试所需使用的第二算法代价指标初始化为设定指标值,比如0,从而可以在没有可用的先验服务要素簇的基础上,自适应提供第二算法代价指标用于目标算法代价的计算。
在一些示例下,可以依据以下步骤确定第一算法代价指标:从至少X个第一特征共性值中,确定出第一目标特征共性值,并基于第一目标特征共性值和设定的参考值之间的第一比较结果,确定第一算法代价指标。
其中,设定的参考值用于减少第一目标特征共性值,以扩展在不同次调试所确定的第一目标特征共性值之间的显著差异性/区分程度,从而提高存在相异类型数据匹配检测知识的在线业务互动数据之间的显著差异性。
举例而言,可以从至少X个第一特征共性值中确定出最大的第一特征共性值,即第一目标特征共性值,将第一目标特征共性值对应的第二数据服务要素向量作为估计得到的、第一数据服务要素向量的同型属性字段。这样,不必在先记录第一数据服务要素向量对应的数据服务要素向量,通过估计得到的同型属性字段进行后续算法代价指标的确定,避免了不必要的算力浪费,还可以准确可靠地确定出算法代价。
在所述内容的基础上,可以确定第一目标特征共性值和设定的参考值之间的第一比较结果(差值),并经由该第一比较结果确定第一算法代价指标。比如,可以对第一比较结果执行幂操作从而确定出第一算法代价指标。
在一些示例下,在基于第一数据服务要素向量与至少部分先验服务要素簇中的第三数据服务要素向量的第二特征共性值,确定第二算法代价指标之前,还可以将当前环节H挖掘的各个第二数据服务要素向量进行聚类,得到当前服务要素簇。举例而言,可以依据以下内容实现。
1)、根据第二数据服务要素向量的数目和设定拆解变量,将至少X个第二数据服务要素向量,迁移到多个当前服务要素簇中。
当前服务要素簇可以理解为在当前次调试中的当前环节H中,基于各个第二数据服务要素向量所确定的服务要素簇。设定拆解变量可以为预先设定的每个服务要素簇中需要包含的第二数据服务要素向量的数目,设定拆解变量(设定分组值或者设定聚类数)小于第二在线业务互动数据的数目。设定拆解变量可以灵活设置。比如,在第二在线业务互动数据包括4个在线业务互动数据的基础上,设定拆解变量可以为2;在第二在线业务互动数据包括6个在线业务互动数据的基础上,设定拆解变量可以为2、4等。
在实际应用过程中,可以通过设定拆解变量,将挖掘的各个第二数据服务要素向量,迁移到(划分至)多个当前服务要素簇中。并且,每个当前服务要素簇的簇类别可以为第二在线业务互动数据的数据匹配检测知识。
2)、在先验服务要素簇和当前服务要素簇的数目的和超过设定簇数目的基础上,确定数目的和与设定簇数目之间的第二比较结果。
设定簇数目可以为记录的服务要素簇的最大数目,设定簇数目可以灵活设置。
在实际应用过程中,在得到各个当前服务要素簇之后,可以将各个当前服务要素簇记录到服务要素簇序列中,其中,服务要素簇序列的存储空间大小为设定簇数目。在将各个当前服务要素簇记录到服务要素簇序列之前,还可以判断服务要素簇序列是否具有足够的存储空间,记录每个当前服务要素簇。
举例而言,可以确定已记录的先验服务要素簇的数目和当前服务要素簇的数目的和,是否超过设定簇数目,如果否,则表明服务要素簇序列可以记录所有的当前服务要素簇,则直接将每个当前服务要素簇记录到服务要素簇序列。之后,新记录到服务要素簇序列的各个当前服务要素簇,可以作为先验服务要素簇,新记录到服务要素簇序列的各个当前服务要素簇中的各个第二数据服务要素向量,可以作为第三数据服务要素向量。如果是,则表明服务要素簇序列无法将所有的当前服务要素簇记录,则需要进一步确定数目的和与设定簇数目之间的第二比较结果。
3)、依据每个先验服务要素簇的数字签名的时序优先级,对每个先验服务要素簇进行整理,得到每个先验服务要素簇的队列编号。
每个先验服务要素簇在生成时,可以记录其数字签名。然后,可以依据服务要素簇序列中包含的每个先验服务要素簇的数字签名的时序优先级,对每个先验服务要素簇进行整理,得到每个先验服务要素簇的队列编号。其中,数字签名(生成时刻)越早的先验服务要素簇,其队列编号越小。
4)、清洗队列编号不超过第二比较结果的各个先验服务要素簇。
可以将服务要素簇序列中包含的各个先验服务要素簇中,队列编号不超过第二比较结果的各个先验服务要素簇清洗,以保证服务要素簇序列能够用于记录各个当前服务要素簇。
在实际应用过程中,在成功清洗队列编号不超过第二比较结果的各个先验服务要素簇之后,可以记录每个当前服务要素簇。其中,记录下来的每个当前服务要素簇作为后一次调试的先验服务要素簇。举例而言,可以将每个当前服务要素簇记录到服务要素簇序列中,作为先验服务要素簇,用于后一次循环调试,或用于下一环节H的调试。
可理解的,所述记录每个当前服务要素簇的时刻可以为清洗队列编号不超过第二比较结果的各个先验服务要素簇之后,且在确定第二算法代价指标之前的任意时刻,也可以在确定第二算法代价指标之后。
针对所述步骤103,在得到第一数据服务要素向量和第二数据服务要素向量之后,还可以确定第一数据服务要素向量与至少部分先验服务要素簇中的各个第三数据服务要素向量的第二特征共性值,并基于第二特征共性值,确定第二算法代价指标。
在实际应用过程中,在将各个当前服务要素簇添加到服务要素簇序列中之后,针对服务要素簇序列中的每个先验服务要素簇,可以分别确定第一数据服务要素向量和该先验服务要素簇中的每个第三数据服务要素向量之间的第二特征共性值。或者,在将各个当前服务要素簇添加到服务要素簇序列中之后,可以不考虑新添加到该服务要素簇序列中的各个当前服务要素簇,针对除新添加到该服务要素簇序列中的各个当前服务要素簇之外的、每个先验服务要素簇,可以分别确定第一数据服务要素向量和该先验服务要素簇中的每个第三数据服务要素向量之间的第二特征共性值。
举例而言,可以依据余弦相似度算法对第一数据服务要素向量,和各个先验服务要素簇中的第三数据服务要素向量进行运算,得到第一数据服务要素向量和各个第三数据服务要素向量的特征共性值。之后,可以通过各个第二特征共性值,确定出第二算法代价指标。比如,可以基于各个第二特征共性值的平均化结果,确定第二算法代价指标。
在一些示例下,针对步骤103中确定第二算法代价指标的步骤,包括但不限于如下相关的技术方案。
步骤103-1、对于每个先验服务要素簇,经由该先验服务要素簇中的每个第三数据服务要素向量与第一数据服务要素向量之间的第二特征共性值,确定该先验服务要素簇对应的第二目标特征共性值。
第二目标特征共性值可以理解为第一数据服务要素向量与先验服务要素簇中各个第三数据服务要素向量之间的特征共性值中的第二目标特征共性值。这里,可以将每个第二目标特征共性值对应的第三数据服务要素向量作为估计得到的、第一数据服务要素向量的非同型属性字段。
在实际应用过程中,对于每个先验服务要素簇,在确定出该先验服务要素簇中的每个第三数据服务要素向量与第一数据服务要素向量之间的第二特征共性值之后,可以从多个第二特征共性值中确定出该先验服务要素簇对应的第二目标特征共性值。进一步地,可以确定出每个先验服务要素簇对应的第二目标特征共性值,也即可以从每个先验服务要素簇中,确定出估计得到的、第一数据服务要素向量的非同型属性字段。其中,先验服务要素簇可以理解为历史的特征集或者特征组。
步骤103-2、结合每个先验服务要素簇的簇类别,从先验服务要素簇中确定出簇类别与第一在线业务互动数据的数据匹配检测知识不相同的目标先验服务要素簇;簇类别为用于挖掘先验服务要素簇中任一第三数据服务要素向量的剩余第二在线业务互动数据的数据匹配检测知识。
簇类别可以理解为用于挖掘先验服务要素簇中的各个第三数据服务要素向量的剩余第二在线业务互动数据的数据匹配检测知识。由于各个第三数据服务要素向量对应的剩余第二在线业务互动数据的数据匹配检测知识一致,所以每个先验服务要素簇对应于一个簇类别。
在实际应用过程中,可以根据每个先验服务要素簇的簇类别,从多个先验服务要素簇中确定出簇类别与第一在线业务互动数据的数据匹配检测知识不相同的目标先验服务要素簇。如此,可以清洗簇类别与第一在线业务互动数据的数据匹配检测知识一致的先验服务要素簇,削弱该先验服务要素簇对算法抵抗性能的干扰。
在确定第二特征共性值过程中确定了每个当前服务要素簇中的第二数据服务要素向量和第一数据服务要素向量之间的特征共性值,由于每个当前服务要素簇的簇类别与第一在线业务互动数据的数据匹配检测知识一致,每个当前服务要素簇也将被清洗,不会用作估计的非同型属性字段。
步骤103-3、结合每个目标先验服务要素簇分别对应的第二目标特征共性值,确定第二算法代价指标。
可以将确定出的各个第二目标特征共性值对应的第三数据服务要素向量,作为第一数据服务要素向量对应的非同型属性字段。进而,可以通过每个非同型属性字段对应的第二目标特征共性值,确定第二算法代价指标。示例性的,对第二目标特征共性值执行幂操作以确定出第二算法代价指标。
如此,基于服务要素簇(特征向量组)的设置,可以完成估计得到的同型属性字段和非同型属性字段之间的动态调整,实现对估计得到的同型属性字段和非同型属性字段之间的分离/解耦,有效降低了同型扰动和非同型扰动的干扰,提高了调试所得的匹配检测决策算法的性能。且通过估计得到的同型属性字段和非同型属性字段之间的动态调整进行目标算法代价的确定,并通过目标算法代价进行调试,既可以降低调试过程的算力开销,还可以对对扰动的抵抗性能。
在一些可独立实施的实施例中,如果可供当前次调试使用的各个先验服务要素簇的簇类别都与第一在线业务互动数据的数据匹配检测知识相同,将无法确定出当前次调试对应的目标先验服务要素簇,从而也无法实施步骤103-3,得不到第二算法代价指标。在这种情况下,为了保障在当前次调试能够确定出目标算法代价,可以直接将当前次调试对应的第二算法代价指标,调整为设定指标值。
在另一些示例下,针对步骤103中确定第二算法代价指标的步骤,还可以依据以下技术方案实现。
步骤1、结合每个先验服务要素簇的簇类别,从先验服务要素簇中确定出簇类别与第一在线业务互动数据的数据匹配检测知识不相同的目标先验服务要素簇。
在本发明实施例中,可以先不进行第二特征共性值的确定,而是先确定目标先验服务要素簇。举例而言,在得到各个第二数据服务要素向量之后,或者在将各个当前服务要素簇添加到服务要素簇序列中之后,可以基于服务要素簇序列中的每个先验服务要素簇的簇类别和第一在线业务互动数据的数据匹配检测知识,从多个先验服务要素簇中确定出簇类别与第一在线业务互动数据的数据匹配检测知识不相同的目标先验服务要素簇。
步骤2、对于每个目标先验服务要素簇,经由该目标先验服务要素簇中的每个第三数据服务要素向量与第一数据服务要素向量之间的第二特征共性值,确定该目标先验服务要素簇对应的第二目标特征共性值。
在实际应用过程中,在确定出各个目标先验服务要素簇之后,对于每个目标先验服务要素簇,可以确定出每个目标先验服务要素簇中的每个第三数据服务要素向量分别与第一数据服务要素向量之间的第二特征共性值然后,可以基于第二特征共性值,确定各个目标先验服务要素簇对应的第二目标特征共性值。
步骤3、结合每个目标先验服务要素簇分别对应的第二目标特征共性值,确定第二算法代价指标。
其中,第一目标特征共性值为最大特征共性值,第二目标特征共性值为最小特征共性值。
在实施步骤1时,若可供当前次调试使用的各个先验服务要素簇的簇类别均与第一在线业务互动数据的数据匹配检测知识相同,无法确定出目标先验服务要素簇,则可以不执行下述步骤2和步骤3,直接将当前次调试对应的第二算法代价指标,调整为所述设定指标值。
在一些示例下,针对所述步骤103-3或所述步骤3,可以依据以下步骤实施:通过特征调整变量分别对每个第二目标特征共性值进行量化调整,结合每个量化调整后的第二目标特征共性值,确定第二算法代价指标。
这里,特征调整变量为设定的参数,用于对第二目标特征共性值进行量化区间(数值范围)的扩增。可以将每个第二目标特征共性值分别和特征调整变量作乘,得到每个量化调整后的第二目标特征共性值,之后对量化调整后的第二目标特征共性值执行幂操作,并结合基于对各个量化调整后的第二目标特征共性值执行幂操作后,确定出第二算法代价指标。
如此设计,通过特征调整变量分别对每个第二目标特征共性值进行量化调整,可以提高特征共性值对应的量化区间,结合每个量化调整后的第二目标特征共性值进行第二算法代价指标的确定,能够保障所确定的第二算法代价指标的精度和可信度,以保证确定出的目标算法代价的精度和可信度。
步骤104、基于第一算法代价指标和第二算法代价指标,确定目标算法代价,并通过目标算法代价对匹配检测决策算法进行循环调试,直到符合调试结束要求,得到完成调试的匹配检测决策算法。
在本发明实施例中,调试结束要求可以为循环调试的次数达到目标次数,和/或,调试所得的匹配检测决策算法的决策分析准确性达到设定准确性。
在实际应用过程中,可以通过第一算法代价指标和第二算法代价指标,计算出匹配检测决策算法在预测数据服务要素向量时的目标算法代价,并目标算法代价对匹配检测决策算法进行循环调试,直到符合调试结束要求,得到完成调试的匹配检测决策算法。
如此,可以在基于扰动信息占比较多的样本进行调试,并得到性质量较佳的匹配检测决策算法。
在一些示例下,针对步骤104,可以依据以下步骤实施:确定第一算法代价指标和第二算法代价指标的代价指标加权结果,并基于第一算法代价指标与代价指标加权结果的设定运算结果,确定目标算法代价。
在实际应用过程中,将第一算法代价指标和第二算法代价指标进行加权便能够得到目标算法代价。
通过所述步骤101-步骤104,通过从第一在线业务互动数据中挖掘的第一数据服务要素向量和从每个第二在线业务互动数据中挖掘的第二数据服务要素向量之间的第一特征共性值,确定第一算法代价指标,没有必要缓存和调取数据匹配检测知识对应的属性字段,便能够确定算法在估计携带一致数据匹配检测知识的在线业务互动数据时的算法代价,减少了算法调试时的算力负荷。由于第三数据服务要素向量为剩余次调试中通过剩余第二在线业务互动数据所确定的,所以第三数据服务要素向量相当于第一数据服务要素向量的扰动信息,而基于第一数据服务要素向量与至少部分先验服务要素簇中的第三数据服务要素向量的第二特征共性值,确定第二算法代价指标,再基于第二算法代价指标确定目标算法代价并通过目标算法代价对算法进行调试,可以实现对扰动信息的抑制,减少扰动信息对算法处理质量的负面影响,提高完成调试的匹配检测决策算法的匹配检测处理准确性和对扰动信息的抵抗性能。
在一些可独立的实施例中,在将所述数字化业务交互数据加载到通过噪声抑制方式调试所得的匹配检测决策算法,得到所述数字化业务交互数据中包含的业务主题匹配指示之后,该方法还可以包括如下内容:基于所述业务主题匹配指示将数字化业务交互数据中的目标数据集分配给目标业务用户端;通过所述目标业务用户端上传的数据使用反馈对所述业务主题匹配指示进行更新。
其中,可以根据业务主题匹配指示从数字化业务交互数据中提取目标数据集,然后将目标数据集下发给业务主题匹配指示对应的目标业务用户端,这样,目标业务用户端可以利用目标数据集进行相关的业务处理,并将数据使用反馈上传给人工智能系统,以供人工智能系统进行分析挖掘,从而实现对业务主题匹配指示的二次更新,提高后续的数据匹配检测和分配合理性。
在一些可独立的实施例中,通过所述目标业务用户端上传的数据使用反馈对所述业务主题匹配指示进行更新,可以通过如下技术方案实现:将所述数据使用反馈传输至自然语言处理模型中的文本挖掘层,得到所述文本挖掘层输出的所述数据使用反馈的第一反馈文本向量和第二反馈文本向量,其中,所述文本挖掘层包括互相连接的多个文本向量挖掘核,所述第一反馈文本向量是所述互相连接的多个文本向量挖掘核中的非末端的文本向量挖掘核输出的反馈文本向量,所述第二反馈文本向量是所述互相连接的多个文本向量挖掘核中的末端的文本向量挖掘核输出的反馈文本向量;将所述第二反馈文本向量传输至所述自然语言处理模型中的反馈需求识别层,得到所述反馈需求识别层输出的目标回归分析窗口(检测区域),其中,所述目标回归分析窗口为在所述数据使用反馈中识别到的目标数据分配需求所对应的回归分析窗口;将所述第一反馈文本向量、所述第二反馈文本向量和第三反馈文本向量以及所述目标回归分析窗口传输至所述自然语言处理模型中的反馈需求挖掘层,得到所述反馈需求挖掘层输出的所述目标数据分配需求的需求主题以及所述目标数据分配需求的需求信息在所述数据使用反馈中的分布特征,其中,所述第三反馈文本向量是所述反馈需求识别层中的文本向量挖掘核根据辅助向量输出的反馈文本向量,所述辅助向量是对所述第二反馈文本向量进行调整得到的文本向量;基于所述需求主题以及所述分布特征,对所述业务主题匹配指示进行更新处理。
如此一来,可以通过由浅入深的需求挖掘识别方式确定出所述目标数据分配需求的需求主题以及所述目标数据分配需求的需求信息在所述数据使用反馈中的分布特征,从而针对性且合理地对业务主题匹配指示进行更新处理,从而保障更新处理之后的业务主题匹配指示在后续使用时能够满足相关的数据分配和使用需求。
基于上述相同或相似的发明构思,请结合参阅图2,还提供了一种基于人工智能的数据匹配检测处理方法的应用环境30的架构示意图,包括互相之间通信的人工智能系统10和目标业务用户端20,人工智能系统10和目标业务用户端20在运行时实现或者部分实现上述方法实施例所描述的技术方案。
进一步地,还提供了一种计算机可读存储介质,其上存储有程序,该程序被处理器执行时实现上述的方法。
在本发明实施例所提供的几个实施例中,应该理解到,所揭露的装置和方法,也可以通过其它的方式实现。以上所描述的装置和方法实施例仅仅是示意性的,例如,附图中的流程图和框图显示了根据本发明的多个实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现方式中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
另外,在本发明各个实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。
所述功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机、或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (5)
1.一种基于人工智能的数据匹配检测处理方法,其特征在于,应用于所述人工智能系统,所述方法包括:
响应于数据处理指令,从云共享数据库中获得待进行检测分析的数字化业务交互数据;
将所述数字化业务交互数据加载到通过噪声抑制方式调试所得的匹配检测决策算法,得到所述数字化业务交互数据中包含的业务主题匹配指示;
其中,所述匹配检测决策算法的调试步骤为:
获得第一在线业务互动数据和至少X组第二在线业务互动数据,所述第二在线业务互动数据与所述第一在线业务互动数据携带一致的数据匹配检测知识;
通过匹配检测决策算法对所述第一在线业务互动数据进行服务要素挖掘处理,得到第一数据服务要素向量,并通过所述匹配检测决策算法的卷积处理单元,分别对每组所述第二在线业务互动数据进行服务要素挖掘处理,得到至少X个第二数据服务要素向量;
依据所述第一数据服务要素向量和每个所述第二数据服务要素向量之间的第一特征共性值,确定第一算法代价指标,并依据所述第一数据服务要素向量与至少部分先验服务要素簇中的第三数据服务要素向量的第二特征共性值,确定第二算法代价指标;其中,每个所述先验服务要素簇中包含的第三数据服务要素向量为在进行当前次调试之前,在剩余次调试中通过剩余第二在线业务互动数据所确定的;
依据所述第一算法代价指标和所述第二算法代价指标,确定目标算法代价,并通过所述目标算法代价对所述匹配检测决策算法进行循环调试,直到符合调试结束要求,得到完成调试的匹配检测决策算法;
其中,所述第一在线业务互动数据和第二在线业务互动数据为数字化业务交互数据,所述匹配检测决策算法为深度学习网络;
其中,所述依据所述第一数据服务要素向量和每个所述第二数据服务要素向量之间的第一特征共性值,确定第一算法代价指标,包括:从所述至少X个所述第一特征共性值中,确定出第一目标特征共性值,并依据所述第一目标特征共性值和设定的参考值之间的第一比较结果,确定所述第一算法代价指标;
其中,所述依据所述第一数据服务要素向量与至少部分先验服务要素簇中的第三数据服务要素向量的第二特征共性值,确定第二算法代价指标,包括:对于每个先验服务要素簇,经由该先验服务要素簇中的每个所述第三数据服务要素向量与所述第一数据服务要素向量之间的第二特征共性值,确定该先验服务要素簇对应的第二目标特征共性值;结合每个所述先验服务要素簇的簇类别,从所述先验服务要素簇中确定出所述簇类别与所述第一在线业务互动数据的数据匹配检测知识不相同的目标先验服务要素簇;其中,所述簇类别为用于挖掘所述先验服务要素簇中任一所述第三数据服务要素向量的剩余第二在线业务互动数据的数据匹配检测知识;结合每个所述目标先验服务要素簇分别对应的第二目标特征共性值,确定所述第二算法代价指标;
其中,所述结合每个所述目标先验服务要素簇分别对应的第二目标特征共性值,确定所述第二算法代价指标,包括:通过特征调整变量分别对每个所述第二目标特征共性值进行量化调整,结合每个量化调整后的第二目标特征共性值,确定所述第二算法代价指标;
其中,在所述依据所述第一数据服务要素向量与至少部分先验服务要素簇中的第三数据服务要素向量的第二特征共性值,确定第二算法代价指标之前,还包括:利用所述第二数据服务要素向量的数目和设定拆解变量,将所述至少X个所述第二数据服务要素向量,迁移到多个当前服务要素簇中;在所述先验服务要素簇和所述当前服务要素簇的数目的和超过设定簇数目的基础上,确定所述数目的和与所述设定簇数目之间的第二比较结果;依据每个所述先验服务要素簇的数字签名的时序优先级,对每个所述先验服务要素簇进行整理,得到每个所述先验服务要素簇的队列编号;清洗队列编号不超过所述第二比较结果的各个所述先验服务要素簇;
其中,在所述清洗队列编号不超过所述第二比较结果的各个所述先验服务要素簇之后,还包括:记录每个所述当前服务要素簇,其中,记录下来的每个所述当前服务要素簇作为后一次调试的先验服务要素簇;
其中,所述依据所述第一数据服务要素向量与至少部分先验服务要素簇中的第三数据服务要素向量的第二特征共性值,确定第二算法代价指标,包括:
结合每个先验服务要素簇的簇类别,从所述先验服务要素簇中确定出所述簇类别与所述第一在线业务互动数据的数据匹配检测知识不相同的目标先验服务要素簇;
对于每个目标先验服务要素簇,经由该目标先验服务要素簇中的每个所述第三数据服务要素向量与所述第一数据服务要素向量之间的第二特征共性值,确定该目标先验服务要素簇对应的第二目标特征共性值;
结合每个所述目标先验服务要素簇分别对应的第二目标特征共性值,确定所述第二算法代价指标。
2.根据权利要求1所述的方法,其特征在于,所述依据所述第一算法代价指标和所述第二算法代价指标,确定目标算法代价,包括:确定所述第一算法代价指标和所述第二算法代价指标的代价指标加权结果,并基于第一算法代价指标与所述代价指标加权结果的设定运算结果,确定所述目标算法代价。
3.根据权利要求1所述的方法,其特征在于,所述方法还包括:在所述当前次调试为第一次调试的基础上,将所述第二算法代价指标初始化为设定指标值。
4.一种人工智能系统,其特征在于,包括处理器和存储器;所述处理器和所述存储器通信连接,所述处理器用于从所述存储器中读取计算机程序并执行,以实现权利要求1-3任一项所述的方法。
5.一种计算机可读存储介质,其特征在于,其上存储有程序,该程序被处理器执行时实现权利要求1-3任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211528286.1A CN115712843B (zh) | 2022-12-01 | 2022-12-01 | 基于人工智能的数据匹配检测处理方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211528286.1A CN115712843B (zh) | 2022-12-01 | 2022-12-01 | 基于人工智能的数据匹配检测处理方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115712843A CN115712843A (zh) | 2023-02-24 |
CN115712843B true CN115712843B (zh) | 2023-10-27 |
Family
ID=85235841
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211528286.1A Active CN115712843B (zh) | 2022-12-01 | 2022-12-01 | 基于人工智能的数据匹配检测处理方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115712843B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116304111B (zh) * | 2023-04-10 | 2024-02-20 | 深圳市兴海物联科技有限公司 | 基于可视化业务数据的ai调用优化处理方法及服务器 |
CN118195157B (zh) * | 2024-03-29 | 2024-08-16 | 北京岳能科技股份有限公司 | 基于集成风光储能的多元数据管理方法及系统 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111415263A (zh) * | 2020-04-07 | 2020-07-14 | 中国建设银行股份有限公司 | 数据匹配方法和装置 |
CN112541174A (zh) * | 2020-12-15 | 2021-03-23 | 平安科技(深圳)有限公司 | 业务数据核验方法、装置、设备及存储介质 |
CN113918621A (zh) * | 2021-10-19 | 2022-01-11 | 广州宏辉信息技术有限公司 | 一种基于互联网金融的大数据防护处理方法及服务器 |
CN114299295A (zh) * | 2021-12-01 | 2022-04-08 | 腾讯科技(深圳)有限公司 | 一种数据处理方法及相关装置 |
CN115374186A (zh) * | 2022-09-29 | 2022-11-22 | 李烜宇 | 基于大数据的数据处理方法及ai系统 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6907436B2 (en) * | 2000-10-27 | 2005-06-14 | Arizona Board Of Regents, Acting For And On Behalf Of Arizona State University | Method for classifying data using clustering and classification algorithm supervised |
-
2022
- 2022-12-01 CN CN202211528286.1A patent/CN115712843B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111415263A (zh) * | 2020-04-07 | 2020-07-14 | 中国建设银行股份有限公司 | 数据匹配方法和装置 |
CN112541174A (zh) * | 2020-12-15 | 2021-03-23 | 平安科技(深圳)有限公司 | 业务数据核验方法、装置、设备及存储介质 |
CN113918621A (zh) * | 2021-10-19 | 2022-01-11 | 广州宏辉信息技术有限公司 | 一种基于互联网金融的大数据防护处理方法及服务器 |
CN114299295A (zh) * | 2021-12-01 | 2022-04-08 | 腾讯科技(深圳)有限公司 | 一种数据处理方法及相关装置 |
CN115374186A (zh) * | 2022-09-29 | 2022-11-22 | 李烜宇 | 基于大数据的数据处理方法及ai系统 |
Non-Patent Citations (2)
Title |
---|
Detecting and investigating crime by means of data mining a general crime matching framework;MohammadReza Keyvanpour et al;《Procedia Computer Science》;第3卷;872-880 * |
数据包过滤规则的快速匹配算法和冲突检测;田大新等;《计算机研究与发展》;第42卷(第7期);1128-1135 * |
Also Published As
Publication number | Publication date |
---|---|
CN115712843A (zh) | 2023-02-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN115712843B (zh) | 基于人工智能的数据匹配检测处理方法及系统 | |
CN106294614B (zh) | 用于访问业务的方法和装置 | |
CN107229662B (zh) | 数据清洗方法和装置 | |
CN109145101B (zh) | 人机对话方法、装置和计算机可读存储介质 | |
US20090182794A1 (en) | Error management apparatus | |
CN110806954A (zh) | 评估云主机资源的方法、装置、设备及存储介质 | |
US10896226B2 (en) | Data analysis system, data analysis method, and data analysis program | |
CN111860667A (zh) | 设备故障的确定方法及装置、存储介质、电子装置 | |
US8644468B2 (en) | Carrying out predictive analysis relating to nodes of a communication network | |
CN113626241B (zh) | 应用程序的异常处理方法、装置、设备及存储介质 | |
CN111931809A (zh) | 数据的处理方法、装置、存储介质及电子设备 | |
CN115374186B (zh) | 基于大数据的数据处理方法及ai系统 | |
CN111970400A (zh) | 骚扰电话识别方法及装置 | |
CN115757745A (zh) | 基于人工智能的业务场景控制方法、系统及云平台 | |
CN114492601A (zh) | 资源分类模型的训练方法、装置、电子设备及存储介质 | |
CN115471108A (zh) | 数据分析决策方法、系统及大数据资源中心 | |
CN114647790A (zh) | 应用于行为意图分析的大数据挖掘方法及云端ai服务系统 | |
CN107871055A (zh) | 一种数据分析方法和装置 | |
CN109902196B (zh) | 一种商标类别推荐方法、装置、计算机设备及存储介质 | |
CN115329205B (zh) | 服务于个性化推送服务的大数据挖掘方法及ai推荐系统 | |
CN115563069B (zh) | 基于人工智能的数据共享处理方法、系统及云平台 | |
CN114203304B (zh) | 基于智慧医疗大数据的信息推送方法及智慧医疗云服务器 | |
CN115757935A (zh) | 应用计算机智能的大数据推送方法及系统 | |
CN115905702A (zh) | 基于用户需求分析的数据推荐方法及系统 | |
CN111193631A (zh) | 信息处理方法、系统和计算机可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
TA01 | Transfer of patent application right | ||
TA01 | Transfer of patent application right |
Effective date of registration: 20231007 Address after: 9th Floor, Building 3, Zone 6, No. 188 South Fourth Ring West Road, Fengtai District, Beijing, 100070 Applicant after: Beijing Guolian video information technology Co.,Ltd. Address before: 261000 No. 5369, Beigong East Street, Beihai Road Street, Kuiwen District, Weifang City, Shandong Province Applicant before: Weifang Mipai Information Technology Co.,Ltd. |
|
GR01 | Patent grant | ||
GR01 | Patent grant |