CN109165119B - 一种电子商务数据处理方法和系统 - Google Patents

一种电子商务数据处理方法和系统 Download PDF

Info

Publication number
CN109165119B
CN109165119B CN201810889530.4A CN201810889530A CN109165119B CN 109165119 B CN109165119 B CN 109165119B CN 201810889530 A CN201810889530 A CN 201810889530A CN 109165119 B CN109165119 B CN 109165119B
Authority
CN
China
Prior art keywords
data
record
processing
similarity value
sets
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810889530.4A
Other languages
English (en)
Other versions
CN109165119A (zh
Inventor
左梅兰
郭子森
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou golden litchi Technology Co.,Ltd.
Original Assignee
Hangzhou Golden Litchi Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Golden Litchi Technology Co ltd filed Critical Hangzhou Golden Litchi Technology Co ltd
Priority to CN201810889530.4A priority Critical patent/CN109165119B/zh
Publication of CN109165119A publication Critical patent/CN109165119A/zh
Application granted granted Critical
Publication of CN109165119B publication Critical patent/CN109165119B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1446Point-in-time backing up or restoration of persistent data
    • G06F11/1458Management of the backup or restore process
    • G06F11/1464Management of the backup or restore process for networked environments

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种电子商务数据处理方法和系统,通过将电子商务中大量数据根据数据集属性的不同合并成多个数据集,并且对数据预先进行预处理,降低数据维度,建立多条处理线程,合理计算参考数据与其他数据之间的数据相似度值,从而确定数据集中的每个数据是否具有较好的关联度,最终确定是否保留该数据。该方法大大减小算法的时间复杂度,提高资源对象的创建和处理,缩短数据总量的处理时间,减小数据处理的误差。

Description

一种电子商务数据处理方法和系统
技术领域
本发明涉及计算机数据处理技术领域,特别涉及一种电子商务数据处理方法和系统。
背景技术
近年来,电子商务蓬勃发展,人们越来越多地使用网络远程购物。在良好的互联网环境下,电子商务发展迅猛,越来越多的零售企业选择电子商务来发展自身业务。电子商务作为一种虚拟的交易方式,在为广大消费者提供便捷的同时,需要很多社会服务环节的配合,它不仅代表一种新的消费体验,也代表了一种零售及其配套服务发展的新业态。与此同时,电子商务平台与信息化息息相关,平台所产生的数据源源不断,数据量呈几何倍数的增长,这些数据可以经由大数据分析后提供给用户更方便快捷的体验。
但是,其中一些数据未进行筛选过滤或者未进行优化处理,保存在数据库表中的数据往往有数据缺失、信息冗余和数据错误等质量问题,这些将直接影响数据分析结果的准确性,极大地降低了平台数据的可用性。而传统的数据整理方法只是针对小规模的数据进行整理,在处理大数据集时,往往具有较低的性能、运算能力不理想、处理时间较长,因此亟待提出针对大数据的处理方法。
发明内容
本发明实施例提供了一种电子商务数据处理方法和系统,将数据库表中的数据进行优化处理,从而解决了现有数据优化处理较低的性能、运算能力不理想、处理时间较长等问题。
为了解决上述问题,本发明公开了如下技术方案:
第一方面,提供一种电子商务数据处理方法,包括:
从数据库中读取数据表,并对所述数据表进行备份存档,复制所述数据到内存中,并将所述数据合并形成多个数据集,其中每个所述数据集中的第一条记录为所述数据集的参考数据;
对所述多个数据集中的数据进行预处理,降低数据的维度,删除冗余或者关联性不大的属性;
在处理器单元内建立多线程,每条所述线程对应一个所述数据集的处理进程,所述多线程同时进行数据处理任务;
建立一个长度为D的窗口,对所述数据集的数据逐条遍历执行字符串匹配运算,将窗口第一条记录与后面的D-1条记录进行比较,对字符串从左侧进行正向最大匹配;
计算所述参考数据与所述数据集中其他数据的数据相似度值,将得到的数据相似度值Q与预设的参考数据相似度值进行比较,得到比较结果;
根据所述比较结果确定所述其他数据是否保留。
第二方面,提供一种电子商务数据处理系统,包括:
合并模块,从数据库中读取数据表,并对所述数据表进行备份存档,复制所述数据到内存中,并将所述数据合并形成多个数据集,其中每个所述数据集中的第一条记录为该数据集的参考数据;
预处理模块,对所述多个数据集中的数据进行预处理,降低数据的维度,删除冗余或者关联性不大的属性;
处理模块,在处理器单元内建立多线程,每条所述线程对应一个所述数据集的处理进程,所述多线程同时进行数据处理任务;
遍历模块,建立一个长度为D的窗口,对所述数据集逐条遍历执行字符串匹配运算,将窗口第一条记录与后面的D-1条记录进行比较,对字符串从左侧进行正向最大匹配;
计算模块,计算所述参考数据与所述数据集中其他数据的数据相似度值,将得到的数据相似度值Q与预设的参考数据相似度值进行比较,得到比较结果;
确定模块,根据所述比较结果确定所述其他数据是否保留。
本发明公开了一种电子商务数据处理方法和系统,通过将电子商务中大量数据根据数据集属性的不同合并成多个数据集,并且对数据预先进行预处理,降低数据维度,建立多条处理线程,合理计算参考数据与其他数据之间的数据相似度值,从而确定数据集中的每个数据是否具有较好的关联度,最终确定是否保留该数据。该方法大大减小算法的时间复杂度,提高资源对象的创建和处理,缩短数据总量的处理时间,减小数据处理的误差。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明一个实施例中电子商务数据处理方法的流程示意图。
图2是本发明另一个实施例中电子商务数据处理系统的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例,基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
参见图1,本发明一个实施例提出了一种电子商务数据处理方法的流程图,从数据库中读取数据表,并对所述数据表进行备份存档,复制所述数据到内存中,并将所述数据合并形成多个数据集。由于数据量可能是海量的,对数据处理任务的分解可以从数据本身入手,将原有的数据集分解成多个小的数据集。假设数据量有N条记录,对于每个记录的处理时间消耗为t,则执行完这M条记录的数据处理任务耗时为M*t,如果将这M条数据分解成M/n个的小的数据集,将这M/n个数据集同时执行数据处理,在不考虑内存和CPU的影响情况下,可以认为处理时间耗时为M/n*t。
进一步的,对所述多个数据集中的数据进行预处理,删除冗余或者关联性不大的属性。对于已分解后多个小的数据集,需要进行降低数据的维度,这样将大大减小算法的时间复杂度,减小误差。
进一步的,将所述数据合并形成多个数据集具体步骤为:提取数据库中的首个数据记录,并将该记录视为新的数据集,并保存下来;分析数据库中的第二条记录,通过比较第二条记录和当前己经存在的数据集的属性,当满足一定的条件时,将这条记录分配到与其相匹配的数据集中,并重新计算这个数据集的属性;如果这条记录与当前己经存在的所有的数据集都不匹配,为这条记录创建一个新的数据集,并为其创建匹配属性;不断重复前面两个步骤,直到每条记录都被扫描计算过,正确的放置到所对应的数据集中,最终得到多个数据集。
进一步的,在处理器单元内建立多线程,每条线程对应一个数据集的处理进程,多个线程可同时进行数据处理任务,提高资源对象的创建和处理,缩短数据总量的处理时间。
进一步的,建立一个长度为D的窗口,对数据集中的数据逐条遍历执行字符串匹配运算,将窗口第一条记录与后面的D-1条记录进行比较;数据滑动窗口模型是在数据集上一个处理窗口,并且可以滑动。在处理数据时,窗口是从数据集中的第一条记录不断向后滑动。
最后,计算两个数据的数据相似度值,将得到的数据相似度值Q与预设的参考数据相似度值进行比较,如果大于或等于参考数据相似度值,则将匹配到的数据添加至记录集,最后保存至新的数据表中;小于参考数据相似度值的数据,从数据表中删除。如果该数据的数据相似度Q大于或等于参考数据相似度值,表示该数据在该数据集中数据关联度较高,不是错误数据;相反,如果该数据的数据相似度Q小于参考数据相似度值,表示该数据在该数据集中数据关联度较低,该数据为错误数据。
其中,所述数据相似度值Q的计算公式为:
Figure BDA0001756575630000041
D为窗口的长度,qi为字段i的相似度,p为两个比较字符串的相同字符数,Nmax为取两个比较字符串长度的最大值,mi为字段i占的权重。
本发明通过将电子商务中大量数据根据数据集属性的不同合并成多个数据集,并且对数据预先进行预处理,降低数据维度,建立多条处理线程,合理计算参考数据与其他数据之间的数据相似度值,从而确定数据集中的每个数据是否具有较好的关联度,最终确定是否保留该数据。该方法大大减小算法的时间复杂度,提高资源对象的创建和处理,缩短数据总量的处理时间,减小数据处理的误差。
图2是本发明另一个实施例中电子商务数据处理系统的结构示意图,提出了一种电子商务数据处理系统,包括:合并模块201、预处理模块202、多线程处理模块203、遍历模块204、计算模块205以及确定模块206。其中:
合并模块201,从数据库中读取数据表,并对所述数据表进行备份存档,复制所述数据到内存中,并将所述数据合并形成多个数据集。由于数据量可能是海量的,对数据处理任务的分解可以从数据本身入手,将原有的数据集分解成多个小的数据集。假设数据量有N条记录,对于每个记录的处理时间消耗为t,则执行完这M条记录的数据处理任务耗时为M*t,如果将这M条数据分解成M/n个的小的数据集,将这M/n个数据集同时执行数据处理,在不考虑内存和CPU的影响情况下,可以认为处理时间耗时为M/n*t。
预处理模块202,对所述多个数据集中的数据进行预处理,删除冗余或者关联性不大的属性。对于已分解后多个小的数据集,需要进行降低数据的维度,这样将大大减小算法的时间复杂度,减小误差。
进一步的,将所述数据合并形成多个数据集具体步骤为:提取数据库中的首个数据记录,并将该记录视为新的数据集,并保存下来;分析数据库中的第二条记录,通过比较第二条记录和当前己经存在的数据集的属性,当满足一定的条件时,将这条记录分配到与其相匹配的数据集中,并重新计算这个数据集的属性;如果这条记录与当前己经存在的所有的数据集都不匹配,为这条记录创建一个新的数据集,并为其创建匹配属性;不断重复前面两个步骤,直到每条记录都被扫描计算过,正确的放置到所对应的数据集中,最终得到多个数据集。
多线程处理模块203,在处理器单元内建立多线程,每条线程对应一个数据集的处理进程,多个线程可同时进行数据处理任务,提高资源对象的创建和处理,缩短数据总量的处理时间。
遍历模块204,建立一个长度为D的窗口,对数据集中的数据逐条遍历执行字符串匹配运算,将窗口第一条记录与后面的D-1条记录进行比较;数据滑动窗口模型是在数据集上一个处理窗口,并且可以滑动。在处理数据时,窗口是从数据集中的第一条记录不断向后滑动。
计算模块205,计算两个数据的数据相似度值,将得到的数据相似度值Q与预设的参考数据相似度值进行比较,得到比较结果。
确定模块206,根据上述比较结果,如果大于或等于参考数据相似度值,则将匹配到的数据添加至记录集,最后保存至新的数据表中;小于参考数据相似度值的数据,从数据表中删除。如果该数据的数据相似度Q大于或等于参考数据相似度值,表示该数据在该数据集中数据关联度较高,不是错误数据;相反,如果该数据的数据相似度Q小于参考数据相似度值,表示该数据在该数据集中数据关联度较低,该数据为错误数据。
其中,所述数据相似度值Q的计算公式为:
Figure BDA0001756575630000051
D为窗口的长度,qi为字段i的相似度,p为两个比较字符串的相同字符数,Nmax为取两个比较字符串长度的最大值,mi为字段i占的权重。
上述系统通过将电子商务中大量数据根据数据集属性的不同合并成多个数据集,并且对数据预先进行预处理,降低数据维度,建立多条处理线程,合理计算参考数据与其他数据之间的数据相似度值,从而确定数据集中的每个数据是否具有较好的关联度,最终确定是否保留该数据。该系统大大减小算法的时间复杂度,提高资源对象的创建和处理,缩短数据总量的处理时间,减小数据处理的误差。
需要说明的是,在本文中,诸如第一和第二之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个······”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同因素。
本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储在计算机可读取的存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质中。
最后需要说明的是:以上所述仅为本发明的较佳实施例,仅用于说明本发明的技术方案,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所做的任何修改、等同替换、改进等,均包含在本发明的保护范围内。

Claims (4)

1.一种电子商务数据处理方法,其特征在于,所述方法包括:
从数据库中读取数据表,并对所述数据表进行备份存档,复制数据到内存中,并将所述数据合并形成多个数据集,其中每个所述数据集中的第一条记录为所述数据集的参考数据;数据量有N条记录,对于每个记录的处理时间消耗为t,则执行完这M条记录的数据处理任务耗时为M*t,将这M条数据分解成M/n个的小的数据集,将这M/n个数据集同时执行数据处理,处理时间耗时为M/n*t;
对所述多个数据集中的数据进行预处理,降低数据的维度,删除冗余或者关联性不大的属性;
在处理器单元内建立多线程,每条所述线程对应一个所述数据集的处理进程,所述多线程同时进行数据处理任务;
建立一个长度为D的窗口,对所述数据集的数据逐条遍历执行字符串匹配运算,将窗口第一条记录与后面的D-1条记录进行比较,对字符串从左侧进行正向最大匹配;
计算所述参考数据与所述数据集中其他数据的数据相似度值,将得到的数据相似度值Q与预设的参考数据相似度值进行比较,得到比较结果;
根据所述比较结果确定所述其他数据是否保留;
其中根据比较结果确定所述其他数据是否保留具体为:如果所述其他数据的数据相似度值大于或等于所述参考数据相似度值,则将所述其他数据添加至记录集,最后保存至新数据表中;如果得到的数据相似度值Q小于所述参考数据相似度值,从所述数据表中删除所述其他数据;
其中,所述数据相似度值Q的计算公式为:
Figure 633524DEST_PATH_IMAGE001
Figure 594527DEST_PATH_IMAGE002
;D为所述窗口的长度,
Figure 367311DEST_PATH_IMAGE003
为字段i的相似度,p为两个比较字符串的相同字符数,
Figure 173593DEST_PATH_IMAGE004
为取两个比较字符串长度的最大值,
Figure 597490DEST_PATH_IMAGE005
为字段i占的权重。
2.根据权利要求1所述的方法,其特征在于,其中将所述数据合并形成多个数据集具体为:提取所述数据表中的所述第一条记录,并将所述第一条记录视为新的数据集,并保存下来;分析所述数据表中的第二条记录,通过比较所述第二条记录和当前己经存在的数据集的属性,当匹配时,将所述第二条记录分配到与其相匹配的数据集中;如果这条记录与当前己经存在的所有的数据集都不匹配,则为这条记录创建一个新的数据集,并为其创建匹配属性;不断重复前面两个步骤,直到每条记录都被扫描计算过,最终得到第二条记录多个数据集。
3.一种电子商务数据处理系统,其特征在于,所述系统包括:
合并模块,从数据库中读取数据表,并对所述数据表进行备份存档,复制数据到内存中,并将所述数据合并形成多个数据集,其中每个所述数据集中的第一条记录为该数据集的参考数据;数据量有N条记录,对于每个记录的处理时间消耗为t,则执行完这M条记录的数据处理任务耗时为M*t,将这M条数据分解成M/n个的小的数据集,将这M/n个数据集同时执行数据处理,处理时间耗时为M/n*t;
预处理模块,对所述多个数据集中的数据进行预处理,降低数据的维度,删除冗余或者关联性不大的属性;
处理模块,在处理器单元内建立多线程,每条所述线程对应一个所述数据集的处理进程,所述多线程同时进行数据处理任务;
遍历模块,建立一个长度为D的窗口,对所述数据集逐条遍历执行字符串匹配运算,将窗口第一条记录与后面的D-1条记录进行比较,对字符串从左侧进行正向最大匹配;
计算模块,计算所述参考数据与所述数据集中其他数据的数据相似度值,将得到的数据相似度值Q与预设的参考数据相似度值进行比较,得到比较结果;
确定模块,根据所述比较结果确定所述其他数据是否保留;
其中所述确定模块,根据所述比较结果确定所述其他数据是否保留,具体为:如果所述其他数据的数据相似度值大于或等于所述参考数据相似度值,则将所述其他数据添加至记录集,最后保存至新数据表中;如果得到的数据相似度值Q小于所述参考数据相似度值,从所述数据表中删除所述其他数据;
其中,所述数据相似度值Q的计算公式为:
Figure 463814DEST_PATH_IMAGE001
Figure 723894DEST_PATH_IMAGE002
;D为所述窗口的长度,
Figure 333867DEST_PATH_IMAGE003
为字段i的相似度,p为两个比较字符串的相同字符数,
Figure 113736DEST_PATH_IMAGE004
为取两个比较字符串长度的最大值,
Figure 416541DEST_PATH_IMAGE005
为字段i占的权重。
4.根据权利要求3所述的系统,其特征在于,其中将所述数据合并形成多个数据集具体为:提取所述数据表中的所述第一条记录,并将所述第一条记录视为新的数据集,并保存下来;分析所述数据表中的第二条记录,通过比较所述第二条记录和当前己经存在的数据集的属性,当匹配时,将所述第二条记录分配到与其相匹配的数据集中;如果这条记录与当前己经存在的所有的数据集都不匹配,则为这条记录创建一个新的数据集,并为其创建匹配属性;不断重复前面两个步骤,直到每条记录都被扫描计算过,最终得到第二条记录多个数据集。
CN201810889530.4A 2018-08-07 2018-08-07 一种电子商务数据处理方法和系统 Active CN109165119B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810889530.4A CN109165119B (zh) 2018-08-07 2018-08-07 一种电子商务数据处理方法和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810889530.4A CN109165119B (zh) 2018-08-07 2018-08-07 一种电子商务数据处理方法和系统

Publications (2)

Publication Number Publication Date
CN109165119A CN109165119A (zh) 2019-01-08
CN109165119B true CN109165119B (zh) 2021-05-14

Family

ID=64895176

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810889530.4A Active CN109165119B (zh) 2018-08-07 2018-08-07 一种电子商务数据处理方法和系统

Country Status (1)

Country Link
CN (1) CN109165119B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112988698B (zh) * 2019-12-02 2024-09-17 阿里巴巴集团控股有限公司 一种数据处理方法以及装置
CN112650895A (zh) * 2021-01-26 2021-04-13 南京超辰信息科技有限公司 一种测绘作业数据采集处理系统及其方法
CN113792039B (zh) * 2021-03-15 2024-03-01 北京京东振世信息技术有限公司 数据处理方法及装置、电子设备、存储介质
CN113688154B (zh) * 2021-07-29 2024-10-11 北京明略昭辉科技有限公司 数据比对方法、系统、存储介质及电子设备

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101933015A (zh) * 2007-12-13 2010-12-29 图形软件科技公司 用于编辑制图数据的系统和方法
CN103136243A (zh) * 2011-11-29 2013-06-05 中国电信股份有限公司 基于云存储的文件系统去重方法及装置
CN104317751A (zh) * 2014-11-18 2015-01-28 浪潮电子信息产业股份有限公司 一种gpu上数据流处理系统及其数据流处理方法
CN107273412A (zh) * 2017-05-04 2017-10-20 北京拓尔思信息技术股份有限公司 一种文本数据的聚类方法、装置和系统

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150268963A1 (en) * 2014-03-23 2015-09-24 Technion Research & Development Foundation Ltd. Execution of data-parallel programs on coarse-grained reconfigurable architecture hardware

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101933015A (zh) * 2007-12-13 2010-12-29 图形软件科技公司 用于编辑制图数据的系统和方法
CN103136243A (zh) * 2011-11-29 2013-06-05 中国电信股份有限公司 基于云存储的文件系统去重方法及装置
CN104317751A (zh) * 2014-11-18 2015-01-28 浪潮电子信息产业股份有限公司 一种gpu上数据流处理系统及其数据流处理方法
CN107273412A (zh) * 2017-05-04 2017-10-20 北京拓尔思信息技术股份有限公司 一种文本数据的聚类方法、装置和系统

Also Published As

Publication number Publication date
CN109165119A (zh) 2019-01-08

Similar Documents

Publication Publication Date Title
CN109165119B (zh) 一种电子商务数据处理方法和系统
US10565234B1 (en) Ticket classification systems and methods
US20200050968A1 (en) Interactive interfaces for machine learning model evaluations
CA2953817C (en) Feature processing tradeoff management
US8180756B1 (en) Similarity-based searching
US10963810B2 (en) Efficient duplicate detection for machine learning data sets
US10459888B2 (en) Method, apparatus and system for data analysis
Alham et al. A MapReduce-based distributed SVM ensemble for scalable image classification and annotation
WO2022142001A1 (zh) 基于多评分卡融合的目标对象评价方法及其相关设备
CN103345616A (zh) 基于行为分析的指纹存储比对的系统
CN109977977B (zh) 一种识别潜在用户的方法及对应装置
CN117556148B (zh) 一种基于网络数据驱动的个性化跨域推荐方法
JP2017054487A (ja) 分布クエリに対してビジネスデータを融合するための方法及びシステム
US20130318104A1 (en) Method and system for analyzing data in artifacts and creating a modifiable data network
US11709798B2 (en) Hash suppression
CN118786449A (zh) 用于基于监管报告和分析来生成洞察的系统和方法
US20140324523A1 (en) Missing String Compensation In Capped Customer Linkage Model
CN109582806B (zh) 一种基于图计算的个人信息处理方法及系统
CN109299260B (zh) 数据分类方法、装置以及计算机可读存储介质
CN110807449A (zh) 一种科技项目申报线上服务终端
JP2018151805A (ja) データ項目名推定装置、データ項目名推定方法、及びプログラム
Trabelsi et al. Employing Data and Process Mining Techniques for Redundancy Detection and Analystics in Business Processes.
JP2001312419A (ja) ソフトウェア重複度評価装置およびソフトウェア重複度評価プログラムを記録した記録媒体
JP2001134577A (ja) データ分析装置、方法、およびそのコンピュータプログラムを記憶した記憶媒体
CN114201460A (zh) 针对并发导致的不完备事件日志的块结构过程挖掘方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20210423

Address after: Room 502-1, 1380 Wenyi West Road, Cangqian street, Yuhang District, Hangzhou City, Zhejiang Province

Applicant after: Hangzhou golden litchi Technology Co.,Ltd.

Address before: Anhui Qingfeng 242530 city of Xuancheng province Jingxian County Jingchuan town Yangong Community Group No. 075

Applicant before: JINGXIAN MAILAN NETWORK TECHNOLOGY SERVICE Co.,Ltd.

TA01 Transfer of patent application right
GR01 Patent grant
GR01 Patent grant