CN111581439A - 一种用于机器学习分析的大数据信息处理方法及系统 - Google Patents

一种用于机器学习分析的大数据信息处理方法及系统 Download PDF

Info

Publication number
CN111581439A
CN111581439A CN202010220896.XA CN202010220896A CN111581439A CN 111581439 A CN111581439 A CN 111581439A CN 202010220896 A CN202010220896 A CN 202010220896A CN 111581439 A CN111581439 A CN 111581439A
Authority
CN
China
Prior art keywords
distribution
value
data
user
feature
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010220896.XA
Other languages
English (en)
Inventor
孟庆海
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
North China University of Technology
Original Assignee
North China University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by North China University of Technology filed Critical North China University of Technology
Priority to CN202010220896.XA priority Critical patent/CN111581439A/zh
Publication of CN111581439A publication Critical patent/CN111581439A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/906Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种用于机器学习分析的大数据信息处理方法及系统,该方法包括:获取原始用户数据,将所述原始用户数据与规则树进行匹配,生成用户元数据集合;将所述用户元数据集合与分布特征一致性模板进行匹配,生成映射特征组;利用机器学习算法对所述映射特征组进行分析,生成数据分布规律结果;根据所述数据分布规律结果,实现大数据相关应用。该方法能够保护用于机器学习分析的用户数据,提高用户数据的安全性。

Description

一种用于机器学习分析的大数据信息处理方法及系统
技术领域
本发明涉及大数据技术领域,具体是一种用于机器学习分析的大数据信息处理方法及系统。
背景技术
基于大数据的信息分析技术近年来日益普及到我们生活的各个方面,通过大数据分析能够发现数据之间潜在的关联规律,提高信息分析的准确率和效率,增强预测精度。特别是通过对用户数据(例如用户消费数据、银行交易数据、移动轨迹和位置数据等)的大数据分析,能够发现用户的特点和偏好,提供针对性和个性化的服务。
特别是随着各种机器学习(例如聚类算法、神经网络、贝叶斯、回归分析等)的发展应用,利用机器学习实现大数据信息的分析和挖掘,其分析的数据量级和效率得到了本质上的飞跃,而且能够从大数据中挖掘深度的、潜在的的规律。
机器学习的原理,和人类的学习方式有很大的区别,机器学习并不需要理解大数据中包含信息的真实含义,而是对数据进行多个维度的分布特征的提取,再进行特征的统计归类等,最终获得大数据蕴含的规律性。
但是,用户数据中存在大量的敏感信息,一旦泄露会严重损害用户的安全和利益,降低公众对数据运营方的信赖感。而进行大数据信息分析,往往要通过网络设备传输、存储海量的用户数据,数据安全方面的风险比较高。目前,应对这方面风险的主要手段是进行用户数据的加密,或者施加各种模糊化、匿名化的处理,但是都不能很好的解决该问题,例如加密的用户数据也有可能被破解,或者是模糊化的用户数据有可能造成大数据分析过程中规律提取的障碍。
因此,如何保护用于机器学习分析的用户数据,提高用户数据的安全性是本领域技术人员亟待解决的问题。
发明内容
鉴于上述问题,本发明的目的是为了解决进行大数据信息分析需要通过网络设备传输、存储海量的用户数据,数据安全方面的风险比较高的问题。
本发明实施例提供一种用于机器学习分析的大数据信息处理方法,包括:
获取原始用户数据,将所述原始用户数据与规则树进行匹配,生成用户元数据集合;
将所述用户元数据集合与分布特征一致性模板进行匹配,生成映射特征组;
利用机器学习算法对所述映射特征组进行分析,生成数据分布规律结果;
根据所述数据分布规律结果,实现大数据相关应用。
在一个实施例中,所述获取原始用户数据,将所述原始用户数据与规则树进行匹配,生成用户元数据集合,包括:
基于专家知识,构建规则树;
将所述原始用户数据中的文本内容与所述规则树的字段名、描述关键词进行检索对比,提取所述原始数据中的用户元数据;
利用所述规则树的逻辑关系组织所述用户源数据,生成用户源数据集合。
在一个实施例中,所述将所述用户元数据与分布特征一致性模板进行匹配,生成映射特征组,包括:
获取所述分布特征一致性模板中每个分布特征单元的价值估值;
将所述用户元数据集合与所述分布特征一致性模板进行匹配,生成所述用户元数据集合与所述分布特征一致性模板中每个分布特征单元的匹配度;
根据所述价值估值与所述匹配度,确定所述用户元数据集合的映射特征值;
将所述映射特征值进行集合,生成所述映射特征组。
在一个实施例中,所述获取所述分布特征一致性模板中每个分布特征单元的价值估值,包括:
根据所述分布特征单元中的字段名计算所述价值估值,具体计算公式为:
Figure BDA0002425221570000031
上式中,k表示所述分布特征一致性模板的第k个分布特征单元,Vk表示所述第k个分布特征单元的价值估值,i表示字段名的序号,N表示所述分布特征单元具有N个字段名,l1表示常数系数,Si表示第i个字段名的取值区间范围的量化值。
在一个实施例中,所述根据所述价值估值与所述匹配度,确定所述用户元数据集合的映射特征值,包括:
所述映射特征值的计算公式如下:
Figure BDA0002425221570000032
上式中,Tk表示所述用户元数据集合对应于第k个分布特征单元的映射特征值,l2、l3表示经验常数,Mk表示第k个分布特征单元与所述用户元数据集合的匹配度。
第二方面,本发明还提供一种用于机器学习分析的大数据信息处理系统,包括:
获取模块,用于获取原始用户数据,将所述原始用户数据与规则树进行匹配,生成用户元数据集合;
匹配模块,用于将所述用户元数据集合与分布特征一致性模板进行匹配,生成映射特征组;
分析模块,用于利用机器学习算法对所述映射特征组进行分析,生成数据分布规律结果;
应用模块,用于根据所述数据分布规律结果,实现大数据相关应用。
在一个实施例中,所述获取模块,包括:
构建子模块,用于基于专家知识,构建规则树;
提取子模块,用于将所述原始用户数据中的文本内容与所述规则树的字段名、描述关键词进行检索对比,提取所述原始数据中的用户元数据;
生成子模块,用于利用所述规则树的逻辑关系组织所述用户源数据,生成用户源数据集合。
在一个实施例中,所述匹配模块,包括:
获取子模块,用于获取所述分布特征一致性模板中每个分布特征单元的价值估值;
匹配子模块,用于将所述用户元数据集合与所述分布特征一致性模板进行匹配,生成所述用户元数据集合与所述分布特征一致性模板中每个分布特征单元的匹配度;
确定子模块,用于根据所述价值估值与所述匹配度,确定所述用户元数据集合的映射特征值;
集合子模块,用于将所述映射特征值进行集合,生成所述映射特征组。
在一个实施例中,所述获取子模块,包括:
根据所述分布特征单元中的字段名计算所述价值估值,具体计算公式为:
Figure BDA0002425221570000041
上式中,k表示所述分布特征一致性模板的第k个分布特征单元,Vk表示所述第k个分布特征单元的价值估值,i表示字段名的序号,N表示所述分布特征单元具有N个字段名,l1表示常数系数,Si表示第i个字段名的取值区间范围的量化值。
在一个实施例中,所述确定子模块中所述映射特征值的计算公式如下:
Figure BDA0002425221570000042
上式中,Tk表示所述用户元数据集合对应于第k个分布特征单元的映射特征值,l2、l3表示经验常数,Mk表示第k个分布特征单元与所述用户元数据集合的匹配度。
本发明实施例提供的上述技术方案的有益效果至少包括:
本发明实施例提供的一种用于机器学习分析的大数据信息处理方法,本方法利用“机器学习并不需要理解大数据中包含信息的真实含义,而是对数据进行多个维度的分布特征的提取,再进行特征的统计归类等,最终获得大数据蕴含的规律性”的特点,将原始的、携带有真实信息含义的用户数据,映射为不携带任何真实信息含义、但在各个维度上的分布特征与用户数据趋于一致的映射数据,再通过机器学习算法,针对映射数据构成的大数据集合进行特征提取和统计归类等分析,获得数据分布规律结果,进而,根据机器学习分析的数据分布规律结果,实现大数据相关应用。在网络中传输、存储的都是不携带真实信息含义的映射数据,即便被截获、泄露,也不可能从中获得任何的有价值的用户数据,从而降低了大数据分析的信息安全风险。
本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
下面通过附图和实施例,对本发明的技术方案做进一步地详细描述。
附图说明
附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。在附图中:
图1为本发明实施例提供的用于机器学习分析的大数据信息处理方法的流程图;
图2为本发明实施例提供的步骤S101流程图;
图3为本发明实施例提供的步骤S102流程图;
图4为本发明实施例提供的用于机器学习分析的大数据信息处理系统的框图;
图5为本发明实施例提供的获取模块41的框图;
图6为本发明实施例提供的匹配模块42的框图。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
参照图1所示,本发明实施例提供的一种用于机器学习分析的大数据信息处理方法,该方法包括:步骤S101~S104;
S101、获取原始用户数据,将所述原始用户数据与规则树进行匹配,生成用户元数据集合;
具体的,将上述原始用户数据与上述规则树进行关键词匹配,生成具有哦字段描述结构、关联结构的用户元数据集合。
S102、将所述用户元数据集合与分布特征一致性模板进行匹配,生成映射特征组;
具体的,将所述用户元数据集合与分布特征一致性模板进行匹配后,生成的映射特征组的特征分布规律与用户元数据集合自身具有的特征分布规律保持一致;其中,上述分布特征一致性模板带有价值估值。
进一步地,上述分布特征一致性模板包含若干个分布特征单元,每个分布特征单元具有与用户元数据集合相同的字段名,每字段名具有预定的字段属性值的取值区间,分布特征单元所包含的字段名与用户元数据集合中的字段名对应。
S103、利用机器学习算法(例如聚类算法、神经网络、贝叶斯、回归分析等)对所述映射特征组进行分析,生成数据分布规律结果(例如聚类或者分类结果等);
S104、根据所述数据分布规律结果,实现大数据相关应用。
例如,通过聚类算法将映射特征组归为某个类群,则对应的用户也就归为该类群,可以根据该类群,向用户提供相应的个性化服务或者推送。
本实施例中,在将大数据分析运用于用户数据的过程中,在原始用户数据的数据源一端,将原始用户数据映射为不携带真实信息含义的映射数据,同时保持映射数据在各个维度上的分布特征与用户数据趋于一致,避免了用户数据在存储、分析、应用等环节的过度集中,减少了大量用户数据的直接网络传输,进而保护了用户数据,提高了用户数据的安全性。
在一个实施例中,参照图2所示,上述步骤S101中获取原始用户数据,将所述原始用户数据与规则树进行匹配,生成用户元数据集合,包括:
S1011、基于专家知识,构建规则树;
其中,上述规则树由专家知识彼此按照逻辑关系进行关联的字段名、描述关键词组成。
S1012、将所述原始用户数据(文本或表单格式的原始用户数据)中的文本内容与所述规则树的字段名、描述关键词进行检索对比,提取所述原始数据中的用户元数据;
具体的,上述用户元数据根据检索对比结果,从原始用户数据中自动提取字段名和字段属性值的用户元数据。
S1013、利用所述规则树的逻辑关系组织所述用户源数据,生成用户源数据集合。
在一个实施例中,参照图3所示,上述步骤S102中所述将所述用户元数据与分布特征一致性模板进行匹配,生成映射特征组,包括:
S1021、获取所述分布特征一致性模板中每个分布特征单元的价值估值;
具体的,根据所述分布特征单元中的字段名计算所述价值估值,具体计算公式为:
Figure BDA0002425221570000081
上式中,k表示所述分布特征一致性模板的第k个分布特征单元,Vk表示所述第k个分布特征单元的价值估值,i表示字段名的序号,N表示所述分布特征单元具有N个字段名,l1表示常数系数,Si表示第i个字段名的取值区间范围的量化值。
进一步地,分布特征单元的字段属性值的取值区间覆盖范围越大,则该分布特征单元的该字段名对应的价值估值越低,全部字段名的价值估值累加作为分布特征单元的价值估值。
S1022、将所述用户元数据集合与所述分布特征一致性模板进行匹配,生成所述用户元数据集合与所述分布特征一致性模板中每个分布特征单元的匹配度;
具体的,用户元数据集合中字段名的字段属性值落入第k个分布特征单元的同字段名取值区间的次数Mk作为该分布特征单元与用户元数据集合的匹配度。
S1023、根据所述价值估值与所述匹配度,确定所述用户元数据集合的映射特征值;
具体的,所述映射特征值的计算公式如下:
Figure BDA0002425221570000082
上式中,Tk表示所述用户元数据集合对应于第k个分布特征单元的映射特征值,l2、l3表示经验常数,Mk表示第k个分布特征单元与所述用户元数据集合的匹配度。
S1024、将所述映射特征值进行集合,生成所述映射特征组。
具体的,用户元数据集合对应于分布特征一致性模板的各个分布特征单元的特征值的集合<T1,T2…Tk…>,作为用户元数据集合的映射特征组。
本实施例中,在原始用户数据的数据源获得映射特征组与用户元数据集合自身具有的特征分布规律一致的特征分布规律,将原始的、携带有真实信息含义的用户数据,映射为不携带任何真实信息含义、但在各个维度上的分布特征与用户数据趋于一致的映射数据,并将映射数据用于机器学习分析,在网络中传输、存储的都是不携带真实信息含义的映射数据,降低了大数据分析的信息安全风险。
基于同一发明构思,本发明实施例还提供了一种用于机器学习分析的大数据信息处理系统,由于该系统所解决问题的原理与前述一种用于机器学习分析的大数据信息处理方法相似,因此该装置的实施可以参见前述方法的实施,重复之处不再赘述。
本发明实施例提供的一种用于机器学习分析的大数据信息处理系统,参照图4所示,包括:
获取模块41,用于获取原始用户数据,将所述原始用户数据与规则树进行匹配,生成用户元数据集合;
具体的,将上述原始用户数据与上述规则树进行关键词匹配,生成具有哦字段描述结构、关联结构的用户元数据集合。
匹配模块42,用于将所述用户元数据集合与分布特征一致性模板进行匹配,生成映射特征组;
具体的,将所述用户元数据集合与分布特征一致性模板进行匹配后,生成的映射特征组的特征分布规律与用户元数据集合自身具有的特征分布规律保持一致;其中,上述分布特征一致性模板带有价值估值。
分析模块43,用于利用机器学习算法例如聚类算法、神经网络、贝叶斯、回归分析等)对所述映射特征组进行分析,生成数据分布规律结果例如聚类或者分类结果等);
应用模块44,用于根据所述数据分布规律结果,实现大数据相关应用。
其中,获取模块41与匹配模块42都设置于原始用户数据的数据源一端。
在一个实施例中,所述获取模块41,包括:
构建子模块411,用于基于专家知识,构建规则树;
其中,上述规则树由彼此按照逻辑关系进行关联的字段名、描述关键词组成。
提取子模块412,用于将所述原始用户数据(文本或表单格式的原始用户数据)中的文本内容与所述规则树的字段名、描述关键词进行检索对比,提取所述原始数据中的用户元数据;
具体的,上述用户元数据根据检索对比结果,从原始用户数据中自动提取字段名和字段属性值的用户元数据。
生成子模块413,用于利用所述规则树的逻辑关系组织所述用户源数据,生成用户源数据集合。
在一个实施例中,所述匹配模块42,包括:
获取子模块421,用于获取所述分布特征一致性模板中每个分布特征单元的价值估值;
进一步地,分布特征单元的字段属性值的取值区间覆盖范围越大,则该分布特征单元的该字段名对应的价值估值越低,全部字段名的价值估值累加作为分布特征单元的价值估值。
匹配子模块422,用于将所述用户元数据集合与所述分布特征一致性模板进行匹配,生成所述用户元数据集合与所述分布特征一致性模板中每个分布特征单元的匹配度;
确定子模块423,用于根据所述价值估值与所述匹配度,确定所述用户元数据集合的映射特征值;
集合子模块424,用于将所述映射特征值进行集合,生成所述映射特征组。
在一个实施例中,所述获取子模块421,包括:
根据所述分布特征单元中的字段名计算所述价值估值,具体计算公式为:
Figure BDA0002425221570000111
上式中,k表示所述分布特征一致性模板的第k个分布特征单元,Vk表示所述第k个分布特征单元的价值估值,i表示字段名的序号,N表示所述分布特征单元具有N个字段名,l1表示常数系数,Si表示第i个字段名的取值区间范围的量化值。
在一个实施例中,所述确定子模块423中所述映射特征值的计算公式如下:
Figure BDA0002425221570000112
上式中,Tk表示所述用户元数据集合对应于第k个分布特征单元的映射特征值,l2、l3表示经验常数,Mk表示第k个分布特征单元与所述用户元数据集合的匹配度。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (10)

1.一种用于机器学习分析的大数据信息处理方法,其特征在于,包括:
获取原始用户数据,将所述原始用户数据与规则树进行匹配,生成用户元数据集合;
将所述用户元数据集合与分布特征一致性模板进行匹配,生成映射特征组;
利用机器学习算法对所述映射特征组进行分析,生成数据分布规律结果;
根据所述数据分布规律结果,实现大数据相关应用。
2.如权利要求1所述的一种用于机器学习分析的大数据信息处理方法,其特征在于,所述获取原始用户数据,将所述原始用户数据与规则树进行匹配,生成用户元数据集合,包括:
基于专家知识,构建规则树;
将所述原始用户数据中的文本内容与所述规则树的字段名、描述关键词进行检索对比,提取所述原始数据中的用户元数据;
利用所述规则树的逻辑关系组织所述用户源数据,生成用户源数据集合。
3.如权利要求1所述的一种用于机器学习分析的大数据信息处理方法,其特征在于,所述将所述用户元数据与分布特征一致性模板进行匹配,生成映射特征组,包括:
获取所述分布特征一致性模板中每个分布特征单元的价值估值;
将所述用户元数据集合与所述分布特征一致性模板进行匹配,生成所述用户元数据集合与所述分布特征一致性模板中每个分布特征单元的匹配度;
根据所述价值估值与所述匹配度,确定所述用户元数据集合的映射特征值;
将所述映射特征值进行集合,生成所述映射特征组。
4.如权利要求3所述的一种用于机器学习分析的大数据信息处理方法,其特征在于,所述获取所述分布特征一致性模板中每个分布特征单元的价值估值,包括:
根据所述分布特征单元中的字段名计算所述价值估值,具体计算公式为:
Figure FDA0002425221560000021
上式中,k表示所述分布特征一致性模板的第k个分布特征单元,Vk表示所述第k个分布特征单元的价值估值,i表示字段名的序号,N表示所述分布特征单元具有N个字段名,l1表示常数系数,Si表示第i个字段名的取值区间范围的量化值。
5.如权利要求3所述的一种用于机器学习分析的大数据信息处理方法,其特征在于,所述根据所述价值估值与所述匹配度,确定所述用户元数据集合的映射特征值,包括:
所述映射特征值的计算公式如下:
Figure FDA0002425221560000022
上式中,Tk表示所述用户元数据集合对应于第k个分布特征单元的映射特征值,l2、l3表示经验常数,Mk表示第k个分布特征单元与所述用户元数据集合的匹配度。
6.一种用于机器学习分析的大数据信息处理系统,其特征在于,包括:
获取模块,用于获取原始用户数据,将所述原始用户数据与规则树进行匹配,生成用户元数据集合;
匹配模块,用于将所述用户元数据集合与分布特征一致性模板进行匹配,生成映射特征组;
分析模块,用于利用机器学习算法对所述映射特征组进行分析,生成数据分布规律结果;
应用模块,用于根据所述数据分布规律结果,实现大数据相关应用。
7.如权利要求6所述的一种用于机器学习分析的大数据信息处理系统,其特征在于,所述获取模块,包括:
构建子模块,用于基于专家知识,构建规则树;
提取子模块,用于将所述原始用户数据中的文本内容与所述规则树的字段名、描述关键词进行检索对比,提取所述原始数据中的用户元数据;
生成子模块,用于利用所述规则树的逻辑关系组织所述用户源数据,生成用户源数据集合。
8.如权利要求6所述的一种用于机器学习分析的大数据信息处理系统,其特征在于,所述匹配模块,包括:
获取子模块,用于获取所述分布特征一致性模板中每个分布特征单元的价值估值;
匹配子模块,用于将所述用户元数据集合与所述分布特征一致性模板进行匹配,生成所述用户元数据集合与所述分布特征一致性模板中每个分布特征单元的匹配度;
确定子模块,用于根据所述价值估值与所述匹配度,确定所述用户元数据集合的映射特征值;
集合子模块,用于将所述映射特征值进行集合,生成所述映射特征组。
9.如权利要求8所述的一种用于机器学习分析的大数据信息处理系统,其特征在于,所述获取子模块,包括:
根据所述分布特征单元中的字段名计算所述价值估值,具体计算公式为:
Figure FDA0002425221560000031
上式中,k表示所述分布特征一致性模板的第k个分布特征单元,Vk表示所述第k个分布特征单元的价值估值,i表示字段名的序号,N表示所述分布特征单元具有N个字段名,l1表示常数系数,Si表示第i个字段名的取值区间范围的量化值。
10.如权利要求8所述的一种用于机器学习分析的大数据信息处理系统,其特征在于,所述确定子模块中所述映射特征值的计算公式如下:
Figure FDA0002425221560000041
上式中,Tk表示所述用户元数据集合对应于第k个分布特征单元的映射特征值,l2、l3表示经验常数,Mk表示第k个分布特征单元与所述用户元数据集合的匹配度。
CN202010220896.XA 2020-03-25 2020-03-25 一种用于机器学习分析的大数据信息处理方法及系统 Pending CN111581439A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010220896.XA CN111581439A (zh) 2020-03-25 2020-03-25 一种用于机器学习分析的大数据信息处理方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010220896.XA CN111581439A (zh) 2020-03-25 2020-03-25 一种用于机器学习分析的大数据信息处理方法及系统

Publications (1)

Publication Number Publication Date
CN111581439A true CN111581439A (zh) 2020-08-25

Family

ID=72111467

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010220896.XA Pending CN111581439A (zh) 2020-03-25 2020-03-25 一种用于机器学习分析的大数据信息处理方法及系统

Country Status (1)

Country Link
CN (1) CN111581439A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112506930A (zh) * 2020-12-15 2021-03-16 北京三维天地科技股份有限公司 一种基于机器学习技术的数据洞察平台
CN112733186A (zh) * 2020-12-31 2021-04-30 上海竞动科技有限公司 一种用户隐私数据分析方法及装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040267770A1 (en) * 2003-06-25 2004-12-30 Lee Shih-Jong J. Dynamic learning and knowledge representation for data mining
CN108268558A (zh) * 2017-01-03 2018-07-10 中移(苏州)软件技术有限公司 一种数据分析的方法和装置
CN110008306A (zh) * 2019-04-04 2019-07-12 北京易华录信息技术股份有限公司 一种数据关系分析方法、装置及数据服务系统
CN111538741A (zh) * 2020-03-23 2020-08-14 重庆特斯联智慧科技股份有限公司 一种面向警情大数据的深度学习分析方法及系统

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040267770A1 (en) * 2003-06-25 2004-12-30 Lee Shih-Jong J. Dynamic learning and knowledge representation for data mining
CN108268558A (zh) * 2017-01-03 2018-07-10 中移(苏州)软件技术有限公司 一种数据分析的方法和装置
CN110008306A (zh) * 2019-04-04 2019-07-12 北京易华录信息技术股份有限公司 一种数据关系分析方法、装置及数据服务系统
CN111538741A (zh) * 2020-03-23 2020-08-14 重庆特斯联智慧科技股份有限公司 一种面向警情大数据的深度学习分析方法及系统

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112506930A (zh) * 2020-12-15 2021-03-16 北京三维天地科技股份有限公司 一种基于机器学习技术的数据洞察平台
CN112733186A (zh) * 2020-12-31 2021-04-30 上海竞动科技有限公司 一种用户隐私数据分析方法及装置

Similar Documents

Publication Publication Date Title
CN108090162A (zh) 基于人工智能的信息推送方法和装置
CN111538741B (zh) 一种面向警情大数据的深度学习分析方法及系统
CN113449048B (zh) 数据标签分布确定方法、装置、计算机设备和存储介质
CN111143838B (zh) 数据库用户异常行为检测方法
CN111428028A (zh) 基于深度学习的信息分类方法及相关设备
CN116455861B (zh) 一种基于大数据的计算机网络安全监测系统及方法
CN111581439A (zh) 一种用于机器学习分析的大数据信息处理方法及系统
CN113904872A (zh) 一种针对匿名服务网站指纹攻击的特征提取方法及系统
CN108280357A (zh) 基于语义特征提取的数据防泄漏方法、系统
CN111209403A (zh) 数据处理方法、装置、介质及电子设备
Koutsonikola et al. A fuzzy bi-clustering approach to correlate web users and pages
CN115618297A (zh) 识别异常企业的方法及其装置
CN116958622A (zh) 数据的分类方法、装置、设备、介质及程序产品
CN113627514A (zh) 知识图谱的数据处理方法、装置、电子设备和存储介质
CN114064893A (zh) 一种异常数据审核方法、装置、设备及存储介质
CN113435741A (zh) 培训计划生成方法、装置、设备及存储介质
CN112100670A (zh) 一种基于大数据的隐私数据分级保护方法
CN113495969B (zh) 数字指纹生成、媒体数据推荐方法、装置和计算机设备
CN116823069B (zh) 基于文本分析的智能客服服务质检方法及相关设备
KR102524828B1 (ko) 빅데이터 기반의 탐정기관 중개 시스템
CN117668499B (zh) 一种基于机器学习的海洋公益诉讼线索研判方法、系统、设备及介质
Huang et al. Video Recommendation Method Based on Deep Learning of Group Evaluation Behavior Sequences
CN116701962A (zh) 边缘数据处理方法、装置、计算设备及存储介质
Zhang et al. Efficient feature selection framework for digital marketing applications
El Haj Stochastics blockmodels, classifications and applications

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination