CN111597179A - 自动清洗数据的方法、装置、电子设备及存储介质 - Google Patents

自动清洗数据的方法、装置、电子设备及存储介质 Download PDF

Info

Publication number
CN111597179A
CN111597179A CN202010420540.0A CN202010420540A CN111597179A CN 111597179 A CN111597179 A CN 111597179A CN 202010420540 A CN202010420540 A CN 202010420540A CN 111597179 A CN111597179 A CN 111597179A
Authority
CN
China
Prior art keywords
data
tags
type
label
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010420540.0A
Other languages
English (en)
Other versions
CN111597179B (zh
Inventor
周祚宇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Si Tech Information Technology Co Ltd
Original Assignee
Beijing Si Tech Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Si Tech Information Technology Co Ltd filed Critical Beijing Si Tech Information Technology Co Ltd
Priority to CN202010420540.0A priority Critical patent/CN111597179B/zh
Publication of CN111597179A publication Critical patent/CN111597179A/zh
Application granted granted Critical
Publication of CN111597179B publication Critical patent/CN111597179B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • G06F16/215Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/25Integrating or interfacing systems involving database management systems
    • G06F16/258Data format conversion from or to a database
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • Processing Or Creating Images (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请提供了一种自动清洗数据的方法、装置、电子设备及存储介质。该自动清洗数据的方法,包括以下步骤;获取目标用户的画像数据,并从所述画像数据中提取出所述目标用户的标签集合,所述标签集合包括多个用于标签;将所述标签集合格式化为N*M*K三维数组,其中,N轴表示标签,M轴表示用户,K轴表示时间;获取所述标签集合内的每一所述标签的数据类型确定所述三维数组的每一维度的数据类型,从而得到所述三维数组的类型特征;根据所述类型特征对所述目标用户的用户数据进行数据清洗。本申请可以提高数据清洗效率。

Description

自动清洗数据的方法、装置、电子设备及存储介质
技术领域
本申请涉及计算机网络技术领域,具体而言,涉及一种自动清洗数据的方法、装置、电子设备及存储介质。
背景技术
不同的公司或组织,基于不同的业务场景,其对用户画像是不同的。用户画像的核心本质就是用户的标签集合。根据标签的数据表现及标签的性质,对标签进行集中分类,并总结出每个标签分类下,可通用的数据清洗方式。最后由程序实现自动数据清洗方法。
针对上述问题,目前尚未有有效的技术解决方案。
发明内容
本申请实施例的目的在于提供一种自动清洗数据的方法、装置、电子设备及存储介质,可以提高数据清洗效率。
第一方面,本申请实施例提供了一种自动清洗数据的方法,包括以下步骤;
获取目标用户的画像数据,并从所述画像数据中提取出所述目标用户的标签集合,所述标签集合包括多个用于标签;
将所述标签集合格式化为N*M*K三维数组,其中,N轴表示标签,M轴表示用户,K轴表示时间;
获取所述标签集合内的每一所述标签的数据类型确定所述三维数组的每一维度的数据类型,从而得到所述三维数组的类型特征;
根据所述类型特征对所述目标用户的用户数据进行数据清洗。
可选地,在本申请实施例所述的自动清洗数据的方法中,所述根据所述类型特征对所述目标用户的用户数据进行数据清洗的步骤包括:
根据所述三维数组的类型特征获取所述用户数据的离散打散方式;
根据所述离散打散方式对所述目标用户的用户数据进行数据清洗。
可选地,在本申请实施例所述的自动清洗数据的方法中,所述多个标签包括静态标签、动态标签、分类标签、连续型标签、文本标签以及数值型标签。
可选地,在本申请实施例所述的自动清洗数据的方法中,所述静态标签包括以下标签中的至少一种或多种:性别、民族、学历、职业。
可选地,在本申请实施例所述的自动清洗数据的方法中,所述动态标签包括以下标签中的至少一种或多种:主资费套餐、可选套餐、体重。
可选地,在本申请实施例所述的自动清洗数据的方法中,所述分类标签包括以下标签中的至少一种或多种:性别、民族、是否已婚。
可选地,在本申请实施例所述的自动清洗数据的方法中,所述连续型标签包括以下标签中的至少一种或多种:月消费、日消费、周消费。
第二方面,本申请实施例还提供了一种自动清洗数据的装置,包括:
第一获取模块,用于获取目标用户的画像数据,并从所述画像数据中提取出所述目标用户的标签集合,所述标签集合包括多个用于标签;
格式化模块,用于将所述标签集合格式化为N*M*K三维数组,其中,N轴表示标签,M轴表示用户,K轴表示时间;
第二获取模块,用于获取所述标签集合内的每一所述标签的数据类型确定所述三维数组的每一维度的数据类型,从而得到所述三维数组的类型特征;
清洗模块,用于根据所述类型特征对所述目标用户的用户数据进行数据清洗。
第三方面,本申请实施例提供一种电子设备,包括处理器以及存储器,所述存储器存储有计算机可读取指令,当所述计算机可读取指令由所述处理器执行时,运行如上述第一方面提供的所述方法中的步骤。
第四方面,本申请实施例提供一种存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时运行如上述第一方面提供的所述方法中的步骤。
由上可知,本申请实施例通过获取目标用户的画像数据,并从所述画像数据中提取出所述目标用户的标签集合,所述标签集合包括多个用于标签;将所述标签集合格式化为N*M*K三维数组,其中,N轴表示标签,M轴表示用户,K轴表示时间;获取所述标签集合内的每一所述标签的数据类型确定所述三维数组的每一维度的数据类型,从而得到所述三维数组的类型特征;根据所述类型特征对所述目标用户的用户数据进行数据清洗;从而实现对数据的自动清洗,可以提高处理效率;提升数据运营价值。
本申请的其他特征和优点将在随后的说明书阐述,并且,部分地从说明书中变得显而易见,或者通过实施本申请实施例了解。本申请的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对本申请实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本申请实施例提供的自动清洗数据的方法的一种流程图。
图2为本申请实施例提供的自动清洗数据的装置的一种结构示意图。
图3为本申请实施例提供的电子设备的结构示意图。
具体实施方式
下面将结合本申请实施例中附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。同时,在本申请的描述中,术语“第一”、“第二”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
请参照图1,图1是本本申请一些实施例中的自动清洗数据的方法的流程图。该自动清洗数据的方法,包括以下步骤;
S101、获取目标用户的画像数据,并从所述画像数据中提取出所述目标用户的标签集合,所述标签集合包括多个用于标签。
S102、将所述标签集合格式化为N*M*K三维数组,其中,N轴表示标签,M轴表示用户,K轴表示时间。
S103、获取所述标签集合内的每一所述标签的数据类型确定所述三维数组的每一维度的数据类型,从而得到所述三维数组的类型特征。
S104、根据所述类型特征对所述目标用户的用户数据进行数据清洗。
其中,在该步骤S101中,由于不同公司或者组织,基于不同的业务场景,其对用户生成的用户画像是不相同的,用户画像的核心本质就是用户的标签集合,因此,在该步骤S101中,就是将目标用户的画像数据中的各个标签提取出来生成一个该目标用户的标签集合。
其中,在该步骤S102中,当然,可以理解地,也可以根据标签的类型数量将其格式化为其他多维数组。
其中,在该步骤S103中,通过工具化的手段,根据标签的数据表现及性质对其有如下划分方式:
划分方式一:
固定N,取M*K切片,进行比较。静态标签,其对用户来说是固定的,如性别、民族;或变动相对而言并不频繁,如学历、职业等;动态标签,取值不稳定,如主资费、可选套餐等。
划分方式二:
固定N和K,取M切片,进行比较。分类型标签,如性别、民族、是否已婚。连续型标签-,也即是连续数值类型,如月消费、日消费、周消费等。
划分方式三:
固定M和K,取N,取数据类型。文本型标签,例如,姓名、家庭住址等,数值型标,例如,月消费、主叫电话数量、体重、身高等。
其中,在该步骤S103中,例如,对于N*M*K三维数组来说,其可以包括以下几种类型:
静态标签-分类标签-文本标签,对应为无序分类变量的离散化。
静态标签-分类标签-数值标签,对应为有序分类变量的离散化。
静态标签-连续标签-文本标签,对应为不存在的数据表现形式。
静态标签-连续标签-数值标签,对应为连续变量的离散化。
动态标签-分类标签-文本标签,对应为对应为无序分类变量的离散化。
动态标签-分类标签-数值标签,对应为有序分类变量的离散化。标签-分类标签-数值标签,对应为有序分类变量的离散化。
动态标签-连续标签-文本标签,对应为不存在的数据表现形式。
动态标签-连续标签-数值标签,对应为连续变量的离散化。
其中,在该步骤S104中,由于不同类型特征的三维数组具有不同的离散打散方式,因此,而对于不同的离散打散方式可以采用不同的数据清洗方法。因此,该步骤S104包括:根据所述三维数组的类型特征获取所述用户数据的离散打散方式;根据所述离散打散方式对所述目标用户的用户数据进行数据清洗。
由上可知,本申请实施例通过获取目标用户的画像数据,并从所述画像数据中提取出所述目标用户的标签集合,所述标签集合包括多个用于标签;将所述标签集合格式化为N*M*K三维数组,其中,N轴表示标签,M轴表示用户,K轴表示时间;获取所述标签集合内的每一所述标签的数据类型确定所述三维数组的每一维度的数据类型,从而得到所述三维数组的类型特征;根据所述类型特征对所述目标用户的用户数据进行数据清洗;从而实现对数据的自动清洗,可以提高处理效率;提升数据运营价值。
请参照图2,图2是本申请一些实施例中的一种自动清洗数据的装置的结构示意图,自动清洗数据的装置,包括:第一获取模块201、格式化模块202、第二获取模块203以及清洗模块204。
其中,该第一获取模块201用于获取目标用户的画像数据,并从所述画像数据中提取出所述目标用户的标签集合,所述标签集合包括多个用于标签;由于不同公司或者组织,基于不同的业务场景,其对用户生成的用户画像是不相同的,用户画像的核心本质就是用户的标签集合,因此,在第一获取模块201就是将目标用户的画像数据中的各个标签提取出来生成一个该目标用户的标签集合。
其中,该格式化模块202用于将所述标签集合格式化为N*M*K三维数组,其中,N轴表示标签,M轴表示用户,K轴表示时间;当然,可以理解地,也可以根据标签的类型数量将其格式化为其他多维数组。
其中,该第二获取模块203用于获取所述标签集合内的每一所述标签的数据类型确定所述三维数组的每一维度的数据类型,从而得到所述三维数组的类型特征;通过工具化的手段,根据标签的数据表现及性质对其有如下划分方式:
划分方式一:
固定N,取M*K切片,进行比较。静态标签,其对用户来说是固定的,如性别、民族;或变动相对而言并不频繁,如学历、职业等;动态标签,取值不稳定,如主资费、可选套餐等。
划分方式二:
固定N和K,取M切片,进行比较。分类型标签,如性别、民族、是否已婚。连续型标签-,也即是连续数值类型,如月消费、日消费、周消费等。
划分方式三:
固定M和K,取N,取数据类型。文本型标签,例如,姓名、家庭住址等,数值型标,例如,月消费、主叫电话数量、体重、身高等。
其中,在该步骤S103中,例如,对于N*M*K三维数组来说,其可以包括以下几种类型:
静态标签-分类标签-文本标签,对应为无序分类变量的离散化。
静态标签-分类标签-数值标签,对应为有序分类变量的离散化。
静态标签-连续标签-文本标签,对应为不存在的数据表现形式。
静态标签-连续标签-数值标签,对应为连续变量的离散化。
动态标签-分类标签-文本标签,对应为对应为无序分类变量的离散化。
动态标签-分类标签-数值标签,对应为有序分类变量的离散化。标签-分类标签-数值标签,对应为有序分类变量的离散化。
动态标签-连续标签-文本标签,对应为不存在的数据表现形式。
动态标签-连续标签-数值标签,对应为连续变量的离散化。
其中,该清洗模块204用于根据所述类型特征对所述目标用户的用户数据进行数据清洗。其中,该清洗模块204由于不同类型特征的三维数组具有不同的离散打散方式,因此,而对于不同的离散打散方式可以采用不同的数据清洗方法。因此,该清洗模块204用于:根据所述三维数组的类型特征获取所述用户数据的离散打散方式;根据所述离散打散方式对所述目标用户的用户数据进行数据清洗。
由上可知,本申请实施例通过获取目标用户的画像数据,并从所述画像数据中提取出所述目标用户的标签集合,所述标签集合包括多个用于标签;将所述标签集合格式化为N*M*K三维数组,其中,N轴表示标签,M轴表示用户,K轴表示时间;获取所述标签集合内的每一所述标签的数据类型确定所述三维数组的每一维度的数据类型,从而得到所述三维数组的类型特征;根据所述类型特征对所述目标用户的用户数据进行数据清洗;从而实现对数据的自动清洗,可以提高处理效率;提升数据运营价值。
请参照图3,图3为本申请实施例提供的一种电子设备的结构示意图,本申请提供一种电子设备3,包括:处理器301和存储器302,处理器301和存储器302通过通信总线303和/或其他形式的连接机构(未标出)互连并相互通讯,存储器302存储有处理器301可执行的计算机程序,当计算设备运行时,处理器401执行该计算机程序,以执行时执行上述实施例的任一可选的实现方式中的方法;从而实现以下功能:获取目标用户的画像数据,并从所述画像数据中提取出所述目标用户的标签集合,所述标签集合包括多个用于标签;将所述标签集合格式化为N*M*K三维数组,其中,N轴表示标签,M轴表示用户,K轴表示时间;获取所述标签集合内的每一所述标签的数据类型确定所述三维数组的每一维度的数据类型,从而得到所述三维数组的类型特征;根据所述类型特征对所述目标用户的用户数据进行数据清洗。
本申请实施例提供一种存储介质,所述计算机程序被处理器执行时,执行上述实施例的任一可选的实现方式中的方法。其中,存储介质可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(Static Random AccessMemory,简称SRAM),电可擦除可编程只读存储器(Electrically Erasable ProgrammableRead-Only Memory,简称EEPROM),可擦除可编程只读存储器(Erasable ProgrammableRead OnlyMemory,简称EPROM),可编程只读存储器(Programmable Red-Only Memory,简称PROM),只读存储器(Read-Only Memory,简称ROM),磁存储器,快闪存储器,磁盘或光盘。
在本申请所提供的实施例中,应该理解到,所揭露装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
另外,作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
再者,在本申请各个实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。
在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。
以上所述仅为本申请的实施例而已,并不用于限制本申请的保护范围,对于本领域的技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。

Claims (10)

1.一种自动清洗数据的方法,其特征在于,包括以下步骤;
获取目标用户的画像数据,并从所述画像数据中提取出所述目标用户的标签集合,所述标签集合包括多个用于标签;
将所述标签集合格式化为N*M*K三维数组,其中,N轴表示标签,M轴表示用户,K轴表示时间;
获取所述标签集合内的每一所述标签的数据类型确定所述三维数组的每一维度的数据类型,从而得到所述三维数组的类型特征;
根据所述类型特征对所述目标用户的用户数据进行数据清洗。
2.根据权利要求1所述的自动清洗数据的方法,其特征在于,所述根据所述类型特征对所述目标用户的用户数据进行数据清洗的步骤包括:
根据所述三维数组的类型特征获取所述用户数据的离散打散方式;
根据所述离散打散方式对所述目标用户的用户数据进行数据清洗。
3.根据权利要求1所述的自动清洗数据的方法,其特征在于,所述多个标签包括静态标签、动态标签、分类标签、连续型标签、文本标签以及数值型标签。
4.根据权利要求3所述的自动清洗数据的方法,其特征在于,所述静态标签包括以下标签中的至少一种或多种:性别、民族、学历、职业。
5.根据权利要求3所述的自动清洗数据的方法,其特征在于,所述动态标签包括以下标签中的至少一种或多种:主资费套餐、可选套餐、体重。
6.根据权利要求3所述的自动清洗数据的方法,其特征在于,所述分类标签包括以下标签中的至少一种或多种:性别、民族、是否已婚。
7.根据权利要求3所述的自动清洗数据的方法,其特征在于,所述连续型标签包括以下标签中的至少一种或多种:月消费、日消费、周消费。
8.一种自动清洗数据的装置,其特征在于,包括:
第一获取模块,用于获取目标用户的画像数据,并从所述画像数据中提取出所述目标用户的标签集合,所述标签集合包括多个用于标签;
格式化模块,用于将所述标签集合格式化为N*M*K三维数组,其中,N轴表示标签,M轴表示用户,K轴表示时间;
第二获取模块,用于获取所述标签集合内的每一所述标签的数据类型确定所述三维数组的每一维度的数据类型,从而得到所述三维数组的类型特征;
清洗模块,用于根据所述类型特征对所述目标用户的用户数据进行数据清洗。
9.一种电子设备,其特征在于,包括处理器以及存储器,所述存储器存储有计算机可读取指令,当所述计算机可读取指令由所述处理器执行时,运行如权利要求1-7任一所述方法中的步骤。
10.一种存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时运行如权利要求1-7任一所述方法中的步骤。
CN202010420540.0A 2020-05-18 2020-05-18 自动清洗数据的方法、装置、电子设备及存储介质 Active CN111597179B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010420540.0A CN111597179B (zh) 2020-05-18 2020-05-18 自动清洗数据的方法、装置、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010420540.0A CN111597179B (zh) 2020-05-18 2020-05-18 自动清洗数据的方法、装置、电子设备及存储介质

Publications (2)

Publication Number Publication Date
CN111597179A true CN111597179A (zh) 2020-08-28
CN111597179B CN111597179B (zh) 2023-12-05

Family

ID=72192209

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010420540.0A Active CN111597179B (zh) 2020-05-18 2020-05-18 自动清洗数据的方法、装置、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN111597179B (zh)

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017092444A1 (zh) * 2015-12-02 2017-06-08 中兴通讯股份有限公司 基于Hadoop的日志数据挖掘方法及系统
WO2017181612A1 (zh) * 2016-04-18 2017-10-26 乐视控股(北京)有限公司 个性化视频推荐方法及装置
CN107908606A (zh) * 2017-10-31 2018-04-13 上海壹账通金融科技有限公司 基于不同信息源自动生成报表的方法和系统
CN107967572A (zh) * 2017-12-15 2018-04-27 华中师范大学 一种基于教育大数据的智能服务器
CN109636482A (zh) * 2018-12-21 2019-04-16 苏宁易购集团股份有限公司 基于相似度模型的数据处理方法及系统
CN109800220A (zh) * 2019-01-29 2019-05-24 浙江国贸云商企业服务有限公司 一种大数据清洗方法、系统及相关装置
US20190325642A1 (en) * 2018-04-19 2019-10-24 Soletanche Freyssinet Computer platform for pooling and viewing digital data
CN110400022A (zh) * 2019-07-31 2019-11-01 中国工商银行股份有限公司 自助柜员机现金用量预测方法及装置
US20190384849A1 (en) * 2018-06-14 2019-12-19 Accenture Global Solutions Limited Data platform for automated data extraction, transformation, and/or loading
CN110633376A (zh) * 2019-08-22 2019-12-31 北京奇艺世纪科技有限公司 一种媒体对象排序方法、装置、设备及存储介质
CN110990474A (zh) * 2019-11-28 2020-04-10 泰华智慧产业集团股份有限公司 一种区域性产业画像分析的方法及装置

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017092444A1 (zh) * 2015-12-02 2017-06-08 中兴通讯股份有限公司 基于Hadoop的日志数据挖掘方法及系统
WO2017181612A1 (zh) * 2016-04-18 2017-10-26 乐视控股(北京)有限公司 个性化视频推荐方法及装置
CN107908606A (zh) * 2017-10-31 2018-04-13 上海壹账通金融科技有限公司 基于不同信息源自动生成报表的方法和系统
CN107967572A (zh) * 2017-12-15 2018-04-27 华中师范大学 一种基于教育大数据的智能服务器
US20190325642A1 (en) * 2018-04-19 2019-10-24 Soletanche Freyssinet Computer platform for pooling and viewing digital data
US20190384849A1 (en) * 2018-06-14 2019-12-19 Accenture Global Solutions Limited Data platform for automated data extraction, transformation, and/or loading
CN109636482A (zh) * 2018-12-21 2019-04-16 苏宁易购集团股份有限公司 基于相似度模型的数据处理方法及系统
CN109800220A (zh) * 2019-01-29 2019-05-24 浙江国贸云商企业服务有限公司 一种大数据清洗方法、系统及相关装置
CN110400022A (zh) * 2019-07-31 2019-11-01 中国工商银行股份有限公司 自助柜员机现金用量预测方法及装置
CN110633376A (zh) * 2019-08-22 2019-12-31 北京奇艺世纪科技有限公司 一种媒体对象排序方法、装置、设备及存储介质
CN110990474A (zh) * 2019-11-28 2020-04-10 泰华智慧产业集团股份有限公司 一种区域性产业画像分析的方法及装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
刘彪;刘金长;: "基于用户画像分析预测电费敏感型客户的建模实践", no. 08 *

Also Published As

Publication number Publication date
CN111597179B (zh) 2023-12-05

Similar Documents

Publication Publication Date Title
CN107844634A (zh) 多元通用模型平台建模方法、电子设备及计算机可读存储介质
CN109918678B (zh) 一种字段含义识别方法和装置
CN108009216A (zh) 目标对象的处理方法、装置和系统、存储介质、处理器
US20070156977A1 (en) Automatic location data determination in an electronic document
CN102315955A (zh) 一种为垃圾信息设置障碍的控制方法以及相应的控制装置
CN113343109A (zh) 榜单推荐方法、计算设备及计算机存储介质
CN113205130A (zh) 一种数据审核方法、装置、电子设备及存储介质
CN113505273A (zh) 基于重复数据筛选的数据排序方法、装置、设备及介质
CN111444368A (zh) 构建用户画像的方法、装置、计算机设备及存储介质
CN111597179A (zh) 自动清洗数据的方法、装置、电子设备及存储介质
CN110990692A (zh) 基于画像分析的数据处理方法及装置
CN111352917A (zh) 信息录入方法、装置、电子设备及存储介质
CN114722789A (zh) 数据报表集成方法、装置、电子设备及存储介质
CN114693435A (zh) 催收名单的智能回访的方法、装置、电子设备及存储介质
CN113987206A (zh) 异常用户的识别方法、装置、设备及存储介质
CN114022184A (zh) 数据管理方法、装置、电子设备及存储介质
CN111680516A (zh) Pdm系统产品设计需求信息语义分析提取方法及系统
CN111585870A (zh) 一种邮件发送方法及相关设备
CN109885710A (zh) 基于差分演化算法的用户画像刻画方法及服务器
CN115718825B (zh) 一种时长标签的确定方法、装置及电子设备
CN112819511B (zh) 对象执行策略的关系展示方法、装置及电子设备
CN115392206B (zh) 基于wps/excel快速查询数据方法、装置、设备及存储介质
CN115392887B (zh) 自然资源一体化平台构建方法、装置
CN113076317B (zh) 基于大数据的数据处理方法、装置、设备及可读存储介质
CN116757525A (zh) 基于数据画像的电网数据质量智能修正方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant