CN117951196A - 名单数据筛选方法、装置、电子用户及存储介质 - Google Patents

名单数据筛选方法、装置、电子用户及存储介质 Download PDF

Info

Publication number
CN117951196A
CN117951196A CN202410075047.8A CN202410075047A CN117951196A CN 117951196 A CN117951196 A CN 117951196A CN 202410075047 A CN202410075047 A CN 202410075047A CN 117951196 A CN117951196 A CN 117951196A
Authority
CN
China
Prior art keywords
user
database
users
forbidden
label
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202410075047.8A
Other languages
English (en)
Inventor
汪克丰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Lexin Software Technology Co Ltd
Original Assignee
Shenzhen Lexin Software Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Lexin Software Technology Co Ltd filed Critical Shenzhen Lexin Software Technology Co Ltd
Priority to CN202410075047.8A priority Critical patent/CN117951196A/zh
Publication of CN117951196A publication Critical patent/CN117951196A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/23Updating

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Fuzzy Systems (AREA)
  • Mathematical Physics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Software Systems (AREA)
  • Computational Linguistics (AREA)
  • Storage Device Security (AREA)

Abstract

本发明涉及数据处理领域,揭露一种名单数据筛选方法,包括:筛选标注有第一类别标签的用户生成第一禁止投放用户群并存储至初始禁止投放数据库;实时监控基础数据库中的用户状态,将监控得到的由第二类别标签转为第一类别标签的用户存储至动态更新数据库;从动态更新数据库中筛选出标注有第一类别标签的多个用户,生成第二禁止投放用户群,计算第二禁止投放用户群与第一禁止投放用户群之间数量的差集,得到目标禁止投放数据库;根据待投放用户表查询目标禁止投放数据库,从目标禁止投放数据库中识别出具有相同身份标识的标注有第一类别标签的用户,在待投放用户表中删除具有相同身份标识的用户,以确保待投放用户表的数据精准定位到目标用户群。

Description

名单数据筛选方法、装置、电子用户及存储介质
技术领域
本发明涉及数据处理领域,尤其涉及一种名单数据筛选方法、装置、电子用户及存储介质。
背景技术
在广告投放领域,短信获客是比较重要的获客方式之一。客户端(短信合作方)接收到企业发送的落地页链接后,客户端从内部数据中筛选出其认为符合落地页链接条件的用户生成投放用户表,将落地页链接制作成营销短信并发送给投放用户表的所有用户。
然而,客户端根据内部数据生成的投放用户表,往往会脱离企业的实际业务需求和落地页链接的导购意向,导致投放用户表可能包含大量的高风险用户或已转化用户,从而造成落地页链接投放到精准用户群的准确率较低。
因此,如何准确地、高效地将落地页链接投放到目标精准用户群,是一个亟待解决的问题。
发明内容
鉴于以上内容,有必要提供一种名单数据筛选方法,其目的是能够准确地对待投放用户表的数据执行有效筛选,以确保待投放用户表的数据精准定位到目标用户群。
本发明提供的名单数据筛选方法,包括:
根据用户的属性信息对基础数据库的所有用户标注第一类别标签或第二类别标签,筛选标注有第一类别标签的多个用户生成第一禁止投放用户群并存储至初始禁止投放数据库,所述第一类别标签包括已转化标签和/或高风险标签,所述第二类别标签包括未转化标签和/或低风险标签;
实时监控所述基础数据库中的所有用户的状态,是否由第二类别标签转为第一类别标签,若是,将监控得到的由第二类别标签转为第一类别标签的用户存储至动态更新数据库;
每隔预设时间,从所述动态更新数据库中筛选出标注有第一类别标签的多个用户,生成第二禁止投放用户群,计算所述第二禁止投放用户群与所述第一禁止投放用户群之间数量的差集,得到第三禁止投放用户群,将所述第三禁止投放用户群存储至所述初始禁止投放数据库,得到目标禁止投放数据库;
接收客户端发送的待投放用户表,根据所述待投放用户表的各个用户的身份标识查询所述目标禁止投放数据库,从所述目标禁止投放数据库中识别出具有相同身份标识的标注有第一类别标签的用户,在所述待投放用户表中删除所述具有相同身份标识的用户,生成目标投放用户表并反馈至所述客户端。
可选的,所述根据用户的属性信息对基础数据库的所有用户标注第一类别标签或第二类别标签,包括:
根据所述属性信息的消费数据或信用等级,将所有用户分类为已转化和/或高风险的第一类别用户、未转化和/或低风险的第二类别用户;
对所述第一类别用户标注第一类别标签,及对第二类别用户标注第二类别标签。
可选的,所述实时监控所述基础数据库中的所有用户的状态,是否由第二类别标签转为第一类别标签,若是,将监控得到的由第二类别标签转为第一类别标签的用户存储至动态更新数据库,包括:
监控所述基础数据库的日志文件,从所述日志文件中识别出由第二类别标签转为第一类别标签的用户并存储至动态更新数据库。
可选的,所述实时监控所述基础数据库中的所有用户的状态,是否由第二类别标签转为第一类别标签,若是,将监控得到的由第二类别标签转为第一类别标签的用户存储至动态更新数据库,包括:
在所述基础数据库中设置触发器,当监控到由第二类别标签转为第一类别标签的用户时,利用所述触发器将监控得到的由第二类别标签转为第一类别标签的用户存储至动态更新数据库。
可选的,所述计算所述第二禁止投放用户群与所述第一禁止投放用户群之间数量的差集,得到第三禁止投放用户群,包括:
获取所述用户第二禁止投放用户群的各个用户的身份标识,及获取所述第一禁止投放用户群的各个用户的身份标识;
筛选出存在于所述用户第二禁止投放用户群但不存在于所述第一禁止投放用户群的身份标识,得到所述第三禁止投放用户群。
可选的,在所述接收客户端发送的待投放用户表之前,所述方法还包括:
获取所述客户端的身份标识,根据所述身份标识生成所述客户端与所述目标禁止投放数据库之间的密钥对;
将所述密钥对的公钥发送至所述客户端,以使所述客户端利用所述公钥对所述待投放用户表进行加签。
可选的,所述根据所述待投放用户表的各个用户的身份标识查询所述目标禁止投放数据库,从所述目标禁止投放数据库中识别出具有相同身份标识的标注有第一类别标签的用户,包括:
将所述身份标识输入所述目标禁止投放数据库的规则引擎,生成检索语句;
执行所述检索语句,从所述目标禁止投放数据库中识别出具有相同身份标识的标注有第一类别标签的用户。
为了解决上述问题,本发明还提供一种名单数据筛选装置,所述装置包括:
筛选模块,用于根据用户的属性信息对基础数据库的所有用户标注第一类别标签或第二类别标签,筛选标注有第一类别标签的多个用户生成第一禁止投放用户群并存储至初始禁止投放数据库,所述第一类别标签包括已转化标签和/或高风险标签,所述第二类别标签包括未转化标签和/或低风险标签;
监控模块,用于实时监控所述基础数据库中的所有用户的状态,是否由第二类别标签转为第一类别标签,若是,将监控得到的由第二类别标签转为第一类别标签的用户存储至动态更新数据库;
计算模块,用于每隔预设时间,从所述动态更新数据库中筛选出标注有第一类别标签的多个用户,生成第二禁止投放用户群,计算所述第二禁止投放用户群与所述第一禁止投放用户群之间数量的差集,得到第三禁止投放用户群,将所述第三禁止投放用户群存储至所述初始禁止投放数据库,得到目标禁止投放数据库;
反馈模块,用于接收客户端发送的待投放用户表,根据所述待投放用户表的各个用户的身份标识查询所述目标禁止投放数据库,从所述目标禁止投放数据库中识别出具有相同身份标识的标注有第一类别标签的用户,在所述待投放用户表中删除所述具有相同身份标识的用户,生成目标投放用户表并反馈至所述客户端。
为了解决上述问题,本发明还提供一种电子用户,所述电子用户包括:
至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的名单数据筛选程序,所述名单数据筛选程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行上述名单数据筛选方法。
为了解决上述问题,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有名单数据筛选程序,所述名单数据筛选程序可被一个或者多个处理器执行,以实现上述名单数据筛选方法。
相较现有技术,本发明对基础数据库、动态更新数据库和目标禁止投放数据库之间的数据量进行逐级筛选,将基础数据库作为企业核心数据库且不对外开放,确保基础数据库的敏感数据不会发生泄露的安全事件,将动态更新数据库作为共享数据库,其只存储新增的状态发生变化的用户,将动态更新数据库中新增的已转化用户、高风险用户存储至目标禁止投放数据库,减少了查询的数据量和提高了数据查询的效率,同时确保目标禁止投放数据库的数据的实时性和一致性。
将新增的第一类别标签的用户实时更新到目标禁止投放数据库,利用目标禁止投放数据库筛选出待投放用户表的已转化用户或高风险用户的数据,以确保目标投放用户表的数据精准定位到目标用户群。
附图说明
图1为本发明一实施例提供的名单数据筛选方法的流程示意图;
图2为本发明一实施例提供的名单数据筛选方法的流程示意图;
图3为本发明一实施例提供的名单数据筛选装置的模块示意图;
图4为本发明一实施例提供的实现名单数据筛选方法的电子用户的结构示意图;
本发明目的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
需要说明的是,在本发明中涉及“第一”、“第二”等的描述仅用于描述目的,而不能理解为指示或暗示其相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。另外,各个实施例之间的技术方案可以相互结合,但是必须是以本领域普通技术人员能够实现为基础,当技术方案的结合出现相互矛盾或无法实现时应当认为这种技术方案的结合不存在,也不在本发明要求的保护范围之内。
图1和图2所示,为本发明一实施例提供的名单数据筛选方法的流程示意图。该方法由电子用户执行。
本实施例中,名单数据筛选方法包括:
S1、根据用户的属性信息对基础数据库的所有用户标注第一类别标签或第二类别标签,筛选标注有第一类别标签的多个用户生成第一禁止投放用户群并存储至初始禁止投放数据库,所述第一类别标签包括已转化标签和/或高风险标签,所述第二类别标签包括未转化标签和/或低风险标签。
在本实施例中,基础数据库是指一个存储系统内的所有用户的属性信息的原始数据库。
初始禁止投放数据库是指基础数据库的子数据库,且初始禁止投放数据库只与客户端开放对接。
用户的属性信息包括消费数据、信用等级,其它实施例中,用户的属性信息还包括用户性别、职业、兴趣、注册时间、手机号码等信息
当用户使用移动设备(例如手机、平板和电脑)登录企业的应用程序时,获取用户的身份标识(例如身份标识包括移动设备MD5号码、IMEIMD5、OAIDMD5、用户的身份号码等),还获取用户的属性信息,将用户的身份标识、属性发信息存储至基础数据库中。
对基础数据库的所有用户进行分类,得到第一类别用户和第二类别用户,对第一类别用户标注第一类别标签,及对第二类别用户标注第二类别标签,筛选标注有第一类别标签的多个用户生成第一禁止投放用户群并存储至初始禁止投放数据库。
在一个实施例中,所述根据用户的属性信息对基础数据库的所有用户标注第一类别标签或第二类别标签,包括:
根据所述属性信息的消费数据或信用等级,将所有用户分类为已转化和/或高风险的第一类别用户、未转化和/或低风险的第二类别用户;
对所述第一类别用户标注第一类别标签,及对第二类别用户标注第二类别标签。
企业根据业务需求定义第一类别标签和第二类别标签的含义和适用条件。例如,根据用户的性别、年龄、职业、在企业的应用程序中未转化、已转化、未注册、已注册、注册超过30天、注册超过90天、近90天授信失败、近180天授信失败等信息,定义第一类别标签和第二类别标签的含义和适用条件。
第一类别标签包括已转化标签和/或高风险标签,已转化标签是指一个已经完成了企业某个关键的商业目标的用户,例如:用户M在企业中已经购买了产品或服务,那么用户M被标记为已转化标签。
在其它实施例中,第一类别标签还可以为其它标签,在此并不限定。
高风险标签用于标识某个用户具有较高风险级别的标记。例如。将年龄标签又划分为高风险标签(18-23岁)、中风险标签(24-30岁)等,将职业标签又划分低风险标签、中风险标签、高风险标签,还可以将近90天授信失败标签、近180天授信失败标签定义为高风险标签等,至于具体的高风险标签根据业务需求来定义,在此并不作限定。
根据上述的定义标签对基础数据库内的所有用户进行分类和标注标签。
在定义第一类别标签为已转化标签和/或高风险标签时,通过程序语言将已转化标签和/或高风险标签写入到标签筛选规则的检索语句,检索语句用于检索出基础数据库中具有上述标签的用户进行归类的程序。
例如,根据预设的业务决策生成的标签筛选规则B为(男性别标签、高风险标签和未注册标签)并设定其筛选出来的用户为第一类别标签的用户,利用标签筛选规则B对基础数据库进行筛选,将多个包含上述标签对应的用户筛选出来作为第一类别标签的用户。
标签筛选规则是指企业按照业务需求,编写对用户进行分类的规则。
在步骤S1中,从基础数据库中筛选出的用户进行收集形成一个新的、统一的第一禁止投放用户群存储至初始禁止投放数据库,由于基础数据库不对外开放,因此,初始禁止投放数据库作为基础数据库的子数据库与客户端开放对接,可以确保基础数据库的用户信息等敏感数据的安全存储。
S2、实时监控所述基础数据库中的所有用户的状态,是否由第二类别标签转为第一类别标签,若是,将监控得到的由第二类别标签转为第一类别标签的用户存储至动态更新数据库。
在本实施例中,由于基础数据库中的用户数量和用户的状态一直处于动态变化,在预设的时间段内(例如1或2小时),定时获取状态发生变化的用户存储至动态更新数据库。
也就是说,通过追踪用户的状态是否发生变化,是关系到目标投放用户表的落地页链接能否精准定位到目标用户群的重要环节之一,因此要实时监控基础数据库中所有用户的状态。
动态更新数据库是一种用于存储和管理用户的状态发生变化的数据库。与基础数据库相比,动态更新数据库只记录自上次更新以来发生变化的用户,而不是存储所有历史数据。通过动态更新数据库可以显著减少存储空间的需求和查询速度更快。
例如,基础数据库中的用户D的注册状态变化由否转是、用户E的授信状态由否转是、用户F的职业信息由无转为有、及还有新增加注册用户的相关信息等等,说明了基础数据库中的信息一直处于动态变化,为了确保目标禁止投放数据库的数据的实时性和后续的落地页链接能够投放到精准用户群,设定好每隔1小时,定时获取状态发生变化的用户存储至动态更新数据库。
在一个实施例中,所述实时监控所述基础数据库中的所有用户的状态,是否由第二类别标签转为第一类别标签,若是,将监控得到的由第二类别标签转为第一类别标签的用户存储至动态更新数据库,包括:
监控所述基础数据库的日志文件,从所述日志文件中识别出由第二类别标签转为第一类别标签的用户并存储至动态更新数据库。
通过基础数据库的日志收集模块监听所有用户的状态发生变化,将状态发生变化的用户记录到日志文件中,对日志文件的内容执行预设处理,预设处理包括分割日志行、识别日志格式、提取关键字段等步骤,得到状态发生变化的用户并存储至动态更新数据库。
通过实时监控基础数据库的日志文件,从日志文件中识别出状态发生变化的用户,并将状态发生变化的用户存储至动态更新数据库,能够有助于保持数据的实时性和准确性,以便后续的名单数据筛选和分析。
在一个实施例中,所述实时监控所述基础数据库中的所有用户的状态,是否由第二类别标签转为第一类别标签,若是,将监控得到的由第二类别标签转为第一类别标签的用户存储至动态更新数据库,包括:
在所述基础数据库中设置触发器,当监控到由第二类别标签转为第一类别标签的用户时,利用所述触发器将监控得到的由第二类别标签转为第一类别标签的用户存储至动态更新数据库。
为基础数据库中每个用户创建一个触发器,将触发器与用户的状态进行关联,当用户发生状态变化时,利用触发器自动执行预定义的操作(例如,预定义的操作为向动态更新数据库插入一条新的记录),以将状态发生变化的用户存储至动态更新数据库
通过在基础数据库中设置触发器的步骤可以替代上述步骤获取日志文件的方式,当用户的状态发生变化时,利用触发器自动执行预定义的操作,将状态发生变化的用户存储至动态更新数据库,能够有助于保持数据的实时性和准确性,以便后续的名单数据筛选和分析。
在一个实施例中,在所述将监控得到的由第二类别标签转为第一类别标签的用户存储至动态更新数据库之后,所述方法还包括:
定期从所述基础数据库获取状态发生变化的用户,与所述动态更新数据库中记录的用户进行比对,找出差异数据;
利用所述差异数据更新所述动态更新数据库。
设置一个定时任务(例如,24小时),周期性地从基础数据库中查询用户的状态,通过比较上次查询结果和当前查询结果,找出状态发生变化的用户,将其与动态更新数据库中的记录进行对比,在比对过程中,找出动态更新数据库中存在的用户状态与基础数据库中的最新状态之间的差异数据。这些差异数据就是动态更新数据库需要更新的数据。
根据差异数据,执行相应的数据库操作。例如对于需要更新的记录,执行UPDATE操作;对于需要插入的新记录,执行INSERT操作。
定期(例如,24小时)从基础数据库获取状态发生变化的用户,与动态更新数据库中记录的用户进行比对,找出差异数据,并利用差异数据更新动态更新数据库中的用户状态,相当于对动态更新数据库进行全面性比对。
而之前每次获取基础数据库中状态发生变化的用户存储至动态更新数据库,其只是在较短的时间段内(例如1或2小时)的比对,通过多次较短时间段的比对和全面性比对相结合,能够保证数据一致性、提高数据实时性、支持数据分析和决策等方面都具有重要作用。
S3、每隔预设时间,从所述动态更新数据库中筛选出标注有第一类别标签的多个用户,生成第二禁止投放用户群,计算所述第二禁止投放用户群与所述第一禁止投放用户群之间数量的差集,得到第三禁止投放用户群,将所述第三禁止投放用户群存储至所述初始禁止投放数据库,得到目标禁止投放数据库。
在本实施例中,动态更新数据库的作用是帮助系统更有效地管理和使用数据,特别是管理那些状态经常发生变化的用户。通过在基础数据库与目标禁止投放数据库之间建立动态更新数据库,能够有助于降低存储成本,提高查询性能,并为各种应用程序提供支持。
每隔预设时间可以是固定的(如每小时、每天等),也可以根据数据更新频率和处理能力进行调整,利用标签筛选规则查询动态更新数据库,将筛选出来的标注有第一类别标签的用户组成用户第二禁止投放用户群。用户第二禁止投放用户群是一个动态更新的数据集,每次筛选后都会包含最新的符合第一类别标签的用户。
动态更新数据库只存储状态发生变化的用户,以利用标签筛选规则查询动态更新数据库时,能够缩小查询范围和提高查询的效率。
本发明的创新之一是将基础数据库新增的状态发生变化的用户存储至动态更新数据库,再利用编写好的标签筛选规则从动态更新数据库中将已转化用户和高风险用户筛选出来,得到用户第二禁止投放用户群,通过计算所述用户第二禁止投放用户群与所述第一禁止投放用户群之间数量的差集,能够将新增的已转化用户和高风险用户存储至目标禁止投放数据库中,确保目标禁止投放数据库的数据的实时性和减少目标禁止投放数据库的数据冗余。
同时通过基础数据库、动态更新数据库和目标禁止投放数据库之间的数据量进行逐级筛选,减少了无效数据,确保了目标禁止投放数据库中的已转化用户和高风险用户的实时性和准确性。
独立的基础数据库、动态更新数据库和目标禁止投放数据库,提高了系统的可扩展性和灵活性。例如,将基础数据库作为存储所有用户、用户信息及状态的原始数据库,将动态更新数据库作为一个共享数据库,根据不同的业务需求利用动态更新数据库的共享特性建立不同的实时数据,实现了系统的可扩展性和灵活性。
在一个实施例中,所述计算所述第二禁止投放用户群与所述第一禁止投放用户群之间数量的差集,得到第三禁止投放用户群,包括:
获取所述用户第二禁止投放用户群的各个用户的身份标识,及获取所述第一禁止投放用户群的各个用户的身份标识;
筛选出存在于所述用户第二禁止投放用户群但不存在于所述第一禁止投放用户群的身份标识,得到所述第三禁止投放用户群。
身份标识包括用户使用的移动设备MD5号码、IMEIMD5、OAIDMD5、用户的身份号码等。
用户第二禁止投放用户群与第一禁止投放用户群包含有用户的身份标识,读取用户第二禁止投放用户群与第一禁止投放用户群的各个用户的身份标识存储在一个身份标识集合中,从身份标识集合中筛选出在用户第二禁止投放用户群中存在的与第一禁止投放用户群中不存在的用户的身份标识,得到差集。通过差集快速找出新增的已转化用户和高风险用户,为目标禁止投放数据库提供准确的更新信息。
根据差集的数据对目标禁止投放数据库执行相应的更新操作。例如更新操作包括插入新的用户记录、删除不再存在的用户记录或修改现有用户记录的状态。
目标禁止投放数据库在本发明中成为了一个关键的数据源,目标禁止投放数据库包含了最新的已转化用户和高风险用户的信息,将目标禁止投放数据库中的用户数据转换为图表、构建实时报警系统或地图等形式,便于直观地查看和理解数据,其使得企业能够更好地理解和利用用户数据,提高运营效率和服务质量。
S4、接收客户端发送的待投放用户表,根据所述待投放用户表的各个用户的身份标识查询所述目标禁止投放数据库,从所述目标禁止投放数据库中识别出具有相同身份标识的标注有第一类别标签的用户,在所述待投放用户表中删除所述具有相同身份标识的用户,生成目标投放用户表并反馈至所述客户端。
在本实施例中,客户端是指与企业合作,提供短信发送服务的供应商。例如,客户端为短信合作方。客户端拥有大量的手机用户资源和运营商关系,能够帮助企业将营销信息、验证码、通知等通过短信形式发送到目标用户的移动设备上。
在一个实施例中,在所述接收客户端发送的待投放用户表之前,所述方法还包括:
获取所述客户端的身份标识,根据所述身份标识生成所述客户端与所述目标禁止投放数据库之间的密钥对;
将所述密钥对的公钥发送至所述客户端,以使所述客户端利用所述公钥对所述待投放用户表进行加签。
在一个实施例中,在所述接收客户端发送的待投放用户表之后,所述方法还包括:
利用所述密钥对的私钥对所述待投放用户表进行解密,得到解密后的待投放用户表。
企业为每个客户端开通数据传输的专属通道,及为每个客户端开发专属的密钥对,通过专属通道将定制的落地页链接和密钥对的公钥发送给客户端,客户端根据落地页链接的主题和内容,从客户端的数据库筛选出符合落地页链接的多个用户,将多个用户的信息存储在至空白表格中,生成待投放用户表,待投放用户表还包括落地页链接的编号、合作方请求标识和企业端的身份标识。
客户端利用公钥对发送给目标禁止投放数据库的请求进行加签,将加签的请求通过专属通道发送给企业。
为了避免混淆不同合作方的数据,获取客户端唯一的身份标识,根据客户端的身份标识,利用随机数生成器和加密算法(如RSA、DSA等)生成一对密钥对,将密钥对的私钥存储在目标禁止投放数据库的服务器上,将密钥对的公钥通过专属通道发送至客户端,以使客户端利用公钥对发送给目标禁止投放数据库的请求进行加签。
通过生成客户端的身份标识生成客户端与目标禁止投放数据库之间的密钥对,确保双方数据的完整性和安全性,防止中间人攻击和数据篡改。
在一个实施例中,在所述接收客户端发送的待投放用户表之前,所述方法还包括:
获取所述目标禁止投放数据库的接口信息,根据所述接口信息设置所述客户端与所述目标禁止投放数据库之间的专属通道。
获取目标禁止投放数据库的接口信息,接口信息包括接口名称、请求方法、URL、参数列表、返回格式等。根据预设的通信协议(例如HTTP、HTTPS、FTP等)和数据格式(例如JSON、XML、CSV等),设置一个专用模块处理客户端与目标禁止投放数据库之间的通信连接,同时还将专用模块设置在客户端的系统中,从而生成客户端与目标禁止投放数据库之间的专属通道。
在客户端与目标禁止投放数据库之间建立专属通道。能够有助于在两个系统之间高效、安全地传递数据,支持后续的数据分析和业务决策。
在一个实施例中,所述根据所述待投放用户表的各个用户的身份标识查询所述目标禁止投放数据库,从所述目标禁止投放数据库中识别出具有相同身份标识的标注有第一类别标签的用户,包括:
将所述身份标识输入所述目标禁止投放数据库的规则引擎,生成检索语句;
执行所述检索语句,从所述目标禁止投放数据库中识别出具有相同身份标识的标注有第一类别标签的用户。
为了有效地控制目标禁止投放数据库的负载和成本,根据预先设定的检验规则对待投放用户表的日请求量、接口QPS进行校验,例如预先设定的检验规则为日请求量为10万,接口QPS为目标禁止投放数据库接口(API)每秒能够处理的查询请求的数量(1万)。
若校验符合预先设定的检验规则,则获取待投放用户表的每个用户信息的身份标识,将检索索引输入目标禁止投放数据库的规则引擎(例如,Aviator)生成检索语句,检索语句包括SELECT、FROM和WHERE子句。其中,SELECT子句指定要检索的字段,FROM子句指定要在目标禁止投放数据库哪个表中进行检索,而WHERE子句则使用身份标识作为条件来筛选记录。
执行检索语句,从目标禁止投放数据库中识别出具有相同身份标识的标注有第一类别标签的用户。也就是说,查询到待投放用户表具有标注有第一类别标签的用户。
例如,在检索时,若待投放用户表的任意用户信息H与目标禁止投放数据库中的用户信息命中,则返回结果值1,说明在目标禁止投放数据库找到了与待投放用户表的用户的身份标识具有相同身份标识的标注有第一类别标签的用户。
若待投放用户表的任意用户信息H与目标禁止投放数据库中的用户信息没有命中,则返回空值,说明在目标禁止投放数据库没有找到具有相同身份标识的标注有第一类别标签的用户,直至得到待投放用户表的所有用户的检索结果。
根据返回结果值为1的用户信息,对待投放用户表中相同的用户信息进行删除,得到目标投放用户表,利用密钥对的私钥对目标投放用户表进行加签,将加签后的目标投放用户表通过专属通道反馈至客户端,以使客户端根据目标投放用户表,将落地页链接制作成营销短信并发送给目标待投放用户表的所有用户。
例如,待投放用户表中的用户信息M的MD5号码为01459,将MD5号码01459作为检索索引,将检索索引输入目标禁止投放数据库的规则引擎对目标禁止投放数据库进行检索,得到返回结果值1,则说明用户信息M是目标禁止投放数据库中的已转化用户或高风险用户,将用户信息M从待投放用户表删除,得到目标待投放用户表。从而能够准确地筛选出待投放用户表的已转化用户或高风险用户的数据,以确保目标投放用户表的落地页链接精准定位到目标用户群。
如图3所示,为本发明一实施例提供的名单数据筛选装置的模块示意图。
本发明所述名单数据筛选装置100可以安装于电子用户中。根据实现的功能,所述名单数据筛选装置100可以包括筛选模块110、监控模块120、计算模块130及反馈模块140。本发明所述模块也可以称之为单元,是指一种能够被电子用户处理器所执行,并且能够完成固定功能的一系列计算机程序段,其存储在电子用户的存储器中。
在本实施例中,关于各模块/单元的功能如下:
筛选模块,用于根据用户的属性信息对基础数据库的所有用户标注第一类别标签或第二类别标签,筛选标注有第一类别标签的多个用户生成第一禁止投放用户群并存储至初始禁止投放数据库,所述第一类别标签包括已转化标签和/或高风险标签,所述第二类别标签包括未转化标签和/或低风险标签;
监控模块,用于实时监控所述基础数据库中的所有用户的状态,是否由第二类别标签转为第一类别标签,若是,将监控得到的由第二类别标签转为第一类别标签的用户存储至动态更新数据库;
计算模块,用于每隔预设时间,从所述动态更新数据库中筛选出标注有第一类别标签的多个用户,生成第二禁止投放用户群,计算所述第二禁止投放用户群与所述第一禁止投放用户群之间数量的差集,得到第三禁止投放用户群,将所述第三禁止投放用户群存储至所述初始禁止投放数据库,得到目标禁止投放数据库;
反馈模块,用于接收客户端发送的待投放用户表,根据所述待投放用户表的各个用户的身份标识查询所述目标禁止投放数据库,从所述目标禁止投放数据库中识别出具有相同身份标识的标注有第一类别标签的用户,在所述待投放用户表中删除所述具有相同身份标识的用户,生成目标投放用户表并反馈至所述客户端。
在一个实施例中,所述根据用户的属性信息对基础数据库的所有用户标注第一类别标签或第二类别标签,包括:
根据所述属性信息的消费数据或信用等级,将所有用户分类为已转化和/或高风险的第一类别用户、未转化和/或低风险的第二类别用户;
对所述第一类别用户标注第一类别标签,及对第二类别用户标注第二类别标签。
在一个实施例中,所述实时监控所述基础数据库中的所有用户的状态,是否由第二类别标签转为第一类别标签,若是,将监控得到的由第二类别标签转为第一类别标签的用户存储至动态更新数据库,包括:
监控所述基础数据库的日志文件,从所述日志文件中识别出由第二类别标签转为第一类别标签的用户并存储至动态更新数据库。
在一个实施例中,所述实时监控所述基础数据库中的所有用户的状态,是否由第二类别标签转为第一类别标签,若是,将监控得到的由第二类别标签转为第一类别标签的用户存储至动态更新数据库,包括:
在所述基础数据库中设置触发器,当监控到由第二类别标签转为第一类别标签的用户时,利用所述触发器将监控得到的由第二类别标签转为第一类别标签的用户存储至动态更新数据库。
在一个实施例中,所述计算所述第二禁止投放用户群与所述第一禁止投放用户群之间数量的差集,得到第三禁止投放用户群,包括:
获取所述用户第二禁止投放用户群的各个用户的身份标识,及获取所述第一禁止投放用户群的各个用户的身份标识;
筛选出存在于所述用户第二禁止投放用户群但不存在于所述第一禁止投放用户群的身份标识,得到所述第三禁止投放用户群。
在一个实施例中,在所述接收客户端发送的待投放用户表之前,所述方法还包括:
获取所述客户端的身份标识,根据所述身份标识生成所述客户端与所述目标禁止投放数据库之间的密钥对;
将所述密钥对的公钥发送至所述客户端,以使所述客户端利用所述公钥对所述待投放用户表进行加签。
在一个实施例中,所述根据所述待投放用户表的各个用户的身份标识查询所述目标禁止投放数据库,从所述目标禁止投放数据库中识别出具有相同身份标识的标注有第一类别标签的用户,包括:
将所述身份标识输入所述目标禁止投放数据库的规则引擎,生成检索语句;
执行所述检索语句,从所述目标禁止投放数据库中识别出具有相同身份标识的标注有第一类别标签的用户。
如图4所示,为本发明一实施例提供的实现名单数据筛选方法的电子用户的结构示意图。
在本实施例中,电子用户1包括,但不仅限于,可通过系统总线相互通信连接的存储器11、处理器12、网络接口13,该存储器11中存储有名单数据筛选程序10,所述名单数据筛选程序10可被所述处理器12执行。图4仅示出了具有组件11-13以及名单数据筛选程序10的电子用户1,本领域技术人员可以理解的是,图4示出的结构并不构成对电子用户1的限定,可以包括比图示更少或者更多的部件,或者组合某些部件,或者不同的部件布置。
其中,存储器11包括内存及至少一种类型的可读存储介质。内存为电子用户1的运行提供缓存;可读存储介质可为如闪存、硬盘、多媒体卡、卡型存储器(例如,SD或DX存储器等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只读存储器(PROM)、磁性存储器、磁盘、光盘等的非易失性存储介质。在一些实施例中,可读存储介质可以是电子用户1的内部存储单元;在另一些实施例中,该非易失性存储介质也可以是电子用户1的外部存储用户,例如电子用户1上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。本实施例中,存储器11的可读存储介质通常用于存储安装于电子用户1的操作系统和各类应用软件,例如存储本发明一实施例中的名单数据筛选程序10的代码等。此外,存储器11还可以用于暂时地存储已经输出或者将要输出的各类数据。
处理器12在一些实施例中可以是中央处理器(Central Processing Unit,CPU)、控制器、微控制器、微处理器、或其他数据处理芯片。该处理器12通常用于控制所述电子用户1的总体操作,例如执行与其他用户进行数据交互或者通信相关的控制和处理等。本实施例中,所述处理器12用于运行所述存储器11中存储的程序代码或者处理数据,例如运行名单数据筛选程序10等。
网络接口13可包括无线网络接口或有线网络接口,该网络接口13用于在所述电子用户1与终端(图中未画出)之间建立通信连接。
可选的,所述电子用户1还可以包括用户接口,用户接口可以包括显示器(Display)、输入单元比如键盘(Keyboard),可选的用户接口还可以包括标准的有线接口、无线接口。可选的,在一些实施例中,显示器可以是LED显示器、液晶显示器、触控式液晶显示器以及OLED(Organic Light-Emitting Diode,有机发光二极管)触摸器等。其中,显示器也可以适当的称为显示屏或显示单元,用于显示在电子用户1中处理的信息以及用于显示可视化的用户界面。
应该了解,所述实施例仅为说明之用,在专利申请范围上并不受此结构的限制。
所述电子用户1中的所述存储器11存储的名单数据筛选程序10是多个指令的组合,在所述处理器12中运行时,可以实现:
根据用户的属性信息对基础数据库的所有用户标注第一类别标签或第二类别标签,筛选标注有第一类别标签的多个用户生成第一禁止投放用户群并存储至初始禁止投放数据库,所述第一类别标签包括已转化标签和/或高风险标签,所述第二类别标签包括未转化标签和/或低风险标签;
实时监控所述基础数据库中的所有用户的状态,是否由第二类别标签转为第一类别标签,若是,将监控得到的由第二类别标签转为第一类别标签的用户存储至动态更新数据库;
每隔预设时间,从所述动态更新数据库中筛选出标注有第一类别标签的多个用户,生成第二禁止投放用户群,计算所述第二禁止投放用户群与所述第一禁止投放用户群之间数量的差集,得到第三禁止投放用户群,将所述第三禁止投放用户群存储至所述初始禁止投放数据库,得到目标禁止投放数据库;
接收客户端发送的待投放用户表,根据所述待投放用户表的各个用户的身份标识查询所述目标禁止投放数据库,从所述目标禁止投放数据库中识别出具有相同身份标识的标注有第一类别标签的用户,在所述待投放用户表中删除所述具有相同身份标识的用户,生成目标投放用户表并反馈至所述客户端。
具体地,所述处理器12对上述名单数据筛选程序10的具体实现方法可参考图1对应实施例中相关步骤的描述,在此不赘述。
进一步地,所述电子用户1集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。所述计算机可读介质可以是非易失性的,也可以是非易失性的。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)。
所述计算机可读存储介质上存储有名单数据筛选程序10,所述名单数据筛选程序10可被一个或者多个处理器执行,本发明计算机可读存储介质具体实施方式与上述名单数据筛选方法各实施例基本相同,在此不作赘述。
在本发明所提供的几个实施例中,应该理解到,所揭露的用户,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能模块的形式实现。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。
因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附关联图标记视为限制所涉及的权利要求。
此外,显然“包括”一词不排除其他单元或步骤,单数不排除复数。系统权利要求中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第二等词语用来表示名称,而并不表示任何特定的顺序。
最后应说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或等同替换,而不脱离本发明技术方案的精神和范围。

Claims (10)

1.一种名单数据筛选方法,其特征在于,所述方法包括:
根据用户的属性信息对基础数据库的所有用户标注第一类别标签或第二类别标签,筛选标注有第一类别标签的多个用户生成第一禁止投放用户群并存储至初始禁止投放数据库,所述第一类别标签包括已转化标签和/或高风险标签,所述第二类别标签包括未转化标签和/或低风险标签;
实时监控所述基础数据库中的所有用户的状态,是否由第二类别标签转为第一类别标签,若是,将监控得到的由第二类别标签转为第一类别标签的用户存储至动态更新数据库;
每隔预设时间,从所述动态更新数据库中筛选出标注有第一类别标签的多个用户,生成第二禁止投放用户群,计算所述第二禁止投放用户群与所述第一禁止投放用户群之间数量的差集,得到第三禁止投放用户群,将所述第三禁止投放用户群存储至所述初始禁止投放数据库,得到目标禁止投放数据库;
接收客户端发送的待投放用户表,根据所述待投放用户表的各个用户的身份标识查询所述目标禁止投放数据库,从所述目标禁止投放数据库中识别出具有相同身份标识的标注有第一类别标签的用户,在所述待投放用户表中删除所述具有相同身份标识的用户,生成目标投放用户表并反馈至所述客户端。
2.如权利要求1所述的名单数据筛选方法,其特征在于,所述根据用户的属性信息对基础数据库的所有用户标注第一类别标签或第二类别标签,包括:
根据所述属性信息的消费数据或信用等级,将所有用户分类为已转化和/或高风险的第一类别用户、未转化和/或低风险的第二类别用户;
对所述第一类别用户标注第一类别标签,及对第二类别用户标注第二类别标签。
3.如权利要求1所述的名单数据筛选方法,其特征在于,所述实时监控所述基础数据库中的所有用户的状态,是否由第二类别标签转为第一类别标签,若是,将监控得到的由第二类别标签转为第一类别标签的用户存储至动态更新数据库,包括:
监控所述基础数据库的日志文件,从所述日志文件中识别出由第二类别标签转为第一类别标签的用户并存储至动态更新数据库。
4.如权利要求1所述的名单数据筛选方法,其特征在于,所述实时监控所述基础数据库中的所有用户的状态,是否由第二类别标签转为第一类别标签,若是,将监控得到的由第二类别标签转为第一类别标签的用户存储至动态更新数据库,包括:
在所述基础数据库中设置触发器,当监控到由第二类别标签转为第一类别标签的用户时,利用所述触发器将监控得到的由第二类别标签转为第一类别标签的用户存储至动态更新数据库。
5.如权利要求1所述的名单数据筛选方法,其特征在于,所述计算所述第二禁止投放用户群与所述第一禁止投放用户群之间数量的差集,得到第三禁止投放用户群,包括:
获取所述用户第二禁止投放用户群的各个用户的身份标识,及获取所述第一禁止投放用户群的各个用户的身份标识;
筛选出存在于所述用户第二禁止投放用户群但不存在于所述第一禁止投放用户群的身份标识,得到所述第三禁止投放用户群。
6.如权利要求1所述的名单数据筛选方法,其特征在于,在所述接收客户端发送的待投放用户表之前,所述方法还包括:
获取所述客户端的身份标识,根据所述身份标识生成所述客户端与所述目标禁止投放数据库之间的密钥对;
将所述密钥对的公钥发送至所述客户端,以使所述客户端利用所述公钥对所述待投放用户表进行加签。
7.如权利要求1所述的名单数据筛选方法,其特征在于,所述根据所述待投放用户表的各个用户的身份标识查询所述目标禁止投放数据库,从所述目标禁止投放数据库中识别出具有相同身份标识的标注有第一类别标签的用户,包括:
将所述身份标识输入所述目标禁止投放数据库的规则引擎,生成检索语句;
执行所述检索语句,从所述目标禁止投放数据库中识别出具有相同身份标识的标注有第一类别标签的用户。
8.一种名单数据筛选装置,其特征在于,所述装置包括:
筛选模块,用于根据用户的属性信息对基础数据库的所有用户标注第一类别标签或第二类别标签,筛选标注有第一类别标签的多个用户生成第一禁止投放用户群并存储至初始禁止投放数据库,所述第一类别标签包括已转化标签和/或高风险标签,所述第二类别标签包括未转化标签和/或低风险标签;
监控模块,用于实时监控所述基础数据库中的所有用户的状态,是否由第二类别标签转为第一类别标签,若是,将监控得到的由第二类别标签转为第一类别标签的用户存储至动态更新数据库;
计算模块,用于每隔预设时间,从所述动态更新数据库中筛选出标注有第一类别标签的多个用户,生成第二禁止投放用户群,计算所述第二禁止投放用户群与所述第一禁止投放用户群之间数量的差集,得到第三禁止投放用户群,将所述第三禁止投放用户群存储至所述初始禁止投放数据库,得到目标禁止投放数据库;
反馈模块,用于接收客户端发送的待投放用户表,根据所述待投放用户表的各个用户的身份标识查询所述目标禁止投放数据库,从所述目标禁止投放数据库中识别出具有相同身份标识的标注有第一类别标签的用户,在所述待投放用户表中删除所述具有相同身份标识的用户,生成目标投放用户表并反馈至所述客户端。
9.一种电子用户,其特征在于,所述电子用户包括:
至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的名单数据筛选程序,所述名单数据筛选程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行如权利要求1至7中任一项所述的名单数据筛选方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有名单数据筛选程序,所述名单数据筛选程序可被一个或者多个处理器执行,以实现如权利要求1至7任一项所述的名单数据筛选方法。
CN202410075047.8A 2024-01-18 2024-01-18 名单数据筛选方法、装置、电子用户及存储介质 Pending CN117951196A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202410075047.8A CN117951196A (zh) 2024-01-18 2024-01-18 名单数据筛选方法、装置、电子用户及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202410075047.8A CN117951196A (zh) 2024-01-18 2024-01-18 名单数据筛选方法、装置、电子用户及存储介质

Publications (1)

Publication Number Publication Date
CN117951196A true CN117951196A (zh) 2024-04-30

Family

ID=90799684

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202410075047.8A Pending CN117951196A (zh) 2024-01-18 2024-01-18 名单数据筛选方法、装置、电子用户及存储介质

Country Status (1)

Country Link
CN (1) CN117951196A (zh)

Similar Documents

Publication Publication Date Title
CN112988770B (zh) 序列号更新的方法、装置、电子设备和存储介质
WO2019085463A1 (zh) 部门需求的推荐方法、应用服务器及计算机可读存储介质
CN110895472A (zh) 一种识别业务变更的方法和装置
CN112860737B (zh) 数据查询方法、装置、电子设备及可读存储介质
CN111858486B (zh) 一种文件分类方法和装置
CN115329381A (zh) 基于敏感数据的分析预警方法、装置、计算机设备及介质
CN111881252A (zh) 工作报告处理方法、装置、计算机设备及存储介质
WO2019071899A1 (zh) 电子装置、车辆数据导入方法及存储介质
US8190559B2 (en) Document management apparatus, storage medium storing program for document management apparatus, and method for managing documents
CN111737303A (zh) 数据查询方法、装置、计算机设备及存储介质
CN115086047B (zh) 接口鉴权方法、装置、电子设备及存储介质
CN117951196A (zh) 名单数据筛选方法、装置、电子用户及存储介质
CN113434585B (zh) 资源保存方法及设备
CN114372052A (zh) 数据变更记录的存储方法和装置、计算机设备、存储介质
CN114860806A (zh) 区块链的数据查询方法、装置、计算机设备和存储介质
CN110705241B (zh) 工业标签的管理方法、系统、电子设备和存储介质
CN109885710B (zh) 基于差分演化算法的用户画像刻画方法及服务器
CN111352747A (zh) 协同作业方法及装置
CN113760695A (zh) 一种定位问题代码的方法和装置
CN113672565B (zh) 一种文件标记方法、装置、电子设备及存储介质
CN114153830B (zh) 数据验证方法及其装置、计算机存储介质、电子设备
CN113360505B (zh) 基于时序数据的数据处理方法、装置、电子设备及可读存储介质
CN110515923B (zh) 一种分布式数据库之间的数据迁移方法和系统
CN113886108B (zh) 网点数据调用方法、装置、电子设备及存储介质
CN117290401B (zh) 一种数据交易方法和系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination