CN112084262A - 数据信息筛选方法、装置、计算机设备及存储介质 - Google Patents

数据信息筛选方法、装置、计算机设备及存储介质 Download PDF

Info

Publication number
CN112084262A
CN112084262A CN202010921077.8A CN202010921077A CN112084262A CN 112084262 A CN112084262 A CN 112084262A CN 202010921077 A CN202010921077 A CN 202010921077A CN 112084262 A CN112084262 A CN 112084262A
Authority
CN
China
Prior art keywords
screening
information
data
database
data information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010921077.8A
Other languages
English (en)
Inventor
赵辉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Property and Casualty Insurance Company of China Ltd
Original Assignee
Ping An Property and Casualty Insurance Company of China Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Property and Casualty Insurance Company of China Ltd filed Critical Ping An Property and Casualty Insurance Company of China Ltd
Priority to CN202010921077.8A priority Critical patent/CN112084262A/zh
Publication of CN112084262A publication Critical patent/CN112084262A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/27Replication, distribution or synchronisation of data between databases or within a distributed database system; Distributed database system architectures therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying

Abstract

本发明公开了数据信息筛选方法、装置、计算机设备及存储介质。方法包括:获取第一数据库中与用户输入的同步字段信息相匹配的数据信息并存储至第二数据库中,根据配置信息生成规则及第二数据库生成筛选配置信息,根据用户选择得到的筛选条件对第二数据库中的数据信息进行筛选得到筛选数据信息,获取与筛选数据信息对应的目标数据并存储至第一数据库中。本发明基于数据筛选技术,属于大数据领域,第二数据库中仅包含第一数据库中部分字段对应的字段值,根据第二数据库生成筛选配置信息可大幅提高生成效率,进行数据信息筛选时针对性更强,用户可对筛选配置信息进行灵活选择得到筛选条件,极大扩展了筛选的灵活性,提高了对数据信息进行筛选的效率。

Description

数据信息筛选方法、装置、计算机设备及存储介质
技术领域
本发明涉及大数据技术领域,属于智慧城市中数据信息筛选的应用场景,尤其涉及一种数据信息筛选方法、装置、计算机设备及存储介质。
背景技术
大型企业通常通过数据库对各种信息进行存储,例如通过oracle数据库存储客户信息或交易信息,还可使用命令语句对数据库中存储的数据进行筛选及获取,例如使用SQL语句对数据库中存储的数据进行筛选及获取。但大型企业的客户数量、交易数量均十分庞大,随着数据量的增加传统数据库进行数据筛选等操作时命令语句的执行效率会大幅下降,对命令语句的维护过程也需耗费操作人员大量时间精力,且由于命令语句自身限制无法根据字段对筛选维度进行灵活扩展,导致操作人员无法根据自身需求灵活组合得到筛选条件,从而降低了对海量数据进行筛选的效率。因此,现有的对数据库中所存储的海量数据进行筛选操作时存在筛选效率较低及灵活性不足的问题。
发明内容
本发明实施例提供了一种数据信息筛选方法、装置、计算机设备及存储介质,旨在解决现有数据信息筛选方法在对海量数据进行筛选时所存储的筛选效率较低及灵活性不足的问题。
第一方面,本发明实施例提供了一种数据信息筛选方法,其包括:
接收用户输入的同步字段信息,获取预存的第一数据库中与所述同步字段信息相匹配的数据信息并存储至预存的第二数据库中;
根据预置的配置信息生成规则及所述第二数据库中的数据信息生成筛选配置信息;
若接收到用户根据所述筛选配置信息进行选择所得到的筛选条件,根据所述筛选条件对所述第二数据库中的数据信息进行筛选得到筛选数据信息;
获取与所述筛选数据信息对应的目标数据并存储至所述第一数据库中。
第二方面,本发明实施例提供了一种数据信息筛选装置,其包括:
数据信息存储单元,用于接收用户输入的同步字段信息,获取预存的第一数据库中与所述同步字段信息相匹配的数据信息并存储至预存的第二数据库中;
筛选配置信息生成单元,用于根据预置的配置信息生成规则及所述第二数据库中的数据信息生成筛选配置信息;
数据信息筛选单元,用于若接收到用户根据所述筛选配置信息进行选择所得到的筛选条件,根据所述筛选条件对所述第二数据库中的数据信息进行筛选得到筛选数据信息;
目标数据存储单元,用于获取与所述筛选数据信息对应的目标数据并存储至所述第一数据库中。
第三方面,本发明实施例又提供了一种计算机设备,其包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述第一方面所述的数据信息筛选方法。
第四方面,本发明实施例还提供了一种计算机可读存储介质,其中所述计算机可读存储介质存储有计算机程序,所述计算机程序当被处理器执行时使所述处理器执行上述第一方面所述的数据信息筛选方法。
本发明实施例提供了一种数据信息筛选方法、装置、计算机设备及存储介质。获取第一数据库中与用户输入的同步字段信息相匹配的数据信息并存储至第二数据库中,根据配置信息生成规则及第二数据库生成筛选配置信息,根据用户选择得到的筛选条件对第二数据库中的数据信息进行筛选得到筛选数据信息,获取与筛选数据信息对应的目标数据并存储至第一数据库中。通过上述方法,第二数据库中仅包含第一数据库中部分字段对应的字段值,根据第二数据库中的数据信息生成筛选配置信息可大幅提高生成效率,所生成的筛选配置信息在进行数据信息筛选时的针对性更强,用户可对筛选配置信息进行灵活选择得到筛选条件,采用这一数据信息筛选方法可极大扩展筛选的灵活性,进而提高了对数据信息进行筛选处理的效率。
附图说明
为了更清楚地说明本发明实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的数据信息筛选方法的流程示意图;
图2为本发明实施例提供的数据信息筛选方法的子流程示意图;
图3为本发明实施例提供的数据信息筛选方法的另一流程示意图;
图4为本发明实施例提供的数据信息筛选方法的另一流程示意图;
图5为本发明实施例提供的数据信息筛选方法的另一子流程示意图;
图6为本发明实施例提供的数据信息筛选方法的另一子流程示意图;
图7为本发明实施例提供的数据信息筛选方法的另一子流程示意图;
图8为本发明实施例提供的数据信息筛选装置的示意性框图;
图9为本发明实施例提供的计算机设备的示意性框图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
应当理解,当在本说明书和所附权利要求书中使用时,术语“包括”和“包含”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
还应当理解,在此本发明说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本发明。如在本发明说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。
还应当进一步理解,在本发明说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
请参阅图1,图1是本发明实施例提供的数据信息筛选方法的流程示意图,该数据信息筛选方法应用于用户终端中,该方法通过安装于用户终端中的应用软件进行执行,用户终端即是用于执行数据信息筛选方法以根据用户需求完成数据信息筛选的终端设备,例如台式电脑、笔记本电脑、平板电脑或手机等。如图1所示,该方法包括步骤S110~S140。
S110、接收用户输入的同步字段信息,获取预存的第一数据库中与所述同步字段信息相匹配的数据信息并存储至预存的第二数据库中。
接收用户输入的同步字段信息,获取预存的第一数据库中与所述同步字段信息相匹配的数据信息并存储至预存的第二数据库中。
具体的,第一数据库可以是oracle数据库、SQLServer数据库、DB2数据库或Mysql数据库等关系型数据库,所述第二数据库为mongodb数据库,mongodb数据库是一种近似非关系数据库的数据库,是非关系数据库当中功能最丰富的数据库,其可存储的数据结构非常松散,且mongodb数据库用于存储bson格式(类似json格式)的数据,因此可以存储比较复杂的数据类型。其中,第一数据库中所存储的数据信息可以是企业客户信息、企业交易信息等数据信息,第一数据库中至少包含基础数据表,基础数据表中包含多条数据及多个字段,每条数据均对应一个标识信息,标识信息即是具有对数据进行唯一标识的信息,例如,若第一数据库用于存储企业客户信息,则标识信息可以是客户身份证号;若第一数据库用于存储企业交易信息,则标识信息可以是交易编号。传统的数据信息筛选方法均是直接对第一数据库中所包含的数据信息进行筛选,由于第一数据库中所包含的数据量十分庞大且字段数据较多,为每一字段生成相应的筛选索引信息需耗费大量时间,因此导致从第一数据库中直接筛选数据信息的效率较低;而通常用户对数据信息进行筛选不需要使用全部字段。
基础数据表中的每条数据均包含与每一字段对应的字段值,同步字段信息即为用户所输入的包含多个字段的信息,同步字段信息所包含同步字段的数量少于基础数据表中字段的数量,同步字段信息中所包含的同步字段即为用户对数据信息进行筛选所需使用的部分字段。可根据同步字段信息获取基础数据表中与同步字段信息相匹配的数据信息后,同步存储至第二数据库中,也即是第二数据库中所存储的数据信息与同步字段信息相对应,则第二数据库所包含数据的数量与第一数据库的基础数据表所包含的数据的数量相等,但第二数据库中仅包含基础数据表中部分字段对应的字段值。
在一实施例中,如图2所示,步骤S110包括子步骤S111、S112和S113。
S111、根据所述同步字段信息所包含的同步字段,获取所述第一数据库的基础数据表中每一条数据与每一所述同步字段对应的字段值得到字段值信息;S112、获取所述基础数据表中每一条数据的标识信息;S113、将每一条数据的标识信息及所述字段值信息对应组合作为与所述同步字段信息相匹配的数据信息。
可根据同步字段信息所包含的同步字段,获取基础数据表中每一条数据与每一同步字段对应的字段值作为字段值信息,并获取基础数据表中每一条数据的标识信息,将字段值信息中某一条数据的信息与该数据对应的一个标识信息进行组合,得到与同步字段信息相匹配的数据信息并存储至第二数据库中。
例如,第一数据库用于存储企业客户信息,每一客户的信息对应基础数据表中的一条数据,其中包括的字段为客户姓名、年龄、性别、职业、联系电话、已办业务信息、业务到期月、初次注册年份、活跃状态,客户对应的标识信息为客户身份证号,已办业务信息可用于记录客户所办理的具体业务,如已办业务信息中记录有客户所办理的车辆综合险业务,业务到期月即为该车辆综合险即将到期的月份信息,初次注册年份即为客户初次在企业注册并办理业务的年份信息,活跃状态即为用于记录客户近期活跃次数的状态信息,如活跃状态可以是用户近三个月内登录应用程序的天数。同步字段信息所包含的同步字段包括已办业务信息、业务到期月、初次注册年份及活跃状态,则获取基础数据表中每一条数据与已办业务信息、业务到期月、初次注册年份及活跃状态对应的字段值作为字段值信息,并获取每一条数据的身份证号,组合得到所述同步字段信息相匹配的数据信息并存储至第二数据库。
在一实施例中,如图3所示,步骤S110之后还包括步骤S101和S102。
S101、根据预设的检测周期对所述第一数据库的基础数据表中数据信息是否变更进行检测;S102、若所述基础数据表中数据信息发生变更,根据变更后的所述基础数据表对所述第二数据库中的数据信息进行同步调整。
用户还可设置检测周期,根据所设置的检测周期对基础数据表中数据信息是否变更进行周期性检测,若检测到基础数据表中的数据信息发生更新、添加或删除等变更,则根据基础数据表中变更后的数据信息对第二数据库的数据信息进行同步调整,如基础数据表中某一客户的某一字段值被更新,某一客户对应的一条数据被删除或增加了一个新客户对应的一条数据;此同步调整过程并不涉及对第二数据库中包含的同步字段进行添加或删除等调整,仅涉及对包含于第二数据库中且在基础数据表中被更改的字段值进行更新、添加或删除。若检测到基础数据表中的数据信息未发生更新、添加或删除等变更,则无需对第二数据库中的数据信息进行同步调整。此外,步骤S101及S102除可在步骤S110之后进行执行之外,还可在对第二数据库的数据信息进行筛选之前的任意时间内进行执行。
在一实施例中,如图4所示,步骤S101之后还包括步骤S1011和S1012。
S1011、判断所述同步字段信息是否更新;
S1012、若所述同步字段信息更新,根据更新后的所述同步字段信息及变更后的所述基础数据表对所述第二数据库中的数据信息进行同步调整。
在对第二数据库中的数据信息进行同步调整之前,还可对同步字段信息是否更新进行判断,若同步字段信息发生更新,则根据更新的同步字段信息及变更后的基础数据表对第二数据库中的数据信息进行同步调整,对同步字段信息中的同步字段进行添加或删除均是对同步字段信息的更新,则此同步调整过程中涉及对第二数据库中包含的同步字段进行添加或删除等调整,同时还涉及对包含于第二数据库中且在基础数据表中被更改的字段值进行更新、添加或删除。
S120、根据预置的配置信息生成规则及所述第二数据库中的数据信息生成筛选配置信息。
根据预置的配置信息生成规则及所述第二数据库中的数据信息生成筛选配置信息。所述配置信息生成规则包括字段值分段规则及连接词集合,配置信息生成规则可根据第二数据库中的数据信息生成筛选配置信息,筛选配置信息中包括每一同步字段相关联的连接词信息及多个筛选区间,可对第二数据库中每一同步字段对应字段值进行统计得到相应的字段值统计信息,根据字段值分段规则对字段值统计信息进行分段即可获取每一同步字段的筛选区间,将每一个同步字段的筛选区间与相应的多个连接词进行组合以得到对应的筛选配置信息,用户可从筛选配置信息中选择得到相应筛选条件,以通过筛选条件对第二数据库中的数据信息进行筛选。由于第二数据库中的数据信息只包含基础数据表中部分字段对应的字段值,因此对第二数据库中数据信息进行筛选处理的针对性更强,且无需为所有字段对应的字段值生成筛选配置信息,可大幅提升数据信息的筛选效率。
在一实施例中,如图5所示,步骤S120包括子步骤S121、S122和S123。
S121、对所述第二数据库中每一同步字段所对应的字段值进行统计以得到对应的字段值统计信息。
对第二数据库中每一同步字段对应的字段值进行统计,得到所有同步字段对应的统计结果组成字段值统计信息,对一个同步字段的字段值进行统计即为获取与该同步字段对应的所有字段值组成的集合,字段值统计结果中还包括字段值的具体类型,可根据对一个同步字段的字段值进行统计的结果中字符类型获取字段值的具体类型,其中,同步字段对应的字段值可分为数值型及文字型两类。
例如第二数据库中初次注册年份这一同步字段对应的字段值中2018、2019、2020这三个字段值均至少出现了一次,则对字段值进行统计得到的结果为{2018,2019,2020};已办业务信息对应的字段值均为所办业务的具体名称,则该同步字段为文字型,业务到期月、初次注册年份及活跃状态对应的字段值均不包含文字的具体数值,则上述三个同步字段均为数值型。
S122、根据所述字段值分段规则获取所述字段值统计信息中每一所述同步字段对应的筛选区间。
字段值分段规则中包括对每一同步字段进行分段的具体规则信息,根据字段值分段规则对每一同步字段对应字段值的统计结果进行分段,即可得到每一同步字段所对应的筛选区间。
例如,字段值分段规则中对年份、月份等信息直接按单个数值进行分段,则初次注册年份这一同步字段对应2018、2019及2020三个筛选区间;对活跃状态这一范围数值按字段值的统计结果中最大值A的0-3%A、(3%A+1)-10%A、(10%A+1)-30%A、(30%A+1)-60%A、(60%A+1)-100%A进行取整后分段,活跃状态这一同步字段对应字段值的统计结果中最大值A为91,则得到对应五个筛选区间分别为[0-2]、[3-9]、[10-27]、[28-54]及[55-91]。
S123、根据所述连接词集合确定与每一所述同步字段相匹配的连接词信息,获取每一所述同步字段的筛选区间及连接词信息作为所述筛选配置信息。
连接词集合中包含与每一字段值类型相匹配的连接词信息,根据字段值统计信息中每一同步字段对应的字段值类型,获取连接词集合中与每一同步字段对应的连接词信息,将每一同步字段的连接词信息与筛选区间进行组合后即可得到筛选配置信息。通过将连接词信息与筛选区间进行组合,可极大扩展筛选的灵活性,使用户可以根据自身需求从筛选区间及连接词信息中进行选择并灵活组合得到相应的筛选条件,可基于筛选配置信息更加方便快捷地选择筛选条件。
例如,字段值为数值型的同步字段对应的连接词信息中可包括大于、不大于、小于、不小于、等于、包含及不包含,字段值为文字型的同步字段对应的连接词信息中可包括包含及不包含。
S130、若接收到用户根据所述筛选配置信息进行选择所得到的筛选条件,根据所述筛选条件对所述第二数据库中的数据信息进行筛选得到筛选数据信息。
若接收到用户根据所述筛选配置信息进行选择所得到的筛选条件,根据所述筛选条件对所述第二数据库中的数据信息进行筛选得到筛选数据信息。用户可从筛选配置信息中选择得到相应筛选条件,筛选条件中可包含对一个或多个同步字段进行筛选的条件,如对活跃状态这一同步字段进行筛选的条件为包含[3-9]及[10-27],根据筛选条件对第二数据库中的数据信息进行筛选,可得到对应的筛选数据信息。若筛选数据信息中包含至少一条数据,则进行继续执行后续步骤;若筛选数据信息中包含的数据数量为零,则向用户发送未筛选得到有效数据的提示信息。
在一实施例中,如图6所示,步骤S130包括子步骤S131、S132和S133。
S131、将所述筛选条件转换成格式语句;
S132、根据所述格式语句对预存的函数模板进行配置得到筛选聚合函数;
S133、根据所述筛选聚合函数对所述第二数据库中的数据进行筛选,以将符合所述筛选聚合函数的数据作为所述筛选数据信息。
首先将筛选条件转换为对应的格式语句,其中,格式语句可以是以json格式进行记载的计算机语句,任何计算机支持的字符类型都可以通过json来表示;之后根据格式语句对预存的函数模板进行配置,得到筛选聚合函数,具体的,格式语句中包含多条语句,每条语句可对应一个类型,函数模板中包含与格式语句中每一类型的语句相匹配的函数方法,可通过格式语句获取与每一条语句的类型相匹配的函数方法,并根据语句对相应函数方法中的判断参数进行配置。例如,某一语句为“业务到期月equal 2018”,对相应函数方法进行配置后得到的程序代码为“if XXX=2018”,配置后的函数方法可以是对字段值是否满足某一条件进行判断的程序代码,将所有配置后的函数方法进行聚合即可得到筛选聚合函数,也即是筛选聚合函数由与筛选条件对应的多个函数方法聚合而成;通过所得到的聚合函数对第二数据库中每一条数据是否符合相应筛选条件进行判断,即可将符合筛选条件的数据从第二数据库中筛出,得到筛选数据信息。由于第二数据库为mongodb数据库,第二数据库中的数据均采用bson格式进行记载,而bson格式与json格式近乎相同,采用将筛选条件转换成json格式语句并对应生成筛选聚合函数的方法,则执行聚合函数对bson格式的数据进行筛选可大幅提升数据筛选的效率。
S140、获取与所述筛选数据信息对应的目标数据并存储至所述第一数据库中。
获取与所述筛选数据信息对应的目标数据并存储至所述第一数据库中。所得到的筛选数据信息中仅包含第一数据表中的一部分数据,且筛选数据信息中每条数据仅包含基础数据表中部分字段对应的字段值,可根据筛选数据信息获取对应的目标数据信息,目标数据信息中的每条数据包含的字段值与基础数据表中所有字段相对应,也即是目标数据信息中的每条数据均包含相应的完整字段值。可在第一数据库中新建一个存储表用于存储目标数据,用户可从新建的存储表中获取该目标数据作为与筛选条件对应的筛选结果。
在一实施例中,如图7所示,步骤S140包括子步骤S141、S142和S143。
S141、获取所述筛选数据信息中每一条数据唯一对应的标识信息;
S142、获取所述基础数据表中与所述标识信息对应的数据作为目标数据;
S143、在所述第一数据库中创建存储表并将所述目标数据存储至所述存储表内。
筛选数据信息中包含每一条数据对应的标识信息,基础数据表中每一条数据包含对应的标识信息,可根据每一条数据对应的标识信息获取基础数据表中与标识信息对应的数据作为目标数据,则目标数据中数据的数量与筛选数据信息中数据的数量相等,目标数据中包含每一条数据对应的完整字段值;在第一数据库中创建新的存储表,将目标数据存储至新创建的存储表中,则该存储表中存储的目标数据即可作为与筛选条件对应的筛选结果。
本申请中的技术方法可应用于智慧政务/智慧城管/智慧社区/智慧安防/智慧物流/智慧医疗/智慧教育/智慧环保/智慧交通等包含对数据信息进行筛选处理的应用场景中,从而推动智慧城市的建设。
在本发明实施例所提供的数据信息筛选方法中,获取第一数据库中与用户输入的同步字段信息相匹配的数据信息并存储至第二数据库中,根据配置信息生成规则及第二数据库生成筛选配置信息,根据用户选择得到的筛选条件对第二数据库中的数据信息进行筛选得到筛选数据信息,获取与筛选数据信息对应的目标数据并存储至第一数据库中。通过上述方法,第二数据库中仅包含第一数据库中部分字段对应的字段值,根据第二数据库中的数据信息生成筛选配置信息可大幅提高生成效率,所生成的筛选配置信息在进行数据信息筛选时的针对性更强,用户可对筛选配置信息进行灵活选择得到筛选条件,采用这一数据信息筛选方法可极大扩展筛选的灵活性,进而提高了对数据信息进行筛选处理的效率。
本发明实施例还提供一种数据信息筛选装置,该数据信息筛选装置用于执行前述数据信息筛选方法的任一实施例。具体地,请参阅图8,图8是本发明实施例提供的数据信息筛选装置的示意性框图。该数据信息筛选装置可以配置于客户端10中。
如图8所示,数据信息筛选装置100包括数据信息存储单元110、筛选配置信息生成单元120、数据信息筛选单元130和目标数据存储单元140。
数据信息存储单元110,用于接收用户输入的同步字段信息,获取预存的第一数据库中与所述同步字段信息相匹配的数据信息并存储至预存的第二数据库中。
在一实施例中,所述数据信息存储单元110包括子单元:字段值信息获取单元、标识信息获取单元和组合单元。
字段值信息获取单元,用于根据所述同步字段信息所包含的同步字段,获取所述第一数据库的基础数据表中每一条数据与每一所述同步字段对应的字段值得到字段值信息;标识信息获取单元,用于获取所述基础数据表中每一条数据的标识信息;组合单元,用于将每一条数据的标识信息及所述字段值信息对应组合作为与所述同步字段信息相匹配的数据信息。
在一实施例中,所述数据信息筛选装置100还包括子单元:数据信息检测单元和第一同步调整单元。
数据信息检测单元,用于根据预设的检测周期对所述第一数据库的基础数据表中数据信息是否变更进行检测;第一同步调整单元,用于若所述基础数据表中数据信息发生变更,根据变更后的所述基础数据表对所述第二数据库中的数据信息进行同步调整。
在一实施例中,所述数据信息筛选装置100还包括子单元:同步字段信息判断单元和第二同步调整单元。
同步字段信息判断单元,用于判断所述同步字段信息是否更新;第二同步调整单元,用于若所述同步字段信息更新,根据更新后的所述同步字段信息及变更后的所述基础数据表对所述第二数据库中的数据信息进行同步调整。
筛选配置信息生成单元120,用于根据预置的配置信息生成规则及所述第二数据库中的数据信息生成筛选配置信息。
在一实施例中,所述筛选配置信息生成单元120包括子单元:字段值统计单元、筛选区间获取单元和组合单元。
字段值统计单元,用于对所述第二数据库中每一同步字段所对应的字段值进行统计以得到对应的字段值统计信息;筛选区间获取单元,用于根据所述字段值分段规则获取所述字段值统计信息中每一所述同步字段对应的筛选区间;连接词信息确定单元,用于根据所述连接词集合确定与每一所述同步字段相匹配的连接词信息,获取每一所述同步字段的筛选区间及连接词信息作为所述筛选配置信息。
数据信息筛选单元130,用于若接收到用户根据所述筛选配置信息进行选择所得到的筛选条件,根据所述筛选条件对所述第二数据库中的数据信息进行筛选得到筛选数据信息。
在一实施例中,所述数据信息筛选单元130包括子单元:格式语句获取单元、筛选聚合函数生成单元和数据筛选单元。
格式语句获取单元,用于将所述筛选条件转换成格式语句;筛选聚合函数生成单元,用于根据所述格式语句对预存的函数模板进行配置得到筛选聚合函数;数据筛选单元,用于根据所述筛选聚合函数对所述第二数据库中的数据进行筛选,以将符合所述筛选聚合函数的数据作为所述筛选数据信息。
目标数据存储单元140,用于获取与所述筛选数据信息对应的目标数据并存储至所述第一数据库中。
在一实施例中,所述目标数据存储单元140包括子单元:数据标识信息获取单元、目标数据获取单元和目标数据转存单元。
数据标识信息获取单元,用于获取所述筛选数据信息中每一条数据唯一对应的标识信息;目标数据获取单元,用于获取所述基础数据表中与所述标识信息对应的数据作为目标数据;目标数据转存单元,用于在所述第一数据库中创建存储表并将所述目标数据存储至所述存储表内。
在本发明实施例所提供的数据信息筛选装置应用上述数据信息筛选方法,获取第一数据库中与用户输入的同步字段信息相匹配的数据信息并存储至第二数据库中,根据配置信息生成规则及第二数据库生成筛选配置信息,根据用户选择得到的筛选条件对第二数据库中的数据信息进行筛选得到筛选数据信息,获取与筛选数据信息对应的目标数据并存储至第一数据库中。通过上述方法,第二数据库中仅包含第一数据库中部分字段对应的字段值,根据第二数据库中的数据信息生成筛选配置信息可大幅提高生成效率,所生成的筛选配置信息在进行数据信息筛选时的针对性更强,用户可对筛选配置信息进行灵活选择得到筛选条件,采用这一数据信息筛选方法可极大扩展筛选的灵活性,进而提高了对数据信息进行筛选处理的效率。
上述数据信息筛选装置可以实现为计算机程序的形式,该计算机程序可以在如图9所示的计算机设备上运行。
请参阅图9,图9是本发明实施例提供的计算机设备的示意性框图。该计算机设备可以是用于执行数据信息筛选方法以对数据信息进行筛选的用户终端。
参阅图9,该计算机设备500包括通过系统总线501连接的处理器502、存储器和网络接口505,其中,存储器可以包括非易失性存储介质503和内存储器504。
该非易失性存储介质503可存储操作系统5031和计算机程序5032。该计算机程序5032被执行时,可使得处理器502执行数据信息筛选方法。
该处理器502用于提供计算和控制能力,支撑整个计算机设备500的运行。
该内存储器504为非易失性存储介质503中的计算机程序5032的运行提供环境,该计算机程序5032被处理器502执行时,可使得处理器502执行数据信息筛选方法。
该网络接口505用于进行网络通信,如提供数据信息的传输等。本领域技术人员可以理解,图9中示出的结构,仅仅是与本发明方案相关的部分结构的框图,并不构成对本发明方案所应用于其上的计算机设备500的限定,具体的计算机设备500可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
其中,所述处理器502用于运行存储在存储器中的计算机程序5032,以实现上述的数据信息筛选方法中对应的功能。
本领域技术人员可以理解,图9中示出的计算机设备的实施例并不构成对计算机设备具体构成的限定,在其他实施例中,计算机设备可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。例如,在一些实施例中,计算机设备可以仅包括存储器及处理器,在这样的实施例中,存储器及处理器的结构及功能与图9所示实施例一致,在此不再赘述。
应当理解,在本发明实施例中,处理器502可以是中央处理单元(CentralProcessing Unit,CPU),该处理器502还可以是其他通用处理器、数字信号处理器(DigitalSignal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。其中,通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
在本发明的另一实施例中提供计算机可读存储介质。该计算机可读存储介质可以为非易失性的计算机可读存储介质。该计算机可读存储介质存储有计算机程序,其中计算机程序被处理器执行时实现上述的数据信息筛选方法中所包含的步骤。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,上述描述的设备、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
在本发明所提供的几个实施例中,应该理解到,所揭露的设备、装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为逻辑功能划分,实际实现时可以有另外的划分方式,也可以将具有相同功能的单元集合成一个单元,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另外,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口、装置或单元的间接耦合或通信连接,也可以是电的,机械的或其它的形式连接。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本发明实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以是两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分,或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个计算机可读存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的计算机可读存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。

Claims (10)

1.一种数据信息筛选方法,应用于用户终端中,其特征在于,所述方法包括:
接收用户输入的同步字段信息,获取预存的第一数据库中与所述同步字段信息相匹配的数据信息并存储至预存的第二数据库中;
根据预置的配置信息生成规则及所述第二数据库中的数据信息生成筛选配置信息;
若接收到用户根据所述筛选配置信息进行选择所得到的筛选条件,根据所述筛选条件对所述第二数据库中的数据信息进行筛选得到筛选数据信息;
获取与所述筛选数据信息对应的目标数据并存储至所述第一数据库中。
2.根据权利要求1所述的数据信息筛选方法,其特征在于,所述获取预存的第一数据库中与所述同步字段信息相匹配的数据信息并存储至预存的第二数据库中,包括:
根据所述同步字段信息所包含的同步字段,获取所述第一数据库的基础数据表中每一条数据与每一所述同步字段对应的字段值得到字段值信息;
获取所述基础数据表中每一条数据的标识信息;
将每一条数据的标识信息及所述字段值信息对应组合作为与所述同步字段信息相匹配的数据信息。
3.根据权利要求1所述的数据信息筛选方法,其特征在于,还包括:
根据预设的检测周期对所述第一数据库的基础数据表中数据信息是否变更进行检测;
若所述基础数据表中数据信息发生变更,根据变更后的所述基础数据表对所述第二数据库中的数据信息进行同步调整。
4.根据权利要求3所述的数据信息筛选方法,其特征在于,所述根据变更后的所述基础数据表对所述第二数据库中的数据信息进行同步调整之前,还包括:
判断所述同步字段信息是否更新;
若所述同步字段信息更新,根据更新后的所述同步字段信息及变更后的所述基础数据表对所述第二数据库中的数据信息进行同步调整。
5.根据权利要求1所述的数据信息筛选方法,其特征在于,所述配置信息生成规则包括字段值分段规则及连接词集合,所述根据预置的配置信息生成规则及所述第二数据库中的数据信息生成筛选配置信息,包括:
对所述第二数据库中每一同步字段所对应的字段值进行统计以得到对应的字段值统计信息;
根据所述字段值分段规则获取所述字段值统计信息中每一所述同步字段对应的筛选区间;
根据所述连接词集合确定与每一所述同步字段相匹配的连接词信息,获取每一所述同步字段的筛选区间及连接词信息作为所述筛选配置信息。
6.根据权利要求1所述的数据信息筛选方法,其特征在于,所述根据所述筛选条件对所述第二数据库中的数据信息进行筛选得到筛选数据信息,包括:
将所述筛选条件转换成格式语句;
根据所述格式语句对预存的函数模板进行配置得到筛选聚合函数;
根据所述筛选聚合函数对所述第二数据库中的数据进行筛选,以将符合所述筛选聚合函数的数据作为所述筛选数据信息。
7.根据权利要求1所述的数据信息筛选方法,其特征在于,所述获取与所述筛选数据信息对应的目标数据并存储至所述第一数据库中,包括:
获取所述筛选数据信息中每一条数据唯一对应的标识信息;
获取所述基础数据表中与所述标识信息对应的数据作为目标数据;
在所述第一数据库中创建存储表并将所述目标数据存储至所述存储表内。
8.一种数据信息筛选装置,其特征在于,包括:
数据信息存储单元,用于接收用户输入的同步字段信息,获取预存的第一数据库中与所述同步字段信息相匹配的数据信息并存储至预存的第二数据库中;
筛选配置信息生成单元,用于根据预置的配置信息生成规则及所述第二数据库中的数据信息生成筛选配置信息;
数据信息筛选单元,用于若接收到用户根据所述筛选配置信息进行选择所得到的筛选条件,根据所述筛选条件对所述第二数据库中的数据信息进行筛选得到筛选数据信息;
目标数据存储单元,用于获取与所述筛选数据信息对应的目标数据并存储至所述第一数据库中。
9.一种计算机设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至7中任一项所述的数据信息筛选方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序当被处理器执行时使所述处理器执行如权利要求1至7任一项所述的数据信息筛选方法。
CN202010921077.8A 2020-09-04 2020-09-04 数据信息筛选方法、装置、计算机设备及存储介质 Pending CN112084262A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010921077.8A CN112084262A (zh) 2020-09-04 2020-09-04 数据信息筛选方法、装置、计算机设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010921077.8A CN112084262A (zh) 2020-09-04 2020-09-04 数据信息筛选方法、装置、计算机设备及存储介质

Publications (1)

Publication Number Publication Date
CN112084262A true CN112084262A (zh) 2020-12-15

Family

ID=73732830

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010921077.8A Pending CN112084262A (zh) 2020-09-04 2020-09-04 数据信息筛选方法、装置、计算机设备及存储介质

Country Status (1)

Country Link
CN (1) CN112084262A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113449160A (zh) * 2021-06-30 2021-09-28 平安科技(深圳)有限公司 数据智能筛选方法、装置、设备及介质
CN115599973A (zh) * 2022-11-04 2023-01-13 广州大事件网络科技有限公司(Cn) 一种用户人群标签筛分方法、系统、设备及存储介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113449160A (zh) * 2021-06-30 2021-09-28 平安科技(深圳)有限公司 数据智能筛选方法、装置、设备及介质
CN115599973A (zh) * 2022-11-04 2023-01-13 广州大事件网络科技有限公司(Cn) 一种用户人群标签筛分方法、系统、设备及存储介质

Similar Documents

Publication Publication Date Title
CN107810500B (zh) 数据质量分析
WO2018172839A1 (en) Automatic generating analytics from blockchain data
US20090106308A1 (en) Complexity estimation of data objects
WO2019168599A1 (en) Data retention handling for data object stores
CN111444287B (zh) 图数据库构建方法、关联信息查询方法、装置及计算设备
CN112084262A (zh) 数据信息筛选方法、装置、计算机设备及存储介质
CN114416891B (zh) 在知识图谱中进行数据处理的方法、系统、装置和介质
CN113051308A (zh) 告警信息处理方法、设备、存储介质及装置
CN115408381A (zh) 数据处理方法及相关设备
CN111090780A (zh) 可疑交易信息的确定方法及装置、存储介质、电子设备
CN110599278B (zh) 聚合设备标识符的方法、装置和计算机存储介质
CN110633304B (zh) 组合特征筛选方法、装置、计算机设备及存储介质
CN111506564A (zh) 基于cs架构的远程数据管理方法、装置、计算机设备及存储介质
CN115994830A (zh) 取数模型的构建方法和数据归集方法及相关装置
US11798096B2 (en) Custom data
US20150213098A1 (en) Business Rules Influenced Quasi-Cubes with Higher Diligence of Data Optimization
CN110457323B (zh) 数据表的处理方法及装置
CN110309211B (zh) 一种定位etl过程问题的方法及相关设备
CN112800040A (zh) 业务数据校验方法、装置、计算机设备及存储介质
CN114880713B (zh) 基于数据链路的用户行为分析方法、装置、设备及介质
CN110119406B (zh) 实时任务记录的核对方法及装置
US20160307207A1 (en) Analytical Functionality Selecting Relevant Market Research Data for Global Reporting
CN117093569A (zh) 数据质量管理方法和装置
CN114168599A (zh) 一种数据汇总方法、装置及终端设备
CN116610660A (zh) 数据清理方法、装置、设备、介质和程序产品

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination