CN110019353B - 一种数据处理方法及装置 - Google Patents

一种数据处理方法及装置 Download PDF

Info

Publication number
CN110019353B
CN110019353B CN201710840495.2A CN201710840495A CN110019353B CN 110019353 B CN110019353 B CN 110019353B CN 201710840495 A CN201710840495 A CN 201710840495A CN 110019353 B CN110019353 B CN 110019353B
Authority
CN
China
Prior art keywords
data
intervals
interval
array
group
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710840495.2A
Other languages
English (en)
Other versions
CN110019353A (zh
Inventor
赵健
张珍心
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Gridsum Technology Co Ltd
Original Assignee
Beijing Gridsum Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Gridsum Technology Co Ltd filed Critical Beijing Gridsum Technology Co Ltd
Priority to CN201710840495.2A priority Critical patent/CN110019353B/zh
Publication of CN110019353A publication Critical patent/CN110019353A/zh
Application granted granted Critical
Publication of CN110019353B publication Critical patent/CN110019353B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2455Query execution
    • G06F16/24553Query execution of query operations
    • G06F16/24554Unary operations; Data partitioning operations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2457Query processing with adaptation to user needs
    • G06F16/24578Query processing with adaptation to user needs using ranking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/248Presentation of query results

Abstract

本发明公开一种数据处理方法及装置,其中,所述方法包括:将待划分区间的t个数据按照大小排序形成数组arr;获取数组arr的中位数m和t个数据的平均数a;根据m和a将t个数据划分为N个区间;N个区间包括第一组区间和第二组区间;将数组arr中最小值到a之间的数据进行第一组区间划分,将a到数组arr中最大值之间的数据进行第二组区间划分;当a减去m的差值大于第一预定值,第一组区间个数大于第二组区间个数;当m减去a的差值大于第一预定值,第一组区间个数小于第二组区间个数。通过该种数据处理方法进行区间划分,可以根据数据分布的密度,相应地进行区间划分,使得所划分出各个区间的数据量分配均匀。

Description

一种数据处理方法及装置
技术领域
本发明涉及大数据技术领域,尤其涉及一种数据处理方法及装置。
背景技术
数据可视化主要是借助图形化手段,清晰有效地传达与沟通信息。在司法领域,尤其是民事案件中,往往会出现判决金额,而判决金额的判决是否合理是群众和法官都关心的问题。
针对案件判决金额的数据可视化,某些判决金额细项的金额跨度过大,进行可视化展示的时候,区间划分成了一个影响展示效果的关键因素。
现有技术中,针对数据区间划分一般包括两种,一种是固定区间,另一种是不固定区间,下面分别来介绍。
第一种:采取固定区间宽度。
例如,采用固定区间宽度为1000时各个区间为:1-1000,1000-2000,2000-3000等。
第二种:采取不固定区间宽度。
例如,采用不固定区间宽度时各个区间为:1-1000,1000-10000,10000-100000等。
但是,无论采用固定区间宽度还是不固定区间宽度均会出现某一区间的数据数量众多,而其他区间数据数量较少甚至没有的情况,这样将导致最终的图表展示效果较差。
发明内容
为了解决现有技术中存在的以上技术问题,本发明提供一种数据处理的方法及装置,能够对数据进行区间划分,使划分出的各个区间中的数据个数分配均匀。
本发明实施例提供了一种数据处理方法,包括:将待划分区间的t个数据按照大小排序形成数组arr;获取所述数组arr的中位数m和所述t个数据的平均数a;根据所述m和a将所述t个数据划分为N个区间;所述N个区间包括第一组区间和第二组区间;将所述数组arr中最小值到a之间的数据进行第一组区间划分,将a到数组arr中最大值之间的数据进行第二组区间划分;当所述a减去m的差值大于第一预定值,所述第一组区间个数大于所述第二组区间个数;当所述m减去a的差值大于第一预定值,所述第一组区间个数小于所述第二组区间个数。
优选的,根据权利要求1所述的数据处理方法,还包括:判断所述a和m差值的绝对值比所述数组arr的最大值小预定数量级,则按照预定区间宽度对所述数组arr进行N个区间平均划分。
所述按照预定区间宽度对所述数组arr进行N个区间平均划分,具体可以包括:将所述数组arr中最大值和所述数组arr中最小值的差值除以所述N,将所得的商作为所述预定区间宽度;按照所述预定区间宽度对所述数组arr进行N个区间平均划分。
根据所述m和a将所述t个数据划分为N个区间;所述N个区间包括第一组区间和第二组区间;将所述数组arr中最小值到a之间的数据进行第一组区间划分,将a到数组arr中最大值之间的数据进行第二组区间划分;具体可以包括:将所述数组arr划分为两个区间,所述两个区间分别为:所述数组arr中最小值到a和a到数组arr中最大值;记录所述两个区间中数据个数较少的区间的数据的数目S1;将所述两个区间中数据个数较多的区间作为新的数组按照对所述数组arr划分为两个区间的方式进行再次划分,获得新的数组划分的两个区间的数据的数目分别为S2和S3;将所述S1、S2和S3最大数目对应的区间作为新的数组继续划分,以此类推,直到划分的区间的个数为N。
当t为奇数时,所述中位数为位于所述数组arr中排序中间的数据;当t为偶数时,所述中位数为所述数组arr中排序中间的两位数据的平均数。
本发明实施例还提供了一种数据处理装置,包括:排序单元、平均数获得单元和区间划分单元;所述排序单元,用于将待划分区间的t个数据按照大小排序形成数组arr;所述平均数获得单元,用于获取所述数组arr的中位数m和所述t个数据的平均数a;所述区间划分单元,用于根据所述m和a将所述t个数据划分为N个区间;所述N个区间包括第一组区间和第二组区间;将所述数组arr中最小值到a之间的数据进行第一组区间划分,将a到数组arr中最大值之间的数据进行第二组区间划分;当所述a减去m的差值大于第一预定值,所述第一组区间个数大于所述第二组区间个数;当所述m减去a的差值大于第一预定值,所述第一组区间个数小于所述第二组区间个数。
优选的,还可以包括:平均划分单元;所述平均划分单元,用于判断所述a和m差值的绝对值比所述数组arr的最大值小预定数量级,则按照预定区间宽度对所述数组arr进行N个区间平均划分。
所述平均划分单元可以包括:预定区间宽度获得子单元和平均划分子单元;所述预定区间宽度获得子单元,用于将所述数组arr中最大值和所述数组arr中最小值的差值除以所述N,将所得的商作为所述预定区间宽度;所述平均划分子单元,用于按照所述预定区间宽度对所述数组arr进行N个区间平均划分。
本发明实施例提供了一种计算机可读存储介质,其上存储有程序,该程序被处理器执行时实现所述数据处理方法。
本发明实施例提供了一种处理器,所述处理器用于运行程序,其中,所述程序运行时执行所述数据处理方法。
与现有技术相比,本发明至少具有以下优点:
该数据处理方法,先获得待划分区间数组中的中位数和平均数,根据中位数和平均数的比较结果,确定数据的分布情况。具体地,若平均数减去中位数得到的差值大于某一预定值时,则可确定数组中的数据主要分布在数组中数据的最小值和平均数之间。相应地,在划分区间时,将位于最小值和平均数之间的数据划分出较多区间。反之,若中位数减去平均数得到的差值大于某一预定值时,即可确定数组中的数据主要分布在平均数和数组中数据的最大值之间。相应地,在划分区间时,将平均数和最大值之间划分出较多区间。采用该种数据处理方法进行区间划分时,可以根据数据分布的密度,相应地进行区间划分,使得所划分出各个区间的数据量分配均匀。进而在进行数据可视化展示时,获得较好的展示效果。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
图1为本发明提供的一种数据处理方法的流程图;
图2为本发明提供的另一种数据处理方法的流程图;
图3为本发明提供的又一种数据处理方法的流程图;
图4为本发明提供的一种数据处理装置的结构示意图;
图5为本发明提供的另一种数据处理装置的结构示意图;
图6为本发明提供的又一种数据处理装置的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
在司法领域,对很多民事案件进行判决时,往往会涉及到判决金额。针对案件判决金额进行数据可视化展示,可以借助图形化的手段,清晰有效地展示案件的判决金额。
对数据进行可视化展示时,一般将数据划分至对应的区间内,统计各区间内包含的数据量,最终以条形图等图形化的形式对数据进行展示。采用上述数据可视化的方法对案件判决金额进行展示时,由于判决金额中各细项的金额跨度一般较大,导致各个数据区间中的数据量分配不均匀,进而影响展示效果。
采用本发明提供的数据处理方法,能够保证根据待划分区间的数据值而进行区间划分,在各个区间内数据量分配均匀,进而能够在进行数据可视化展示时,得到更好的展示效果。
需要说明的是,以下实施例提供的数据处理方法,不仅应用于对判决金额的区间划分,而是可以应用于针对各种数据进行区间划分的场景。
方法实施例一
参见图1,为本实施例提供的一种数据处理方法的流程图。
步骤101:将待划分区间的t个数据按照大小排序形成数组arr。
将需要进行区间划分的t个数据,按照从小到大的顺序进行排列,或者按照从大到小的顺序进行排序。并将按照上述排列顺序进行排列的t个数据,组成数组arr。
以下实施例中以t个数据按照从小到大的顺序排序为例进行介绍。
步骤102:获取所述数组arr的中位数m和所述t个数据的平均数a。
由于数组arr中的数据是按照大小排序之后的数据,中位数m是数组arr的中位数。
当t为奇数时,所述中位数为位于所述数组arr中排序中间的数据;
当t为偶数时,所述中位数为所述数组arr中排序中间的两位数据的平均数。
具体地,例如,数组arr中包括13个数据,即t=13,则位于中间位置的数据为第
Figure BDA0001409502490000051
位的数据,即13个数据的中间位置是第7位数据,因此获取该数组arr中排序位于第7位的数据作为数组的中位数m。若数组arr中含有偶数个数据,则m为位于数组arr中间的两位数据的平均数。例如,数组arr中含有16个数据,即t=16,则位于中间的两位数据为位于第t/2位和第
Figure BDA0001409502490000052
位的平均数,即第8位和第9位的数据。因此,可获取数组arr中排序位于第8位和第9位数据的平均数作为数组的中位数m。
获取数组arr中t个数据的平均数a。具体地,将数组arr中的所有数据进行求和计算,得到数组arr中t个数据的和,再将得到的t个数据的和除以t,即可获得数组arr中t个数据的平均数a。
步骤103:根据所述m和a将所述t个数据划分为N个区间;所述N个区间包括第一组区间和第二组区间;将所述数组arr中最小值到a之间的数据进行第一组区间划分,将a到数组arr中最大值之间的数据进行第二组区间划分;当所述a减去m的差值大于第一预定值,所述第一组区间个数大于所述第二组区间个数;当所述m减去a的差值大于第一预定值,所述第一组区间个数小于所述第二组区间个数。
根据中位数m和平均数a,对数组arr中t个数据进行区间划分,划分出N个区间,N个区间包括第一组区间和第二组区间。
其中,第一组区间的数据范围为数组arr中最小值到平均数a,在该范围内,还可继续进行区间的划分,例如第一组区间具体可以包含A个区间。相应地,第二组区间的数据范围为平均数a到数组arr中最大值,在该范围内,还可继续进行区间的划分,例如第二组区间具体可以包含B个区间。上述第一组区间包含的区间个数A,与第二组区间包含的区间个数B相加得到的和,即为对数组arr中t个数据划分N个区间,即N=A+B。
根据中位数m和平均数a的比较结果,判断数组arr中数据的分布情况,根据上述数据的分布情况,选择将第一组区间划分出较多的区间或将第二组区间划分出较多的区间。
具体地,当平均数a减去中位数m得到的差值大于第一预定值时,可判断出数组中的数据主要分布在数组arr中最小值与平均数a之间,相应地,处于数组arr中最小值到平均数a的范围的第一组区间,应该划分较多的区间个数,而处于数组arr中平均数a和最大值之间的第二组区间应该划分较少的区间个数。即A>B。
相反地,当中位数m减去平均数a得到的差值,大于第一预定值时,可判断数组中的数据主要分布在平均数a与数组arr中最大值之间,相应地,处于平均数a到数组arr中最大值的范围的第二组区间,应该划分较多的区间个数,即B>A。
上述第一预定值可以根据实际需要进行设置,可以将数组arr中最大值与最小值之间的差值除以总区间个数N得到的值,作为第一预定值,当然,也可以根据业务场景的实际需要对第一预定值进行设置,在此不做任何限定。
为了便于理解,现对本实施例提供的具体实施方式进行举例说明。
现有待划分区间的9个数据,分别为20,25,50,30,35,300,100,200,10。将上述9个数据按照从小到大的顺序进行排列,形成数组arr,即数组arr中包含9个数据,分别为:10,20,25,30,35,50,100,200,300。
获取数组arr的中位数m,按照上述中位数m的选取原则,该数组arr包括的数据个数为奇数,则选取数组中第五位的数据35作为数组arr的中位数m,即m=35。
获取数组arr中9个数据的平均数a,具体地,对数组arr中的9个数据进行求和,即计算10+20+25+30+35+50+100+200+300的值,计算得到上述9个数据的和为770,将得到的9个数据的和除以9得到平均数a=85.5。
假设N=5,即将数组arr中的9个数据划分为5个区间,根据得到的m值35和a值85.5,将数组arr中的9个数据进行区间的划分。上述5个区间包括第一组区间和第二组区间,其中,第一组区间的范围为数组arr中的最小值10到a值85.5的范围,第二组区间的范围为平均数a值85.5到数组arr中的最大值300。第一组区间中包含的区间个数,与第二区间包含的区间个数的和为5。
本实施例中,将第一预定值设置为数组arr中最大值与最小值的差值除以数据总个数得到的结果,即第一预定值=(300-10)/9=32.2。
判断平均数a减去中位数m得到的差值是否大于第一预定值,即计算85.5减去35得到的差值为50.5,50.5大于第一预定值32.2,即平均数a减去中位数m得到的差值大于第一预定值。此时,可以判定第一组区间范围内数据分布较为密集,即在10到85.5之间的数据较多,因此,在进行区间划分时,第一组区间中区间的个数应多于第二组区间中区间的个数。
本实施例提供的数据处理方法,先获得待划分区间数组中的中位数和平均数,根据中位数和平均数的比较结果,确定数据的分布情况。具体地,若平均数减去中位数得到的差值大于某一预定值时,则可确定数组中的数据主要分布在数组中数据的最小值和平均数之间。相应地,在划分区间时,将位于最小值和平均数之间的数据划分出较多区间。反之,若中位数减去平均数得到的差值大于某一预定值时,即可确定数组中的数据主要分布在平均数和数组中数据的最大值之间。相应地,在划分区间时,将数组中位于平均数和最大值之间的数据划分出较多区间。采用该种数据处理方法进行区间划分时,可以根据数据分布的密度,相应地进行区间划分,使得所划分出各个区间的数据量分配均匀。进而在进行数据可视化展示时,获得较好的展示效果。
另外,当平均值a不属于数组arr中数据的情况,对于划分所得的两个子区间中数据较多的那个区间(例如是右边的那个区间(a,数组最大值]),再次划分时形成的新区间是数据较多的那些数据构成的新区间,新区间中的最小值与a之间的空白区间会被舍弃。即在划分区间的过程中,可能出现某个区间中不包括数组arr中的任何数据,对于这样的区间就会舍弃。针对具有舍弃区间的情况,最终划分出来的区间的各个分界点不是连续的,例如三个区间分别为:1-20,45-70,70-100;对于20-45之间的区间由于不包括数组arr中的任何数据,所以进行了舍弃。
需要说明的是,对于平均值a属于数组中数据的情况,可以设定a都属于左区间或都属于右区间,本实施例中不做具体限定,只要对于同一批待划分区间的数据采用相同标准即可。
方法实施例二
当数组中数据的平均数和中位数的差值比数组中最大值小预定数量级时,可采用以下实施例提供的方法,对待划分区间的t个数据进行区间划分。参见图2,为本实施例提供的另一种数据处理方法的流程图。
步骤201:将待划分区间的t个数据按照从小到大的顺序排序形成数组arr。
步骤202:获取所述数组arr的中位数m和所述t个数据的平均数a。
步骤201和步骤202的具体实施方式,与方法实施例一中步骤101和步骤102的具体实施方式相类似,详细请参见步骤101和步骤102的实施方式,在此不再赘述。
步骤203:根据所述m和a将所述t个数据划分为N个区间;判断所述a和m差值的绝对值比所述数组arr的最大值小预定数量级,则按照预定区间宽度对所述数组arr进行N个区间平均划分。
获得平均数a和中位数m的差值。
将平均数a和中位数m的差值的绝对值与最大值进行比较,若平均数a与中位数m的差值的绝对值比最大值小预定数量级,则说明数组中数据的分布较为均匀,可以直接将数组中的数据按照固定区间宽度划分为N个区间。
上述预定数量级可以根据实际需要进行设定,可以根据数组中的最大值和最小值之间相差的数量级设置预定数量级;也可以结合数据所要划分出的区间和数组中的最大值设置预定数量级;也可以根据数组中最大值设置预定数据级。例如当根据最大值设置预定数据量时,数组中最大值为5位数,则预定数量级为2位数或3位数。如果最大值为10000,平均数a和中位数m的差值的绝对值为800,由于800是3位数,10000是5位数,则800比10000小2个数量级,因此可以采取固定区间宽度来平均划分t个数据。
将所述数组arr中最大值和所述数组arr中最小值的差值除以所述N,将所得的商作为所述预定区间宽度。
本实施例中预定区间宽度即为固定区间宽度。
按照预定区间宽度对所述数组arr进行N个区间平均划分。
具体地,将数组arr中的最大值和最小值做差,得到数组中数据的总体范围,由于根据平均数a和中位数m差值的绝对值与最大值的比较结果,可以确定数组中的数据分布较为均匀。因此,可以直接对数组中数据的总体范围除以N,所得的结果即可作为所要划分的每个区间的预定区间宽度。
得到预定区间宽度后,即可在数组中数据所处的总体范围内,进行N个区间的区间划分。具体地,可以在数组中最小值到最大值的数据总体范围内,以上述预定区间宽度,对数组arr进行N个区间的平均划分。
为了便于理解,现对本实施例提供的具体实施方式进行举例说明:
现有待划分出3个区间的6个数据,将6个数据按照从小到大的顺序进行排列,得到数组arr为100,210,330,440,560,660。
获取数组arr的中位数m,由于数组中包含6个数据,因此获取第三位数据和第四位数据的平均值,即中位数为(330+440)/2的值,即中位数为385。
获取数组arr中6个数据的平均数,具体地,对数组arr中的6个数据进行求和,即计算100+210+330+440+560+660的值,计算上述6个数据的和为2300,将得到的6个数据的和除以6,得到平均数a=383.3。
计算平均数a和中位数m的差值的绝对值为1.7,该绝对值与数组中最大值相比,比数组中最大值小预定数量级,可以判定该数组arr中数据分布较为均匀,进而可以对数组中所有数据所在的范围进行3等分。计算数组中数据的最大值660和数组中数据的最小值100之间的差值,得到差值为560,将得到的差值除以3,得到预定区间宽度为560/3=187。
进一步地,根据获取到的预定区间宽度对数组内数据所处的范围进行划分,所划分出的每个区间宽度均为187,即每个区间内可包括187个整数数据,具体地划分出100-287为第一区间,287-474为第二区间,474-660为第三区间。上述待划分的6个数据中,100和210属于第一区间,330和440属于第二区间,560和660属于第三区间,根据上述各个区间内数据量的分配情况可知,各个区间分配的数据量较为均匀。
本实施例提供的数据处理方法,通过对比由待划分数据组成的数组的中位数和平均数,对数组中数据的分布进行总体的判断,若判断出数组中数据分布较为均匀,则可直接对待划分的数据进行N个区间的划分。针对于待划分数据分布较为均匀的情况,减少了区间划分的步骤,节约区间划分的时间。
方法实施例三
本实施例提供的区间划分方法,针对于待划分区间的数据分布不均匀的情况,对上述数据进行区间划分。参见图3,为本实施例提供的又一种数据处理方法的流程图。
步骤301:将所述数组arr划分为两个区间,所述两个区间分别为:所述数组arr中最小值到平均数a和平均数a到数组arr中最大值。
根据方法实施例二中提供的区间方法可知,若平均数a和中位数m差值的绝对值,与数组arr的最大值相比,没有小于上述预定数量级,则说明待划分区间的数据分布不均匀。
基于该种待划分区间的数据分布不均匀的情况,本实施例直接以数据的平均数a为分界点,将数组arr划分为两个区间,即将数组arr划分成两个区间,一个区间中数据的范围为数组arr中最小值到平均数a,另一个区间中数据的范围为平均数a到数组arr中的最大值。
步骤302:记录所述两个区间中数据个数较少的区间的数据的数目S1。
比较步骤301中划分出的两个区间中包含的数据个数,即比较数据范围为数组arr中最小值到平均数a的区间中包含的数据个数,和数据范围为平均数a到数组arr中的最大值的区间中包含的数据个数。记录包含数据个数较少的区间中的数据个数S1。
步骤303:将所述两个区间中数据个数较多的区间作为新的数组按照对所述数组arr划分为两个区间的方式进行再次划分,获得新的数组划分的两个区间的数据的数目分别为S2和S3。
将在步骤302中比较得到的包含数据个数较多的区间,作为新的数组按照上述划分两个区间的方法继续进行区间划分。
具体地,将包含数据个数较多的区间中的数据按照从小到大的顺序进行排列,得到新的数组arr1,对数组arr1继续进行划分。计算数组arr1中数据的平均数p,以平均数p为分界点,将数组arr1划分出两个区间。具体地,以数组arr1中数据最小值到平均数p为范围,划分出第三区间,以平均数p到数组arr1数据最大值为范围,划分出第四区间。统计出第三区间包含的数据数目为S2,第四区间包含的数据数目为S3。
步骤304:将所述S1、S2和S3最大数目对应的区间作为新的数组继续划分,以此类推,直到划分的区间的个数为N。
将步骤302中划分出的包含数据个数较少的区间中的数据个数S1,步骤303中划分出的第三区间包含的数据个数S2,步骤303中划分出的第四区间包含的数据个数S3进行比较,取S1、S2、S3中的最大值对应的区间继续进行划分,具体区间划分的方法与步骤303相类似,在此不再赘述。
按照上述方法,对比已经划分出的区间中包含的数据个数,取包含数据个数最多的区间作为新的数组,对新数组继续进行划分。以此类推,重复上述步骤,直到划分出的区间个数达到N。
需要说明的是,对于每次划分时,对数据最多的区间进行重新划分,指的是对于所有已经划分的区间进行统计,判断哪个区间数据的个数最多。例如,对于数组arr首次划分为X和Y两个区间,其中Y区间的数据个数比X区间的数据个数多,则继续对Y进行划分。Y划分为Y1和Y2两个区间,再继续划分时,则需要统计X、Y1和Y2这三个区间中哪个区间的数据个数最多,例如是X区间中数据个数最多,则对X区间中的数据继续进行划分,以此类推。
为了便于理解,现对本实施例提供的具体实施方式进行举例说明:
现有待划分出5个区间的11个数据,将这11个数据按照从小到大的顺序排列,形成数组arr,数组arr为10,20,25,30,35,50,80,100,120,200,300。计算数组arr中11个数据的平均数为88。以平均数88为分界点,将数组arr划分为两个区间,第一区间为数组arr中最小值10到88,第二区间为88到数组arr中最大值300。
根据第一区间的数据范围,可知第一区间中包含数据10,20,25,30,35,50,80,即第一区间中包含7个数据,根据第二区间的数据范围,可知第二区间中包含数据100,120,200,300,即第二区间中包含4个数据。记录包含数据个数较少的第二区间中包含的数据个数4为S1。
对包含较多数据个数的第一区间作为新的数组,对其继续进行划分。具体地,将第一区间中的数据作为新数组arr1,arr1为10,20,25,30,35,50,80,计算数组arr1的平均数,得到arr1的平均数为(10+20+25+30+35+50+80)/7,即数组arr1的平均数为36。以36为分界点将第一区间划分为第三区间和第四区间,第三区间的数据范围为数组arr1中最小值到平均值36,即第三区间中的数据范围为10—36,第四区间的数据范围为平均值36到数组arr1中最大值,即第四区间中的数据范围为36—80。相应地,第三区间中包含10,20,25,30,35,记录第三区间中包含的数据个数5为S2,第四区间中包含50,80,记录第四区间中包含的数据个数为S3。
对比S1,S2和S3,可知S2最大,即S2对应的第三区间中包含的数据个数最多,因此,需要继续对第三区间进行划分。将第三区间中所包含的数据10,20,25,30,35,作为新的数组arr2,计算新数组arr2中数据的平均数,得到数组arr2的平均数为(10+20+25+30+35)/5,即数组arr2的平均数为24。以平均数24作为第三区间的分界点,将第三区间进一步划分为第五区间和第六区间,第五区间的数据范围为10—24,第六区间的数据范围为24—35,根据上述区间对应的数据范围,可知,第五区间包含S4个数据,S4为2,2个数据分别为10,20,第六区间包含S5个数据,S5为3,3个数据分别为25,30,35。
对比S1,S3,S4,S5的大小,将其中最大数目对应的区间按照上述方法继续进行划分,直至得到所需要的5个区间为止。
本实施例提供的数据处理方法,针对于数据分布不均匀的数据,进行反复划分,直到将待划分的数据划分出所需要的N个区间为止。采用该种方法对区间进行划分,保证了数据量的均匀分配,即保证各个区间包含的数据量基本一致,防止了因数据量分配不均,而导致数据可视化效果较差的情况发生。
基于以上实施例提供的一种数据处理方法,本发明实施例还提供一种数据处理装置,下面结合附图进行详细的介绍。
装置实施例一
参见图4,为本实施例提供的一种数据处理装置的结构示意图。
该数据处理装置包括:排序单元401、平均数获得单元402和区间划分单元403。
所述排序单元401,用于将待划分区间的t个数据按照从小到大的顺序排序形成数组arr。
所述平均数获得单元402,用于获取所述数组arr的中位数m和所述t个数据的平均数a。
所述区间划分单元403,用于根据所述m和a将所述t个数据划分为N个区间;所述N个区间包括第一组区间和第二组区间;将所述数组arr中最小值到a之间的数据进行第一组区间划分,将a到数组arr中最大值之间的数据进行第二组区间划分;当所述a减去m的差值大于第一预定值,所述第一组区间个数大于所述第二组区间个数;当所述m减去a的差值大于第一预定值,所述第一组区间个数小于所述第二组区间个数。
本实施例图4所示的装置是与方法实施例一所述的方法所对应的装置,具体实现方法类似,参考方法实施例中的描述,这里不再赘述。
本实施例提供的装置,先获得待划分区间数组中的中位数和平均数,根据中位数和平均数的比较结果,确定数据的分布情况。具体地,若平均数减去中位数得到的差值大于某一预定值时,则可确定数组中的数据主要分布在数组中数据的最小值和平均数之间。相应地,在划分区间时,将位于最小值和平均数之间的数据划分出较多区间。反之,若中位数减去平均数得到的差值大于某一预定值时,即可确定数组中的数据主要分布在平均数和数组中数据的最大值之间。相应地,在划分区间时,将平均数和最大值之间划分出较多区间。采用该种数据处理方法进行区间划分时,可以根据数据分布的密度,相应地进行区间划分,使得所划分出各个区间的数据量分配均匀。进而在进行数据可视化展示时,获得较好的展示效果。
装置实施例二
参见图5,为本实施例提供的针对于数据分布较为均匀的情况,对应的数据处理装置的结构示意图。
该数据处理装置包括:排序单元501、平均数获得单元502和平均划分单元503。
所述排序单元501,用于将待划分区间的t个数据按照从小到大的顺序排序形成数组arr。
所述平均数获得单元502,用于获取所述数组arr的中位数m和所述t个数据的平均数a。
所述平均划分单元503,用于判断所述a和m差值的绝对值比所述数组arr的最大值小预定数量级,则按照预定区间宽度对所述数组arr进行N个区间平均划分。
所述平均划分单元503还包括:预定区间宽度获得子单元504和平均划分子单元505。
所述预定区间宽度获得子单元504,用于将所述数组arr中最大值和所述数组arr中最小值的差值除以所述N,将所得的商作为所述预定区间宽度。
所述平均划分子单元505,用于按照所述预定区间宽度对所述数组arr进行N个区间平均划分。
本实施例图5所示的装置是与方法实施例二所述的方法所对应的装置,具体实现方法类似,参考方法实施例中的描述,这里不再赘述。
本实施例提供的数据处理装置,通过对比由待划分数据组成的数组的中位数和平均数,对数组中数据的分布进行总体的判断,若判断出数组中数据分布较为均匀,则可直接对待划分的数据进行N个区间的划分。针对于待划分数据分布较为均匀的情况,减少了区间划分的步骤,节约区间划分的时间。
装置实施例三
参见图6,为本实施例提供的针对于数据分不均匀的情况,对应的数据处理装置的结构示意图。
该区间划分单元包括:两区间划分子单元601,记录子单元602,新区间获得子单元603和循环子单元604。
所述两区间划分子单元601,用于将所述数组arr划分为两个区间,所述两个区间分别为:所述数组arr中最小值到a和a到数组arr中最大值。
所述记录子单元602,用于记录所述两个区间中数据个数较少的区间的数据的数目S1。
所述新区间获得子单元603,用于将所述两个区间中数据个数较多的区间作为新的数组按照对所述数组arr划分为两个区间的方式进行再次划分,获得新的数组划分的两个区间的数据的数目分别为S2和S3。
所述循环子单元604,用于将所述S1、S2和S3最大数目对应的区间作为新的数组继续划分,以此类推直到划分的区间的个数为N。
本实施例图6所示的装置是与方法实施例三所述的方法所对应的装置,具体实现方法类似,参考方法实施例中的描述,这里不再赘述。
本实施例提供的数据处理装置,针对于数据分布不均匀的数据,进行反复划分,直到将待划分的数据划分出所需要的N个区间为止。采用该装置对区间进行划分,保证了数据量的均匀分配,即保证各个区间包含的数据量基本一致,防止了因数据量分配不均,而导致数据可视化效果较差的情况发生。
所述数据处理装置包括处理器和存储器,上述排序单元、平均数获得单元和区间划分单元等均作为程序单元存储在存储器中,由处理器执行存储在存储器中的上述程序单元来实现相应的功能。
处理器中包含内核,由内核去存储器中调取相应的程序单元。内核可以设置一个或以上,通过调整内核参数来对数据进行区间划分,使划分出的各个区间中的数据量分配均匀。进而在进行数据可视化展示时,获得较好的展示效果。
存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM),存储器包括至少一个存储芯片。
本发明实施例提供了一种计算机可读存储介质,其上存储有程序,该程序被处理器执行时实现所述数据处理方法。
本发明实施例提供了一种处理器,所述处理器用于运行程序,其中,所述程序运行时执行所述数据处理方法。
本发明实施例提供了一种设备,设备包括处理器、存储器及存储在存储器上并可在处理器上运行的程序,处理器执行程序时实现以下步骤:
将待划分区间的t个数据按照大小排序形成数组arr;获取所述数组arr的中位数m和所述t个数据的平均数a;根据所述m和a将所述t个数据划分为N个区间;所述N个区间包括第一组区间和第二组区间;将所述数组arr中最小值到a之间的数据进行第一组区间划分,将a到数组arr中最大值之间的数据进行第二组区间划分;当所述a减去m的差值大于第一预定值,所述第一组区间个数大于所述第二组区间个数;当所述m减去a的差值大于第一预定值,所述第一组区间个数小于所述第二组区间个数。
优选的,根据权利要求1所述的数据处理方法,还包括:判断所述a和m差值的绝对值比所述数组arr的最大值小预定数量级,则按照预定区间宽度对所述数组arr进行N个区间平均划分。
所述按照预定区间宽度对所述数组arr进行N个区间平均划分,具体可以包括:将所述数组arr中最大值和所述数组arr中最小值的差值除以所述N,将所得的商作为所述预定区间宽度;按照所述预定区间宽度对所述数组arr进行N个区间平均划分。
根据所述m和a将所述t个数据划分为N个区间;所述N个区间包括第一组区间和第二组区间;将所述数组arr中最小值到a之间的数据进行第一组区间划分,将a到数组arr中最大值之间的数据进行第二组区间划分;具体可以包括:将所述数组arr划分为两个区间,所述两个区间分别为:所述数组arr中最小值到a和a到数组arr中最大值;记录所述两个区间中数据个数较少的区间的数据的数目S1;将所述两个区间中数据个数较多的区间作为新的数组按照对所述数组arr划分为两个区间的方式进行再次划分,获得新的数组划分的两个区间的数据的数目分别为S2和S3;将所述S1、S2和S3最大数目对应的区间作为新的数组继续划分,以此类推,直到划分的区间的个数为N。
当t为奇数时,所述中位数为位于所述数组arr中排序中间的数据;当t为偶数时,所述中位数为所述数组arr中排序中间的两位数据的平均数。
本文中的设备可以是服务器、PC、PAD、手机等。
本申请还提供了一种计算机程序产品,当在数据处理设备上执行时,适于执行初始化有如下方法步骤的程序:
将待划分区间的t个数据按照从小到大的顺序排序形成数组arr;
获取所述数组arr的中位数m和所述t个数据的平均数a;
根据所述m和a将所述t个数据划分为N个区间;所述N个区间包括第一组区间和第二组区间;将所述数组arr中最小值到a之间的数据进行第一组区间划分,将a到数组arr中最大值之间的数据进行第二组区间划分;当所述a减去m的差值大于第一预定值,所述第一组区间个数大于所述第二组区间个数;当所述m减去a的差值大于第一预定值,所述第一组区间个数小于所述第二组区间个数。
该方法还包括:
判断所述a和m差值的绝对值比所述数组arr的最大值小预定数量级,则按照预定区间宽度对所述数组arr进行N个区间平均划分。
所述按照预定区间宽度对所述t个数据进行N个区间平均划分,具体包括:
将所述数组arr中最大值和所述数组arr中最小值的差值除以所述N,将所得的商作为所述预定区间宽度;
按照所述预定区间宽度对所述数组arr进行N个区间平均划分。
根据所述m和a将所述t个数据划分为N个区间;所述N个区间包括第一组区间和第二组区间;将所述数组arr中最小值到a之间的数据进行第一组区间划分,将a到数组arr中最大值之间的数据进行第二组区间划分;,具体包括:
将所述数组arr划分为两个区间,所述两个区间分别为:所述数组arr中最小值到a和a到数组arr中最大值;
记录所述两个区间中数据个数较少的区间的数据的数目S 1;
将所述两个区间中数据个数较多的区间作为新的数组按照对所述数组arr划分为两个区间的方式进行再次划分,获得新的数组划分的两个区间的数据的数目分别为S2和S3;
将所述S1、S2和S3最大数目对应的区间作为新的数组继续划分,以此类推,直到划分的区间的个数为N。
当t为奇数时,所述中位数为位于所述数组arr中排序中间的数据;
当t为偶数时,所述中位数为所述数组arr中排序中间的两位数据的平均数。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。存储器是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括要素的过程、方法、商品或者设备中还存在另外的相同要素。
本领域技术人员应明白,本申请的实施例可提供为方法、系统或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
以上仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。

Claims (8)

1.一种数据处理方法,其特征在于,包括:
将待划分区间的t个数据按照大小排序形成数组arr;
获取所述数组arr的中位数m和所述t个数据的平均数a;
根据所述m和a将所述t个数据划分为N个区间;所述N个区间包括第一组区间和第二组区间;将所述数组arr中最小值到a之间的数据进行第一组区间划分,将a到数组arr中最大值之间的数据进行第二组区间划分;当所述a减去m的差值大于第一预定值,所述第一组区间个数大于所述第二组区间个数;当所述m减去a的差值大于第一预定值,所述第一组区间个数小于所述第二组区间个数;
对划分到所述N个区间的t个数据进行可视化展示;
所述数据处理方法,还包括:
判断所述a和m差值的绝对值比所述数组arr的最大值小预定数量级,则按照预定区间宽度对所述数组arr进行N个区间平均划分。
2.根据权利要求1所述的数据处理方法,其特征在于,所述按照预定区间宽度对所述数组arr进行N个区间平均划分,具体包括:
将所述数组arr中最大值和所述数组arr中最小值的差值除以所述N,将所得的商作为所述预定区间宽度;
按照所述预定区间宽度对所述数组arr进行N个区间平均划分。
3.根据权利要求1所述的数据处理方法,其特征在于,根据所述m和a将所述t个数据划分为N个区间;所述N个区间包括第一组区间和第二组区间;将所述数组arr中最小值到a之间的数据进行第一组区间划分,将a到数组arr中最大值之间的数据进行第二组区间划分;具体包括:
将所述数组arr划分为两个区间,所述两个区间分别为:所述数组arr中最小值到a和a到数组arr中最大值;
记录所述两个区间中数据个数较少的区间的数据的数目S1;
将所述两个区间中数据个数较多的区间作为新的数组按照对所述数组arr划分为两个区间的方式进行再次划分,获得新的数组划分的两个区间的数据的数目分别为S2和S3;
将所述S1、S2和S3最大数目对应的区间作为新的数组继续划分,以此类推,直到划分的区间的个数为N。
4.根据权利要求1-3任一项所述的数据处理方法,其特征在于,当t为奇数时,所述中位数为位于所述数组arr中排序中间的数据;
当t为偶数时,所述中位数为所述数组arr中排序中间的两位数据的平均数。
5.一种数据处理装置,其特征在于,包括:排序单元、平均数获得单元和区间划分单元;
所述排序单元,用于将待划分区间的t个数据按照大小排序形成数组arr;
所述平均数获得单元,用于获取所述数组arr的中位数m和所述t个数据的平均数a;
所述区间划分单元,用于根据所述m和a将所述t个数据划分为N个区间;所述N个区间包括第一组区间和第二组区间;将所述数组arr中最小值到a之间的数据进行第一组区间划分,将a到数组arr中最大值之间的数据进行第二组区间划分;当所述a减去m的差值大于第一预定值,所述第一组区间个数大于所述第二组区间个数;当所述m减去a的差值大于第一预定值,所述第一组区间个数小于所述第二组区间个数;
所述数据处理装置,还用于对划分到所述N个区间的t个数据进行可视化展示;
所述数据处理装置,还包括:
平均划分单元,用于判断所述a和m差值的绝对值比所述数组arr的最大值小预定数量级,则按照预定区间宽度对所述数组arr进行N个区间平均划分。
6.根据权利要求5所述的数据处理装置,其特征在于,所述平均划分单元包括:预定区间宽度获得子单元和平均划分子单元;
所述预定区间宽度获得子单元,用于将所述数组arr中最大值和所述数组arr中最小值的差值除以所述N,将所得的商作为所述预定区间宽度;
所述平均划分子单元,用于按照所述预定区间宽度对所述数组arr进行N个区间平均划分。
7.一种处理器,其特征在于,所述处理器用于运行程序,其中,所述程序运行时执行如权利要求1-4任一项所述的数据处理方法。
8.一种计算机可读存储介质,其特征在于,其上存储有计算机程序,该程序被处理器执行时实现如权利要求1-4任一项所述的数据处理方法。
CN201710840495.2A 2017-09-15 2017-09-15 一种数据处理方法及装置 Active CN110019353B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710840495.2A CN110019353B (zh) 2017-09-15 2017-09-15 一种数据处理方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710840495.2A CN110019353B (zh) 2017-09-15 2017-09-15 一种数据处理方法及装置

Publications (2)

Publication Number Publication Date
CN110019353A CN110019353A (zh) 2019-07-16
CN110019353B true CN110019353B (zh) 2021-07-27

Family

ID=67186292

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710840495.2A Active CN110019353B (zh) 2017-09-15 2017-09-15 一种数据处理方法及装置

Country Status (1)

Country Link
CN (1) CN110019353B (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110399418B (zh) * 2019-07-26 2022-04-12 北京明略软件系统有限公司 数据处理方法及装置、存储介质、电子装置
CN110647557B (zh) * 2019-09-04 2023-05-05 创新先进技术有限公司 海量数据统计方法、装置及设备
CN110806179B (zh) * 2019-11-28 2021-04-30 贵州中烟工业有限责任公司 烟块切片厚度测量方法
CN112668036B (zh) * 2020-02-19 2022-02-01 华控清交信息科技(北京)有限公司 一种数据处理方法、装置和用于数据处理的装置
CN111984934A (zh) * 2020-09-01 2020-11-24 黑龙江八一农垦大学 一种对动物血液生化指标进行优选的方法
CN116414733B (zh) * 2023-03-03 2024-02-20 港珠澳大桥管理局 数据处理方法、装置、计算机设备和存储介质
CN116821559B (zh) * 2023-07-07 2024-02-23 中国人民解放军海军工程大学 用于快速获取一组大数据集中趋势的方法、系统及终端

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105894329A (zh) * 2016-03-31 2016-08-24 乐视控股(北京)有限公司 一种数据分析方法和装置

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105894329A (zh) * 2016-03-31 2016-08-24 乐视控股(北京)有限公司 一种数据分析方法和装置

Also Published As

Publication number Publication date
CN110019353A (zh) 2019-07-16

Similar Documents

Publication Publication Date Title
CN110019353B (zh) 一种数据处理方法及装置
CN110768912B (zh) Api网关限流方法及装置
US10178042B2 (en) System, method, and apparatus for computer system resource allocation
CN111310784B (zh) 资源数据的处理方法及装置
US20150032759A1 (en) System and method for analyzing result of clustering massive data
CN110287197A (zh) 一种数据存储方法、迁移方法及装置
CN109561052A (zh) 网站异常流量的检测方法及装置
EP3961383A1 (en) Automatic derivation of software engineering artifact attributes with integrated distribution calculation
CN112000467A (zh) 一种数据倾斜处理方法、装置、终端设备及存储介质
CN106569893A (zh) 流量控制方法及设备
CN111369599A (zh) 一种图像匹配方法、设备、装置及存储介质
CN111800471B (zh) 一种推荐页面的展示方法、装置及电子设备
CN113485988A (zh) 一种数据质量监控方法、设备及计算机可读存储介质
CN115442262B (zh) 一种资源评估方法、装置、电子设备及存储介质
CN108197074B (zh) 快速傅里叶变换fft数据处理方法及装置
CN104794128A (zh) 数据处理方法和装置
CN110020744A (zh) 动态预测方法及其系统
CN108154377B (zh) 广告作弊预测方法及装置
CN111611243B (zh) 数据处理方法及装置
CN113449208B (zh) 空间查询方法、设备、系统及存储介质
US10698910B2 (en) Generating cohorts using automated weighting and multi-level ranking
CN113672979A (zh) 基于桶结构划分的差分隐私非等距直方图发布方法和装置
CN110782276B (zh) 一种访问分流策略干扰判断方法、装置及电子设备
CN111984637A (zh) 数据建模中的缺失值处理方法和装置、设备及存储介质
CN111274275A (zh) 数据处理方法、装置和计算机可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information

Address after: 100080 No. 401, 4th Floor, Haitai Building, 229 North Fourth Ring Road, Haidian District, Beijing

Applicant after: Beijing Guoshuang Technology Co.,Ltd.

Address before: 100086 Beijing city Haidian District Shuangyushu Area No. 76 Zhichun Road cuigongfandian 8 layer A

Applicant before: Beijing Guoshuang Technology Co.,Ltd.

CB02 Change of applicant information
GR01 Patent grant
GR01 Patent grant