CN108710600A - 快速计算统计趋势特征值的方法及装置 - Google Patents

快速计算统计趋势特征值的方法及装置 Download PDF

Info

Publication number
CN108710600A
CN108710600A CN201810272763.XA CN201810272763A CN108710600A CN 108710600 A CN108710600 A CN 108710600A CN 201810272763 A CN201810272763 A CN 201810272763A CN 108710600 A CN108710600 A CN 108710600A
Authority
CN
China
Prior art keywords
value
sequence
difference
number judgment
absolute value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810272763.XA
Other languages
English (en)
Inventor
马瑞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ding Zhilu
Original Assignee
Zhejiang Changxin Descartes Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang Changxin Descartes Technology Co Ltd filed Critical Zhejiang Changxin Descartes Technology Co Ltd
Priority to CN201810272763.XA priority Critical patent/CN108710600A/zh
Publication of CN108710600A publication Critical patent/CN108710600A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Operations Research (AREA)
  • Probability & Statistics with Applications (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Algebra (AREA)
  • Evolutionary Biology (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Complex Calculations (AREA)

Abstract

本发明公开了快速计算统计趋势特征值的方法及装置,该方法包括向量化步骤、分组求中位步骤、个数判断步骤、输出步骤,无需排序操作,仅通过少量循环即可找到统计趋势特征值作为序列的统计中值,比简单的数学中值更能够直观反映序列的变化趋势。本发明改进了包括机器学习在内的中值计算方法,适用于包括机器学习领域在内的统计操作中,在快速寻找中值的同时使得结果还能够反映序列的趋势;并且,与数据均值相比,本发明计算出的统计中值与数学中值在数学上误差较小,同时具备一定的趋势指示能力。

Description

快速计算统计趋势特征值的方法及装置
技术领域
本发明涉及数据统计的技术领域,尤其涉及快速计算统计趋势特征值的方法及装置。
背景技术
寻找序列的统计中值,即中位数,是包括机器学习在内需要统计操作领域非常频繁的操作,现有方法大多是基于排序的,先对序列排序而后从排序序列中直接找到中位数作为统计中值。
如图1所示,图中序列1、2和3显然具备不同的趋向性,而普通的数学中值(图中ME与1、2和3的交点)所得到的结果是完全一致的,在机器学习的诸多领域如LOSS计算时极有可能会导致方向性丢失。
发明内容
为了克服现有技术的不足,本发明的目的在于提供快速计算统计趋势特征值的方法及装置,旨在解决现有技术寻找序列的统计中值时无法体现数据趋向性的问题。
本发明的目的采用以下技术方案实现:
一种快速计算统计趋势特征值的方法,包括:
向量化步骤,将一维数据表示为行向量,称为序列A:
A=[A1 A2 A3 ... An-1 An],n为正整数;
分组求中位步骤,将A中前3个元素取出组成序列A′,A′=[A1 A2 A3],找到A′的中位数并存入一个初始为空的序列B中使得B=[B1];
再将A中接下来3个元素取出组成序列A′,A′=[A4 A5 A6],找到A′的中位数并存入B中使得B=[B1 B2];
依次类推直到A中全部元素被取出组成序列A′,找到A′的中位数并存入B中,进入个数判断步骤;或者A中剩余元素不足3个;
如果A中剩余元素为2个,An-1和An,则将An-1和An取出组成序列A′,A′=[An-1 An],用A′中较大的值代替B中的最大值,用A′中较小的值代替B中的最小值,进入个数判断步骤;
如果A中剩余元素为1个,An,则将An取出组成序列A′,A′=[An],判断An是否位于B中的最大值和最小值之间,如果是则进入个数判断步骤,否则分别计算An与B中的最大值之差的绝对值、An与B中的最小值之差的绝对值;如果An与B中的最大值之差的绝对值大于An与B中的最小值之差的绝对值,则用An代替B中的最小值,进入个数判断步骤;如果An与B中的最大值之差的绝对值小于An与B中的最小值之差的绝对值,则用An代替B中的最大值,进入个数判断步骤;如果An与B中的最大值之差的绝对值等于An与B中的最小值之差的绝对值,则用An代替B中的最大值,进入个数判断步骤;
个数判断步骤,判断B中元素的个数是否大于等于3,如果是则用B代替A进入分组求中位步骤,否则进入输出步骤;
输出步骤,如果B中有1个元素则输出该1个元素作为序列A的统计趋势特征值,如果B中有2个元素则输出该2个元素的平均数作为序列A的统计趋势特征值。
在上述实施例的基础上,优选的,所述向量化步骤前,还包括:
一维化步骤,将多维数据串接为一维数据。
一种快速计算统计趋势特征值的装置,包括:
向量化模块,用于将一维数据表示为行向量,称为序列A:
A=[A1 A2 A3 ... An-1 An],n为正整数;
分组求中位模块,用于将A中前3个元素取出组成序列A′,A′=[A1 A2 A3],找到A′的中位数并存入一个初始为空的序列B中使得B=[B1];
再将A中接下来3个元素取出组成序列A′,A′=[A4 A5 A6],找到A′的中位数并存入B中使得B=[B1 B2];
依次类推直到A中全部元素被取出组成序列A′,找到A′的中位数并存入B中,调用个数判断模块;或者A中剩余元素不足3个;
如果A中剩余元素为2个,An-1和An,则将An-1和An取出组成序列A′,A′=[An-1 An],用A′中较大的值代替B中的最大值,用A′中较小的值代替B中的最小值,调用个数判断模块;
如果A中剩余元素为1个,An,则将An取出组成序列A′,A′=[An],判断An是否位于B中的最大值和最小值之间,如果是则调用个数判断模块,否则分别计算An与B中的最大值之差的绝对值、An与B中的最小值之差的绝对值;如果An与B中的最大值之差的绝对值大于An与B中的最小值之差的绝对值,则用An代替B中的最小值,调用个数判断模块;如果An与B中的最大值之差的绝对值小于An与B中的最小值之差的绝对值,则用An代替B中的最大值,调用个数判断模块;如果An与B中的最大值之差的绝对值等于An与B中的最小值之差的绝对值,则用An代替B中的最大值,调用个数判断模块;
个数判断模块,用于判断B中元素的个数是否大于等于3,如果是则用B代替A并调用分组求中位模块,否则调用输出模块;
输出模块,用于如果B中有1个元素则输出该1个元素作为序列A的统计趋势特征值,如果B中有2个元素则输出该2个元素的平均数作为序列A的统计趋势特征值。
在上述实施例的基础上,优选的,还包括:
一维化模块,用于将多维数据串接为一维数据。
相比现有技术,本发明的有益效果在于:
本发明公开了快速计算统计趋势特征值的方法及装置,无需排序操作,仅通过少量循环即可找到统计趋势特征值作为序列的统计中值,比简单的数学中值更能够直观反映序列的变化趋势。本发明改进了包括机器学习在内的中值计算方法,适用于包括机器学习领域在内的统计操作中,在快速寻找中值的同时使得结果还能够反映序列的趋势;并且,与数据均值相比,本发明计算出的统计中值与数学中值在数学上误差较小,同时具备一定的趋势指示能力。
附图说明
下面结合附图和实施例对本发明进一步说明。
图1示出了序列1、2、3的数学中值、数据均值以及本发明实施例提供的统计趋势特征值的示意图;
图2示出了本发明实施例提供的一种快速计算统计趋势特征值的方法的流程示意图;
图3示出了本发明实施例提供的一种快速计算统计趋势特征值的装置的结构示意图。
具体实施方式
下面,结合附图以及具体实施方式,对本发明做进一步描述,需要说明的是,在不相冲突的前提下,以下描述的各实施例之间或各技术特征之间可以任意组合形成新的实施例。
具体实施例一
如图2所示,本发明实施例提供了一种快速计算统计趋势特征值的方法,包括:
向量化步骤,将一维数据表示为行向量,称为序列A:
A=[A1 A2 A3 ... An-1 An],n为正整数;
分组求中位步骤,将A中前3个元素取出组成序列A′,A′=[A1 A2 A3],找到A′的中位数并存入一个初始为空的序列B中使得B=[B1];
再将A中接下来3个元素取出组成序列A′,A′=[A4 A5 A6],找到A′的中位数并存入B中使得B=[B1 B2];
依次类推直到A中全部元素被取出组成序列A′,找到A′的中位数并存入B中,进入个数判断步骤;或者A中剩余元素不足3个;
如果A中剩余元素为2个,An-1和An,则将An-1和An取出组成序列A′,A′=[An-1 An],用A′中较大的值代替B中的最大值,用A′中较小的值代替B中的最小值,进入个数判断步骤;
如果A中剩余元素为1个,An,则将An取出组成序列A′,A′=[An],判断An是否位于B中的最大值和最小值之间,如果是则进入个数判断步骤,否则分别计算An与B中的最大值之差的绝对值、An与B中的最小值之差的绝对值;如果An与B中的最大值之差的绝对值大于An与B中的最小值之差的绝对值,则用An代替B中的最小值,进入个数判断步骤;如果An与B中的最大值之差的绝对值小于An与B中的最小值之差的绝对值,则用An代替B中的最大值,进入个数判断步骤;如果An与B中的最大值之差的绝对值等于An与B中的最小值之差的绝对值,则用An代替B中的最大值,进入个数判断步骤;
个数判断步骤,判断B中元素的个数是否大于等于3,如果是则用B代替A进入分组求中位步骤,否则进入输出步骤;
输出步骤,如果B中有1个元素则输出该1个元素作为序列A的统计趋势特征值,如果B中有2个元素则输出该2个元素的平均数作为序列A的统计趋势特征值。
如图1所示,数学中值即图中ME线与序列1、2、3的交点,本发明实施例计算出的统计中值即图中M2线与序列1、2、3的交点,数据均值即AVG线与序列1、2、3的交点。从图中可以看出,相对于数据均值,本发明实施例计算出的统计中值,与数学中值在数学意义上误差较小,同时具备了一定的趋势指示能力。
本发明实施例无需排序操作,仅通过少量循环即可找到统计趋势特征值作为序列的统计中值,比简单的数学中值更能够直观反映序列的变化趋势。本发明实施例改进了包括机器学习在内的中值计算方法,适用于包括机器学习领域在内的统计操作中,在快速寻找中值的同时使得结果还能够反映序列的趋势;并且,与数据均值相比,本发明实施例计算出的统计中值与数学中值在数学上误差较小,同时具备一定的趋势指示能力。
本发明实施例并非只能用于一维数据,并且对需要计算统计中值的数据维数不做限定,对于多维数据只需要将多维数据串接为一维数据即可,其效果不变。优选的,在所述向量化步骤前,本发明实施例还可以包括:一维化步骤,将多维数据串接为一维数据。这样做的好处是,使得本发明实施例可以应用到任何维数数据的统计中值计算中。
本发明实施例中的串接,指的是将多维数据的所有元素从第一行开始,到最后一行结束,依次顺序连接,例如原三维数据为则串接后的一维数据为[1 2 3 4 56 7 8 9]。
在上述的具体实施例一中,提供了快速计算统计趋势特征值的方法,与之相对应的,本申请还提供快速计算统计趋势特征值的装置。由于装置实施例基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。下述描述的装置实施例仅仅是示意性的。
具体实施例二
如图3所示,本发明实施例提供了一种快速计算统计趋势特征值的装置,包括:
向量化模块201,用于将一维数据表示为行向量,称为序列A:
A=[A1 A2 A3 ... An-1 An],n为正整数;
分组求中位模块202,用于将A中前3个元素取出组成序列A′,A′=[A1 A2 A3],找到A′的中位数并存入一个初始为空的序列B中使得B=[B1];
再将A中接下来3个元素取出组成序列A′,A′=[A4 A5 A6],找到A′的中位数并存入B中使得B=[B1 B2];
依次类推直到A中全部元素被取出组成序列A′,找到A′的中位数并存入B中,调用个数判断模块203;或者A中剩余元素不足3个;
如果A中剩余元素为2个,An-1和An,则将An-1和An取出组成序列A′,A′=[An-1 An],用A′中较大的值代替B中的最大值,用A′中较小的值代替B中的最小值,调用个数判断模块203;
如果A中剩余元素为1个,An,则将An取出组成序列A′,A′=[An],判断An是否位于B中的最大值和最小值之间,如果是则调用个数判断模块203,否则分别计算An与B中的最大值之差的绝对值、An与B中的最小值之差的绝对值;如果An与B中的最大值之差的绝对值大于An与B中的最小值之差的绝对值,则用A代替B中的最小值,调用个数判断模块203;如果An与B中的最大值之差的绝对值小于An与B中的最小值之差的绝对值,则用An代替B中的最大值,调用个数判断模块203;如果An与B中的最大值之差的绝对值等于An与B中的最小值之差的绝对值,则用An代替B中的最大值,调用个数判断模块203;
个数判断模块203,用于判断B中元素的个数是否大于等于3,如果是则用B代替A并调用分组求中位模块202,否则调用输出模块204;
输出模块204,用于如果B中有1个元素则输出该1个元素作为序列A的统计趋势特征值,如果B中有2个元素则输出该2个元素的平均数作为序列A的统计趋势特征值。
本发明实施例无需排序操作,仅通过少量循环即可找到统计趋势特征值作为序列的统计中值,比简单的数学中值更能够直观反映序列的变化趋势。本发明实施例改进了包括机器学习在内的中值计算方法,适用于包括机器学习领域在内的统计操作中,在快速寻找中值的同时使得结果还能够反映序列的趋势;并且,与数据均值相比,本发明实施例计算出的统计中值与数学中值在数学上误差较小,同时具备一定的趋势指示能力。
优选的,本发明实施例还可以包括:一维化模块205,用于将多维数据串接为一维数据。
本发明从使用目的上,效能上,进步及新颖性等观点进行阐述,其具有的实用进步性,己符合专利法所强调的功能增进及使用要件,本发明以上的说明及附图,仅为本发明的较佳实施例而己,并非以此局限本发明,因此,凡一切与本发明构造,装置,待征等近似、雷同的,即凡依本发明专利申请范围所作的等同替换或修饰等,皆应属本发明的专利申请保护的范围之内。
需要说明的是,在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。尽管本发明已进行了一定程度的描述,明显地,在不脱离本发明的精神和范围的条件下,可进行各个条件的适当变化。可以理解,本发明不限于所述实施方案,而归于权利要求的范围,其包括所述每个因素的等同替换。对本领域的技术人员来说,可根据以上描述的技术方案以及构思,做出其它各种相应的改变以及形变,而所有的这些改变以及形变都应该属于本发明权利要求的保护范围之内。

Claims (4)

1.一种快速计算统计趋势特征值的方法,其特征在于,包括:
向量化步骤,将一维数据表示为行向量,称为序列A:
A=[A1A2A3...An-1An],n为正整数;
分组求中位步骤,将A中前3个元素取出组成序列A',A'=[A1A2A3],找到A′的中位数并存入一个初始为空的序列B中使得B=[B1];
再将A中接下来3个元素取出组成序列A′,A′=[A4A5A6],找到A'的中位数并存入B中使得B=[B1B2];
依次类推直到A中全部元素被取出组成序列A′,找到A′的中位数并存入B中,进入个数判断步骤;或者A中剩余元素不足3个;
如果A中剩余元素为2个,An-1和An,则将An-1和An取出组成序列A',A′=[An-1An],用A′中较大的值代替B中的最大值,用A′中较小的值代替B中的最小值,进入个数判断步骤;
如果A中剩余元素为1个,An,则将An取出组成序列A′,A′=[An],判断An是否位于B中的最大值和最小值之间,如果是则进入个数判断步骤,否则分别计算An与B中的最大值之差的绝对值、An与B中的最小值之差的绝对值;如果An与B中的最大值之差的绝对值大于An与B中的最小值之差的绝对值,则用An代替B中的最小值,进入个数判断步骤;如果An与B中的最大值之差的绝对值小于An与B中的最小值之差的绝对值,则用An代替B中的最大值,进入个数判断步骤;如果An与B中的最大值之差的绝对值等于An与B中的最小值之差的绝对值,则用An代替B中的最大值,进入个数判断步骤;
个数判断步骤,判断B中元素的个数是否大于等于3,如果是则用B代替A进入分组求中位步骤,否则进入输出步骤;
输出步骤,如果B中有1个元素则输出该1个元素作为序列A的统计趋势特征值,如果B中有2个元素则输出该2个元素的平均数作为序列A的统计趋势特征值。
2.根据权利要求1所述的快速计算统计趋势特征值的方法,其特征在于,所述向量化步骤前,还包括:
一维化步骤,将多维数据串接为一维数据。
3.一种快速计算统计趋势特征值的装置,其特征在于,包括:
向量化模块,用于将一维数据表示为行向量,称为序列A:
A=[A1A2A3...An-1An],n为正整数;
分组求中位模块,用于将A中前3个元素取出组成序列A′,A′=[A1A2A3],找到A′的中位数并存入一个初始为空的序列B中使得B=[B1];
再将A中接下来3个元素取出组成序列A′,A′=[A4A5A6],找到A′的中位数并存入B中使得B=[B1B2];
依次类推直到A中全部元素被取出组成序列A′,找到A′的中位数并存入B中,调用个数判断模块;或者A中剩余元素不足3个;
如果A中剩余元素为2个,An-1和An,则将An-1和An取出组成序列A′,A′=[An-1An],用A′中较大的值代替B中的最大值,用A′中较小的值代替B中的最小值,调用个数判断模块;
如果A中剩余元素为1个,An,则将An取出组成序列A′,A′=[An],判断An是否位于B中的最大值和最小值之间,如果是则调用个数判断模块,否则分别计算An与B中的最大值之差的绝对值、An与B中的最小值之差的绝对值;如果An与B中的最大值之差的绝对值大于An与B中的最小值之差的绝对值,则用An代替B中的最小值,调用个数判断模块;如果An与B中的最大值之差的绝对值小于An与B中的最小值之差的绝对值,则用An代替B中的最大值,调用个数判断模块;如果An与B中的最大值之差的绝对值等于An与B中的最小值之差的绝对值,则用An代替B中的最大值,调用个数判断模块;
个数判断模块,用于判断B中元素的个数是否大于等于3,如果是则用B代替A并调用分组求中位模块,否则调用输出模块;
输出模块,用于如果B中有1个元素则输出该1个元素作为序列A的统计趋势特征值,如果B中有2个元素则输出该2个元素的平均数作为序列A的统计趋势特征值。
4.根据权利要求3所述的快速计算统计趋势特征值的装置,其特征在于,还包括:
一维化模块,用于将多维数据串接为一维数据。
CN201810272763.XA 2018-03-29 2018-03-29 快速计算统计趋势特征值的方法及装置 Pending CN108710600A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810272763.XA CN108710600A (zh) 2018-03-29 2018-03-29 快速计算统计趋势特征值的方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810272763.XA CN108710600A (zh) 2018-03-29 2018-03-29 快速计算统计趋势特征值的方法及装置

Publications (1)

Publication Number Publication Date
CN108710600A true CN108710600A (zh) 2018-10-26

Family

ID=63866506

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810272763.XA Pending CN108710600A (zh) 2018-03-29 2018-03-29 快速计算统计趋势特征值的方法及装置

Country Status (1)

Country Link
CN (1) CN108710600A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116821559A (zh) * 2023-07-07 2023-09-29 中国人民解放军海军工程大学 用于快速获取一组大数据集中趋势的方法、系统及终端

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116821559A (zh) * 2023-07-07 2023-09-29 中国人民解放军海军工程大学 用于快速获取一组大数据集中趋势的方法、系统及终端
CN116821559B (zh) * 2023-07-07 2024-02-23 中国人民解放军海军工程大学 用于快速获取一组大数据集中趋势的方法、系统及终端

Similar Documents

Publication Publication Date Title
CN104408179B (zh) 数据表中数据处理方法和装置
WO2017157048A1 (zh) 电网系统图自动化布局克服交叉的方法及系统、存储介质
CN109066687A (zh) 一种电力系统潮流计算方法、系统及电子设备
CN109261528A (zh) 基于双目视觉的快件分拣方法及装置
CN108932217A (zh) 能耗统计的方法及装置
CN103020296A (zh) 一种高精度多维计数布鲁姆过滤器及其大数据处理方法
CN106293938A (zh) 解决大数据计算过程中数据倾斜的方法
CN104462443B (zh) 数据处理方法和装置
CN108377372B (zh) 一种白平衡处理方法、装置、终端设备和存储介质
CN108710600A (zh) 快速计算统计趋势特征值的方法及装置
CN107330944A (zh) 一种全景图像的识别方法、装置、终端设备和存储介质
CN109885384B (zh) 任务并行度优化方法、装置、计算机设备及存储介质
CN103413306B (zh) 一种自适应阈值的Harris角点检测方法
CN104268293B (zh) 数据库中的不可累加指标处理方法和装置
CN105929335A (zh) 电池信息采样处理方法及装置
CN104765820B (zh) 一种非侵入式的服务依赖关系发现方法
CN107864017A (zh) 一种相位校正方法和装置
CN109522630A (zh) 一种基于对角加边形式的电力系统暂态稳定仿真并行计算方法
CN115263467A (zh) 单抽热电联产抽凝机组运行功率上下限确定方法及系统
CN107943807A (zh) 一种数据处理方法及存储设备
CN102663441A (zh) 基于点线关系一致性的错误匹配去除方法
CN209525652U (zh) 一种查表数字电路
CN110347967A (zh) 异构众核处理器的任意带状线性方程组两级分区两次缩聚并行计算的方法及系统
CN110516796A (zh) 一种面向嵌入式平台的分组卷积过程优化方法
CN108647185A (zh) 快速计算统计中值的方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20210219

Address after: No.50 GUCUI Road, Xihu District, Hangzhou City, Zhejiang Province 310012

Applicant after: Ding Zhilu

Address before: 313100 LV Shan township industrial zone, Changxing County, Huzhou, Zhejiang

Applicant before: ZHEJIANG CHANGXING DICAER TECHNOLOGY Co.,Ltd.

RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20181026