CN103559291A - 一种应用正态分布方法的统计分析方法 - Google Patents

一种应用正态分布方法的统计分析方法 Download PDF

Info

Publication number
CN103559291A
CN103559291A CN201310555116.7A CN201310555116A CN103559291A CN 103559291 A CN103559291 A CN 103559291A CN 201310555116 A CN201310555116 A CN 201310555116A CN 103559291 A CN103559291 A CN 103559291A
Authority
CN
China
Prior art keywords
data
normal distribution
sample
samples
normal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201310555116.7A
Other languages
English (en)
Inventor
李军
王世盛
迟宝华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
DALIAN EAST STAR INFORMATION TECHNOLOGY Co Ltd
Original Assignee
DALIAN EAST STAR INFORMATION TECHNOLOGY Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by DALIAN EAST STAR INFORMATION TECHNOLOGY Co Ltd filed Critical DALIAN EAST STAR INFORMATION TECHNOLOGY Co Ltd
Priority to CN201310555116.7A priority Critical patent/CN103559291A/zh
Publication of CN103559291A publication Critical patent/CN103559291A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2462Approximate or statistical queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/20Education
    • G06Q50/205Education administration or guidance

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Tourism & Hospitality (AREA)
  • Strategic Management (AREA)
  • Educational Technology (AREA)
  • Educational Administration (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • Fuzzy Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Economics (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • General Business, Economics & Management (AREA)
  • Complex Calculations (AREA)

Abstract

本发明公开了一种应用正态分布方法的统计分析方法,其特征在于包括:接收样本,从模块宿主处接收样本S,同时备份原样本S1;判断S的数量是否符合正态分布,当数据合法,获取样本的最大精度P(A2),根据P和S的平均值计算获取均值X;如果数据不合法,结束操作,向样本中填充足够数量的无意义数据使样本数量符合正态分布A1;根据正态分布公式,生成正态分布图形所需要的数据点,根据已计算出的变量向主面板绘制正态分布图;根据步骤三得到的数据点向主面板绘制线性回归线,为统计分析提供参考该方法通过完成大量的数据统计工作,从而使评价人员最终理顺数据间的分布状态、数据的特征和变化规律、数据间的关系。

Description

一种应用正态分布方法的统计分析方法
技术领域
本发明涉及一种应用正态分布方法的统计分析方法。
背景技术
学校的统计分析,是通过考评表在考评结束后对被统计、分析以及导出Excel表格、打印成标准的A4格式的文件和形成各种图表,图标的种类不少于5种,如折线图、柱形图、立体图、饼形图、雷达图等。然后基于人的查阅,直观评定。这样做非常不公平。如果不对获得的数据进行整理、分析,揭示出蕴含在数据中的问题。使得分析工作变得不公平。正态分布(Normal distribution)又名高斯分布(Gaussian distribution),是一个在数学、物理及工程等领域都非常重要的概率分布,在统计学的许多方面有着重大的影响力。为统计分析系统提供了技术支持。
发明内容
本发明针对以上问题的提出,而研制一种应用正态分布方法的统计分析方法。本发明采用的技术方案如下:
一种应用正态分布方法的统计分析方法,其特征在于包括如下步骤:
步骤一:接收样本,从模块宿主处接收样本S,同时备份原样本S1;
步骤二:判断S的数量是否符合正态分布,当数据合法,获取样本的最大精度P(A2),根据P和S的平均值计算获取均值X,X=Round(Simple.Avg,P),根据X轴刻度,计算获取Σ.(A3),计算得出均值上限Usl=X+3*∑,均值下限Lsl=X–3*∑;如果数据不合法,结束操作,向样本中填充足够数量的无意义数据使样本数量符合正态分布A1;
步骤三:根据正态分布公式,生成正态分布图形所需要的数据点,根据已计算出的变量向主面板绘制正态分布图;
步骤四:根据步骤三得到的数据点向主面板绘制线性回归线,为统计分析提供参考。本方法为其宿主提供了一系列接口给外部调用,所以宿主可以是form或者webClient。
这种系统通过完成大量的数据统计工作,从而使评价人员最终理顺数据间的分布状态、数据的特征和变化规律、数据间的关系。
附图说明
图1为本发明所述方法的具体实现流程图;
图2为样本的最小值和最大值运算的流程图;
图3为比较出最大的精度的流程图;
图4为运算S开平方的流程图
图5本发明实施效果图。
具体实施方式
如图1和图5所示应用正态分布方法的统计分析方法包括如下步骤:
步骤一:接收样本,从模块宿主处接收样本S,同时备份原样本S1;
步骤二:判断S的数量是否符合正态分布,当数据合法,获取样本的最大精度P(A2),根据P和S的平均值计算获取均值X,X=Round(Simple.Avg,P),根据X轴刻度,计算获取Σ.(A3),计算得出均值上限Usl=X+3*∑,均值下限Lsl=X–3*∑;如果数据不合法,结束操作,向样本中填充足够数量的无意义数据使样本数量符合正态分布A1;
步骤三:根据正态分布公式,生成正态分布图形所需要的数据点,根据已计算出的变量向主面板绘制正态分布图;
步骤四:根据步骤三得到的数据点向主面板绘制线性回归线,为统计分析提供参考。
本发明具体实现如下:
在接收样本时,本方法(由SilverLight实现)为其宿主提供了一系列接口给外部调用,所以宿主可以是form或者webClient中的任意一种.在客户端中,宿主窗体通过实例名.方法来进行参数传递和交互.而在web开发的系统中,是以js脚本来传参和交互.这样做的目的是为了提高本方法组件的移植性.
WEB端调用:
Figure BDA0000409945910000021
Form端调用:
Chart.ChartMain cm=new Chart.ChartMain();
cm.SetMapInfo(new Chart.Models.ChartInfo{chartType=Chart.ToolClass.ChartType.Piechart,TableName="测试表A"});
接收样本之后,需要对样本是否附合或者有足够的样本来计算绘制出正态分布图表.由正态分布特征得知:正态分布具有集中性,对称性和均匀变动性.而当样本数量过少时(如长度为2的数组{30,50})便不能满足正态分布的数据要求.所以此时方法会向样本中按照当前样本的走势,补足足够数量的虚拟样本.
样式加工完成后,则进入主要计算环节.根据正态分布曲线性质:
1.当x<μ时,曲线上升;当x>μ时,曲线下降。当曲线向左右两边无限延伸时,以x轴为渐近线。
2.正态曲线关于直线x=μ对称。
3.σ越大,正态曲线越扁平;σ越小,正态曲线越尖陡。
4.在正态曲线下方和x轴上方范围内区域面积为1。3σ原则:P(μ-σ<X≤μ+σ)=68.3%P(μ-2σ<X≤μ+2σ)=95.4%P(μ-3σ<X≤μ+3σ)=99.7%
举例绘制正态分布的方法:
某地1993年抽样调查了100名18岁男大学生身高(cm),其均数=172.70cm,标准差s=4.01cm,①估计该地18岁男大学生身高在168cm以下者占该地18岁男大学生总数的百分数;②分别求X+-1s、X+-1.96s、X+-2.58s范围内18岁男大学生占该地18岁男大学生总数的实际百分数,并与理论百分数比较。
本例,μ、σ未知但样本含量n较大,按式(3.1)用样本均数X和标准差S分别代替μ和σ,求得u值,u=(168-172.70)/4.01=-1.17。查附表标准正态曲线下的面积,在表的左侧找到-1.1,表的上方找到0.07,两者相交处为0.1210=12.10%。该地18岁男大学生身高在168cm以下者,约占总数12.10%。其它计算结果见[表3]。
[表3]100名18岁男大学生身高的实际分布与理论分布
求均数μ的代码实现为:
μ=Math.Round((double)Samples.Average(),mostPrecision);
解释:均数=样本的平均数按照最大浮点精度4舍5入
求标准差σ的代码实现为:
Figure BDA0000409945910000042
根据已得出的μ和σ,将S中的值转换为可在屏幕显示的比例后,就会得出如图5的结果。

Claims (2)

1.一种应用正态分布方法的统计分析方法,其特征在于包括如下步骤:
步骤一:接收样本,从模块宿主处接收样本S,同时备份原样本S1;
步骤二:判断S的数量是否符合正态分布,当数据合法,获取样本的最大精度P(A2),根据P和S的平均值计算获取均值X,X=Round(Simple.Avg,P),根据X轴刻度,计算获取Σ.(A3),计算得出均值上限Usl=X+3*∑,均值下限Lsl=X–3*∑;如果数据不合法,结束操作,向样本中填充足够数量的无意义数据使样本数量符合正态分布A1;
步骤三:根据正态分布公式,生成正态分布图形所需要的数据点,根据已计算出的变量向主面板绘制正态分布图;
步骤四:根据步骤三得到的数据点向主面板绘制线性回归线,为统计分析提供参考。
2.根据权利要求1所述的一种应用正态分布方法的统计分析方法,其特征在于本方法为其宿主提供了一系列接口给外部调用,所以宿主可以是form或者webClient。
CN201310555116.7A 2013-11-07 2013-11-07 一种应用正态分布方法的统计分析方法 Pending CN103559291A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310555116.7A CN103559291A (zh) 2013-11-07 2013-11-07 一种应用正态分布方法的统计分析方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310555116.7A CN103559291A (zh) 2013-11-07 2013-11-07 一种应用正态分布方法的统计分析方法

Publications (1)

Publication Number Publication Date
CN103559291A true CN103559291A (zh) 2014-02-05

Family

ID=50013537

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310555116.7A Pending CN103559291A (zh) 2013-11-07 2013-11-07 一种应用正态分布方法的统计分析方法

Country Status (1)

Country Link
CN (1) CN103559291A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109359816A (zh) * 2018-09-12 2019-02-19 珠海知未科技有限公司 一种基于回归分析的教学加工分析方法及系统
CN109408303A (zh) * 2018-09-19 2019-03-01 Oppo(重庆)智能科技有限公司 测试数据分析方法及相关产品
CN109711083A (zh) * 2019-01-09 2019-05-03 王雪微 一种基于正态分布的服装尺寸确定方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109359816A (zh) * 2018-09-12 2019-02-19 珠海知未科技有限公司 一种基于回归分析的教学加工分析方法及系统
CN109408303A (zh) * 2018-09-19 2019-03-01 Oppo(重庆)智能科技有限公司 测试数据分析方法及相关产品
CN109711083A (zh) * 2019-01-09 2019-05-03 王雪微 一种基于正态分布的服装尺寸确定方法

Similar Documents

Publication Publication Date Title
CN103247008B (zh) 一种电力统计指标数据的质量评估方法
Peeples et al. Refining correspondence analysis-based ceramic seriation of regional data sets
CN109961165B (zh) 件量预测方法、装置、设备及其存储介质
CN103116696A (zh) 基于稀疏采样的手机定位数据的人员常驻地点识别方法
CN104573333B (zh) 利用聚类分析进行模型优选的方法
CN103559291A (zh) 一种应用正态分布方法的统计分析方法
CN110210751A (zh) 基于神经网络的检修作业风险分析方法、装置及终端
CN107291582A (zh) 基于标准大数据的智能化集成测试方法
CN112181782A (zh) 基于ab测试的自适应灰度功能发布方法和装置
CN104866940A (zh) 一种地质风险评价随机模拟方法
CN108846360A (zh) 草原盐渍化的遥感识别方法、装置及计算机可读储存介质
CN105930255A (zh) 一种系统健康度预测方法及装置
CN105488253A (zh) 一种确定地面沉降和区域静载荷相关性的方法
CN105739970A (zh) 数据映射为自定义类对象的方法和装置
CN103559402A (zh) 一种应用线性回归方法的统计分析方法
CN117593115A (zh) 信贷风险评估模型的特征值确定方法、装置、设备和介质
CN112231386A (zh) 铁路科研数据可视化交互方法及系统、设备及存储介质
CN110287243B (zh) 分布式数据实时采集与展示系统及方法
JP2015041259A (ja) リスク計量システム
CN114511239B (zh) 土壤重金属污染风险区划分方法、装置、电子设备及介质
CN110941646A (zh) 基于10kv工程三率数据挖掘的项目进度管控系统
CN105499282A (zh) 一种冷轧带钢在线板形分析方法及装置
CN115344495A (zh) 批量任务测试的数据分析方法、装置、计算机设备及介质
CN105095552A (zh) 一种通用概率分布参数估计流程与分析方法
CN105095981A (zh) 一种基于人机交互的油气藏规模序列资源评价方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20140205