CN103559291A - 一种应用正态分布方法的统计分析方法 - Google Patents
一种应用正态分布方法的统计分析方法 Download PDFInfo
- Publication number
- CN103559291A CN103559291A CN201310555116.7A CN201310555116A CN103559291A CN 103559291 A CN103559291 A CN 103559291A CN 201310555116 A CN201310555116 A CN 201310555116A CN 103559291 A CN103559291 A CN 103559291A
- Authority
- CN
- China
- Prior art keywords
- data
- normal distribution
- sample
- samples
- normal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 32
- 238000007619 statistical method Methods 0.000 claims abstract description 9
- 238000012417 linear regression Methods 0.000 claims abstract description 4
- 238000004364 calculation method Methods 0.000 claims description 4
- 238000010586 diagram Methods 0.000 description 5
- 238000011156 evaluation Methods 0.000 description 2
- 241000208340 Araliaceae Species 0.000 description 1
- 235000005035 Panax pseudoginseng ssp. pseudoginseng Nutrition 0.000 description 1
- 235000003140 Panax quinquefolius Nutrition 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 235000008434 ginseng Nutrition 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2462—Approximate or statistical queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/20—Education
- G06Q50/205—Education administration or guidance
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Probability & Statistics with Applications (AREA)
- Tourism & Hospitality (AREA)
- Strategic Management (AREA)
- Educational Technology (AREA)
- Educational Administration (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- Fuzzy Systems (AREA)
- General Engineering & Computer Science (AREA)
- Economics (AREA)
- General Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- General Business, Economics & Management (AREA)
- Complex Calculations (AREA)
Abstract
本发明公开了一种应用正态分布方法的统计分析方法,其特征在于包括:接收样本,从模块宿主处接收样本S,同时备份原样本S1;判断S的数量是否符合正态分布,当数据合法,获取样本的最大精度P(A2),根据P和S的平均值计算获取均值X;如果数据不合法,结束操作,向样本中填充足够数量的无意义数据使样本数量符合正态分布A1;根据正态分布公式,生成正态分布图形所需要的数据点,根据已计算出的变量向主面板绘制正态分布图;根据步骤三得到的数据点向主面板绘制线性回归线,为统计分析提供参考该方法通过完成大量的数据统计工作,从而使评价人员最终理顺数据间的分布状态、数据的特征和变化规律、数据间的关系。
Description
技术领域
本发明涉及一种应用正态分布方法的统计分析方法。
背景技术
学校的统计分析,是通过考评表在考评结束后对被统计、分析以及导出Excel表格、打印成标准的A4格式的文件和形成各种图表,图标的种类不少于5种,如折线图、柱形图、立体图、饼形图、雷达图等。然后基于人的查阅,直观评定。这样做非常不公平。如果不对获得的数据进行整理、分析,揭示出蕴含在数据中的问题。使得分析工作变得不公平。正态分布(Normal distribution)又名高斯分布(Gaussian distribution),是一个在数学、物理及工程等领域都非常重要的概率分布,在统计学的许多方面有着重大的影响力。为统计分析系统提供了技术支持。
发明内容
本发明针对以上问题的提出,而研制一种应用正态分布方法的统计分析方法。本发明采用的技术方案如下:
一种应用正态分布方法的统计分析方法,其特征在于包括如下步骤:
步骤一:接收样本,从模块宿主处接收样本S,同时备份原样本S1;
步骤二:判断S的数量是否符合正态分布,当数据合法,获取样本的最大精度P(A2),根据P和S的平均值计算获取均值X,X=Round(Simple.Avg,P),根据X轴刻度,计算获取Σ.(A3),计算得出均值上限Usl=X+3*∑,均值下限Lsl=X–3*∑;如果数据不合法,结束操作,向样本中填充足够数量的无意义数据使样本数量符合正态分布A1;
步骤三:根据正态分布公式,生成正态分布图形所需要的数据点,根据已计算出的变量向主面板绘制正态分布图;
步骤四:根据步骤三得到的数据点向主面板绘制线性回归线,为统计分析提供参考。本方法为其宿主提供了一系列接口给外部调用,所以宿主可以是form或者webClient。
这种系统通过完成大量的数据统计工作,从而使评价人员最终理顺数据间的分布状态、数据的特征和变化规律、数据间的关系。
附图说明
图1为本发明所述方法的具体实现流程图;
图2为样本的最小值和最大值运算的流程图;
图3为比较出最大的精度的流程图;
图4为运算S开平方的流程图
图5本发明实施效果图。
具体实施方式
如图1和图5所示应用正态分布方法的统计分析方法包括如下步骤:
步骤一:接收样本,从模块宿主处接收样本S,同时备份原样本S1;
步骤二:判断S的数量是否符合正态分布,当数据合法,获取样本的最大精度P(A2),根据P和S的平均值计算获取均值X,X=Round(Simple.Avg,P),根据X轴刻度,计算获取Σ.(A3),计算得出均值上限Usl=X+3*∑,均值下限Lsl=X–3*∑;如果数据不合法,结束操作,向样本中填充足够数量的无意义数据使样本数量符合正态分布A1;
步骤三:根据正态分布公式,生成正态分布图形所需要的数据点,根据已计算出的变量向主面板绘制正态分布图;
步骤四:根据步骤三得到的数据点向主面板绘制线性回归线,为统计分析提供参考。
本发明具体实现如下:
在接收样本时,本方法(由SilverLight实现)为其宿主提供了一系列接口给外部调用,所以宿主可以是form或者webClient中的任意一种.在客户端中,宿主窗体通过实例名.方法来进行参数传递和交互.而在web开发的系统中,是以js脚本来传参和交互.这样做的目的是为了提高本方法组件的移植性.
WEB端调用:
Form端调用:
Chart.ChartMain cm=new Chart.ChartMain();
cm.SetMapInfo(new Chart.Models.ChartInfo{chartType=Chart.ToolClass.ChartType.Piechart,TableName="测试表A"});
接收样本之后,需要对样本是否附合或者有足够的样本来计算绘制出正态分布图表.由正态分布特征得知:正态分布具有集中性,对称性和均匀变动性.而当样本数量过少时(如长度为2的数组{30,50})便不能满足正态分布的数据要求.所以此时方法会向样本中按照当前样本的走势,补足足够数量的虚拟样本.
样式加工完成后,则进入主要计算环节.根据正态分布曲线性质:
1.当x<μ时,曲线上升;当x>μ时,曲线下降。当曲线向左右两边无限延伸时,以x轴为渐近线。
2.正态曲线关于直线x=μ对称。
3.σ越大,正态曲线越扁平;σ越小,正态曲线越尖陡。
4.在正态曲线下方和x轴上方范围内区域面积为1。3σ原则:P(μ-σ<X≤μ+σ)=68.3%P(μ-2σ<X≤μ+2σ)=95.4%P(μ-3σ<X≤μ+3σ)=99.7%
举例绘制正态分布的方法:
某地1993年抽样调查了100名18岁男大学生身高(cm),其均数=172.70cm,标准差s=4.01cm,①估计该地18岁男大学生身高在168cm以下者占该地18岁男大学生总数的百分数;②分别求X+-1s、X+-1.96s、X+-2.58s范围内18岁男大学生占该地18岁男大学生总数的实际百分数,并与理论百分数比较。
本例,μ、σ未知但样本含量n较大,按式(3.1)用样本均数X和标准差S分别代替μ和σ,求得u值,u=(168-172.70)/4.01=-1.17。查附表标准正态曲线下的面积,在表的左侧找到-1.1,表的上方找到0.07,两者相交处为0.1210=12.10%。该地18岁男大学生身高在168cm以下者,约占总数12.10%。其它计算结果见[表3]。
[表3]100名18岁男大学生身高的实际分布与理论分布
求均数μ的代码实现为:
μ=Math.Round((double)Samples.Average(),mostPrecision);
解释:均数=样本的平均数按照最大浮点精度4舍5入
求标准差σ的代码实现为:
根据已得出的μ和σ,将S中的值转换为可在屏幕显示的比例后,就会得出如图5的结果。
Claims (2)
1.一种应用正态分布方法的统计分析方法,其特征在于包括如下步骤:
步骤一:接收样本,从模块宿主处接收样本S,同时备份原样本S1;
步骤二:判断S的数量是否符合正态分布,当数据合法,获取样本的最大精度P(A2),根据P和S的平均值计算获取均值X,X=Round(Simple.Avg,P),根据X轴刻度,计算获取Σ.(A3),计算得出均值上限Usl=X+3*∑,均值下限Lsl=X–3*∑;如果数据不合法,结束操作,向样本中填充足够数量的无意义数据使样本数量符合正态分布A1;
步骤三:根据正态分布公式,生成正态分布图形所需要的数据点,根据已计算出的变量向主面板绘制正态分布图;
步骤四:根据步骤三得到的数据点向主面板绘制线性回归线,为统计分析提供参考。
2.根据权利要求1所述的一种应用正态分布方法的统计分析方法,其特征在于本方法为其宿主提供了一系列接口给外部调用,所以宿主可以是form或者webClient。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310555116.7A CN103559291A (zh) | 2013-11-07 | 2013-11-07 | 一种应用正态分布方法的统计分析方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310555116.7A CN103559291A (zh) | 2013-11-07 | 2013-11-07 | 一种应用正态分布方法的统计分析方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN103559291A true CN103559291A (zh) | 2014-02-05 |
Family
ID=50013537
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201310555116.7A Pending CN103559291A (zh) | 2013-11-07 | 2013-11-07 | 一种应用正态分布方法的统计分析方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN103559291A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109359816A (zh) * | 2018-09-12 | 2019-02-19 | 珠海知未科技有限公司 | 一种基于回归分析的教学加工分析方法及系统 |
CN109408303A (zh) * | 2018-09-19 | 2019-03-01 | Oppo(重庆)智能科技有限公司 | 测试数据分析方法及相关产品 |
CN109711083A (zh) * | 2019-01-09 | 2019-05-03 | 王雪微 | 一种基于正态分布的服装尺寸确定方法 |
-
2013
- 2013-11-07 CN CN201310555116.7A patent/CN103559291A/zh active Pending
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109359816A (zh) * | 2018-09-12 | 2019-02-19 | 珠海知未科技有限公司 | 一种基于回归分析的教学加工分析方法及系统 |
CN109408303A (zh) * | 2018-09-19 | 2019-03-01 | Oppo(重庆)智能科技有限公司 | 测试数据分析方法及相关产品 |
CN109711083A (zh) * | 2019-01-09 | 2019-05-03 | 王雪微 | 一种基于正态分布的服装尺寸确定方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103247008B (zh) | 一种电力统计指标数据的质量评估方法 | |
Peeples et al. | Refining correspondence analysis-based ceramic seriation of regional data sets | |
CN104573333B (zh) | 利用聚类分析进行模型优选的方法 | |
CN103559291A (zh) | 一种应用正态分布方法的统计分析方法 | |
CN110991985A (zh) | 一种项目进度数据处理方法 | |
CN107291582A (zh) | 基于标准大数据的智能化集成测试方法 | |
DE112016001459T5 (de) | System und Verfahren zum Bereitstellen von Information über einen gegenwärtigen Geschäftszustand eines lokalen Güter- oder Dienstleistungsanbieters | |
CN112181782A (zh) | 基于ab测试的自适应灰度功能发布方法和装置 | |
CN104866940A (zh) | 一种地质风险评价随机模拟方法 | |
CN108846360A (zh) | 草原盐渍化的遥感识别方法、装置及计算机可读储存介质 | |
CN106651513B (zh) | 线路板订单的报价方法与装置 | |
CN105930255A (zh) | 一种系统健康度预测方法及装置 | |
CN111062602A (zh) | 企业信用风险评估的方法、装置及存储介质 | |
JP6192432B2 (ja) | リスク計量システム | |
CN103559402A (zh) | 一种应用线性回归方法的统计分析方法 | |
CN117593115A (zh) | 信贷风险评估模型的特征值确定方法、装置、设备和介质 | |
CN112231386A (zh) | 铁路科研数据可视化交互方法及系统、设备及存储介质 | |
CN110287243B (zh) | 分布式数据实时采集与展示系统及方法 | |
CN110941646A (zh) | 基于10kv工程三率数据挖掘的项目进度管控系统 | |
Sokolov et al. | SwingStations: a web-based client tool for the Baltic environmental database | |
CN105631634A (zh) | 一种跨终端可交互的物流大数据实时分析系统 | |
CN105499282A (zh) | 一种冷轧带钢在线板形分析方法及装置 | |
CN115344495A (zh) | 批量任务测试的数据分析方法、装置、计算机设备及介质 | |
CN114511239A (zh) | 土壤重金属污染风险区划分方法、装置、电子设备及介质 | |
CN115292202A (zh) | 一种产品测试分析方法、装置、电子设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20140205 |