CN108090214B - 一种基于样本量阈值计算的实时统计样本量的方法 - Google Patents

一种基于样本量阈值计算的实时统计样本量的方法 Download PDF

Info

Publication number
CN108090214B
CN108090214B CN201711478959.6A CN201711478959A CN108090214B CN 108090214 B CN108090214 B CN 108090214B CN 201711478959 A CN201711478959 A CN 201711478959A CN 108090214 B CN108090214 B CN 108090214B
Authority
CN
China
Prior art keywords
sample size
user
new data
counting
experiment
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201711478959.6A
Other languages
English (en)
Other versions
CN108090214A (zh
Inventor
吴朝鑫
杜旭明
张胜革
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Anhui Fangzheng Medical Information Technology Co ltd
Original Assignee
Anhui Fangzheng Medical Information Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Anhui Fangzheng Medical Information Technology Co ltd filed Critical Anhui Fangzheng Medical Information Technology Co ltd
Priority to CN201711478959.6A priority Critical patent/CN108090214B/zh
Publication of CN108090214A publication Critical patent/CN108090214A/zh
Application granted granted Critical
Publication of CN108090214B publication Critical patent/CN108090214B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2462Approximate or statistical queries

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Probability & Statistics with Applications (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Fuzzy Systems (AREA)
  • Computational Linguistics (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本发明公开了一种基于样本量阈值计算的实时统计样本量的方法,具体步骤如下:用户设置好本次实验目的模板和所需要统计的限制条件;监听是否有新数据进入系统;监听到有新数据进入后,统计样本量,以验证新数据是否满足用户设置的统计限制条件;新数据满足用户设置的统计限制条件后,验证统计系统样本量是否达到阈值;系统样本量达到阈值后,通知用户。本发明具有操作方便、大大降低了实验人员的使用难度等优点。

Description

一种基于样本量阈值计算的实时统计样本量的方法
技术领域
本发明涉及统计学样本量阈值计算领域,具体来说是一种基于样本量阈值计算的实时统计样本量的方法。
背景技术
在临床实验研究中,无论是实验组还是对照组都需要有一定数量的受试对象,这是因为同一种实验处理在不同的受试对象身上表现出的实验效应是存在着变异的,仅凭一次实验观测结果或单个受试者所表现出来的实验效应说明不了什么问题,必须通过一定数量的重复观测才能把研究总体真实的客观规律性显示出来,并且可以对抽样误差做出客观地估计。因此在实验设计中的一个重要问题就是如何科学合理确定样本阈值。所以样本量使统计显得尤为重要,只有样本量到达了阈值的需求,实验研究才具备一定的可信度。
在临床试验中,一般的流程如下:
(1)从各个生产环境中收集数据存入数据仓库;
(2)根据相应的实验目的计算出需要的样本量阈值;
(3)定时查当前环境中统计目前的样本量是否达标。
在以上的操作流程中存在几个问题:
1、在上述流程中的步骤(2),计算所需要的样本量阈值时需要各种指标的使用到各种指标的标准差,然后再代入公式计算,比较繁琐手工计算还存在计算失误的情况;
2、在步骤(3)中去统计样本量,需要实验人员具备一定的IT技能或者找运维工程师统计,这样加大了实验的操作难度;
3、定时去统计样本量,不能实时的获取当前样本量的实际情况。
发明内容
针对于现有技术所存在的操作繁琐、存在计算误差的缺陷,提供一种基于样本量阈值计算的实时统计样本量的方法,该方法能够根据用户的实验目的计算当前实验所需的样本量阈值和实时统计当前环境的样本量,当样本量达到阈值,通过短信、微信、邮件等方式通知用户。
为实现上述目的,本发明采用的技术方案是:一种基于样本量阈值计算的实时统计样本量的方法,具体步骤如下:
(1)、用户设置好本次实验目的模板和所需要统计的限制条件;
(2)、监听是否有新数据进入系统;
(3)、监听到有新数据进入后,统计样本量,以验证新数据是否满足用户设置的统计限制条件;
(4)、新数据满足用户设置的统计限制条件后,验证统计系统样本量是否达到阈值;
(5)、系统样本量达到阈值后,通知用户。
作为优选,所述的步骤(1)中,结合业务需求把常用的实验指标制作为实验目的模板,如果实验目的模板不满足需求,用户可以自定义实验模板。
作为优选,所述的步骤(2)中,监听是否有新数据进入系统的具体方法为:在数据库中设置触发器,当表数据有变动时,触发器会执行去触发系统监听,程序即监听到有新数据进入。
作为优选,所述的步骤(3)中,在每次统计样本量时会生成相应的checkpoint文件,记录上一次所统计的时间区间范围,读取checkpoint文件,以当前时间作为查询条件,由此来过滤大量数据,避免使用全表统计,只统计当前新增的数据中有没有符合条件的数据;
作为优选,所述的步骤(5)中,通知用户所采用的方式为短信、微信或邮件。
作为优选,所述的步骤(5)中,通过短信、微信或邮件这三种方式来通知实验人员样本量达标了,如果三种方式都通知失败了,那么接下来每天都会通知一次,如果五次都没有通知成功那么就会取消本次提醒任务,或者实验人员通过前台页面得知样本量达标才会停止也会取消本次提醒任务。
本发明相比现有技术具有以下优点:
采用本发明所述的方法,可以减少了实验人员重复计算样本量阈值的工作量,只需使用实验目的模板即可计算样本量阈值,操作比较方便,而且精确度高,再有就是实时监控样本量是否达标,不需要实验人员懂得IT技术也能得知当前样本量的最新情况,大大降低了实验人员使用难度。
附图说明
图1是实施例1中的方法流程图;
图2是实施例2中的流程图;
图3是实施例3中的流程图。
具体实施方式
为使对本发明的结构特征及所达成的功效有更进一步的了解与认识,用以较佳的实施例及附图配合详细的说明,说明如下:
实施例1
如图1所示,用户首先要先设置自己的实验目的和所要查询使用的限制条件,然后系统会根据所选的实验目的自动计算出所需要的样本量阈值,然后统计当前满足条件的样本量有多少,如果样本量达标,那么通知用户当前样本量已达标,可以进行实验,如果不达标,那么就会实时监控新数据入库的消息,如果新数据入库,检查新数据是否满足条件,如果满足更新样本量。
实施例2
如图2所示,当数据仓库有新数据进入时,会发送消息去通知程序,然后程序接到消息以后会读取checkpoint文件,统计新增的数据中有否有满足条件的样本,如果满足条件,那么更新样本量。
实施例3
如图3所示,如果样本量到达阈值以后,会发送消息去通知用户,如果三种消息都发送失败,那么就会生成一个定时任务,每天都去通知一次,如果通知五次失败,就会取消定时任务。
以上显示和描述了本发明的基本原理、主要特征和本发明的优点。本行业的技术人员应该了解,本发明不受上述实施例的限制,上述实施例和说明书中描述的只是本发明的原理,在不脱离本发明精神和范围的前提下本发明还会有各种变化和改进,这些变化和改进都落入要求保护的本发明的范围内。本发明要求的保护范围由所附的权利要求书及其等同物界定。

Claims (1)

1.一种基于样本量阈值计算的实时统计样本量的方法,具体步骤如下:
(1)、用户设置好本次实验目的模板和所需要统计的限制条件;
(2)、监听是否有新数据进入系统;
(3)、监听到有新数据进入后,统计样本量,以验证新数据是否满足用户设置的统计限制条件;
(4)、新数据满足用户设置的统计限制条件后,验证统计系统样本量是否达到阈值;
(5)、系统样本量达到阈值后,通知用户;
所述的步骤(1)中,结合业务需求把常用的实验指标制作为实验目的模板,如果实验目的模板不满足需求,用户可以自定义实验模板;
所述的步骤(2)中,监听是否有新数据进入系统的具体方法为:在数据库中设置触发器,当表数据有变动时,触发器会执行去触发系统监听,程序即监听到有新数据进入;
所述的步骤(3)中,在每次统计样本量时会生成相应的checkpoint文件,记录上一次所统计的时间区间范围,读取checkpoint文件,以当前时间作为查询条件,由此来过滤大量数据,避免使用全表统计,只统计当前新增的数据中有没有符合条件的数据;
所述的步骤(5)中,通知用户所采用的方式为短信、微信或邮件;
所述的步骤(5)中,通过短信、微信或邮件这三种方式来通知实验人员样本量达标了,如果三种方式都通知失败了,那么接下来每天都会通知一次,如果五次都没有通知成功那么就会取消本次提醒任务,或者实验人员通过前台页面得知样本量达标才会停止也会取消本次提醒任务。
CN201711478959.6A 2017-12-29 2017-12-29 一种基于样本量阈值计算的实时统计样本量的方法 Active CN108090214B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711478959.6A CN108090214B (zh) 2017-12-29 2017-12-29 一种基于样本量阈值计算的实时统计样本量的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711478959.6A CN108090214B (zh) 2017-12-29 2017-12-29 一种基于样本量阈值计算的实时统计样本量的方法

Publications (2)

Publication Number Publication Date
CN108090214A CN108090214A (zh) 2018-05-29
CN108090214B true CN108090214B (zh) 2021-09-14

Family

ID=62180653

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711478959.6A Active CN108090214B (zh) 2017-12-29 2017-12-29 一种基于样本量阈值计算的实时统计样本量的方法

Country Status (1)

Country Link
CN (1) CN108090214B (zh)

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7546223B2 (en) * 2006-06-07 2009-06-09 Ee Systems Group Inc. Process and system of energy signal detection
US9625349B2 (en) * 2012-02-29 2017-04-18 Fisher Controls International Llc Time-stamped emissions data collection for process control devices
CN104602217B (zh) * 2013-10-30 2019-07-02 中国移动通信集团四川有限公司 一种用户流量实时统计方法及系统
CN105344617B (zh) * 2015-09-30 2017-11-17 中国人民解放军第三军医大学第二附属医院 一种血样自动分拣和统计装置
CN105636181B (zh) * 2015-12-21 2018-10-23 斯凯瑞利(北京)科技有限公司 一种能动态调整阈值的唤醒方法与装置
CN105956778A (zh) * 2016-05-06 2016-09-21 长沙市麓智信息科技有限公司 工作日程管理系统及其管理方法

Also Published As

Publication number Publication date
CN108090214A (zh) 2018-05-29

Similar Documents

Publication Publication Date Title
US8935201B1 (en) Determining and extracting changed data from a data source
US20150095381A1 (en) Method and apparatus for managing time series database
CN105956734A (zh) 动态设置it设备的性能的指标阈值的方法及系统
CN110830438A (zh) 一种异常日志告警方法、装置及电子设备
US8135666B2 (en) Systems and methods for policy based execution of time critical data warehouse triggers
CN109670091B (zh) 一种基于数据标准的元数据智能维护方法和装置
CN110069925B (zh) 软件监测方法、系统及计算机可读存储介质
CN109408331A (zh) 基于用户个性化特征的日志报警系统
CN112306700A (zh) 一种异常rpc请求的诊断方法和装置
CN109617745A (zh) 告警预测方法、装置、系统及存储介质
JP2018511861A (ja) 分散データベースにおけるデータブロックを処理する方法およびデバイス
CN107526820A (zh) 一种多源多库企业创新监测大数据标准数据库构建方法
CN108090214B (zh) 一种基于样本量阈值计算的实时统计样本量的方法
CN109101390A (zh) 基于高斯分布的定时任务异常监控方法、电子装置及介质
CN108304276A (zh) 一种日志处理方法、装置及电子设备
CN107798086B (zh) 服务器信息更新方法、装置、系统及电子设备
US10419885B2 (en) Communication device and method, and computer program product for associating a mobile telephony identifier and a computer network identifier
CN106599005B (zh) 一种数据归档方法及装置
CN104548273A (zh) 一种输液监控系统及方法
CN213365743U (zh) 基于物联网的危险化学品仓储监测与预警系统
CN113254310A (zh) 服务器监控系统及方法
CN105380614A (zh) 基于物联网的穿戴设备及系统
CN105337414A (zh) 一种自动巡检稳控装置的运行信息的巡检校验方法
CN112233807A (zh) 一种出入境疫情智能卫生检疫大数据分析系统
CN109857774B (zh) 基于多传感器融合变形监测数据统计方法以及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant