CN107526935A - 一种数据统计方法及装置 - Google Patents

一种数据统计方法及装置 Download PDF

Info

Publication number
CN107526935A
CN107526935A CN201710809854.8A CN201710809854A CN107526935A CN 107526935 A CN107526935 A CN 107526935A CN 201710809854 A CN201710809854 A CN 201710809854A CN 107526935 A CN107526935 A CN 107526935A
Authority
CN
China
Prior art keywords
data
type
statistical
pending data
pending
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710809854.8A
Other languages
English (en)
Inventor
王学兴
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
New Island Information Technology (shanghai) Co Ltd
Original Assignee
New Island Information Technology (shanghai) Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by New Island Information Technology (shanghai) Co Ltd filed Critical New Island Information Technology (shanghai) Co Ltd
Priority to CN201710809854.8A priority Critical patent/CN107526935A/zh
Publication of CN107526935A publication Critical patent/CN107526935A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/2282Tablespace storage structures; Management thereof
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2462Approximate or statistical queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Probability & Statistics with Applications (AREA)
  • General Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Databases & Information Systems (AREA)
  • Mathematical Physics (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Operations Research (AREA)
  • Algebra (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Fuzzy Systems (AREA)
  • Computational Linguistics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明实施例提供的一种数据统计方法及装置,属于医疗数据统计领域。该数据统计方法通过获取用户终端所发送的待处理数据以及执行指令,从而根据所述执行指令所携带的统计类型与执行变量类型对所述待处理数据进行统计,使得用户能够根据所显示的统计类型进行选择,从而使得用户无需具备较好的统计理论知识,也可以对自己的数据进行统计,进一步地使得普通用户都能够使用。以及通过简单的操作可以用户能够更快的获取到统计数据,并且无需花费较大的学习成本。

Description

一种数据统计方法及装置
技术领域
本发明涉及医疗数据统计领域,具体而言,涉及一种数据统计方法及装置。
背景技术
目前主流的统计软件如SAS、SPSS、R等都是“统计方法导向型”,即要求用户非常明确要选择什么样的统计方法进行分析,这是基于用户具有较强的统计理论知识的基础之上。不同的统计方法拥有不同的适用条件,如果使用者选择错误或者不合适的统计方法将导致分析的结论存在较大的偏差。选择错误统计方法在医疗科研领域是很常见的现象,大量医学期刊文献中的统计方法错误比比皆是,这说明大部分使用统计软件的用户并没有很好的统计理论知识。从而给用户带来了极大的不便。并且主流统计软件需要较大的学习成本。除了SPSS之外,其他主流统计软件如SAS和R都需要进行编程,这导致用户使用门槛较高,用户需要花费大量时间进行软件编程的学习。而SPSS虽然无需编程,当时它复杂的交互菜单、专业的术语也让大多数用户难以适从,同时实现一次统计分析需要繁多的步骤。以及在制作统计图形方面,SAS和R都需要复杂的编程才能制作出满足期刊杂志要求的统计图形。而SPSS制作的图形不符合多少期刊杂志的需求。因此大多数不会编程的用户往往需要再去寻找其他的制作图形的软件,无法在一个平台完成统计分析与图形的制作。
发明内容
本发明提供一种数据统计方法及装置,旨在改善上述问题。
第一方面,本发明提供的一种数据统计方法,应用于服务器,所述方法包括:获取用户终端所发送的待处理数据;获取统计所述待处理数据的执行指令,所述执行指令携带有统计类型与执行变量类型;基于所述统计类型获取与所述统计类型对应的预设的统计方法;基于所述执行变量类型获取所述待处理数据中与所述执行变量类型匹配的数据变量类型;根据所述统计方法与所述数据变量类型对所述待处理数据进行统计,以得到统计结果;将所述统计结果发送至用户终端进行显示。
优选地,所述的获取统计所述待处理数据的执行指令,所述执行指令携带有统计类型与执行变量类型的步骤之前,还包括:识别所述待处理数据中的变量类型;判断所述变量类型是否满足预设规则;当所述变量类型不满足预设规则时,获取用户对于所述变量类型进行修改后所输入的更改变量类型;获取所述更改变量类型,将所述更改变量类型作为执行变量类型。
优选地,所述的获取统计所述待处理数据的执行指令之前,还包括:获取数据筛选指令;基于所述数据筛选指令对所述待处理数据进行筛选,以获取与所述筛选指令所对应的筛选信息。
优选地,所述的基于所述统计类型获取与所述统计类型对应的预设的统计方法的步骤包括:获取所述统计类型所对应的预设的多个统计方法;按照正态性检验和组间比较获取多个所述统计方法中的最优统计方法,以通过所述最优统计方法对所述待处理数据进行统计。
优选地,所述结果包括表格信息和图表信息,所述的将所述结果发送至用户终端进行显示的步骤包括:将所述表格信息和所述图表信息发送至用户终端进行显示。
优选地,所述的获取根据所述统计方法与所述数据变量类型对所述待处理数据进行统计的结果的步骤之后,还包括:获取预设的统计指标,所述统计指标包括均数、标准差和p值;根据所述统计指标获取所述待处理数据中的均数、标准差和p值。
第二方面,本发明提供的一种数据统计方法,应用于用户终端,所述方法包括:获取待处理数据、统计类型、执行变量类型和用于统计所述待处理数据的执行指令;将所述待处理数据、所述执行指令、所述统计类型与所述执行变量类型发送至服务器,以使所述服务器对所述待处理数据进行统计;获取所述服务器基于所述执行指令、所述统计类型与所述执行变量类型所返回的结果;将所述结果进行显示。
优选地,所述结果包括表格信息和图表信息,所述的将所述结果进行显示的步骤包括:基于AngularJS将所述表格信息按照预设的显示格式进行显示;将所述图表信息显示在所述表格信息下方。
第三方面,本发明提供的一种数据统计装置,应用于服务器,所述装置包括:第一数据获取单元,用于获取用户终端所发送的待处理数据;第二数据获取单元,用于获取统计所述待处理数据的执行指令,所述执行指令携带有统计类型与执行变量类型;第一数据查询处理单元,用于基于所述统计类型获取与所述统计类型对应的预设的统计方法;第二数据处理单元,用于基于所述执行变量类型获取所述待处理数据中与所述执行变量类型匹配的数据变量类型;第三数据处理单元,用于根据所述统计方法与所述数据变量类型对所述待处理数据进行统计,以得到统计结果;数据发送单元,用于将所述统计结果发送至用户终端进行显示。
第四方面,本发明提供的一种数据统计装置,应用于用户终端,所述装置包括:数据采集单元,用于获取待处理数据、统计类型、执行变量类型和用于统计所述待处理数据的执行指令;数据发送单元,用于将所述待处理数据、所述执行指令、所述统计类型与所述执行变量类型发送至服务器,以使所述服务器对所述待处理数据进行统计;数据获取单元,用于获取所述服务器基于所述执行指令、所述统计类型与所述执行变量类型所返回的结果;显示单元,用于将所述结果进行显示。
上述本发明提供的一种数据统计方法及装置,通过获取用户终端所发送的待处理数据以及执行指令,从而根据所述执行指令所携带的统计类型与执行变量类型对所述待处理数据进行统计,使得用户能够根据所显示的统计类型进行选择,从而使得用户无需具备较好的统计理论知识,也可以对自己的数据进行统计,进一步地使得普通用户都能够使用。以及通过简单的操作可以用户能够更快的获取到统计数据,并且无需花费较大的学习成本。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本发明实施例提供的用户终端与服务器进行交互的示意图;
图2为本发明实施例提供的电子设备的结构框图;
图3为本发明第一实施例提供的一种数据统计方法的流程图;
图4为本发明第二实施例提供的一种数据统计方法的流程图;
图5为本发明第三实施例提供的一种数据统计装置的功能模块示意图;
图6为本发明第四实施例提供的一种数据统计装置的功能模块示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
如图1所示,是本发明较佳实施例提供的服务器与用户终端进行交互的示意图。所述服务器100通过网络与一个或多个用户终端200进行通信连接,以进行数据通信或交互。所述服务器100可以是网络服务器、数据库服务器等。所述用户终端200可以是个人电脑(personal computer,PC)、平板电脑、智能手机、个人数字助理(personal digitalassistant,PDA)等。
如图2所示,为本发明实施例提供的一种电子设备的结构框图。所述电子设备300可以作为用户终端200,也可以作为服务器100。所述电子设备300包括数据统计装置、存储器302、存储控制器303、处理器304及外设接口305。
所述存储器302、存储控制器303、处理器304及外设接口305各元件相互之间直接或间接地电性连接,以实现数据的传输或交互。例如,这些元件相互之间可通过一条或多条通讯总线或信号线实现电性连接。所述数据统计装置包括至少一个可以软件或固件(firmware)的形式存储于所述存储器302中或固化在所述电子设备300的操作系统(operating system,OS)中的软件功能模块。所述处理器304用于执行存储器302中存储的可执行模块,例如所述数据统计装置包括的软件功能模块或计算机程序。
其中,存储器302可以是,但不限于,随机存取存储器(Random Access Memory,RAM),只读存储器(Read Only Memory,ROM),可编程只读存储器(Programmable Read-Only Memory,PROM),可擦除只读存储器(Erasable Programmable Read-Only Memory,EPROM),电可擦除只读存储器(Electric Erasable Programmable Read-Only Memory,EEPROM)等。其中,存储器302用于存储程序,所述处理器304在接收到执行指令后,执行所述程序,前述本发明实施例任一实施例揭示的流过程定义的服务器100所执行的方法可以应用于处理器304中,或者由处理器304实现。
处理器304可能是一种集成电路芯片,具有信号的处理能力。上述的处理器304可以是通用处理器,包括中央处理器(Central Processing Unit,简称CPU)、网络处理器(Network Processor,简称NP)等;还可以是数字信号处理器(DSP)、专用集成电路(ASIC)、现成可编程门阵列(FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
所述外设接口305将各种输入/输入装置耦合至处理器304以及存储器302。在一些实施例中,外设接口305、处理器304以及存储控制器303可以在单个芯片中实现。在其他一些实例中,他们可以分别由独立的芯片实现。
请参阅图3,是本发明第一实施例提供的一种数据统计方法的流程图。所述方法应用于服务器。下面将对图3所示的具体流程进行详细阐述。
步骤S301,获取用户终端所发送的待处理数据。
所述待处理数据是指用户需要进行统计的数据。
在本实施例中,用户通过将所述待处理数据上传到用户终端上所安装的应用程序中,即用户使用的应用程序。其中,所上传的所述待处理数据可以是excel格式的数据,也可以是其他格式的数据,例如sas、spss或csv格式的数据,在此不作具体限定。当用户将所述待处理数据上传到用户终端上时,用户终端将所述待处理数据发送指服务器,进而使得所述服务器获取到用户所上传的所述待处理数据。
步骤S302,获取统计所述待处理数据的执行指令,所述执行指令携带有统计类型与执行变量类型。
其中,所述执行指令是所述用户终端所发送的。用户终端基于用户在用户终端上进行的点击事件生成所述执行指令,从而将所述执行指令发送到所述服务器。
作为一种实施场景,用户在用户终端上的所运行的应用程序中,点击该应用程序上设有统计类型选项,选择用户需要的统计类型。其中,所述统计类型包括“一般描述”、“比较”、“相关与单因素回归”、“生存分析”和“多因素回归”。每一类统计类型都预设有多个统计方法。例如,预先将每个统计方法的适用条件写成逻辑嵌套到服务器的代码中,从而根据用户所选择的统计类型以及执行变量类型对统计方法做出智能推荐。使得用户能够根据所显示的统计类型进行选择,从而使得用户无需具备较好的统计理论知识,也可以对自己的数据进行统计。进一步地使得普通用户都能够使用。
作为一种实施方式,用户终端通过将所采集到的统计类型与执行变量类型存储到本地,直到用户终端采集到所述执行指令时,将所述统计类型与执行变量类型封装到所述执行指令中,从而将携带有所述统计类型与执行变量类型的执行指令发送到服务器,进而服务器根据所接收到的执行指令,按照该执行指令所携带的所述统计类型与执行变量类型对所述待处理数据进行统计。
作为另一种实施方式,在本实施例中,用户终端通过将采集到的统计类型与所述执行变量类型直接发送至服务器,服务器直到获取到用户终端所发送的执行指令时,才会基于所接收到的统计类型与所述执行变量类型对所述待处理数据进行统计。即按照统计类型与执行变量类型对所述待处理数据进行统计处理。
在本实施例中,当用户对所述执行变量的类型进行更改时,步骤S302之前还包括:识别所述待处理数据中的变量类型;判断所述变量类型是否满足预设规则;当所述变量类型不满足预设规则时,获取用户对于所述变量类型进行修改后所输入的更改变量类型;获取所述更改变量类型,将所述更改变量类型作为执行变量类型。通过获取用户对所识别后的变量类型进行更改,使得用户可以随意进行更改,进一步提高了统计数据的准确率。其中,所述预设规则是指根据预先设置是判断条件判断当前变量类型是否与所述判断条件匹配。例如,所述判断条件可以是表头含姓名、编号、序号、住院号、患者号、卡号或身份证等,通过判断所述待处理数据的变量类型是否与所述判断条件匹配,从而判断是否满足预设规则。用户终端采集的用户所修改后的变量类型并将所述修改后的更改变量类型发送至服务器,从而使得服务器根据用户所修改的更改变量类型进行数据的统计。
在本实施例中,当用户对所述待处理数据进行筛选时,所述步骤S302之前还包括:获取数据筛选指令;基于所述数据筛选指令对所述待处理数据进行筛选,以获取与所述筛选指令所对应的筛选信息。通过筛选指令可以使得服务器对所述待处理数据进行统计的数据量进一步减少,进而能够加快统计速度。
例如,用户通过用户终端上所设置的“筛选设置”可以对数据进行复杂的筛选,并将筛选后的数据进行统计分析。其中,筛选设置可以实现“and”、“or”以及“()”的查询逻辑,例如实现逻辑:A and(B or C)。用户设置完的筛选条件将保存为MongoDB语句,服务器通过该语句对数据进行筛选。
步骤S303,基于所述统计类型获取与所述统计类型对应的预设的统计方法。
其中,所述统计类型都预设有多个统计方法。每个统计方法都存储在数据库中。例如,将每个统计方法的适用条件写成逻辑嵌套到服务器的代码中,以使所选择的统计类型以及执行变量类型对统计方法做出智能推荐。当出现与所述统计方法匹配的逻辑时,则使用该统计方法。例如,当出现A时,选择统计方法B。
作为一种实施场景,当用户在用户终端上通过下拉菜单选择该下拉菜单中所列举的统计类型时,用户终端根据用户所选择的统计类型,将所选择的统计类型发送到服务器,服务器根据所获取到统计类型,寻找与所述统计类型所匹配的统计方法。其中,通过将所有的统计类型列举出来,使得用户能够通过选择自己需要的统计类型,从而使得服务器能够根据用户所选择的统计类型,自动的匹配到统计方法,进而将用户所提供的待处理数据进行统计。使得用户无需自己根据所需要的统计结果来进行选择统计方法,进一步使得没有较好的统计理论知识的用户也可以进行数据统计。从而给用户带来了极大的便利。
作为一种实施方式,服务器通过获取所述统计类型所对应的预设的多个统计方法;并按照预设规则获取多个所述统计方法中的最优统计方法。其中,最优的统计方法是指所述统计类型所对应的多个统计方法中最适合所述待处理数据进行统计的方法。例如,通过统计方法A统计该待处理数据的准确率为90%,但是统计方法B统计该待处理数据的准确率为95%,则统计方法B最适合对所述待处理数据进行统计。又例如,所述待处理数据为正态分布的数据,则通过正态分布统计方法来进行数据统计更加便捷。具体地,在本实施例中,可以通过正态性检验和组间比较来举例说明如何根据预设规则进行获取多个所述统计方法中的最优统计方法。例如,通过所述正态性检验规则来获取最优统计方法时,通过判断所述统计数据中的变量频数是否与预设值进行匹配,例如,当所述预设值为5000时,即当所述变量频数小于5000时,选择Shapiro-Wilk正态性检验;变量频数大于5000时,选择One-sample Kolmogorov-Smirnov检验。其中,变量频数又称“次数”,是指变量值中代表某种特征的数(标志值)出现的次数。例如患者年龄这个字段,有1500个数据,年龄这个变量的频数就是1500。。
其中,所述组间比较是指当自变量在分组情况和总体都服从正态性分布且方差齐的条件下,采用独立t检验;自变量在分组情况和总体任一为非正态分布条件下,采用Wilcoxon秩和检验;自变量在分组情况和总体都服从正态性分布,方差不齐的条件下,采用矫正t检验;存在期望计数小于1或者n小于40,组间比较采用Fisher精确概率;所有的期望计数满足期望计数小于5且大于1,以及n大于40,组间比较采用pearson矫正卡方检验;所有期望计数大于5,且n大于40,组间比较采用pearson卡方检验;自变量在分组情况和总体都服从正态性分布且方差齐的条件下,组间比较采用方差分析;自变量在分组情况和总体任一为非正态分布或者方差不齐的条件下,组间比较采用kruskal-wallis检验。
通过获取用户终端所发送的基于用户选择的统计类型对该统计类型所对应的统计方法做出智能推荐,使得用户无需了解每个统计方法,从而也能够获取到最佳的统计结果,进一步给用户带来了便利。
步骤S304,基于所述执行变量类型获取所述待处理数据中与所述执行变量类型匹配的数据变量类型。
其中,变量类型包括:“生存时间”、“连续型”、“二分类”、“无序多分类”、“有序多分类”、“日期型”和“无类型”。
其中,服务器先按照预先规则获取所述待处理数据中的变量类型。
当所述预设规则为表头为OS(Overall Survival,总生存期)、PFS(Progress FreeSurvival,病人无进展生存)、DFS(Disease Free Survival,无病生存期)、TTP(time oftumor progression,肿瘤进展时间)、TTF(Time to treatment failure,治疗失败时间)、总生存期、无进展生存期、无病生存期或至进展时间等时,判断所述待处理数据的变量类型为生存时间。
当所述预设规则为表头含姓名、编号、序号、住院号、患者号、卡号或身份证等时,判断所述待处理数据的变量类型是否为无类型。
当所述预设规则为所述待处理数据中的数值型变量占比大于该待处理数据中的所有变量类型的80%,且有小数;或者是判断数值型变量占比大于该待处理数据中的所有变量类型的80%,且10以上的唯一值占比大于该待处理数据中的所有唯一值的30%;或者判断数值型变量占比大于该待处理数据中的所有变量类型的80%,且唯一值数大于15时,判定为所述待处理数据的变量类型为连续型。
当所述预设规则为字符型有序值占比大于该待处理数据中的所有变量类型的80%且字符型有序值唯一数小于或等于12;或者表头包含有序变量名称,有序整数占比大于该待处理数据中的所有变量类型的80%时,判定为所述待处理数据的变量类型为有序多分类。
当所述预设规则为所述待处理数据中的唯一值数为2,没有小数或有字符型时,判定所述待处理数据的变量类型为二分类。
当所述预设规则为所述待处理数据中的日期型变量占比大于该待处理数据中的所有变量类型的80%时,判定所述待处理数据的变量类型为日期型。
需要说明的是,上述表头是指表格的开头部分,用于对一些问题的性质的归类。例如,每张调查表按惯例总要有被调查者的简况反映,如被调查者的性别、年龄、学历、收入、家庭成员组成、政治背景、经济状况等。这类问题一般排列在调查表开头部分,称“表头”。表头设计应根据调查内容的不同有所分别,表头所列项目是分析结果时不可缺少的基本项目。
在本实施例中,服务器通过获取用户终端所采集的用户所输入的执行变量类型,即用户终端通过采集用户输入的所述执行变量类型,并将所采集到的所述执行变量类型发送至所述服务器。例如,用户可以通过鼠标点击用户终端上的执行变量类型选择选项,从而通过点击事件来获取用户所输入的执行变量类型。
在本实施例中,对于分类变量(包括二分类、无序多分类和有序多分类)可以对其类别进行排序,最终统计结果均按此排序进行排列,其中针对有序分类变量,该排序也相当于指定各个类别的等级或者高低次序。
步骤S305,获取根据所述统计方法与所述数据变量类型对所述待处理数据进行统计的结果。
所述结果包括表格信息和图表信息。服务器根据所述统计方法和数据变量类型对所述待处理数据进行数据统计,从而获取统计结果,所述统计结果包括表格信息和图表信息。其中,表格信息是指所述服务器将所统计出来的数据通过表格的形式显示在用户终端上,以及将所统计的数据按照预设的图表格式显示在用户终端上,以使用户获取到三线表格式的数据以及图表格式的统计数据。进而使得不会编程的用户也能够获取到图表数据,使得不会编程的用户无需再去寻找其他的制作图形的软件,以及能够在一个平台完成统计分析与图形的制作,进一步为用户带来了便利。
在本实施例中,通过获取预设的统计指标,所述统计指标包括均数、标准差和p值;根据所述统计指标获取所述待处理数据中的均数、标准差和p值。即在进行数据统计的同时,服务器根据所述预设的统计指标将所述待处理数据中与所述统计指标所对应的数据进行统计,从而使得用户无需对该统计指标进行手动统计。通过获取统计指标,并根据所得到的数据输出统计结论,使得用户可以通过所述统计指标对所得到的统计数据更加清楚。
步骤S306,将所述结果发送至用户终端进行显示。
将上述步骤所获得的统计数据以图表的形式和表格形式显示在用户终端上。进而使得用户获得到所需要的三线表格式的统计数据,以及图表数据。
例如,服务器将所述结果中的表格信息转化为JSON格式,而图表信息则转换为Plotly格式。服务器再将JSON格式的数据和Plotly格式的数据发送至用户终端进行显示,用户终端采用AngularJS将JSON格式的统计结果按照标准的“三线表”格式放入当前页面。而对于Plotly格式的统计图形,展示在统计表格下方。
在本实施例中,当用户在用户终端上的应用程序中对某个统计图形点击“编辑图形”按钮时,服务器会将该Plotly的图形传至“图形编辑”页面。在该页面上,嵌套了Plotly大多数的编辑控件,用户可以在“图形编辑”页面进行灵活的图形编辑。
请参阅图4,是本发明第二实施例提供的一种数据统计方法的流程图。所述方法应用于用户终端。下面将对图4所示的具体流程进行详细阐述。
步骤S401,获取待处理数据、统计类型、执行变量类型和用于统计所述待处理数据的执行指令。
用户终端通过采集用户所上传的待处理数据,以及获取对所述待处理数据进行统计的统计类型、执行变量类型和用于统计所述待处理数据的执行指令。
步骤S402,将所述待处理数据、所述执行指令、所述统计类型与所述执行变量类型发送至所述服务器,以使所述服务器对所述待处理数据进行统计。
步骤S403,获取所述服务器基于所述执行指令、所述统计类型与所述执行变量类型所返回的结果。
步骤S404,将所述结果进行显示。
其中,所述结果包括表格信息和图表信息。用户终端基于AngularJS将所述表格信息按照预设的显示格式进行显示;将所述图表信息显示在所述表格信息下方。
例如,服务器将所述结果中的表格信息转化为JSON格式,而图表信息则转换为Plotly格式。服务器再将JSON格式的数据和Plotly格式的数据发送至用户终端进行显示,用户终端采用AngularJS将JSON格式的统计结果按照标准的“三线表”格式放入当前页面。而对于Plotly格式的统计图形,展示在统计表格下方。
在本实施例中,当用户在用户终端上的应用程序中对某个统计图形点击“编辑图形”按钮时,服务器会将该Plotly的图形传至“图形编辑”页面。在该页面上,嵌套了Plotly大多数的编辑控件,用户可以在“图形编辑”页面进行灵活的图形编辑。
请参阅图5,是本发明第三实施例提供的一种数据统计装置的功能模块示意图。所述数据统计装置500应用于服务器。所述数据统计装置500包括第一数据获取单元510、第二数据获取单元520、第一数据查询处理单元530、第二数据处理单元540、第三数据处理单元550和数据发送单元560。
第一数据获取单元510,用于获取用户终端所发送的待处理数据;
第二数据获取单元520,用于获取统计所述待处理数据的执行指令,所述执行指令携带有统计类型与执行变量类型;
第一数据查询处理单元530,用于基于所述统计类型获取与所述统计类型对应的预设的统计方法;
第二数据处理单元540,用于基于所述执行变量类型获取所述待处理数据中与所述执行变量类型匹配的数据变量类型;
第三数据处理单元550,用于根据所述统计方法与所述数据变量类型对所述待处理数据进行统计,以得到统计结果;
数据发送单元560,用于将所述统计结果发送至用户终端进行显示。
请参阅图6,是本发明第四实施例提供的一种数据统计装置的功能模块示意图。所述数据统计装置600应用于用户终端。所述数据统计装置600包括数据采集单元610、数据发送单元620、数据获取单元630和显示单元640。
数据采集单元610,用于获取待处理数据、统计类型、执行变量类型和用于统计所述待处理数据的执行指令。
数据发送单元620,用于将所述待处理数据、所述执行指令、所述统计类型与所述执行变量类型发送至所述服务器,以使所述服务器对所述待处理数据进行统计。
数据获取单元630,用于获取所述服务器基于所述执行指令、所述统计类型与所述执行变量类型所返回的结果。
显示单元640,用于将所述结果进行显示。
其中,所述结果包括表格信息和图表信息,所述显示单元640具体用于:基于AngularJS将所述表格信息按照预设的显示格式进行显示;将所述图表信息显示在所述表格信息下方。
综上所述,本发明提供一种数据统计方法及装置,通过获取用户终端所发送的待处理数据以及执行指令,从而根据所述执行指令所携带的统计类型与执行变量类型对所述待处理数据进行统计,使得用户能够根据所显示的统计类型进行选择,从而使得用户无需具备较好的统计理论知识,也可以对自己的数据进行统计,进一步地使得普通用户都能够使用。以及通过简单的操作可以用户能够更快的获取到统计数据,并且无需花费较大的学习成本。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置和方法,也可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,附图中的流程图和框图显示了根据本发明的多个实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现方式中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
另外,在本发明各个实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。
所述功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。

Claims (10)

1.一种数据统计方法,其特征在于,应用于服务器,所述方法包括:
获取用户终端所发送的待处理数据;
获取统计所述待处理数据的执行指令,所述执行指令携带有统计类型与执行变量类型;
基于所述统计类型获取与所述统计类型对应的预设的统计方法;
基于所述执行变量类型获取所述待处理数据中与所述执行变量类型匹配的数据变量类型;
根据所述统计方法与所述数据变量类型对所述待处理数据进行统计,以得到统计结果;
将所述统计结果发送至用户终端进行显示。
2.根据权利要求1所述的方法,其特征在于,所述的获取统计所述待处理数据的执行指令,所述执行指令携带有统计类型与执行变量类型的步骤之前,还包括:
识别所述待处理数据中的变量类型;
判断所述变量类型是否满足预设规则;
当所述变量类型不满足预设规则时,获取用户对于所述变量类型进行修改后所输入的更改变量类型;
获取所述更改变量类型,将所述更改变量类型作为执行变量类型。
3.根据权利要求1所述的方法,其特征在于,所述的获取统计所述待处理数据的执行指令之前,还包括:
获取数据筛选指令;
基于所述数据筛选指令对所述待处理数据进行筛选,以获取与所述筛选指令所对应的筛选信息。
4.根据权利要求1所述的方法,其特征在于,所述的基于所述统计类型获取与所述统计类型对应的预设的统计方法的步骤包括:
获取所述统计类型所对应的预设的多个统计方法;
按照正态性检验和组间比较获取多个所述统计方法中的最优统计方法,以通过所述最优统计方法对所述待处理数据进行统计。
5.根据权利要求1所述的方法,其特征在于,所述统计结果包括表格信息和图表信息,所述的将所述统计结果发送至用户终端进行显示的步骤包括:
将所述表格信息和所述图表信息发送至用户终端进行显示。
6.根据权利要求1所述的方法,其特征在于,所述的获取根据所述统计方法与所述数据变量类型对所述待处理数据进行统计的结果的步骤之后,还包括:
获取预设的统计指标,所述统计指标包括均数、标准差和p值;
根据所述统计指标获取所述待处理数据中的均数、标准差和p值。
7.一种数据统计方法,其特征在于,应用于用户终端,所述方法包括:
获取待处理数据、统计类型、执行变量类型和用于统计所述待处理数据的执行指令;
将所述待处理数据、所述执行指令、所述统计类型与所述执行变量类型发送至服务器,以使所述服务器对所述待处理数据进行统计;
获取所述服务器基于所述执行指令、所述统计类型与所述执行变量类型所返回的结果;
将所述结果进行显示。
8.根据权利要求7所述的方法,其特征在于,所述结果包括表格信息和图表信息,所述的将所述结果进行显示的步骤包括:
基于AngularJS将所述表格信息按照预设的显示格式进行显示;
将所述图表信息显示在所述表格信息下方。
9.一种数据统计装置,其特征在于,应用于服务器,所述装置包括:
第一数据获取单元,用于获取用户终端所发送的待处理数据;
第二数据获取单元,用于获取统计所述待处理数据的执行指令,所述执行指令携带有统计类型与执行变量类型;
第一数据查询处理单元,用于基于所述统计类型获取与所述统计类型对应的预设的统计方法;
第二数据处理单元,用于基于所述执行变量类型获取所述待处理数据中与所述执行变量类型匹配的数据变量类型;
第三数据处理单元,用于根据所述统计方法与所述数据变量类型对所述待处理数据进行统计,以得到统计结果;
数据发送单元,用于将所述统计结果发送至用户终端进行显示。
10.一种数据统计装置,其特征在于,应用于用户终端,所述装置包括:
数据采集单元,用于获取待处理数据、统计类型、执行变量类型和用于统计所述待处理数据的执行指令;
数据发送单元,用于将所述待处理数据、所述执行指令、所述统计类型与所述执行变量类型发送至服务器,以使所述服务器对所述待处理数据进行统计;
数据获取单元,用于获取所述服务器基于所述执行指令、所述统计类型与所述执行变量类型所返回的结果;
显示单元,用于将所述结果进行显示。
CN201710809854.8A 2017-09-08 2017-09-08 一种数据统计方法及装置 Pending CN107526935A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710809854.8A CN107526935A (zh) 2017-09-08 2017-09-08 一种数据统计方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710809854.8A CN107526935A (zh) 2017-09-08 2017-09-08 一种数据统计方法及装置

Publications (1)

Publication Number Publication Date
CN107526935A true CN107526935A (zh) 2017-12-29

Family

ID=60736431

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710809854.8A Pending CN107526935A (zh) 2017-09-08 2017-09-08 一种数据统计方法及装置

Country Status (1)

Country Link
CN (1) CN107526935A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108921459A (zh) * 2018-08-31 2018-11-30 北京海数宝科技有限公司 指标生成方法、装置、计算机设备和存储介质
CN109684383A (zh) * 2018-12-25 2019-04-26 广州天鹏计算机科技有限公司 数据分析结果的获取方法、装置、计算机设备和存储介质
CN112036140A (zh) * 2020-09-01 2020-12-04 中国银行股份有限公司 前端表格数据分组统计方法及装置
CN112233747A (zh) * 2020-11-16 2021-01-15 广东省新一代通信与网络创新研究院 一种基于个人数字孪生网络数据分析方法及系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104933329A (zh) * 2015-06-29 2015-09-23 西南民族大学 生物数据处理方法、装置及便携式移动手持设备
CN105975500A (zh) * 2016-04-27 2016-09-28 努比亚技术有限公司 数据处理方法、数据统计系统及后台管理系统
CN106372240A (zh) * 2016-09-14 2017-02-01 北京搜狐新动力信息技术有限公司 一种数据分析的方法和装置
CN107133454A (zh) * 2017-04-20 2017-09-05 无锡慧方科技有限公司 用于对医疗数据集进行搜索和统计的方法、系统和计算机可读存储介质

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104933329A (zh) * 2015-06-29 2015-09-23 西南民族大学 生物数据处理方法、装置及便携式移动手持设备
CN105975500A (zh) * 2016-04-27 2016-09-28 努比亚技术有限公司 数据处理方法、数据统计系统及后台管理系统
CN106372240A (zh) * 2016-09-14 2017-02-01 北京搜狐新动力信息技术有限公司 一种数据分析的方法和装置
CN107133454A (zh) * 2017-04-20 2017-09-05 无锡慧方科技有限公司 用于对医疗数据集进行搜索和统计的方法、系统和计算机可读存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
史周华等, 北京:中国中医药出版社 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108921459A (zh) * 2018-08-31 2018-11-30 北京海数宝科技有限公司 指标生成方法、装置、计算机设备和存储介质
CN108921459B (zh) * 2018-08-31 2020-12-11 北京海数宝科技有限公司 指标生成方法、装置、计算机设备和存储介质
CN109684383A (zh) * 2018-12-25 2019-04-26 广州天鹏计算机科技有限公司 数据分析结果的获取方法、装置、计算机设备和存储介质
CN112036140A (zh) * 2020-09-01 2020-12-04 中国银行股份有限公司 前端表格数据分组统计方法及装置
CN112036140B (zh) * 2020-09-01 2023-08-18 中国银行股份有限公司 前端表格数据分组统计方法及装置
CN112233747A (zh) * 2020-11-16 2021-01-15 广东省新一代通信与网络创新研究院 一种基于个人数字孪生网络数据分析方法及系统

Similar Documents

Publication Publication Date Title
US11030167B2 (en) Systems and methods for providing data quality management
US11670021B1 (en) Enhanced graphical user interface for representing events
CN107526935A (zh) 一种数据统计方法及装置
US10579659B2 (en) Method, apparatus, electronic equipment and storage medium for performing screening and statistical operation on data
US8370181B2 (en) System and method for supply chain data mining and analysis
WO2017094262A1 (ja) ログ分析システム、方法およびプログラム
CN109447689A (zh) 用户风险画像生成方法、装置、设备及可读存储介质
CN111160855A (zh) 一种报告单自动审核方法、装置、设备及存储介质
WO2019119627A1 (zh) FoF资产行业分析方法、终端和计算机可读存储介质
CN108694108A (zh) 一种iOS崩溃数据分类与统计的方法和装置
CN104182226B (zh) 一种通用移动信息系统适配方法与装置
JP5017434B2 (ja) 情報処理装置およびプログラム
KR20170043365A (ko) 빅데이터를 이용한 중요 판례 추출 및 정리 방법
CN107291616A (zh) 一种项目报告在线生成平台
CN106897267A (zh) 文章缩略文意生成方法、装置及服务器
CN110232154A (zh) 基于随机森林的产品推荐方法、装置及介质
CN109815224A (zh) 数据质量检测及清洗的方法和装置
CA2843363A1 (en) Network device for protocol alignment through recursive, time sensitive event-based matching
KR102585283B1 (ko) 소셜 빅데이터 분석을 통한 국가별 사용자 관심 토픽 자동 구성 방법
CN114780408A (zh) 软件用户行为路径分析方法及装置
CN107391957A (zh) 一种统计方法及装置
JP2009009342A (ja) 情報処理装置およびプログラム
US20210358267A1 (en) Operation system based on membership level and method thereof
CN112700835B (zh) 医疗护理期电子体温单填写监督管理方法、装置及介质
CN117411895B (zh) 工业生产检测数据处理方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination