CN110390999A

CN110390999A - 一种临床数据的值域计算方法、装置、可读介质及电子设备

Info

Publication number: CN110390999A
Application number: CN201910497402.XA
Authority: CN
Inventors: 郎超; 孔维晓; 刘水清; 李潇; 闫柳村
Original assignee: Nanjing Medical Jiyun Medical Data Research Institute Co Ltd
Current assignee: Nanjing Medical Jiyun Medical Data Research Institute Co Ltd
Priority date: 2019-06-10
Filing date: 2019-06-10
Publication date: 2019-10-29
Anticipated expiration: 2039-06-10
Also published as: CN110390999B

Abstract

本发明公开了一种临床数据的值域计算方法、装置、可读介质及电子设备，所述方法包括：对已知数据集合进行数据训练，以建立目标分类模型；所述已知数据集合包括已知目标数据和已知非目标数据；利用所述目标分类模型对未知数据集合进行分类，获得待统计目标数据；对所述待统计目标数据的临床指标进行置信区间拟合，得到所述待统计目标数据的值域；所述方法高效的对大数据进行了应用，因此数据分析所涉及的数据范围更广泛，数量更庞大，而且计算方式更为严密，所以能够结合大数据分析的优势，得到相比传统方式更准确、更有医学价值的临床数据值域区间。

Description

一种临床数据的值域计算方法、装置、可读介质及电子设备

技术领域

本发明涉及计算机技术领域，尤其涉及一种临床数据的值域计算方法、装置、可读介质及电子设备。

背景技术

在医学上，临床数据的重要性不言而喻。几乎所有的诊断都离不开对于临床数据的分析和判断。其中，临床数据的值域范围，包括健康人体的临床数据值域范围，以及某些典型疾病的特殊临床数据的值域范围(例如糖尿病人的血糖数据/尿糖数据等)，无论在诊疗上还是在医学研究上，都具有非常大的医学价值。

而如何对数据的值域范围进行界定，传统医学领域往往是依靠历史经验，或者依靠人工的统计和数据计算。例如，传统的算法是在方格纸上将测试数据的手动绘图，并且基于绘图视觉评估正常区间；或者计算绘图数据的线性回归。

但显然，传统算法能够利用的数据量较少，数据覆盖范围有限；计算方法也相对简单，精确度有待提高。在人工智能技术和大数据分析日趋成熟的今天，传统方式所得到的数据值域已经无法满足当前的实际需求。

发明内容

本发明提供一种临床数据的值域计算方法、装置、可读介质及电子设备，基于人工智能技术和大数据分析技术，实现从海量临床数据中取得临床数据的特定值域范围。

第一方面，本发明提供了一种临床数据的值域计算方法，包括：

对已知数据集合进行数据训练，以建立目标分类模型；所述已知数据集合包括已知目标数据和已知非目标数据；

利用所述目标分类模型对未知数据集合进行分类，获得待统计目标数据；

对所述待统计目标数据的临床指标进行置信区间拟合，得到所述待统计目标数据的值域。

优选地，所述对已知数据集合进行数据训练，以建立目标分类模型包括：

将所述已知目标数据和已知非目标数据作为训练样本进行监督学习训练，以获得所述已知目标数据的数值与数据特征的函数关系，通过所述函数关系建立所述目标分类模型。

优选地，所述对已知数据集合进行数据训练，以建立目标分类模型还包括：

将已知目标数据或已知非目标数据代入所述目标分类模型，以获得所述目标分类模型的第一拟合度；

当所述第一拟合度低于预设的第一拟合度标准，则通过所述监督学习训练修正所述函数关系。

优选地，所述对所述待统计目标数据的数值进行置信区间拟合，得到所述待统计目标数据的值域包括：

统计计算所述待统计目标数据的临床指标，以获得至少两个临床指标数值范围不同的置信区间；

从待统计目标数据当中，获取临床指标数值范围与所述各个置信区间相符合的多个数据，以作为所述各个置信区间对应的置信集合；

对所述各个置信集合分别进行数据训练，以建立所述各个置信区间对应的置信模型；并获得所述各个置信模型的模型量化指标；

对比所述各置信模型的模型量化指标，将模型量化指标最高的置信模型对应的置信区间作为所述待统计目标数据的值域。

优选地，所述已知数据集合和所述未知数据集合具有特定且相同的时间范围和/或空间范围。

优选地，还包括：

根据所述待统计目标数据的值域建立目标预测模型；

利用所述目标预测模型对未知数据进行分类，得到所述未知数据的数据特征。

第二方面，本发明提供了一种临床数据的值域计算装置，包括：

建模模块，用于对已知数据集合进行数据训练，以建立目标分类模型；所述已知数据集合包括已知目标数据和已知非目标数据；

分类模块，用于利用所述目标分类模型对未知数据集合进行分类，获得待统计目标数据；

分析模块，用于对所述待统计目标数据的临床指标进行置信区间拟合，得到所述待统计目标数据的值域。

优选地，所述分析模块包括：

置信计算单元，用于统计计算所述待统计目标数据的临床指标，以获得至少两个临床指标数值范围不同的置信区间；从待统计目标数据当中，获取临床指标数值范围与所述各个置信区间相符合的多个数据，以作为所述各个置信区间对应的置信集合；

置信建模单元，用于对所述各个置信集合分别进行数据训练，以建立所述各个置信区间对应的置信模型；并获得所述各个置信模型的模型量化指标；

值域生成单元，用于对比所述各置信模型的模型量化指标，将模型量化指标最高的置信模型对应的置信区间作为所述待统计目标数据的值域

第三方面，本发明提供了一种可读介质，包括执行指令，当电子设备的处理器执行所述执行指令时，所述电子设备执行如第一方面中任一所述的方法。

第四方面，本发明提供了一种电子设备，包括处理器以及存储有执行指令的存储器，当所述处理器执行所述存储器存储的所述执行指令时，所述处理器执行如第一方面中任一所述的方法。

本发明提供了一种临床数据的值域计算方法、装置、可读介质及电子设备，所述方法利用所述目标分类模型从未知数据集合海量的数据中高效的筛选出特定目标数据即待统计目标数据，以用于后续分析。基于人工智能技术实现了对于海量未知数据特征的临床数据的有效利用。然后进一步基于大数据分析技术，对于待统计目标数据进行统计分析计算，得到临床数据的值域范围。可见，本实施例中高效的对大数据进行了应用，因此数据分析所涉及的数据范围更广泛，数量更庞大，而且计算方式更为严密，所以能够结合大数据分析的优势，得到相比传统方式更准确、更有医学价值的临床数据值域区间；另外本发明详细公开了利用监督学习训练方法建立目标分类模型的过程，并且进一步包括了对于目标分类模型的校验和修正步骤。由此保障了所述目标分类模型的精度，提高了数据筛选的准确率，从而使得所述临床数据的值域计算整体上更加精确。本发明具体描述了对于待统计目标数据的置信分析过程，通过对多个置信区间进行建模和对比分析，选取出相对最优的置信区间作为临床数据的值域范围。由此进一步提高了值域计算的准确性。

上述的非惯用的优选方式所具有的进一步效果将在下文中结合具体实施方式加以说明。

附图说明

为了更清楚地说明本发明实施例或现有的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明中记载的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1为本发明一实施例提供的一种临床数据的值域计算方法的流程示意图；

图2为本发明一实施例提供的另一种临床数据的值域计算方法的流程示意图；

图3为本发明一实施例提供的又一种临床数据的值域计算方法的流程示意图；

图4为本发明一实施例提供的又一种临床数据的值域计算装置的结构示意图；

图5为本发明一实施例提供的一种电子设备的结构示意图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚，下面将结合具体实施例及相应的附图对本发明的技术方案进行清楚、完整地描述。显然，所描述的实施例仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

前述已知，传统医学领域对临床数据的值域范围进行界定，例如界定“健康人”的空腹血糖的值域区间，往往是依靠历史经验，或者依靠人工的统计和数据计算。传统方法数据分析量有限，计算方式也相对简单。本发明则试图基于人工智能技术进行建模，并利用模型对海量的临床数据进行统计分析，从而测算出更加精确的值域范围。所以相对于传统方法，本发明的计算过程精确度更高，并且所分析的临床数据数量更加庞大，覆盖范围更广泛。

参照图1所示，为本发明所述临床数据的值域计算方法的一个具体实施例。本实施例中所述方法包括以下步骤：

步骤101、对已知数据集合进行数据训练，以建立目标分类模型；所述已知数据集合包括已知目标数据和已知非目标数据。

所述已知数据集合中，包括一定数量的已知数据特征的临床数据。其来源可以是医疗结构的历史临床数据，优选的已知数据集合中的数据数量可以为1000～2000组。又因为，本步骤中建模的目的在于筛选出特定目标(即筛选出具有特定数据特征的数据)，所以为了进行针对性训练，已知数据集合中的数据又包括已知目标数据和已知非目标数据。所述已知目标数据即具备所述特定数据特征的临床数据，已知非目标数据则反之为不具备所述特定数据特征的临床数据。

例如，假设所述特定目标为“健康人”。则已知目标数据的数据特征即“健康人”，意味着所述已知目标数据为来自于健康人的临床数据。而已知非目标数据的数据特征即“不健康人”。或者，假设所述特定目标为“糖尿病人”。则已知目标数据的数据特征即“糖尿病人”，意味着所述已知目标数据为来自于糖尿病人的临床数据。而已知非目标数据的数据特征即“非糖尿病人”。

将已知目标数据和已知非目标数据作为样本，基于人工智能技术进行数据训练建立，即可获悉已知目标数据的数值与数据特征之间特定的关联性，以此能够建立目标分类模型。

步骤102、利用所述目标分类模型对未知数据集合进行分类，获得待统计目标数据。

根据前述，由于所述目标分类模型中，已经体现了已知目标数据的数值与数据特征之间特定的关联性，那么将未知数据特征的临床数据代入到所述目标分类模型中，即可通过计算发现该临床数据的数据特征是否为所述目标分类模型的特定目标。

同样以所述特定目标为“健康人”为例，将一个未知数据特征的临床数据代入所述目标分类模型，所述目标分类模型即可对该临床数据的数值进行计算分析，并判断出该临床数据是否符合“健康人”这一数据特征。进而可认为，所述目标分类模型能够筛选出哪些未知特征的临床数据来自于“健康人”。

实际上，能够用来分析的已知特征的数据数量是非常有限的。海量的数据往往是未知特征的临床数据。若想对这种未知特征的临床数据进行分析，便需要借助目标分类模型，从而高效的从中筛选出具备所述特定目标，也就是具备特定数据特征的临床数据。所述未知数据集合，即是海量的未知数据特征的临床数据形成的集合。优选的未知数据集合中的数据数量可以为至少100000组。将其代入所述目标分类模型，筛选出其中具备特定数据特征的那部分临床数据，以作为待统计目标数据。

步骤103、对所述待统计目标数据的临床指标进行置信区间拟合，得到所述待统计目标数据的值域。

所述待统计目标数据中，数据的数值分布为正态分布。则可以对所述待统计目标数据进行置信分析，得到其正态分布的数值的置信区间。所述置信区间，体现了正态分布的数据的真实值区间范围。所以理论上，可以以此作为本实施例所述方法的计算结果，即作为待统计目标数据的值域。

还需要说明的是，由于某些临床数据的数值与时间/空间有明显的关联性，所以本实施例最终计算得到值域，还可以包含时间维度和/或空间维度。具体的，可以使所述已知数据集合和所述未知数据集合具有特定且相同的时间范围和/或空间范围。由此得到时间维度和/或空间维度下的值域。

通过以上技术方案可知，本实施例所述方法具备的有益效果是：通过人工智能技术对已知数据集合进行训练建模，得到目标分类模型；利用所述目标分类模型从未知数据集合海量的数据中高效的筛选出特定目标数据即待统计目标数据，以用于后续分析。基于人工智能技术实现了对于海量未知数据特征的临床数据的有效利用。然后进一步基于大数据分析技术，对于待统计目标数据进行统计分析计算，得到临床数据的值域范围。可见，本实施例中高效的对大数据进行了应用，因此数据分析所涉及的数据范围更广泛，数量更庞大，而且计算方式更为严密，所以能够结合大数据分析的优势，得到相比传统方式更准确、更有医学价值的临床数据值域区间。

图1所示仅为本发明所述方法的基础实施例，在其基础上进行一定的优化和拓展，还能够得到所述方法的其他优选实施例。

如图2所示，为本发明所述临床数据的值域计算方法的另一个具体实施例。本实施例在前述实施例的基础上，对于训练建模过程进行了更具体的描述和一定程度的优化。为了便于解释和说明，本实施例将结合“计算健康人空腹血糖值域”这一具体场景进行阐述。当然应该认为，在其他有关的场景下，本实施例所述方法亦同样适用。

结合上述具体场景以及前述实施例中的描述可知，在本实施例中特定目标为“健康人”。则在已知数据集合中，已知目标数据的数据特征即“健康人”，意味着所述已知目标数据为来自于健康人的临床数据；而已知非目标数据的数据特征即“不健康人”，意味着所述已知非目标数据为来自于不健康人的临床数据。

本实施例所述方法，将要通过建立模型来筛选哪些未知数据特征的临床数据是健康人的临床数据。进而通过大量健康人的临床数据统计计算健康人的空腹血糖值域。

还需要说明的是，虽然本实施例中旨在计算“空腹血糖”这一项临床指标的值域，但并不意味着方法中所涉及的各种临床数据(包括已知数据集合和未知数据集合中的数据)仅仅包括“血糖”一项临床指标。因为仅通过一项临床指标难以和所述数据特征形成强关联性。或者说，只通过分析血糖数值无法准确的判断一个人是否为“健康人”。所以实际上，针对一个个体的一份临床数据，一般都包括了多项临床指标(如血糖、血压、体重、心率等)及数值。

本实施例中所述方法包括以下步骤：

步骤201、将所述已知目标数据和已知非目标数据作为训练样本进行监督学习训练，以获得所述已知目标数据的数值与数据特征的函数关系，通过所述函数关系建立所述目标分类模型。

所述监督学习训练，即通过人工智能计算来发现数据数值和已知的数据特征之间，存在怎样的关联性。在本实施例的场景下，也就是通过健康人的临床数据(已知目标数据)和不健康人的临床数据(已知非目标数据)来分析发现，临床数据的数值呈何种状态即意味着数据特征为“健康人”。

假设已知数据集合中一份数据表示为(x,y)。其中x表示数据的数值，具体可以用x＝(x₁,x₂…x_n)来表达x₁～x_n共n项临床指标各自的数值。y表示数据特征，在本实施例中可认为当y＝1即数据特征为“健康人”，y＝0即数据特征为“非健康人”。

经过所述监督学习训练，可获得已知目标数据的数值与数据特征的函数关系y＝f(x)。即获得所述目标分类模型。对于未知数据特征的临床数据，只需将其数值作为x代入模型，即可得到数据特征y。

监督学习训练的具体过程，以及相应的函数关系y＝f(x)的表达式，在本实施例中不做限定。现有技术中所有可实现的人工智能训练算法均可结合在本实施例的整体技术方案之下。并且根据具体应用场景和需求，建模的数学运算过程也可进行适当的调整。

步骤202、将已知目标数据或已知非目标数据代入所述目标分类模型，以获得所述目标分类模型的第一拟合度；当所述第一拟合度低于预设的第一拟合度标准，则通过所述监督学习训练修正所述函数关系。

为确保所述目标分类模型能够精确的完成筛选和分类，本实施例中在通过一定程度的训练获得上述函数关系后，还需对其进行校验及修正。

校验方式为，将已知目标数据或已知非目标数据代入，判断所述目标分类模型计算获得的数据特征与预先已知的数据特征是否相符合。例如，代入一组“健康人”的临床数据数值，看所述目标分类模型计算的结果是否同样显示其数据特征为“健康人”。

利用大量已知目标数据和已知非目标数据代入所述目标分类模型进行校验，即可根据所述目标分类模型输出的准确率来统计其第一拟合度。原则上第一拟合度越高说明所述目标分类模型越准确。但如果所述目标分类模型的第一拟合度低于预设的第一拟合度标准，则说明其准确程度尚不符合要求。所以需要对其继续进行监督学习训练，修正所述函数关系，直到第一拟合度符合要求。

步骤203、利用所述目标分类模型对未知数据集合进行分类，获得待统计目标数据。

步骤204、对所述待统计目标数据的临床指标进行置信区间拟合，得到所述待统计目标数据的值域。

在本实施例中，利用所述目标分类模型对所述未知数据集合中的海量数据进行筛选，即可筛选出所述未知数据集合中所有数据特征为“健康人”的临床数据，以作为待统计目标数据。实现了对于海量数据的高效筛选。

然后，从海量的来自于“健康人”的待统计数据中，统计分析“健康人”的空腹血糖的数值分布范围，从而计算出健康人空腹血糖值域。

另外优选地，本实施例中所述方法还可以包括：

步骤205、根据所述待统计目标数据的值域建立目标预测模型。

步骤206、利用所述目标预测模型对未知数据进行分类，得到所述未知数据的数据特征。

上述步骤表示了所述待统计目标数据的值域的应用过程。也就是说，在得到所述待统计目标数据的值域之后，可以根据所述待统计目标数据的值域建模，并以此对所述未知数据进行分类。在本实施例中，即通过所述目标预测模型判断患者的血糖数据是否正常，进而预测该患者是否为“正常人”。

通过以上技术方案可知，本实施例所述方法在图1所示实施例的基础上，进一步实现的有益效果是：本实施例中详细公开了利用监督学习训练方法建立目标分类模型的过程，并且进一步包括了对于目标分类模型的校验和修正步骤。由此保障了所述目标分类模型的精度，提高了数据筛选的准确率，从而使得所述临床数据的值域计算方法整体上更加精确。

如图3所示，为本发明所述临床数据的值域计算方法的又一个具体实施例。本实施例在前述实施例的基础上，对于待统计目标数据的数值进行置信分析过程进行了更具体的描述和一定程度的优化。为了便于解释和说明，本实施例将继续结合“计算健康人空腹血糖值域”这一具体场景进行阐述。当然应该认为，在其他有关的场景下，本实施例所述方法亦同样适用。

本实施例中，所述方法包括以下步骤：

步骤301、对已知数据集合进行数据训练，以建立目标分类模型；所述已知数据集合包括已知目标数据和已知非目标数据。

步骤302、利用所述目标分类模型对未知数据集合进行分类，获得待统计目标数据。

同理图2所示实施例，在本实施例中同样可以通过上述步骤得到所述未知数据集合中所有数据特征为“健康人”的临床数据，以作为待统计目标数据。在本实施例的后续步骤中，将更加具体的阐述如何通过海量的来自于“健康人”的待统计数据，统计分析“健康人”的空腹血糖的数值分布范围。

步骤303、统计计算所述待统计目标数据的临床指标，以获得至少两个临床指标数值范围不同的置信区间。

从医学规律来看，“健康人”的空腹血糖数值基本会固定的处于某个特定区间内并呈正态分布。而本实施例所述方法，需要过滤掉正态分布两端极少数不具有代表性的数据点，得到较为典型的置信区间。所述置信区间，体现了正态分布的数据的真实值区间范围，可以作为一个具有更高医学价值的健康人空腹血糖值域范围。

本步骤中将通过统计学算法直接得到一个置信区间。置信的具体计算过程存在较为成熟的数学方法，在此不做赘述。

理论上，直接计算得到的置信区间可以直接作为临床数据的值域范围。不过实际应用中，直接计算得到的标准置信区间未必是最优的数值范围，可能还需结合实际情况进行调整。所以在本实施例中，将通过多个置信区间进行对比的方式，找到一个相对最优选的置信区间。以便进一步的优化临床数据的最终值域。

本步骤中还可将直接得到的置信区间进行数值范围调整，再得到至少一个数值范围不同的置信区间。所述数值范围的调整，可以包括数值范围的扩大、缩小或者偏移等方式。

也就是说，本步骤中将得到至少两个数值范围不相同的置信区间，以供后续进行计算和对比。而无论是直接计算得到的置信区间，还是数值调整后得到的置信区间，在后续过程中均无区别，在表达上可以不做特意的区分。

假设本实施例中得到关于空腹血糖数值的两个置信区间。分别是置信区间A(4.0-6.0)mmol/L；置信区间B(3.9～6.1)mmol/L。

步骤304、从待统计目标数据当中，获取临床指标数值范围与所述各个置信区间相符合的多个数据，以作为所述各个置信区间对应的置信集合。

本实施例中，将从海量的待统计目标数据中，选出数值范围与每个置信区间相符合的多个数据，从而为每个置信区间建立一个置信集合。

例如从待统计目标数据中选取1000组数据，空腹血糖数值均在置信区间A范围内，将该1000组数据作为置信区间A对应的置信集合A。另从待统计目标数据中选取1000组数据，空腹血糖数值均在置信区间B范围内，将该1000组数据作为置信区间B对应的置信集合B。

步骤305、对所述各个置信集合分别进行数据训练，以建立所述各个置信区间对应的置信模型；并获得所述各个置信模型的模型量化指标。

本实施例中，所述置信模型的建模原理同所述目标分类模型相同，即同样以监督学习训练进行建模。可以认为，将所述置信集合中的数据替换所述已知目标数据，同时保留原有的已知非目标数据，再重复执行图1～图2所示实施例中的建模相关步骤(包括步骤101，或步骤201～步骤202)，即可同理得到置信模型。建模过程在此不做赘述。

另需说明的是，基于当前的人工智能计算技术，随着置信模型的生成过程，除得到模型本身(即所述函数关系)以外，还能够基于多种评估指标对模型进行评估，以得到模型的模型量化指标。所述评估指标包括精准度、召回率、F1值、AUC值和对数损失等。

按照上述，本实施例中可针对置信集合A进行数据训练，得到置信模型A，并获得置信模型A的模型量化指标A；针对置信集合B进行数据训练，得到置信模型B，并获得置信模型A的模型量化指标A。

步骤306、对比所述各置信模型的模型量化指标，将模型量化指标最高的置信模型对应的置信区间作为所述待统计目标数据的值域。

通过各种评估指标可以评估所述置信模型的精确程度。本实施例中通过对多个置信模型的模型量化指标进行对比，从而找到相对最优的一个置信模型。进而，将该置信模型对应的置信区间作为所述待统计目标数据的值域，也即本实施例中希望求得的，健康人空腹血糖的值域范围。

如上所述，对比发现模型量化指标B＞模型量化指标A，即说明置信模型B相对最优，则将置信区间B(3.9～6.1)mmol/L作为健康人空腹血糖的值域范围。

通过以上技术方可知，本实施例在前述实施例的基础上，进一步实现的有益效果是：具体描述了对于待统计目标数据的置信分析过程，通过对多个置信区间进行建模和对比分析，选取出相对最优的置信区间作为临床数据的值域范围。由此进一步提高了值域计算的准确性。

如图4所示，为本发明所述临床数据的值域计算装置的一个具体实施例。本实施例所述装置，即用于执行图1～3所述方法的实体装置。其技术方案本质上与上述实施例一致，上述实施例中的相应描述同样适用于本实施例中。本实施例中所述装置包括：

建模模块401，用于对已知数据集合进行数据训练，以建立目标分类模型；所述已知数据集合包括已知目标数据和已知非目标数据。

所述建模模块401包括，

训练单元411，用于将所述已知目标数据和已知非目标数据作为训练样本进行监督学习训练，以获得所述已知目标数据的数值与数据特征的函数关系，通过所述函数关系建立所述目标分类模型。

修正单元412，用于将已知目标数据或已知非目标数据代入所述目标分类模型，以获得所述目标分类模型的第一拟合度；在所述第一拟合度低于预设的第一拟合度标准时，通过所述监督学习训练修正所述函数关系。

分类模块402，用于利用所述目标分类模型对未知数据集合进行分类，获得待统计目标数据。

分析模块403，用于用于对所述待统计目标数据的临床指标进行置信区间拟合，得到所述待统计目标数据的值域。

所述分析模块403包括：

置信计算单元431，用于统计计算所述待统计目标数据的临床指标，以获得至少两个临床指标数值范围不同的置信区间；从待统计目标数据当中，获取临床指标数值范围与所述各个置信区间相符合的多个数据，以作为所述各个置信区间对应的置信集合。

置信建模单元432，用于对所述各个置信集合分别进行数据训练，以建立所述各个置信区间对应的置信模型；并获得所述各个置信模型的模型量化指标。

值域生成单元433，用于对比所述各置信模型的模型量化指标，将模型量化指标最高的置信模型对应的置信区间作为所述待统计目标数据的值域。

另外优选的，所述已知数据集合和所述未知数据集合可以具有特定且相同的时间范围和/或空间范围。

通过以上技术方案可知，本实施例存在的有益效果是：利用所述目标分类模型从未知数据集合海量的数据中高效的筛选出特定目标数据即待统计目标数据，以用于后续分析。基于人工智能技术实现了对于海量未知数据特征的临床数据的有效利用。然后进一步基于大数据分析技术，对于待统计目标数据进行统计分析计算，得到临床数据的值域范围。可见，本实施例中高效的对大数据进行了应用，因此数据分析所涉及的数据范围更广泛，数量更庞大，而且计算方式更为严密，所以能够结合大数据分析的优势，得到相比传统方式更准确、更有医学价值的临床数据值域区间。本实施例中详细公开了利用监督学习训练方法建立目标分类模型的过程，并且进一步包括了对于目标分类模型的校验和修正步骤。由此保障了所述目标分类模型的精度，提高了数据筛选的准确率，从而使得所述临床数据的值域计算整体上更加精确。具体描述了对于待统计目标数据的置信分析过程，通过对多个置信区间进行建模和对比分析，选取出相对最优的置信区间作为临床数据的值域范围。由此进一步提高了值域计算的准确性。

图5是本发明实施例提供的一种电子设备的结构示意图。在硬件层面，该电子设备包括处理器，可选地还包括内部总线、网络接口、存储器。其中，存储器可能包含内存，例如高速随机存取存储器(Random-Access Memory，RAM)，也可能还包括非易失性存储器(non-volatile memory)，例如至少1个磁盘存储器等。当然，该电子设备还可能包括其他业务所需要的硬件。

处理器、网络接口和存储器可以通过内部总线相互连接，该内部总线可以是ISA(Industry StandardArchitecture，工业标准体系结构)总线、PCI(Peripheral ComponentInterconnect，外设部件互连标准)总线或EISA(Extended IndustryStandardArchitecture，扩展工业标准结构)总线等。所述总线可以分为地址总线、数据总线、控制总线等。为便于表示，图5中仅用一个双向箭头表示，但并不表示仅有一根总线或一种类型的总线。

存储器，用于存放执行指令。具体地，执行指令即可被执行的计算机程序。存储器可以包括内存和非易失性存储器，并向处理器提供执行指令和数据。

在一种可能实现的方式中，处理器从非易失性存储器中读取对应的执行指令到内存中然后运行，也可从其它设备上获取相应的执行指令，以在逻辑层面上形成临床数据的值域计算装置。处理器执行存储器所存放的执行指令，以通过执行的执行指令实现本发明任一实施例中提供的临床数据的值域计算方法。

上述如本发明图4所示实施例提供的临床数据的值域计算装置执行的方法可以应用于处理器中，或者由处理器实现。处理器可能是一种集成电路芯片，具有信号的处理能力。在实现过程中，上述方法的各步骤可以通过处理器中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器可以是通用处理器，包括中央处理器(Central ProcessingUnit，CPU)、网络处理器(Network Processor，NP)等；还可以是数字信号处理器(DigitalSignal Processor，DSP)、专用集成电路(Application Specific Integrated Circuit，ASIC)、现场可编程门阵列(Field－Programmable GateArray，FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。

结合本发明实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成，或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器，闪存、只读存储器，可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器，处理器读取存储器中的信息，结合其硬件完成上述方法的步骤。

本发明实施例还提出了一种可读介质，该可读存储介质存储有执行指令，存储的执行指令被电子设备的处理器执行时，能够使该电子设备执行本发明任一实施例中提供的临床数据的值域计算方法，并具体用于执行如图1～图3所示的方法。

前述各个实施例中所述的电子设备可以为计算机。

本领域内的技术人员应明白，本发明的实施例可提供为方法或计算机程序产品。因此，本发明可采用完全硬件实施例、完全软件实施例，或软件和硬件相结合的形式。

本发明中的各个实施例均采用递进的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。尤其，对于装置实施例而言，由于其基本相似于方法实施例，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

还需要说明的是，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。

以上所述仅为本发明的实施例而已，并不用于限制本发明。对于本领域技术人员来说，本发明可以有各种更改和变化。凡在本发明的精神和原理之内所作的任何修改、等同替换、改进等，均应包含在本发明的权利要求范围之内。

Claims

1.一种临床数据的值域计算方法，其特征在于，包括：

2.根据权利要求1所述方法，其特征在于，所述对已知数据集合进行数据训练，以建立目标分类模型包括：

3.根据权利要求2所述方法，其特征在于，所述对已知数据集合进行数据训练，以建立目标分类模型还包括：

4.根据权利要求1所述方法，其特征在于，所述对所述待统计目标数据的数值进行置信区间拟合，得到所述待统计目标数据的值域包括：

5.根据权利要求1～4任意一项所述方法，其特征在于，所述已知数据集合和所述未知数据集合具有特定且相同的时间范围和/或空间范围。

6.根据权利要求1～4任意一项所述方法，其特征在于，还包括：

根据所述待统计目标数据的值域建立目标预测模型；

7.一种临床数据的值域计算装置，其特征在于，包括：

8.根据权利要求6所述装置，其特征在于，所述分析模块包括：

值域生成单元，用于对比所述各置信模型的模型量化指标，将模型量化指标最高的置信模型对应的置信区间作为所述待统计目标数据的值域。

9.一种可读介质，包括执行指令，当电子设备的处理器执行所述执行指令时，所述电子设备执行如权利要求1至6中任一所述的方法。

10.一种电子设备，包括处理器以及存储有执行指令的存储器，当所述处理器执行所述存储器存储的所述执行指令时，所述处理器执行如权利要求1至6中任一所述的方法。