CN108511057A

CN108511057A - 输血量模型建立及预测方法、装置、设备及其存储介质

Info

Publication number: CN108511057A
Application number: CN201810164800.5A
Authority: CN
Inventors: 徐振华
Original assignee: Beijing Hexing Souren Health Technology Co Ltd
Current assignee: Beijing Hexing Souren Health Technology Co Ltd
Priority date: 2018-02-28
Filing date: 2018-02-28
Publication date: 2018-09-07

Abstract

本申请公开了输血量模型建立及预测方法、装置、设备及其存储介质。该方法包括：获取预定时长内历史用户数据集，将历史用户数据集划分成训练数据集和测试数据集；基于历史用户数据集提取至少一个特征参数集，该特征参数集不包括手术耗费时间；以及利用训练数据集和测试数据集采用模型训练算法进行学习和验证，得到至少一个特征参数集与单用户输血量之间的映射关系作为输血量预测模型。根据本申请实施例的技术方案，通过建立至少一个特征参数集和单用户输血量之间的映射关系作为输血量预测模型，可以适用于医疗领域的各种输血场景。且应用该预测模型，能够降低红细胞超适应症输注比例和异体输血风险，从而节约血液资源。

Description

输血量模型建立及预测方法、装置、设备及其存储介质

技术领域

本申请一般涉及临床医疗领域，具体涉及医疗信息化处理技术领域，尤其涉及输血量模型建立及预测方法、装置、设备及其存储介质。

背景技术

对于红细胞输注阈值，国家卫生部《临床输血技术规范》中“手术及创伤输血指南”规定：Hb＞100g/L可以不输血；Hb＜70g/L应考虑输血；Hb介于70-100g/L应根据患者贫血程度、心脏代偿功能、有无代谢率增高及年龄等因素决定。“内科输血指南”规定Hb＜60g/L，或者红细胞比容小于20％时，可以考虑输注。

对于Hb介于70-100g/L手术或创伤患者和Hb＞60g/L内科贫血患者，由于现有行业规范和指南中并没有可行的、公认的标准，以致存在血液资源使用的不合理，甚至浪费。而且，输血量的不确定性还增加了患者异体输血风险和医疗成本。

发明内容

鉴于现有技术中的上述缺陷或不足，期望提供一种能够对用户红细胞输注量精确量化的方案，来降低红细胞超适应症输注比率和医疗成本，并提高临床输注红细胞量的精准度。

第一方面，本申请实施例提供了一种建立输血量预测模型的方法，该方法包括：

获取预定时长内历史用户数据集，将历史用户数据集划分成训练数据集和测试数据集；

基于历史用户数据集提取至少一个特征参数集，该特征参数集不包括手术耗费时间；以及

利用训练数据集和测试数据集采用模型训练算法进行学习和验证，得到至少一个特征参数集与单用户输血量之间的映射关系作为输血量预测模型。

第二方面，本申请实施例提供了一种输血量预测方法，该方法包括：

提取待预测用户数据和预设的目标参数；

根据待预测用户数据和预设的目标参数，利用预先按照如本申请实施例描述的方法建立的输血量预测模型来预测待预测用户的输血量。

第三方面，本申请实施例提供了一种输血量预测方法，该方法包括：

获取输血申请数据；

基于输血申请数据的第一标识选择对应的输血量预测模型，其中，输血量预测模型包括按照本申请实施例描述的方法建立的输血量预测模型；

基于输血申请数据提取待预测用户数据和预设的目标参数；

根据待预测用户数据和预设的目标参数，利用所选择的输血量预测模型来预测待预测用户的输血量。

第四方面，本申请实施例提供了一种建立输血量预测模型的装置，该装置包括：

数据获取划分单元，用于获取预定时长内历史用户数据集，将历史用户数据集划分成训练数据集和测试数据集；

特征提取单元，用于基于历史用户数据集提取至少一个特征参数集，该特征参数集不包括手术耗费时间；以及

模型训练单元，用于利用训练数据集和测试数据集采用模型训练算法进行学习和验证，得到至少一个特征参数集与单用户输血量之间的映射关系作为输血量预测模型。

第五方面，本申请实施例提供了一种输血量预测装置，该装置包括：

数据提取单元，用于提取待预测用户数据和预设的目标参数；

预测单元，用于根据待预测用户数据和目标参数利用预先按照本申请实施例描述的方法建立的输血量预测模型来预测待预测用户的输血量。

第六方面，一种输血量预测装置，该装置包括：

数据获取单元，用于获取输血申请数据；

模型选择单元，用于基于输血申请数据的第一标识选择对应的输血量预测模型，其中输血量预测模型包括按照本申请实施例描述的方法建立的输血量预测模型；

数据提取单元，用于基于输血申请数据提取待预测用户数据和预设的目标参数；

预测单元，用于根据待预测用户数据和预设的目标参数利用所选择的输血量预测模型来预测待预测用户的输血量。

第七方面，本申请实施例提供了一种计算机设备，包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序，该处理器执行该程序时实现如本申请实施例描述的方法。

第八方面，本申请实施例提供了一种计算机可读存储介质，其上存储有计算机程序，该计算机程序用于：

该计算机程序被处理器执行时实现如本申请实施例描述的方法。

本申请实施例提供的建立输血量预测模型的方案，通过从历史用户数据集中划分训练数据集，并利用训练数据集采用模型训练算法进行模型训练，得到至少一个特征参数集与用户输血量之间的映射关系作为输血量预测模型。该输血量预测模型通过至少一个特征参数集来描述用户输血量，能够适用于医疗领域的各种输血场景。

本申请实施例还提供了基于预先建立的输血量预测模型来预测用户输血量的方案，通过多维度特征参数描述输血量，能够有效地提高预测输血量的准确性，进一步地通过引入专家建议的血红蛋白值或红细胞压积值合理控制输血量，通过本申请实施例预测方案，能够对患者红细胞输注需求和输注后疗效做出精准的量化评价，直接为临床医师提供红细胞输注决策意见，并能够提高临床医师红细胞输注决策水平，还能够降低红细胞超适应症输注比率及异体输血风险，节约宝贵的血液资源。

本申请实施例还提供了基于可选的输血量预测模型预测用户输血量的方案，简化了输血操作流程，提升了医疗处理的效率。

附图说明

通过阅读参照以下附图所作的对非限制性实施例所作的详细描述，本申请的其它特征、目的和优点将会变得更明显：

图1示出了本申请实施例提供的建立输血量预测模型方法的流程示意图；

图2示出了本申请又一实施例提供的建立用于内科输血量预测模型方法的流程示意图；

图3示出了本申请又一实施例提供的建立用于外科输血量预测模型方法的流程示意图；

图4示出了本申请又一实施例提供的输血量预测方法的流程示意图；

图5示出了本申请又一实施例提供的输血量预测方法的流程示意图；

图6示出了本申请实施例提供的建立输血量预测模型装置的示例性结构框图；

图7示出了本申请又一实施例提供的建立用于内科输血量预测的模型的装置的示例性结构框图；

图8示出了本申请又一实施例提供的建立用于外科输血量预测的模型的装置的示例性结构框图；

图9示出了本申请又一实施例提供的输血量预测装置的示例性结构框图；

图10示出了本申请又一实施例提供的输血量预测装置的示例性结构框图；

图11示出了适于用来实现本申请实施例的终端设备或服务器的计算机系统1100的结构示意图。

具体实施方式

下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是，此处所描述的具体实施例仅仅用于解释相关发明，而非对该发明的限定。另外还需要说明的是，为了便于描述，附图中仅示出了与发明相关的部分。

需要说明的是，在不冲突的情况下，本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。

请参考图1，图1示出了本申请实施例提供的建立输血量预测模型方法的流程示意图。

如图1所示，该方法包括：

步骤120，获取预定时长内历史用户数据集，将历史用户数据集划分成训练数据集和测试数据集。

本申请实施例中，通过人工智能的方法来建立用于预测输血量的输血量预测模型。人工智能的研究领域在不断扩大，其包括专家系统、机器学习、进化计算、模糊逻辑、计算机视觉、自然语言处理、推荐系统等。其中，机器学习来源于早期的人工智能领域，传统的算法包括决策树、聚类、贝叶斯分类、支持向量机、EM、Adaboost等等。机器学习算法大致可以分为监督学习(如分类问题)、无监督学习(如聚类问题)、半监督学习、集成学习、深度学习和强化学习等等。深度学习作为实现机器学习的一种技术，通过构建很多隐层的机器学习模型和海量数据来学习更有用的特征参数，从而提升分类或预测的准确性。

输血量预测模型的建立，基于海量历史用户数据。在本申请实施例中，通过获取预定时长内历史用户数据集来用于训练和验证/测试输血量预测模型。其中，预定时长是预定的时间范围，可以根据学习模型的需要选择时间范围。例如，选择某医院2011年-2017年的病患电子记录数据作为历史用户数据集。该历史用户数据集是通过医院信息系统收集的进行过输血治疗的患者的相关数据集合，例如，患者的基本信息(年龄、身高、体重、性别)、血常规检查结果、内科输血前或手术前生命体征信息、生化检查结果、病患诊断结果、科室归属信息等等。其中，患者的基本信息(年龄、身高、体重、性别)可以定义为用户基本信息数据子集，内科输血前的血常规、血气、凝血、生化、生命体征，输血后的血常规等可以定义为用户检查结果数据子集；或者手术前的血常规、血气、凝血、生化、生命体征，手术后的失血量、手术后的血红蛋白值或红细胞压积值等，可以定义为用户手术前后检查结果数据子集；病患诊断结果可以定义为用户诊断信息数据子集；以及患者历史就诊的数据等可以定义为用户既往病史数据子集。

在获取历史用户数据集之后，根据预先设定的比例值划分训练数据集和测试数据集。预先设定的比例值可以是7∶3或者8∶2或者12∶4，还可以是其他比例值，这里不作限定。

步骤140，基于历史用户数据集提取至少一个特征参数集，该特征参数集不包括手术耗费时间。

在本申请实施例中，通过对历史用户数据集的分析，可以得到影响预测对象相关的至少一个特征参数集。该预测对象是不同场景内的单用户输血量。通过从医院信息系统收集得到历史用户数据集，经过可选的预处理步骤之后，可以采用多种方式提取与单用户输血量相关的至少一个特征参数集。该特征参数集可以是根据不同的预测场景提取得到的不同的特征参数集。该特征参数集不包括手术耗费时间等参数。本申请实施例能够适用于内科输血场景的预测，也能够适用外科输血场景的预测。在外科输血预测过程中，不需要引入手术过程中的相关参数，例如手术耗费时间，手术过程中实时失血量，相应的通过术前的参数即可完成输血量的预测，节约了备血时间，简化了预测步骤。

其中，预处理步骤可以包括：剔除、特征编码、特征二值化、清洗、插补、置空等方式，以上仅作为数据预处理方式的举例，实际预处理过程中并不限于上述预处理方式。

即对历史用户数据集进行预处理，预处理可以包括以下一种或者多种：

剔除历史用户数据集的异常数据样本；

对历史用户数据集的部分特征参数进行one-hot编码处理；

对历史用户数据集的部分特征参数进行二值化处理；

对历史用户数据集进行清洗、插补、置空处理。

本申请实施例中，数据预处理还可以包括统计分析噪声清洗、技术分析噪声清洗等方式。

其中，对历史用户数据集中的部分特征参数进行one-hot编码处理包括：

例如，对于用户基本信息数据子集中性别参数，性别参数通常可以分为男、女、未知三种状态，采用one-hot编码可以将性别为男的信息转换成[1，0，0]，将性别为女的信息转换成[0，1，0]，未知转变成[0，0，1]。

例如，对用户诊断信息数据子集的处理，可以包括从用户诊断信息数据子集的主要诊断结果中提取关键字，将关键字转换成数字变量，例如提取微创，用数值1表示微创手术，用数值0表示非微创手术。还可以从用户既往病史数据子集中提取相关的关键词进行二值化处理，例如既往病史中出现“手术”，用数值1表示。

其中，提取与单用户输血量相关的至少一个特征参数集，可以采用人工提取方法、机器学习方法或者深度学习方法中的一种或多种组合。例如，机器学习算法包括随机森林算法、极端梯度提升树算法、支持向量机算法等，深度学习算法包括卷积神经网络CNN、深度神经网络DNN等。实际提取过程中并不限于上述机器学习算法或深度学习算法。

其中，至少一个特征参数集可以是用于内科输血预测场景的单个特征参数集，也可以是用于外科输血预测场景的多个特征参数集。

用于内科输血预测场景的单个特征参数集定义为第一特征参数集，其包括内科检查的各个相关子集中的至少一个。例如，用户基本信息数据子集、用户检查结果数据子集、用户诊断信息数据子集、用户既往病史数据子集等。其中，用户基本信息数据子集例如可以包括患者的年龄、身高、体重、性别等参数；用户检查结果数据子集例如可以包括：输血前的血常规、血气、凝血、生化、生命体征，输血后的血常规等等；用户诊断信息数据子集例如可以包括患者就诊过程中的诊断数据；用户既往病史数据子集例如可以包括患者历史就诊的数据。

用于外科输血预测场景的多个特征参数集，根据外科的手术或者创伤输血场景提取至少两个特征参数集，分别定义为第二特征参数集和第三特征参数集。其中，第二特征参数集用于预测单用户的失血量，第三特征参数集用于预测单用户的输血量。

第二特征参数集可以包括以下一种或多种：用户基本信息数据子集、用户手术前后检查结果的第一数据子集、用户诊断信息数据子集、用户既往病史数据子集、用户历史手术数据子集。其中，用户基本信息数据子集例如可以包括患者的年龄、身高、体重、性别等参数；用户手术前后检查结果的第一数据子集例如可以包括：手术前的血常规、血气、凝血、生化、生命体征，手术后的失血量等等；用户诊断信息数据子集例如可以包括患者就诊过程中的诊断数据；用户既往病史数据子集例如可以包括患者历史就诊的数据；用户历史手术数据子集例如可以包括患者历史手术的数据等。

第三特征参数集可以包括以下一种或多种：用户基本信息数据子集、用户手术前后检查结果的第二数据子集、用户诊断信息数据子集、用户既往病史数据子集、用户历史手术数据子集。其中，用户基本信息数据子集例如可以包括患者的年龄、身高、体重、性别等参数；用户手术前后检查结果的第二数据子集例如可以包括：手术前的血常规、血气、凝血、生化、生命体征，手术后的血红蛋白值或红细胞压积等等；用户诊断信息数据子集例如可以包括患者就诊过程中的诊断数据；用户既往病史数据子集例如可以包括患者历史就诊的数据；用户历史手术数据子集例如可以包括患者历史手术的数据等。

提取至少一个特征参数集的方法可以包括以下至少一种方式：

利用历史用户数据集已有的特征参数确定至少一个特征参数集；

利用特征提取算法从历史用户数据集中提取至少一个特征参数集；

利用特征提取算法组合从历史用户数据集中提取并生成至少一个特征参数集。

其中，利用历史用户数据集已有的特征参数确定至少一个特征参数集可以是从历史用户数据集中人为选择相关的参数作为预测单用户输血量的相关特征参数集，例如，第一特征参数集、第二特征参数集和/或第三特征参数集。

其中，利用特征提取算法从历史用户数据集中提取至少一个特征参数集可以采用机器学习算法中的任一种来提取预测单用户输血量的相关特征参数集，例如第一特征参数集、第二特征参数集和/或第三特征参数集。机器学习算法例如可以是梯度提升树GBDT算法以及其他能够用于提取特征的机器学习算法，例如逻辑回归算法等。

其中，利用特征提取算法组合从历史用户数据集中提取并生成至少一个特征参数集，可以是从历史用户数据集中获取原始特征，将原始特征通过梯度提升树算法(GBDT，Gradient Boosting Decision Tree)或逻辑回归算法进行训练得到对应的组合特征，还可以是利用梯度提升树算法构建新的特征，从而使特征更好地表达数据。具体地可以通过已有的原始特征训练GBDT模型，然后利用GBDT模型学习得到的树来构造新的特征，最后把这些新特征加入原有特征一起训练预测模型。例如，基于梯度特征树GBDT算法生成一个或多个用于表征单用户输血量的特征参数，并结合GBDT算法从历史用户数据集中提取的相关特征参数来共同表征单用户输血量信息。

本申请实施例中通过提取用于表征输血量预测模型的特征参数来训练输血量预测模型，使得该模型具备可解释性。

步骤160，利用训练数据集和测试数据集采用模型训练算法进行学习和验证，得到至少一个特征参数集与单用户输血量之间的映射关系作为输血量预测模型。

在本申请实施例中，根据训练数据集和测试数据集采用模型训练算法进行模型学习和验证，得到输血量预测模型。其中，训练数据集和测试数据集在步骤140中划分，或者在预处理步骤之后完成。

可以采用不同的模型训练算法学习得到至少一个特征参数集与单用户输血量之间的映射关系作为输血量预测模型。例如，学习得到第一特征参数集与单用户输血量之间的映射关系，或者第三特征参数集与单用户输血量之间的映射关系。通过训练学习过程，得到多个特征维度来表征的单个用户的预测输血量。

其中，根据模型训练算法得到第三特征参数集与单用户输血量之间的映射关系之前，还包括根据模型训练算法得到第二特征参数集与单用户失血量之间的映射关系，即利用训练数据集采用模型训练算法进行模型训练，得到第二特征参数集与单用户失血量之间的映射关系作为失血量预测模型；利用训练数据集采用模型训练算法进行模型训练，得到所述第三特征参数集与单用户输血量之间的映射关系作为输血量预测模型，所述第三特征参数集包括根据所述失血量预测模型预测的单用户失血量。

可以采用不同模型训练算法进行学习，先得到预测单用户失血量的模型，然后，再通过不同模型训练算法再次进行学习构建多维度的输血量预测模型，该模型包含多个不同的特征参数，其中一部分特征参数来自模型预测，一部分特征参数来自专家设置，从而能够有效提高单个用户输血量预测的准确性，并实现多维度的输血量预测。

其中，模型训练算法可以为随机森林算法、极端梯度提升树算法、支持向量机算法等机器学习算法中的任意一种，或者卷积神经网络CNN、深度神经网络DNN等深度学习算法中的任意一种。

本申请实施例，通过模型训练学习得到预测单用户输血量的模型，该模型包含多个不同的特征参数用于表征输血量的结果，能够有效提高单个用户输血量预测的准确性，并实现多维度的输血量预测，提升了辅助输血的处理效率。

针对步骤140，不同的输血场景可能存在不同的特征参数集，影响单用户输血量的预测结果。例如，输血场景可能是内科贫血患者的输血场景或者其他内科的输血场景。

可选地，本申请实施例提供一种适用于内科输血量预测场景的输血量预测模型，该预测模型是基于内科输血的相关数据子集创建的。

进一步参考图2，图2示出了本申请又一实施例提供的建立用于内科输血量预测模型方法的流程示意图。

步骤210，获取预定时长内历史用户数据集，将历史用户数据集划分成训练数据集和测试数据集。

该历史用户数据集可以包括内科患者至少一个相关的数据子集，例如，用户基本信息数据子集、用户检查结果数据子集、用户诊断信息数据子集、用户既往病史数据子集等。

其中，用户基本信息数据子集例如可以包括内科患者的年龄、身高、体重、性别等参数；用户检查结果数据子集例如可以包括：内科患者在内科输血前进行检查血常规、血气、凝血、生化、生命体征，内科患者在内科输血后的血常规等等；用户诊断信息数据子集例如可以包括患者就诊过程中的诊断数据；用户既往病史数据子集例如可以包括患者历史就诊的数据。

在步骤210之后，可选地执行步骤220。

步骤220，对历史用户数据集进行预处理。其中，预处理可以包括：剔除、特征编码、特征二值化、清洗、插补、置空等方式，以上仅作为数据预处理方式的举例，实际预处理过程中并不限于上述预处理方式。

步骤230，基于预处理后的历史用户数据集提取第一特征参数集。

在本申请实施例中，从预处理后的历史用户数据集中提取或筛选出用于内科输血预测场景的单个特征参数集，该特征参数集可以定义为第一特征参数集，该第一特征参数集不包括手术耗费时间。其包括内科患者至少一个相关的数据子集。

其中，从历史用户数据集中提取或筛选第一特征参数集，可以通过人为选择相关的参数作为单用户的相关特征参数集，例如，通过专业人士(如某科室的专业医生)的经验判断，影响输血量的重要因子可以包括患者在内科输血前进行检查血常规、血气、凝血、生化、生命体征，患者在内科输血后的血常规，以及患者在内科的诊断结果等等。

还可以利用特征提取算法提取第一特征参数集。其中，特征提取算法可以采用机器学习算法中的任一种来提取预测单用户输血量的相关特征参数集。机器学习算法例如可以是梯度提升树GBDT算法以及其他能够用于提取特征的机器学习算法，例如逻辑回归算法等。例如，将经过预处理的历史用户数据输入逻辑回归算法模型进行训练，根据特征与响应变量(即内科单用户输血量)的相关性，提取与响应变量相关性高的特征，例如可以包括患者在内科输血前进行检查血常规、血气、凝血、生化、生命体征，患者在内科输血后的血常规等，患者在内科就诊过程中的诊断数据；以及患者在内科就诊的历史诊断数据等。

还可以利用特征提取算法组合从历史用户数据集中提取并生成第一特征参数集。例如，从历史用户数据集中获取原始特征，将原始特征通过梯度提升树算法(GBDT，Gradient Boosting Decision Tree)进行训练得到对应的组合特征，或者利用梯度提升树GBDT算法构建新的特征，使特征更好地表达数据。具体地可以通过已有的原始特征训练GBDT模型，然后利用GBDT模型学习得到的树来构造新的特征，最后把这些新特征加入原有特征一起训练预测模型。例如，基于梯度特征树GBDT算法生成一个或多个用于表征单用户输血量的特征参数，并结合GBDT算法从历史用户数据集中提取的相关特征参数来共同表征单用户输血量信息。例如，利用内科患者的年龄、身高、体重、性别等参数等，在内科输血前进行检查血常规、血气、凝血、生化、生命体征，患者在内科输血后的血常规等，患者在内科就诊过程中的诊断数据训练GBDT模型，然后利用GBDT模型学习到的树构造新特征，该新特征向量的长度等于GBDT模型中所有树包含的叶子结点树之和。

根据特征的分布特性、相关特性以及重要性从多个特征中提取适合表征单用户输血量的特征参数集来训练输血量预测模型，从而使得模型泛化能力更强，减少过拟合。

步骤240，利用训练数据集和测试数据集采用模型训练算法进行学习和验证，得到第一特征参数集与单用户输血量之间的映射关系作为输血量预测模型。

在本申请实施例中，根据训练数据集采用模型训练算法进行模型学习，得到第一特征参数集与单用户输血量之间的映射关系，并通过测试数据集调整优化输血量预测模型。

优化过程，采用分类器建立的模型，需要建立相应的代价函数，对该代价函数利用优化准则进行优化，从而控制模型的复杂度。

具体地，以极端梯度提升树算法(XGBoost，extreme Gradient Boosting)训练内科输血量预测模型为例。

从历史用户数据集中获取用于建立内科输血量预测模型的数据集，基于该数据集学习并验证内科输血量预测模型。其中，用于内科输血预测场景的特征参数集，例如可以包括对用户输血前的大量数据参数，利用梯度提升树算法从大量特征参数中筛选出以下部分特征集合，例如患者的年龄、身高、体重、性别等参数，输血前的血常规、血气、凝血、生化、生命体征，输血后的血常规等等，患者就诊过程中的诊断数据；以及患者历史就诊的数据。

然后，将患者的年龄、身高、体重、性别等参数，输血前的血常规、血气、凝血、生化、生命体征，输血后的血红蛋白值或红细胞压积值作为自变量，患者的输血量作为因变量，按照XGBoost算法中的相关参数的进行训练构造基于树的迭代模型，相当于带L1和L2正则化项的线性回归分类器，其中相关参数包括”booster”：”ghtree”，分类器每次迭代的模型为基于树的模型，’lambda’：50，用于控制XGBoost算法的正则化部分，在XGBoost算法中正则部分包含树的叶子节点个数，每个叶子节点上输出的评分的L2模的平方，通过正则部分的控制来减少过拟合作用。

最后，通过构建最小化的损失函数来优化模型结构，得到输血量预测模型。

上述以极端梯度提升树算法训练内科输血量预测模型为例，旨在说明模型训练算法应用训练模型的实现过程，不作为限定。例如，还可以以卷积神经网络CNN或者深度神经网络DNN作为模型训练算法，将特征参数集通过逐层构建的单层神经元训练，然后通过构建最小化的损失函数来优化模型结构，从而得到输血量预测模型。

本申请实施例，通过模型训练算法学习得到用于预测内科的单用户输血量的模型，该模型包含多个影响单用户输血量的内科特征参数，能够有效提高单个用户在内科输血量过程中，对输血量需求预测的准确性，并实现多维度的输血量预测。

针对步骤140，不同的输血场景可能存在不同的特征参数集，影响单用户输血量的预测结果。例如，输血场景可能是微创手术输血或者其他外科输血场景。

可选地，本申请实施例提供一种适用于外科输血量预测场景的输血量预测模型，该预测模型是基于外科输血的相关数据子集创建的，在外科手术输血量预测的过程中，本申请实施例还分阶段实现单用户输血量的预测。

进一步参考图3，图3示出了本申请又一实施例提供的建立用于外科输血量预测模型方法的流程示意图。

与用于内科输血量预测模型相同的，在步骤310获取历史用户数据集之后，可选地执行步骤320对历史用户数据集进行预处理，然后进入步骤330，从预处理后的历史用户数据集中提取影响外科单用户输入量的特征参数集。

与用于内科输血量预测模型不同之处在于，外科手术过程存在术中失血的过程。现有技术针对特定病症的手术患者进行预测，需要引入手术过程的相关参数来进行输血量预测，例如，需要手术耗费时间、手术过程中失血量等信息，然后再将利用这些信息预测输血量。这样的混合预测导致预测结果不够精准。因此，本申请实施例提出将预测过程划分成不同阶段，按阶段预测，避免引入手术过程出现的参数，并能够提高预测的精准度。

步骤330，基于预处理后的历史用户数据集提取第二特征参数集和第三特征参数集。

本申请实施例，通过分阶段完成输血量预测。首先从预处理后的历史用户数据集中提取或筛选用于外科失血量预测的特征参数集，然后，再从历史用户数据集中提取或筛选用于外科输血量预测特征参数集。用于外科失血量预测的特征参数集定义为第二特征参数集，用于外科输血量预测特征参数集定义为第三特征参数集，这些特征参数集均不包含手术耗费时间。

对于第二特征参数集例如可以包括以下一种或多种：用户基本信息数据子集、用户手术前后检查结果的第一数据子集、用户诊断信息数据子集、用户既往病史数据子集、用户历史手术数据子集。其中，用户基本信息数据子集、用户诊断数据子集、用户既往病史数据子集所包含的特征参数与内科用户的这些数据子集相同，获取数据的类目可能不同，例如，类目是根据病患归属科室来划分的，如果属于骨科手术的患者，则数据可以从骨科诊疗数据中查询获取。

其中，用户手术前后检查结果的第一数据子集例如可以包括：患者在手术前的血常规、血气、凝血、生化、生命体征，患者在手术后的失血量等等；中，用户历史手术数据子集包括患者历史手术的数据等。

对于第三特征参数集例如可以包括以下一种或多种：用户基本信息数据子集、用户手术前后检查结果的第二数据子集、用户诊断信息数据子集、用户既往病史数据子集、用户历史手术数据子集。用户基本信息数据子集、用户诊断信息数据子集、用户既往病史数据子集、用户历史手术数据子集与第二特征参数集相同。

其中，用户手术前后检查结果的第二数据子集例如可以包括：患者在手术前的血常规、血气、凝血、生化、生命体征，患者在手术后的血红蛋白值或红细胞压积值等等。

本申请实施例中，从预处理后的历史用户数据集中提取或筛选出第二特征参数集和第三特征参数集可以与提取第一特征参数集的方式相同，也可以与提取第一特征参数集的方式不同。例如，从历史用户数据集中提取第二特征参数集和第三特征参数集可以通过人为选择相关的参数作为单用户的相关特征参数集。或者，人为选择第二特征参数集和利用特征提取算法提取第三特征参数集；或者利用特征提取算法提取第二特征参数集和第三特征参数集；或者利用特征提取算法组合从历史用户数据集中提取并生成第二特征参数集和第三特征参数集。以上仅作为提取特征参数方式的举例，实际预处理过程中并不限于上述提取方式。

具体地以利用特征提取算法组合提取并生成第二特征参数集和第三特征参数集为例，来进一步说明用于外科失血量预测的特征参数集，和用于外科输血量预测特征参数集。

将历史用户数据集中的原始特征参数通过GBDT算法进行训练构造新的特征，并基于历史用户数据集中的原始特征通过GBDT算法提取部分特征，然后，将构造出的新的特征和提取的部分特征一起作为失血量模型的输入，共同训练失血量预测模型。

然后，将历史用户数据集中的原始特征参数通过GBDT算法进行训练构造新的特征，并基于历史用户数据集中的原始特征通过GBDT算法提取部分特征，然后，将构造出的新的特征和提取的部分特征以及失血量预测模型输出的预测结果一起作为输血量模型的输入，共同训练输血量预测模型。

步骤340，利用训练数据集和测试数据集采用模型训练算法进行学习和验证，得到第二特征参数集与单用户失血量之间的映射关系作为失血量预测模型。

步骤350，利用训练数据集和测试数据集采用模型训练算法进行学习和验证，得到第三特征参数集与单用户输血量之间的映射关系作为输血量预测模型，其中第三特征参数集包括第三特征参数集包括根据失血量预测模型预测的单用户失血量。

本申请实施例，通过步骤340和步骤350分阶段实现失血量预测模型和输血量预测模型的建立。通过用于预测单用户失血量的数据集，采用模型训练算法学习得到的第二特征参数集与单用户失血量之间的映射关系作为失血量预测模型。然后，通过用于预测单用户失血量和其他影响用户输血量的特征参数集以及专家输入的血红蛋白值或红细胞压积值，采用模型训练算法得到第三特征参数集与单用户输血量之间的映射关系作为输血量预测模型。

在两个模型创建的过程中，分别建立相应的代价函数，然后对代价函数进行优化，从而控制模型的复杂度，提升预测模型的精准度。

本申请实施例，考虑到外科手术过程中针对患者的血液输注量不仅取决于患者的体征因素、病灶因素等，还取决于手术或创口的失血量。因此，提出分阶段完成单用户输血量的预测，首先通过机器学习模型精准地预测单用户失血量，然后，将单用户失血量和待预测用户的其他影响因子一起作为预测输血量模型的输入，得到待预测用户的输血量。本申请实施例，提出预测单用户输血量的方法能够提前预测失血量，并基于失血量进一步预测单用户的血液输注量，能够精准地控制术后的血红蛋白值或红细胞压积值等。

具体地，以极端梯度提升树算法(XGBoost，extreme Gradient Boosting)训练外科输血量预测模型为例。

从历史用户数据集中获取用于建立外科输血量预测模型的数据集，基于该数据集学习并验证外科输血量预测模型。

用于外科输血预测场景的特征参数集，例如至少包括用于预测单用户失血量的特征参数集和用于预测单用户输血量的特征参数集。其中，用于预测单用户失血量的特征参数集可以通过人工筛选提取、或提取特征算法来提取、或利用特征提取算法组合来提取并生成。例如，从历史用户数据集中采用GBDT算法提取并生成出用于建立失血量预测模型的特征参数集，该特征参数集至少包括：患者在手术前的血常规、血气、凝血、生化、生命体征，患者在手术后的失血量。

其中，用于预测单用户输血量的特征参数集可以通过人工筛选提取、或提取特征算法来提取、或利用特征提取算法组合来提取并生成。例如，从历史用户数据集中采用GBDT算法提取并生成出用于建立失血量预测模型的特征参数集，该特征参数集至少包括：手术前的血常规、血气、凝血、生化、生命体征，预测失血量、手术后的血红蛋白值或红细胞压积值。

然后，将用于预测单用户失血量的特征参数集和用于预测单用户输血量的特征参数集分别进行训练，用于构造基于树的迭代模型，相当于带L1和L2正则化项的线性回归分类器。

将训练数据集中用于预测单用户失血量的特征参数集按照XGBoost算法中的相关参数的进行训练，得到单用户失血量预测模型，例如”booster”：”ghtree”，分类器每次迭代的模型为基于树的模型，’lambda’：50，用于控制XGBoost算法的正则化部分，在XGBoost算法中正则化部分包含树的叶子节点个数，每个叶子节点上输出的评分的L2模的平方，通过正则项部分的控制来减少过拟合作用。

然后，通过构建最小化的损失函数来优化模型结构，得到单用户失血量预测模型。

即第一阶段，将患者的手术前的血常规、血气、凝血、生化、生命体征作为自变量，患者的失血量作为因变量，采用XGBoost算法训练用于预测失血量的回归模型，并利用测试数据集对该模型构建最小的损失函数来优化该模型。

另外，还将训练数据集中用于预测单用户输血量的特征参数集按照XGBoost算法中的相关参数的进行训练，得到单用户输血量预测模型，其中用于预测单用户输血量的特征参数集包括从单用户失血量预测模型中预测得到的失血量。

即第二阶段，将患者的手术前的血常规、血气、凝血、生化、生命体征、预测失血量、专家建议的术后血红蛋白值或红细胞压积值作为自变量，单用户的输血量作为因变量，利用XGBoost算法训练用于预测失血量的回归模型，并利用测试数据集对该模型构建最小的损失函数来进一步优化，从而得到最终的输血量预测模型。

上述以极端梯度提升树算法训练外科输血量预测模型为例，旨在说明模型训练算法应用训练模型的实现过程，不作为限定。例如，还可以以卷积神经网络CNN或者深度神经网络DNN作为模型训练算法，将特征参数通过逐层构建的单层神经元进行训练，然后通过构建最小化的损失函数来优化模型结构，从而得到失血量预测模型和输血量预测模型。或者，采用不同模型训练算法的组合方式分别得到失血量预测模型和输血量预测模型。

本申请实施例，通过创新性的将预测输血量的过程划分为多个密切衔接的部分，采用不同模型训练算法进行学习，先得到预测单用户失血量的模型，然后，再通过不同模型训练算法再次进行学习构建多维度的输血量预测模型，该模型包含多个不同的特征参数，其中一部分特征参数来自模型预测，一部分特征参数根据专家设置，从而能够有效提高单个用户输血量预测的准确性，并实现多维度的输血量预测，本申请实施例提供的预测方案，能够对患者红细胞输注需求和输注后疗效做出精准的量化评价，直接为临床医师提供红细胞输注决策意见，并能够提高临床医师红细胞输注决策水平，还能够降低红细胞超适应症输注比率及异体输血风险，节约宝贵的血液资源。

在获得输血量预测模型之后，本申请实施例还提供了应用输血量预测模型对单个用户的输血量进行预测的方法。

进一步参考图4，图4示出了本申请又一实施例提供的输血量预测方法的流程示意图。

为了精确地控制用户输血量，本申请实施例通过机器学习或深度学习算法建立了用于预测单个用户的输血量的输血量预测模型，在得到该模型之后，将待测用户的相关信息，以及预设的目标参数输入该输血量预测模型，可以得到该待测用户的预测输血量。

步骤410，提取待测用户数据和预设的目标参数。

其中，待测用户数据和预设的目标参数可以从医生开具的输血电子申请单中提取。还可以通过发送报文主动获取携带诊疗结果的数据报文，然后通过解析报文提取待预测用户数据和预设的目标参数。还可以根据预设的协议方式，建立辅助医疗设备与医疗信息系统之间的数据传输协议，按照协议解析方式提取。以及其他能够获取目标数据的方式，都可以应用在本申请实施例中。

其中，待预测用户数据包括：待预测用户的年龄、身高、体重、性别等参数；输血前/手术前的血常规、血气、凝血、生化、生命体征，预测失血量等等，以及就诊过程中的诊断数据和待预测用户的历史就诊的数据等等。

其中，预设的目标参数可以是专家建议或输入的预设的血红蛋白值或红细胞压积值等。输入可以通过键盘、或者触摸屏、语音或者提取数据等方式实现。

步骤420，根据所述待预测用户数据和预设的目标参数，利用预先按照如图1描述的方法建立的输血量预测模型来预测待预测用户的输血量。

后台将待手术或待输血的患者的年龄、身高、体重、性别、输血前/手术前的血常规、血气、凝血、生化、生命体征，或预测失血量、患者的诊断结果数据、患者的历史就诊数据以及专家输入的预设的血红蛋白值或红细胞压积值作为输入参数，输入如图1所描述的输血量预测模型，得到患者的输血量值，将该输血量值通过显示装置显示给医生，然后指导医生按照显示的结果申请或输入相应数量的血量。

本申请实施例提出了一种精准的输血方法，能够对患者的红细胞输注量进行精准预测，解决现有医疗系统的用血量不规范的问题，同时也为患者节省了配血产生的花销。

为了简化输血工作的操作程序，本申请实施例还进一步提出了能够智能识别输血环境的输血量预测方法。

进一步参考图5，图5示出了本申请又一实施例提供的输血量预测方法的流程示意图。

步骤510，获取输血申请数据。

即从医院信息系统获取医生提交的输血申请数据，该输血申请数据可以是输血电子申请单，也可以是电子诊断数据。

步骤520，基于输血申请数据的第一标识选择对应的输血量预测模型，其中，该输血量预测模型包括按照如图2描述的方法，或者按照如3描述的方法建立的输血量预测模型。

输血申请数据设置第一标识，该第一标识可以是科室信息或者是否手术信息，科室信息可以大致分为内科或外科，是否手术信息可以理解为手术信息标识为外科手术的输血需求，非手术信息为内科输血的需求。

根据输血申请数据的第一标识选择对应的输血量预测模型。如果输申请数据的第一标识信息包括内科，则选择如图2描述的输血量模型进行单用户的输血量预测。如果输申请数据的第一标识信息包括外科，则选择如图3描述的输血量模型进行单用户的输血量预测。

步骤530，基于输血申请数据提取待预测用户数据和预设的目标参数。

在获取输血申请数据后，根据输血申请数据中的第一标识确定选择的输血量预测模型。再从输血申请数据中，提取用于预测的用户数据，例如用户的年龄、身高、体重、性别等参数；输血前/手术前的血常规、血气、凝血、生化、生命体征，输血后的血常规、失血量等等，以及就诊过程中的诊断数据和待预测用户的历史就诊的数据等等。其中，预设的目标参数可以是专家级医护人员输入的血红蛋白值或红细胞压积值等。

步骤540，根据待预测用户数据和预设的目标参数，利用所选择的输血量预测模型来预测待预测用户的输血量。

例如，识别输血申请数据中的第一标识为外科，则提取患者的数据包括：患者的年龄、身高、体重、性别、手术前的血常规、血气、凝血、生化、生命体征、患者的诊断结果数据和患者历史就诊数据。

在将提取的患者上述数据输入到失血量预测模型后得到该患者的预测失血量。该预测失血量可以通过显示装置显示，也可以不显示。然后，将预测的失血量和上述数据以及专家级医护人员输入的血红蛋白值或红细胞压积值馈入第二阶段输血量预测模型。得到患者的输血量值，将该输血量值通过显示装置显示给医生，然后指导医生按照显示的结果申请或输入相应数量的血量。

本申请实施例，通过获取输血申请数据中第一标识识别出采用内科输血模型还是外科输血模型，扩展输血量预测模型的使用范围，突破了现有单一化预测模型的局限性，节约了不同模型训练的时间，提高了辅助输血的处理效率。

应当注意，尽管在附图中以特定顺序描述了本发明方法的操作，但是，这并非要求或者暗示必须按照该特定顺序来执行这些操作，或是必须执行全部所示的操作才能实现期望的结果。相反，流程图中描绘的步骤可以改变执行顺序。附加地或备选地，可以省略某些步骤，将多个步骤合并为一个步骤执行，和/或将一个步骤分解为多个步骤执行。

基于同一发明构思，本申请实施例中还提供了建立输血量预测模型的装置，该装置用于执行上述图1对应的方法实施例，因此该装置的实施方式参见图1描述的方法的实施方式，重复之处不再赘述。

进一步参考图6，图6示出了本申请实施例提供的建立输血量预测模型装置的示例性结构框图。

如图6所示，该装置600包括：

数据获取划分单元620，用于获取预定时长内历史用户数据集，将历史用户数据集划分成训练数据集和测试数据集。

特征提取单元640，用于基于历史用户数据集提取至少一个特征参数集，该特征参数集不包括手术耗费时间。

在本申请实施例中，装置600通过对历史用户数据集的分析，可以得到影响预测对象相关的至少一个特征参数集。该预测对象是不同场景内的单用户输血量。通过从医院信息系统收集得到历史用户数据集，经过预处理步骤之后，采用多种方式提取与单用户输血量相关的至少一个特征参数集，该特征参数集可以是根据不同的预测场景提取得到的不同的特征参数集。该特征参数集不包括手术耗费时间等参数。本申请实施例能够适用于内科输血的预测，也能够适用外科输血的预测，在外科输血预测过程中，不需要引入手术过程中的相关参数，例如手术耗费时间，手术过程中实时失血量，相应的通过术前的参数即可完成输血量的预测，节约了备血时间，简化了预测步骤。

在特征提取单元640之前，还包括数据预处理过程，该过程可以至少包括：剔除、特征编码、特征二值化、清洗、插补、置空等预处理操作。以上仅作为数据预处理方式的举例，实际预处理过程中并不限于上述预处理方式。

对历史用户数据集进行预处理，预处理包括以下一种或者多种：

剔除历史用户数据集的异常数据样本；

对历史用户数据集的部分特征参数进行one-hot编码处理；

对历史用户数据集的部分特征参数进行二值化处理；

对历史用户数据集进行清洗、插补、置空处理。

例如，对用户基本信息数据子集中性别参数，通常性别参数可以分为男、女、未知三种状态，采用one-hot编码可以将性别为男的信息转换成[1，0，0]，将性别为女的信息转换成[0，1，0]，未知转变成[0，0，1]。

其中，利用历史用户数据集已有的特征参数确定至少一个特征参数集可以是从历史用户数据集中人为选择相关的参数作为单用户的相关特征参数集，例如，第一特征参数集、第二特征参数集和/或第三特征参数集。

其中，利用特征提取算法从历史用户数据集中提取至少一个特征参数集可以采用机器学习算法中的任一种来提取预测单用户输血量的相关特征参数集，例如第一特征参数集、第二特征参数集和/或第三特征参数集。其中，机器学习算法可以是梯度提升树GBDT算法以及其他能够用于提取特征的机器学习算法，例如逻辑回归算法等。

其中，利用特征提取算法组合从历史用户数据集中提取并生成至少一个特征参数集，可以是从历史用户数据集中获取原始特征，将原始特征通过梯度提升树算法(GBDT，Gradient Boosting Decison Tree)或逻辑回归算法进行训练得到对应的组合特征，还可以是利用梯度提升树算法构建新的特征，从而使特征更好地表达数据。具体地可以通过已有的原始特征训练GBDT模型，然后利用GBDT模型学习得到的树来构造新的特征，最后把这些新特征加入原有特征一起训练预测模型。例如，基于梯度特征树GBDT算法生成一个或多个用于表征单用户输血量的特征参数，并结合GBDT算法从历史用户数据集中提取的相关特征参数来共同表征单用户输血量信息。

模型训练单元660，用于利用训练数据集和测试数据集采用模型训练算法进行学习和验证，得到至少一个特征参数集与单用户输血量之间的映射关系作为输血量预测模型。

在本申请实施例中，根据训练数据集和测试数据集采用模型训练算法进行模型学习和验证，得到输血量预测模型。其中，训练数据集和测试数据集在数据获取划分单元610中划分，或者在预处理单元之后完成。

采用不同的模型训练算法学习得到至少一个特征参数集与单用户输血量之间的映射关系作为输血量预测模型。例如，学习得到第一特征参数集与单用户输血量之间的映射关系，或者第三特征参数集与单用户输血量之间的映射关系。通过训练学习过程，得到多个特征维度来表征的单个用户的预测输血量。

本申请实施例，通过模型训练学习得到预测单用户输血量的模型，该模型包含多个不同的特征参数用于表征输血量的结果，能够有效提高单个用户输血量预测的准确性，并实现多维度的输血量预测。

基于同一发明构思，本申请实施例中还提供了建立适用于内科输血场景的输血量预测模型的装置，该装置可以用于执行与图2对应的方法实施例，该装置的实施方式参见图2的方法的实施方式，重复之处不再赘述。

进一步参考图7，图7示出了本申请又一实施例提供的建立用于内科输血量预测的模型的装置的示例性结构框图。

该装置700包括：

数据获取划分单元710，用于获取预定时长内历史用户数据集，将历史用户数据集划分成训练数据集和测试数据集。该装置还可选地包括：

数据预处理单元720，用于对历史用户数据集进行预处理

特征提取单元730，用于基于预处理后的历史用户数据集提取第一特征参数集。

在本申请实施例中，从预处理后的历史用户数据集中提取或筛选出用于内科输血预测场景的单个特征参数集，该特征参数集可以定义为第一特征参数集，该第一特征参数集不包括手术耗费时间。其包括内科检查的各个相关子集中的至少一个。

其中，从历史用户数据集中筛选第一特征参数集可以通过人为选择相关的参数作为单用户的相关特征参数集，例如，通过专业人士的经验判断，影响输血量的重要因子包括患者在内科输血前进行检查血常规、血气、凝血、生化、生命体征，患者在内科输血后的血常规，以及患者在内科的诊断结果等等。

或者，利用特征提取算法提取第一特征参数集，其中，特征提取算法可以采用机器学习算法中的任一种来提取预测单用户输血量的相关特征参数集。其中，机器学习算法可以是梯度提升树GBDT算法以及其他能够用于提取特征的机器学习算法，例如逻辑回归算法等。例如，将经过预处理的历史用户数据输入逻辑回归算法模型进行训练，根据特征与响应变量(即内科单用户输血量)的相关性，提取与响应变量相关性高的特征，例如可以包括患者在内科输血前进行检查血常规、血气、凝血、生化、生命体征，患者在内科输血后的血常规等，患者在内科就诊过程中的诊断数据；以及患者在内科就诊的历史诊断数据等。

或者利用特征提取算法组合从历史用户数据集中提取并生成第一特征参数集，可以是从历史用户数据集中获取原始特征，将原始特征通过梯度提升树算法(GBDT，GradientBoosting Decison Tree)进行训练得到对应的组合特征，或者还可以利用梯度提升树算法构建新的特征，使特征更好地表达数据。具体地可以通过已有的原始特征训练GBDT模型，然后利用GBDT模型学习得到的树来构造新的特征，最后把这些新特征加入原有特征一起训练预测模型。基于梯度特征树GBDT算法生成一个或多个用于表征单用户输血量的特征参数，并结合GBDT算法从历史用户数据集中提取的相关特征参数来共同表征单用户输血量信息。例如，利用患者的年龄、身高、体重、性别等参数等，在内科输血前进行检查血常规、血气、凝血、生化、生命体征，患者在内科输血后的血常规等，患者在内科就诊过程中的诊断数据训练GBDT模型，然后利用GBDT模型学习到的树构造新特征，该新特征向量的长度等于GBDT模型中所有树包含的叶子结点树之和。

模型训练单元740，用于利用训练数据集和测试数据集采用模型训练算法进行学习和验证，得到第一特征参数集与单用户输血量之间的映射关系作为输血量预测模型。

基于同一发明构思，本申请实施例中还提供了建立适用于内科输血场景的输血量预测模型的装置，该装置可以用于执行与图3对应的方法实施例，该装置的实施方式参见图3的方法的实施方式，重复之处不再赘述。

进一步参考图8，图8示出了本申请又一实施例提供的建立用于外科输血量预测的模型的装置的示例性结构框图。

该装置800包括：

数据获取划分单元820，用于获取预定时长内历史用户数据集，将历史用户数据集划分成训练数据集和测试数据集。

数据预处理单元810，用于对历史用户数据集进行预处理。

特征提取单元830，用于基于历史用户数据集提取第二特征参数集和第三特征参数集。

本申请实施例，分阶段完成输血量预测，首先需要从预处理后的历史用户数据集中提取或筛选用于外科失血量预测的特征参数集，然后，再从历史用户数据集中提取或筛选用于外科输血量预测特征参数集。用于外科失血量预测的特征参数集定义为第二特征参数集，用于外科输血量预测特征参数集定义为第三特征参数集，这些特征参数集均不包含手术耗费时间。

其中，用户手术前后检查结果的第一数据子集包括：患者在手术前的血常规、血气、凝血、生化、生命体征，患者在手术后的失血量等等；中，用户历史手术数据子集包括患者历史手术的数据等。

第三特征参数集例如可以包括以下一种或多种：用户基本信息数据子集、用户手术前后检查结果的第二数据子集、用户诊断信息数据子集、用户既往病史数据子集、用户历史手术数据子集。用户基本信息数据子集、用户诊断信息数据子集、用户既往病史数据子集、用户历史手术数据子集与第二特征参数集相同。

其中，用户手术前后检查结果的第二数据子集包括：患者在手术前的血常规、血气、凝血、生化、生命体征，患者在手术后的血红蛋白值或红细胞压积值等等

从预处理后的历史用户数据集中提取或筛选出第二特征参数集和第三特征参数集可以与提取第一特征参数集的方式相同，也可以与提取第一特征参数集的方式不同。例如，从历史用户数据集中提取第二特征参数集和第三特征参数集可以通过人为选择相关的参数作为单用户的相关特征参数集。或者，人为选择第二特征参数集和利用特征提取算法提取第三特征参数集；或者利用特征提取算法提取第二特征参数集和第三特征参数集；或者利用特征提取算法组合从历史用户数据集中提取并生成第二特征参数集和第三特征参数集。以上仅作为提取特征参数方式的举例，实际预处理过程中并不限于上述提取方式。

第一模型训练子单元840，用于利用训练数据集和测试数据集采用模型训练算法进行学习和验证，得到第二特征参数集与单用户失血量之间的映射关系作为失血量预测模型。

第二模型训练子单元850，用于利用训练数据集和测试数据集采用模型训练算法进行学习和验证，得到第三特征参数集与单用户输血量之间的映射关系作为输血量预测模型，其中第三特征参数集包括第三特征参数集包括根据失血量预测模型预测的单用户失血量。

本申请实施例，通过用于预测单用户失血量的数据集，采用模型训练算法学习得到的第二特征参数集与单用户失血量之间的映射关系作为失血量预测模型。然后，通过用于预测单用户失血量和其他影响用户输血量的特征参数集以及专家输入的血红蛋白值或红细胞压积值，采用模型训练算法得到第三特征参数集与单用户输血量之间的映射关系作为输血量预测模型。

在两个模型创建的过程中，分别建立相应的代价函数，对代价函数进行优化，从而控制模型的复杂度，提升预测模型的精准度。

本申请实施例，通过创新性的将预测输血量的过程划分为多个密切衔接的部分，采用不同模型训练算法进行学习，先得到预测单用户失血量的模型，然后，再通过不同模型训练算法再次进行学习构建多维度的输血量预测模型，该模型包含多个不同的特征参数，其中一部分特征参数来自模型预测，一部分特征参数根据专家设置，从而能够有效提高单个用户输血量预测的准确性，并实现多维度的输血量预测，本申请实施例提供的预测模型装置，能够对患者红细胞输注需求和输注后疗效做出精准的量化评价，直接为临床医师提供红细胞输注决策意见，并能够提高临床医师红细胞输注决策水平，还能够降低红细胞超适应症输注比率及异体输血风险，节约宝贵的血液资源。

基于同一发明构思，在获得输血量预测模型之后，本申请实施例中还提供了应用输血量模型对单用户的输血量进行的装置，该装置可以用于执行与图4对应的方法实施例，该装置的实施方式参见图4的方法的实施方式，重复之处不再赘述。

进一步参考图9，图9示出了本申请又一实施例提供的输血量预测装置的示例性结构框图。

为了精确地控制用户输血量，本申请实施例通过机器学习或深度学习算法建立了用于预测单用户输血量的输血量预测模型，在得到该模型之后，将待测用户的相关信息，以及设定的目标参数输入该输血量预测模型，得到该待测用户的预测输血量。

该装置900包括：

数据提取单元910，用于提取待测用户数据和预设的目标参数。

其中，预设的目标参数可以是专家建议或输入的预设的血红蛋白值或红细胞压积值等。输入可以通过键盘、或者触摸屏、语音或者提取数据等方式实现等。

预测单元920，用于根据所述待预测用户数据和预设的目标参数，利用预先按照如图1描述的方法建立的输血量预测模型来预测待预测用户的输血量。

基于同一发明构思，为了简化输血工作的操作程序，本申请实施例中还提供了能够智能识别输血场景的输血量预测装置，该装置可以用于执行与图5对应的方法实施例，该装置的实施方式参见图5的方法的实施方式，重复之处不再赘述。

进一步参考图10，图10示出了本申请又一实施例提供的输血量预测装置的示例性结构框图。

该装置1000包括：

数据获取单元1010，用于获取输血申请数据。

从医院信息系统获取医生提交的输血申请数据，该输血申请数据可以是输血电子申请单，也可以是电子诊断数据。

模型选择单元1020，用于基于输血申请数据的第一标识选择对应的输血量预测模型，其中，该输血量预测模型包括按照如图2描述的方法，或者按照如3描述的方法建立的输血量预测模型。

数据提取单元1030，用于基于输血申请数据提取待预测用户数据和预设的目标参数。

预测单元1040，用于根据待预测用户数据和目标参数，利用所选择的输血量预测模型来预测待预测用户的输血量。

应当理解，装置600-1000中记载的诸单元或模块与参考图1-5描述的方法中的各个步骤相对应。由此，上文针对方法描述的操作和特征同样适用于装置600-1000及其中包含的单元，在此不再赘述。装置600-1000可以预先实现在电子设备的浏览器或其他安全应用中，也可以通过下载等方式而加载到电子设备的浏览器或其安全应用中。装置600-1000中的相应单元可以与电子设备中的单元相互配合以实现本申请实施例的方案。

下面参考图11，其示出了适于用来实现本申请实施例的终端设备或服务器的计算机系统1100的结构示意图。

如图11所示，计算机系统1100包括中央处理单元(CPU)1101，其可以根据存储在只读存储器(ROM)1102中的程序或者从存储部分1108加载到随机访问存储器(RAM)1103中的程序而执行各种适当的动作和处理。在RAM 1103中，还存储有系统1100操作所需的各种程序和数据。CPU 1101、ROM 1102以及RAM 1103通过总线1104彼此相连。输入/输出(I/O)接口1105也连接至总线1104。

以下部件连接至I/O接口1105：包括键盘、鼠标等的输入部分1106；包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分1107；包括硬盘等的存储部分1108；以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分1109。通信部分1109经由诸如因特网的网络执行通信处理。驱动器1110也根据需要连接至I/O接口1105。可拆卸介质1111，诸如磁盘、光盘、磁光盘、半导体存储器等等，根据需要安装在驱动器1110上，以便于从其上读出的计算机程序根据需要被安装入存储部分1108。

特别地，根据本公开的实施例，上文参考图1-5描述的过程可以被实现为计算机软件程序。例如，本公开的实施例包括一种计算机程序产品，其包括有形地包含在机器可读介质上的计算机程序，所述计算机程序包含用于执行图1-5的方法的程序代码。在这样的实施例中，该计算机程序可以通过通信部分1109从网络上被下载和安装，和/或从可拆卸介质1111被安装。

附图中的流程图和框图，图示了按照本发明各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上，流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分，所述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意，在有些作为替换的实现中，方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如，两个接连地表示的方框实际上可以基本并行地执行，它们有时也可以按相反的顺序执行，这依所涉及的功能而定。也要注意的是，框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合，可以用执行规定的功能或操作的专用的基于硬件的系统来实现，或者可以用专用硬件与计算机指令的组合来实现。

描述于本申请实施例中所涉及到的单元或模块可以通过软件的方式实现，也可以通过硬件的方式来实现。所描述的单元或模块也可以设置在处理器中，例如，可以描述为：一种处理器包括数据获取划分单元、特征提取单元以及模型训练单元。其中，这些单元或模块的名称在某种情况下并不构成对该单元或模块本身的限定，例如，数据获取划分单元还可以被描述为“用于获取划分数据的单元”。

作为另一方面，本申请还提供了一种计算机可读存储介质，该计算机可读存储介质可以是上述实施例中所述装置中所包含的计算机可读存储介质；也可以是单独存在，未装配入设备中的计算机可读存储介质。计算机可读存储介质存储有一个或者一个以上程序，所述程序被一个或者一个以上的处理器用来执行描述于本申请的输血量预测方法。

以上描述仅为本申请的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解，本申请中所涉及的发明范围，并不限于上述技术特征的特定组合而成的技术方案，同时也应涵盖在不脱离所述发明构思的情况下，由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本申请中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。

Claims

1.一种建立输血量预测模型的方法，其特征在于，该方法包括：

获取预定时长内历史用户数据集，将所述历史用户数据集划分成训练数据集和测试数据集；

基于所述历史用户数据集提取至少一个特征参数集，所述特征参数集不包括手术耗费时间；以及

利用所述训练数据集和所述测试数据集采用模型训练算法进行学习和验证，得到所述至少一个特征参数集与单用户输血量之间的映射关系作为输血量预测模型。

2.根据权利要求1所述的方法，其特征在于，所述至少一个特征参数集包括第一特征参数集，并且所述方法包括：

利用所述训练数据集和所述测试数据集采用模型训练算法进行学习和验证，得到所述第一特征参数集与单用户输血量之间的映射关系作为输血量预测模型。

3.根据权利要求2所述的方法，其特征在于，所述第一特征参数集包括以下一种或者多种：

用户基本信息数据子集、用户检查结果数据子集、用户诊断信息数据子集、用户既往病史数据子集。

4.根据权利要求1所述的方法，其特征在于，所述至少一个特征参数集包括第二特征参数集和第三特征参数集，并且所述方法包括：

利用所述训练数据集和所述测试数据集采用模型训练算法进行学习和验证，得到所述第二特征参数集与单用户失血量之间的映射关系作为失血量预测模型；

利用所述训练数据集和所述测试数据集采用模型训练算法进行学习和验证，得到所述第三特征参数集与单用户输血量之间的映射关系作为输血量预测模型，所述第三特征参数集包括根据所述失血量预测模型预测的单用户失血量。

5.根据权利要求4所述的方法，其特征在于，

所述第二特征参数集包括以下一种或多种：

用户基本信息数据子集、用户手术前后检查结果的第一数据子集、用户诊断信息数据子集、用户既往病史数据子集、用户历史手术数据子集；

所述第三特征参数集还包括以下一种或多种：

用户基本信息数据子集、用户手术前后检查结果的第二数据子集、用户诊断信息数据子集、用户既往病史数据子集、用户历史手术数据子集。

6.根据权利要求1-5任一项所述的方法，其特征在于，所述基于所述历史用户数据集提取至少一个特征参数集，包括以下至少一种方式：

利用所述历史用户数据集已有的特征参数确定所述至少一个特征参数集；

利用特征提取算法从所述历史用户数据集中提取所述至少一个特征参数集；

利用特征提取算法组合从所述历史用户数据集中提取并生成所述至少一个特征参数集。

7.根据权利要求1-6任一项所述的方法，其特征在于，在获取在预定时长内历史用户数据集之后，该方法还包括：

对所述历史用户数据集进行预处理，所述预处理包括以下一种或者多种：

剔除所述历史用户数据集的异常数据样本；

对所述历史用户数据集的部分特征参数进行one-hot编码处理；

对所述历史用户数据集的部分特征参数进行二值化处理；

对所述历史用户数据集进行清洗、插补、置空处理。

8.根据权利要求1-7任一项所述的方法，其特征在于，所述模型训练算法包括机器学习算法或者深度学习算法。

9.根据权利要求8所述的方法，其特征在于，所述特征提取算法包括机器学习算法。

10.根据权利要求8或9所述的方法，其特征在于，所述机器学习算法至少包括以下一种：

随机森林算法、梯度提升树算法、极端梯度提升树算法、支持向量机算法。

11.根据权利要求8所述的方法，其特征在于，所述深度学习算法包括以下至少一种：

卷积神经网络CNN、深度神经网络DNN。

12.一种输血量预测方法，其特征在于，该方法包括

提取待预测用户数据和预设的目标参数；

根据所述待预测用户数据和预设的目标参数，利用预先按照权利要求1-11任一种所述的方法建立的输血量预测模型来预测所述待预测用户的输血量。

13.根据权利要求12所述的方法，其特征在于，所述目标参数是血红蛋白值或红细胞压积值。

14.一种输血量预测方法，其特征在于，该方法包括：

获取输血申请数据；

基于所述输血申请数据的第一标识选择对应的输血量预测模型，其中，所述输血量预测模型包括按照权利要求2所述的方法或者按照权利要求4所述的方法建立的输血量预测模型；

基于所述输血申请数据提取待预测用户数据和预设的目标参数；

根据所述待预测用户数据和预设的目标参数，利用所选择的所述输血量预测模型来预测所述待预测用户的输血量。

15.根据权利要求14所述的方法，其特征在于，所述目标参数是血红蛋白值或红细胞压积值。

16.一种建立输血量预测模型的装置，其特征在于，该装置包括：

数据获取划分单元，用于获取预定时长内历史用户数据集，将所述历史用户数据集划分成训练数据集和测试数据集；

特征提取单元，用于基于所述历史用户数据集提取至少一个特征参数集，所述特征参数集不包括手术耗费时间；以及

模型训练单元，用于利用所述训练数据集和所述测试数据集采用模型训练算法进行学习和验证，得到所述至少一个特征参数集与单用户输血量之间的映射关系作为输血量预测模型。

17.根据权利要求16所述的装置，其特征在于，所述至少一个特征参数集包括第一特征参数集，并且所述装置包括：

所述模型训练单元，用于利用所述训练数据集采用模型训练算法进行学习和验证，得到所述第一特征参数集与单用户输血量之间的映射关系作为输血量预测模型。

18.根据权利要求16所述的装置，其特征在于，所述至少一个特征参数集包括第二特征参数集和第三特征参数集，则所述模型训练单元包括：

第一模型训练子单元，用于利用所述训练数据集采用模型训练算法进行学习和验证，得到所述第二特征参数集与单用户失血量之间的映射关系作为失血量预测模型；

第二模型训练子单元，用于利用所述训练数据集采用模型训练算法进行学习和验证，得到所述第三特征参数集与单用户输血量之间的映射关系作为输血量预测模型，所述第三特征参数集包括根据所述失血量预测模型预测的单用户失血量。

19.根据权利要求16-18任一项所述的装置，其特征在于，所述特征提取单元，包括以下至少一种子单元：

第一提取子单元，用于利用所述历史用户数据集已有的特征参数确定所述至少一个特征参数集；

第二提取子单元，用于利用特征提取算法从所述历史用户数据集中提取所述至少一个特征参数集；

第三提取子单元，用于利用特征提取算法组合从所述历史用户数据集中提取并生成所述至少一个特征参数集。

20.根据权利要求16-19任一项所述的装置，其特征在于，在所述数据获取划分单元之后，该装置还包括：

数据预处理单元，用于对所述历史用户数据集进行预处理，所述预处理包括以下一种或者多种：

剔除所述历史用户数据集的异常数据样本；

对所述历史用户数据集的部分特征参数进行one-hot编码处理；

对所述历史用户数据集的部分特征参数进行二值化处理；

对所述历史用户数据集进行清洗、插补、置空处理。

21.一种输血量预测装置，其特征在于，该装置包括：

预测单元，用于根据所述待预测用户数据和预设的目标参数，利用预先按照权利要求1-11任一种所述的方法建立的输血量预测模型来预测所述待预测用户的输血量。

22.一种输血量预测装置，其特征在于，该装置包括：

数据获取单元，用于获取输血申请数据；

模型选择单元，用于基于所述输血申请数据的第一标识选择对应的输血量预测模型，其中所述输血量预测模型包括按照权利要求2所述的方法或者按照权利要求4所述的方法建立的输血量预测模型；

数据提取单元，用于基于所述输血申请数据提取待预测用户数据和预设的目标参数；

预测单元，用于根据所述待预测用户数据和预设的目标参数利用所选择的所述输血量预测模型来预测所述待预测用户的输血量。

23.一种计算机设备，包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序，其特征在于，所述处理器执行所述程序时实现如权利要求1-15中任一所述的方法。

24.一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序用于：

所述计算机程序被处理器执行时实现如权利要求1-15中任一所述的方法。