CN113035299B - 分中心推荐方法、装置、计算机设备和存储介质 - Google Patents
分中心推荐方法、装置、计算机设备和存储介质 Download PDFInfo
- Publication number
- CN113035299B CN113035299B CN202110360995.2A CN202110360995A CN113035299B CN 113035299 B CN113035299 B CN 113035299B CN 202110360995 A CN202110360995 A CN 202110360995A CN 113035299 B CN113035299 B CN 113035299B
- Authority
- CN
- China
- Prior art keywords
- index
- result
- scoring
- center
- sub
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H10/00—ICT specially adapted for the handling or processing of patient-related medical or healthcare data
- G16H10/20—ICT specially adapted for the handling or processing of patient-related medical or healthcare data for electronic clinical trials or questionnaires
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0631—Resource planning, allocation, distributing or scheduling for enterprises or organisations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
- G06Q10/06393—Score-carding, benchmarking or key performance indicator [KPI] analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/10—Office automation; Time management
- G06Q10/103—Workflow collaboration or project management
Landscapes
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Engineering & Computer Science (AREA)
- Strategic Management (AREA)
- Entrepreneurship & Innovation (AREA)
- Economics (AREA)
- Tourism & Hospitality (AREA)
- General Physics & Mathematics (AREA)
- Educational Administration (AREA)
- Marketing (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Development Economics (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Game Theory and Decision Science (AREA)
- Data Mining & Analysis (AREA)
- Health & Medical Sciences (AREA)
- Epidemiology (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Primary Health Care (AREA)
- Public Health (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请涉及一种分中心推荐方法、装置、计算机设备和存储介质。所述方法包括:获取候选分中心对应的分中心数据,分中心数据中包括疾病领域和对应的合作项目的预实施方案;根据疾病领域和对应的合作项目的预实施方案,获取每一分中心对应的指标评分矩阵;指标评分矩阵中包含每一指标的指标评分权重;根据指标评估模型的分箱计算,得到每一分中心的预实施方案中每一指标所处的指标分箱区间以及对应的指标评分权重值和分箱证据权重;根据预设的评分模型、每一指标的指标评分权重值和分箱证据权重,计算每一分中心的预实施方案的综合评分结果;根据综合评分结果在候选分中心中确定目标分中心作为分中心推荐结果。采用本方法提高了分中心推荐的准确性。
Description
技术领域
本申请涉及项目管理评估技术领域,特别是涉及一种分中心推荐方法、装置、计算机设备和存储介质。
背景技术
在新药研发及上市过程中,临床试验是确证新药有效性和安全性必不可少的步骤,临床试验申办方需要和各个医院及机构(称为研究项目的分中心)合作,在医院中招募受试者。
传统的方法中,研究项目的分中心大多依据既往经验进行人工决策筛选,然而,这种筛选方式很难做到客观、数据化和准确性,进而也会影响临床试验的进行。
发明内容
基于此,有必要针对上述技术问题,提供一种分中心推荐方法、装置、计算机设备和存储介质。
一种分中心推荐方法,所述方法包括:
获取候选分中心对应的分中心数据,所述分中心数据中包括疾病领域和对应的合作项目的预实施方案;
根据所述疾病领域和对应的所述合作项目的预实施方案,获取每一分中心对应的指标评分矩阵;所述指标评分矩阵中包含所述预实施方案中每一指标的指标评分权重;
根据指标评估模型的分箱计算,得到每一分中心的所述预实施方案中每一指标所处的指标分箱区间以及对应的指标评分权重值和分箱证据权重;
根据预设的评分模型、所述指标评分矩阵中每一指标的指标评分权重值和所述分箱证据权重,计算每一分中心的所述预实施方案的综合评分结果;
根据所述综合评分结果,在所述候选分中心中确定目标分中心,作为分中心推荐结果。
在其中一个实施例中,在所述根据指标评估模型的分箱计算,得到每一分中心的所述预实施方案中每一指标所处的指标分箱区间以及对应的指标评分权重值和分箱证据权重之前,所述方法还包括:
获取历史合作项目数据样本,所述历史合作项目数据样本中包含与所述候选分中心进行历史合作项目的实施方案以及所述历史合作项目的实施方案的评分结果;
根据指标单调性对每一指标进行指标分箱,得到指标分箱结果,并根据所述评分结果、所述指标分箱结果以及预设的逻辑斯特回归模型,得到指标评分权重值;
将每一指标分箱结果包含的指标数据输入至曲线评估模型,得到每一所述指标分箱结果对应的拟合曲线,根据所述拟合曲线的拟合结果对所述指标分箱结果和所述逻辑斯特回归模型进行调整调整,并在调整后的指标分箱结果和对应的所述逻辑斯特回归模型下重新进行指标分箱和指标评分权重值的确定,直至所述拟合曲线的拟合结果达到预设阈值。
在其中一个实施例中,所述获取历史合作项目数据样本,包括:
获取所述候选分中心的历史合作项目的实施方案数据,所述实施方案数据中包含各指标数据值;
对所述各指标数据值进行缺失值处理和噪声处理,得到处理后的初始历史合作项目数据样本;
通过数据标准化算法对所述初始历史合作项目数据样本进行数据变换,得到标准化数据,作为历史合作项目数据样本。
在其中一个实施例中,所述根据指标单调性对每一指标进行指标分箱,得到指标分箱结果,并根据所述评分结果以及预设的逻辑斯特回归模型,得到指标评分权重值之后,所述方法还包括:
根据所述历史合作项目的实施方案中第一评分结果与第二评分结果的所占比例,计算每一分箱结果的分箱证据权重,并根据所述分箱证据权重计算每一分箱结果的分箱指标价值;
对所述分箱指标价值进行求和计算,得到每一指标对应的指标价值;
根据预设的指标价值阈值与所述指标价值进行比对,若所述指标价值大于所述指标阈值,则保留所述指标价值对应的指标,得到指标筛选结果;
所述将每一指标分箱结果包含的指标数据输入至曲线评估模型,得到每一所述指标分箱结果对应的拟合曲线,根据所述拟合曲线的拟合结果对所述指标分箱结果和所述逻辑斯特回归模型进行调整,并在调整后的指标分箱结果和对应的所述逻辑斯特回归模型下重新进行指标评分权重值的确定,直至所述拟合曲线的拟合结果达到预设阈值,包括:
将指标筛选结果中保留的每一指标的分箱结果包含的指标数据输入至所述曲线评估模型,得到每一所述指标分箱结果对应的拟合曲线,根据所述拟合曲线的拟合结果对所述指标分箱结果和所述逻辑斯特回归模型进行调整调整,并在调整后的指标分箱结果和对应的所述逻辑斯特回归模型下重新进行指标评分权重值的确定,直至所述拟合曲线的拟合结果达到预设阈值。
在其中一个实施例中,所述根据指标评估模型的分箱计算,得到每一分中心的所述预实施方案中每一指标所处的指标分箱区间以及对应的指标评分权重值和分箱证据权重,包括:
根据训练好的指标单调性分箱标准进行指标分箱计算,确定每一指标的分箱结果;
根据所述每一分中心对应的预实施方案中每一指标的预设指标值,确定所述指标的所处指标分箱区间;
根据所述指标分箱区间和训练好的逻辑斯特回归模型,确定所述预实施方案中每一所述指标对应的分箱证据权重和指标评分权重值。
在其中一个实施例中,所述根据预设的评分模型、所述指标评分矩阵中每一指标的指标评分权重值和所述分箱证据权重,计算每一分中心的所述预实施方案的综合评分结果,包括:
计算每一分中心的合作项目的预实施方案中每一指标的所述分箱证据权重与对应的指标评分权重值的乘积,并将所述乘积进行求和计算,得到全部指标对应的综合权重;
根据所述综合权重与评分差值进行相乘计算,得到所述每一分中心的所述预实施方案的综合评分差值;所述评分差值为满分值与基准分值的差值;
根据所述基准分值与所述综合评分差值进行求和计算,得到所述每一分中心的综合评分结果。
在其中一个实施例中,所述根据所述综合评分结果,在所述候选分中心中确定目标分中心,作为分中心推荐结果,包括:
将所述每一分中心的综合评分结果进行由大到小排序,得到所述综合评分结果的排序结果;
根据预设的分中心选取数目,在所述排序结果中依序选取目标分中心,作为本次合作项目的分中心推荐结果。
一种分中心推荐装置,所述装置包括:
第一获取模块,用于获取候选分中心对应的分中心数据,所述分中心数据中包括疾病领域和对应的合作项目的预实施方案;
第二获取模块,用于根据所述疾病领域和对应的所述合作项目的预实施方案,获取每一分中心对应的指标评分矩阵;所述指标评分矩阵中包含所述预实施方案中每一指标的指标评分权重;
模型处理模块,用于根据指标评估模型的分箱计算,得到每一分中心的所述预实施方案中每一指标所处的指标分箱区间以及对应的指标评分权重值和分箱证据权重;
综合评分模块,用于根据预设的评分模型、所述指标评分矩阵中每一指标的指标评分权重值和所述分箱证据权重,计算每一分中心的所述预实施方案的综合评分结果;
推荐模块,用于根据所述综合评分结果,在所述候选分中心中确定目标分中心,作为分中心推荐结果。
一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
获取候选分中心对应的分中心数据,所述分中心数据中包括疾病领域和对应的合作项目的预实施方案;
根据所述疾病领域和对应的所述合作项目的预实施方案,获取每一分中心对应的指标评分矩阵;所述指标评分矩阵中包含所述预实施方案中每一指标的指标评分权重;
根据指标评估模型的分箱计算,得到每一分中心的所述预实施方案中每一指标所处的指标分箱区间以及对应的指标评分权重值和分箱证据权重;
根据预设的评分模型、所述指标评分矩阵中每一指标的指标评分权重值和所述分箱证据权重,计算每一分中心的所述预实施方案的综合评分结果;
根据所述综合评分结果,在所述候选分中心中确定目标分中心,作为分中心推荐结果。
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
获取候选分中心对应的分中心数据,所述分中心数据中包括疾病领域和对应的合作项目的预实施方案;
根据所述疾病领域和对应的所述合作项目的预实施方案,获取每一分中心对应的指标评分矩阵;所述指标评分矩阵中包含所述预实施方案中每一指标的指标评分权重;
根据指标评估模型的分箱计算,得到每一分中心的所述预实施方案中每一指标所处的指标分箱区间以及对应的指标评分权重值和分箱证据权重;
根据预设的评分模型、所述指标评分矩阵中每一指标的指标评分权重值和所述分箱证据权重,计算每一分中心的所述预实施方案的综合评分结果;
根据所述综合评分结果,在所述候选分中心中确定目标分中心,作为分中心推荐结果。
上述分中心推荐方法、装置、计算机设备和存储介质,获取候选分中心对应的分中心数据,所述分中心数据中包括疾病领域和对应的合作项目的预实施方案;根据所述疾病领域和对应的所述合作项目的预实施方案,获取每一分中心对应的指标评分矩阵;所述指标评分矩阵中包含所述预实施方案中每一指标的指标评分权重;根据指标评估模型的分箱计算,得到每一分中心的所述预实施方案中每一指标所处的指标分箱区间以及对应的指标评分权重值和分箱证据权重;根据预设的评分模型、所述指标评分矩阵中每一指标的指标评分权重值和所述分箱证据权重,计算每一分中心的所述预实施方案的综合评分结果;根据所述综合评分结果,在所述候选分中心中确定目标分中心,作为分中心推荐结果。采用本方法,针对每一候选的分中心的合作项目通过指标评估模型确定分中心的评估标准,进而在该标准下确定分中心的综合评分结果,提高了分中心的推荐准确性。
附图说明
图1为一个实施例中分中心推荐方法的流程示意图;
图2为一个实施例中指标评估模型的训练步骤的流程示意图;
图3为一个实施例构建历史合作项目数据样本步骤的流程示意图;
图4为一个实施例中指标筛选步骤的流程示意图;
图5为一个实施例中确定指标权重步骤的流程示意图;
图6为一个实施例中对分中心进行综合评分步骤的流程示意图;
图7为一个实施例中分中心推荐步骤的流程示意图;
图8为一个实施例中分中心推荐装置的结构框图;
图9为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
其中,临床试验申办方需要和各个医院及机构合作,在医院中招募受试者,各个医院及机构简称为研究项目的分中心。针对每一类疾病,每一分中心具有不同的承接能力(机构能力、各科室能力等等),因此,在进行临床试验项目时,需要筛选分中心,进行项目合作。
在一个实施例中,如图1所示,提供了一种分中心推荐方法,本实施例以该方法应用于终端进行举例说明,可以理解的是,该方法也可以应用于服务器,还可以应用于包括终端和服务器的系统,并通过终端和服务器的交互实现。本实施例中,该方法包括以下步骤:
步骤101,获取候选分中心对应的分中心数据,分中心数据中包括疾病领域和对应的合作项目的预实施方案。
在实施中,计算机设备获取候选分中心对应的分中心数据,其中,分中心数据中包括疾病领域和对应的合作项目的预实施方案。
具体地,根据待开展项目的所属疾病领域,计算机设备确定对应的候选分中心,并在每一候选分中心中确定针对待开展项目的预实施方案,例如,对应肺癌疾病领域确定候选分中心A,若在该候选分中心A中展开待合作项目,则候选分中心A可以提供对应的合作项目的预实施方案,其中,针对每一候选分中心对应的预实施方案不限于是一对一的关系,一个候选分中心可以提供多个不同侧重的预实施方案(即一对多的关系),例如,以成员入组速率指标为优先侧重的预实施方案,以病例数为优先侧重的预实施方案以及以历史合作数量多为优先侧重的实施方案,因此,本实施例对于预实施方案的设定不做限定。具体的,每一候选分中心的预实施方案中又包含多个实施指标,例如,可以包含机构能力(例如,病床数目、医护人数、仪器设备数目入组速率等等),科室能力和SMO(Site ManagementOrganization,现场管理组织)协同能力,如下表1中举例,本实施例不做限定。
表1
步骤102,根据疾病领域和对应的合作项目的预实施方案,获取每一分中心对应的指标评分矩阵;指标评分矩阵中包含预实施方案中每一指标的指标评分权重。
其中,指标评分矩阵中包含的各元素表征预实施方案中每一指标的评分权重Wi。
在实施中,计算机设备根据疾病领域与该次合作项目的候选分中心的预实施方案,进行指标评分矩阵的筛选,得到每一候选分中心对应的指标评分矩阵;
步骤103,根据指标评估模型的分箱计算,得到每一分中心的预实施方案中每一指标所处的指标分箱区间以及对应的指标评分权重值和分箱证据权重。
在实施中,计算机设备根据指标数据的单调性对指标数据进行分箱,同时根据根据指标评估模型,得到每一分中心的预实施方案中每一指标所处的指标分箱区间以及对应的指标评分权重值和分箱证据权重。
具体地,计算机设备将每一候选分中心针对该次合作项目给出的预实施方案中的每一指标值在训练好的指标分箱区间进行边界值比对,确定该指标值所处指标分箱区间,每一指标分箱区间对应有确定的分箱证据权重,故将确定好的对应分箱证据权重输入对应的训练好的指标评估模型(例如,logistics,逻辑斯特回归模型),该指标评估模型确定每一指标值指标评分权重值。
步骤104,根据预设的评分模型、指标评分矩阵中每一指标的指标评分权重值和分箱证据权重,计算每一分中心的预实施方案的综合评分结果。
其中,评分模型中包含每一指标的评分权重值、分箱证据权重(用于代替具体的指标特征)、基准分数值和满分分数值。
在实施中,计算机设备根据预设的评分模型对每一分中心的预实施方案进行评分计算,计算每一分中心的预实施方案的综合评分结果。
步骤105,根据综合评分结果,在候选分中心中确定目标分中心,作为分中心推荐结果。
在实施中,计算机设备根据综合评分结果对各候选分中心进行排序(例如,按照降序排列),得到对应的候选分中心排序结果,并在候选分中心排序结果中确定预设数目个目标分中心,作为分中心推荐结果。
上述分中心推荐方法中,获取候选分中心对应的分中心数据,分中心数据中包括疾病领域和对应的合作项目的预实施方案;根据疾病领域和对应的合作项目的预实施方案,获取每一分中心对应的指标评分矩阵;指标评分矩阵中包含预实施方案中每一指标的指标评分权重;根据指标评估模型的分箱计算,得到每一分中心的预实施方案中每一指标所处的指标分箱区间以及对应的指标评分权重值和分箱证据权重;根据预设的评分模型、指标评分矩阵中每一指标的指标评分权重值和分箱证据权重,计算每一分中心的预实施方案的综合评分结果;根据综合评分结果,在候选分中心中确定目标分中心,作为分中心推荐结果。采用本方法,提高了分中心推荐的准确性。
在一个实施例中,如图2所示,在步骤103之前,该方法还包括以下步骤:
步骤201,获取历史合作项目数据样本,历史合作项目数据样本中包含与候选分中心进行历史合作项目的实施方案以及历史合作项目的实施方案的评分结果。
在实施中,计算机设备获取历史合作项目数据样本,其中,历史合作项目数据样本中包含与候选分中心进行历史合作项目的实施方案以及历史合作项目的实施方案的评分结果。该评分结果可以是历史合作项目整体反馈的结果,根据调查问卷或者预设的评分卡等形式获取,该评分结果仅用于对历史合作项目数据样本进行分类(分为正样本和负样本),因此,该评分结果中包含第一评分结果和第二评分结果两种结果。其中,第一评分结果为历史合作项目反馈为好的评分结果(对应正样本);第二评分结果为历史合作项目反馈为差的评分结果(对应负样本)。
步骤202,根据指标单调性对每一指标进行指标分箱,得到指标分箱结果,并根据评分结果、指标分箱结果以及预设的逻辑斯特回归模型,得到指标评分权重值。
在实施中,计算机设备根据评分结果确定历史合作项目数据样本中正样本(对应第一评分结果的历史合作项目)和负样本(对应第二评分结果的历史合作项目)的数目,同时将历史合作项目数据中同一指标数据进行排序处理,通过同一指标间数据单调性划分区间对每一指标进行指标分箱,得到指标分箱结果,每一指标分箱结果可以计算对应的分箱证据权重,进而根据预设的逻辑斯特回归模型和分箱证据权重,得到指标评分权重值(Wi)。
具体地,针对每一指标,进行指标分箱,得到初次指标分箱结果,例如,针对指标A,得到分箱1、分箱2和分箱3的分箱结果,针对每一分箱结果(例如,分箱1),进行分箱证据权重计算,具体地计算分箱证据权重的计算公式为:
其中,WOEi表示第i个分箱的分箱证据权重,BadT为历史合作项目样本中第二评分结果的历史合作项目的总数目(即负样本总数目),Badi表示第i个分箱中包含的第二评分结果的历史合作项目的数目,GoodT为历史合作项目样本中第一评分结果的历史合作项目的总数目(即正样本总数目),Goodi示第i个分箱中包含的第一评分结果的历史合作项目的数目。
具体地,逻辑斯特回归模型的表达式如下所示:
其中,P代表一个历史合作项目样本中差的评分结果(第二评分结果)的概率,可以通过差的评分结果的历史合作项目数目与总样本数目的比值得到,e为自然常数,α为逻辑斯特回归模型的常系数(为已知量),Xi代表各个指标变量,在本方案中用WOEi(分箱证据权重)值表征各个指标变量特征,即用WOEi作为Xi的输入值,Wi为每一指标变量的权重系数(即指标评分权重)。
计算机设备在根据已知的P值和每一指标各个分箱的WOEi,确定每一分箱证据权重的指标评分权重Wi。
步骤203,将每一指标分箱结果包含的指标数据输入至曲线评估模型,得到每一指标分箱结果对应的拟合曲线,根据拟合曲线的拟合结果指标分箱结果和逻辑斯特回归模型进行调整,并在调整后的指标分箱结果和对应的逻辑斯特回归模型下重新进行指标分箱和指标评分权重值的确定,直至拟合曲线的拟合结果达到预设阈值。
在实施中,针对单调性区间划分得到的每一指标的分箱结果和逻辑斯特回归模型得到的指标评分权重值进行验证,计算机设备将每一指标分箱结果包含的指标数据输入至曲线评估模型(例如,ROC曲线评估模型、K-S曲线评估模型、AUC曲线评估模型),得到每一指标分箱结果的拟合曲线,根据拟合曲线进行分箱结果评估调整,即根据每一分箱结果中数据的拟合曲线的拟合结果对指标分箱结果和逻辑斯特回归模型进行调整,并在调整后的指标分箱结果和对应的逻辑斯特回归模型下重新进行该指标的指标评分权重值的确定,直至拟合曲线的拟合结果达到预设的拟合阈值,确认指标分箱结果(或称为指标分箱标准)和逻辑斯特回归模型的训练完成。
例如,针对指标A的三个分箱结果,分箱1,包括0-3;分箱2:包含4-8;分箱3:包含8-20(其中的“0-3”,“4-8”和“4-8”可以认为是每一分箱的区间,但分箱区间不限定为指标的具体数值区间);将每一分箱结果(分箱区间)中的指标数据输入曲线评估模型进行拟合,得到每一分箱结果的拟合曲线,根据每一分箱结果的拟合曲线的拟合误差值判断拟合曲线的拟合效果,若该拟合曲线的拟合效果未达到预设要求(即误差值大于预设阈值)则对分箱结果和指标评分权重确定模型(即逻辑斯特回归模型)的参数进行调整,并根据调整后的分箱结果和模型对指标A进行重新分箱,指标A重新分箱后可能包含4个分箱结果,4个分箱结果对应不同的分箱区间,因此,对于每一指标的分箱数目不做限定,根据具体的模型处理结果以及分箱结果的拟合效果确定。进而,直至指标A的分箱结果对应的拟合曲线的分箱效果满足预设阈值,确定分箱结果(分箱区间划分标准)和逻辑斯特回归模型针对该指标A的训练完成。
可选地,为了减少计算量,提高分中心推荐效率,对于逻辑斯特回归模型可以不针对每一次的分箱结果都进行参数调整,即每一指标进行单调性的指标区间划分后,得到对应的分箱结果,计算分箱结果的分箱证据权重,仅需将该分箱证据权重输入至逻辑斯特回归模型确定其对应的指标评分权重即可。此时的逻辑斯特回归模型仅作为计算指标评分权重的工具模型,不参与分箱计算的训练过程。
在一个实施例中,如图3所示,步骤201的具体处理过程如下所示:
步骤301,获取候选分中心的历史合作项目的实施方案数据,实施方案数据中包含各指标数据值。
在实施中,计算机设备获取候选分中心的历史合作项目的实施方案数据,其中,实施方案数据中包含各指标数据值。具体地,实施方案数据中包含的指标内容,可以参照上述步骤101中表1中的指标内容,本实施例不做限定。
步骤302,对各指标数据值进行缺失值处理和噪声处理,得到处理后的初始历史合作项目数据样本。
在实施中,计算机设备对各指标数据值进行缺失值处理和噪声处理,得到处理后打的初始历史合作数据样本。
具体地,对于获取到历史合作项目的实施方案数据中每一条数据记录(即每一历史合作项目对应的指标数据)进行缺失值处理,对缺失值进行删除或者数据补齐,其中,针对删除缺失值处理,若各指标存在的缺失值过多(超过预设缺失值数目阈值),则删除整条数据记录。针对数据补齐处理,在该指标对应的数据范围内采用特殊值填充、均值填充、热卡填充、回归填充或者多重插补等数据补齐方式对缺失数据进行补齐。
针对缺失值处理后的历史合作项目的实施方案数据进行噪声处理,通过建立该指标对应的指标值和预测指标值的回归模型,根据回归系数和预测指标值,反解出自变量的近似值。根据自变量的近似值替换异常的自变量值,得到处理后的初始历史合作项目数据样本。
步骤303,通过数据标准化算法对初始历史合作项目数据样本进行数据变换,得到标准化数据,作为历史合作项目数据样本。
在实施中,计算机设备通过数据标准化算法对初始历史合作项目数据样本进行数据变换,得到标准化数据,作为最终的用于模型训练的历史合作项目数据样本。
具体地,对初始历史合作项目数据样本中的数据进行规范化和标准化处理;规范化:对于不同量纲的数据,根据预设标准单位与各量纲单位的转换规则,统一同一指标下不同量纲的数据值;标准化:可以采用min-max标准化(Min-max normalization),Z-score标准化方法(也叫正规化方法),log函数转换标准化方法对每一指标下的数据进行标准化处理,得到最终的用于模型训练的历史合作项目数据样本。
本实施例中,通过对数据的规范化、标准化处理,创建数据完整标准的模型训练样本,提高指标评估模型的模型训练准确性。
在一个实施例中,如图4所示,该方法还包括:
步骤401,根据历史合作项目的实施方案中第一评分结果与第二评分结果的所占比例,计算每一分箱结果的分箱证据权重,并根据分箱证据权重计算每一分箱结果的分箱指标价值。
在实施中,计算机设备根据历史合作项目实施方案中第一评分结果与第二评分结果的所占比例(即正负样本的比例),计算每一指标的每一分箱结果的分箱证据权重(其具体的计算方法与上述步骤202相同,本实施例不再赘述),进一步地,根据每一指标的每一分箱证据权重计算每一指标的分箱指标价值,其具体的计算公式如下所示:
其中,IVi表示指标第i个分箱的分箱指标价值,WOEi表示第i个分箱的分箱证据权重,BadT为历史合作项目样本中第二评分结果的历史合作项目的总数目(即负样本总数目),Badi表示第i个分箱中包含的第二评分结果的历史合作项目的数目,GoodT为历史合作项目样本中第一评分结果的历史合作项目的总数目(即正样本总数目),Goodi示第i个分箱中包含的第一评分结果的历史合作项目的数目。
步骤402,对分箱指标价值进行求和计算,得到每一指标对应的指标价值。
在实施中,计算机设备对分箱指标价值进行求和计算,得到每一指标对应的指标价值。具体地,指标价值IV的计算公式为
IV=∑IVi (4)
步骤403,根据预设的指标价值阈值与指标价值进行比对,若指标价值大于指标阈值,则保留指标价值对应的指标,得到指标筛选结果。
在实施中,计算机设备根据预设的指标价值阈值与指标价值进行比对,若指标价值大于指标阈值则保留指标价值对应的指标,进而得到指标筛选结果。具体地,指标价值表征对应的指标与实施方案的相关性(即该指标对于实施方案评分结果的影响程度),若指标价值阈值设定为0.1,则指标价值大于0.1的指标被保留,作为后续模型训练数据,指标价值小于0.1的指标,对整体实施方案的评分结果影响不大,为减少计算量将其删除掉,不做处理。进而可以得到指标筛选结果。
可选地,除了设定指标价值阈值来进行指标筛选之外,还可以通过聚类算法对相关性较高的指标进行合并,即根据每一指标的指标价值进行聚类得到指标聚类结果,每一指标聚类结果对应包含的指标均具有高程度相关性,可以确定其中的代表性指标作为这一指标聚类结果对应的全部指标的指标合并结果,进一步简化指标,减少计算量和降低计算复杂度,对于指标筛选和合并的方法,本实施例不做限定。
则步骤203的具体处理过程如下所示:
步骤404,将指标筛选结果中保留的每一指标的分箱结果包含的指标数据输入至曲线评估模型,得到每一指标分箱结果对应的拟合曲线,根据拟合曲线的拟合结果对指标分箱结果和逻辑斯特回归模型进行调整,并在调整后的指标分箱结果和对应的逻辑斯特回归模型下重新进行指标评分权重值的确定,直至拟合曲线的拟合结果达到预设阈值。
在实施中,针对全部指标进行筛选后,得到的指标筛选结果为对最终的评分结果影响较大的指标(也可以称为高价值指标),进而,计算机设备利用这些高价值指标的指标分箱结果进行模型训练,具体的模型数据处理过程(训练过程)与上述步骤203相同,本实施例不再赘述。
在一个实施例中,如图5所示,步骤103的具体处理过程如下所示:
步骤501,根据训练好的指标单调性分箱标准进行分箱计算,确定每一指标的分箱结果。
在实施中,计算机设备根据训练好的指标单调性分箱标准进行分箱计算,确定每一指标的分箱结果。即,针对预实施方案中每一指标,根据训练好的该指标的指标单调性分箱标准确定分箱结果,即对应几个分箱,每个分箱的区间对应的区间范围。
步骤502,根据每一分中心对应的预实施方案中每一指标的预设指标值,确定指标的所处指标分箱区间。
在实施中,计算机设备根据每一分中心对应的预实施方案中每一指标的预设指标值,确定指标的所处指标分箱区间。具体地,根据每一(候选)分中心的预实施方案中每一指标值(例如,当前病床数:20(床))等,确定该指标值所处的指标分箱区间,例如,在分箱2:区间10-30。
步骤503,根据指标分箱区间和训练好的逻辑斯特回归模型,确定预实施方案中每一指标对应的分箱证据权重和指标评分权重值。
在实施中,计算机设备根据确定出的指标分箱区间与分箱证据权重和指标评分权重的对应关系,确定预实施方案中每一指标对应的分箱证据权重(WOEi)和指标评分权重值(Wi)。
在一个实施例中,如图6所示,步骤104的具体处理过程如下所示:
步骤601,计算每一分中心的合作项目的预实施方案中每一指标的分箱证据权重与对应的指标评分权重值的乘积,并将乘积进行求和计算,得到全部指标对应的综合权重。
步骤602,根据综合权重与评分差值进行相乘计算,得到每一分中心的预实施方案的综合评分差值;评分差值为满分值与基准分值的差值。
其中,评分差值为满分值与基准分值的差值。例如,满分值为100分,基准分值(Pbase)为60分,则评分差值对应为100-60=40分。
步骤603,根据基准分值与综合评分差值进行求和计算,得到每一分中心的综合评分结果。
在实施中,计算机设备根据基准分值与综合评分差值进行求和计算,得到每一分中心的综合评分结果Pa。具体地,评分模型表达式为:
本实施例中,通过指标筛选和指标分箱后,在统一的评分标准下,确定指标评分权重,进而通过评分模型对每一分中心进行综合评分,得到每一分中心的综合评分结果,提高了分中心推荐的准确性。
在一个实施例中,如图7所示,步骤105的具体处理过程如下所示:
步骤701,将每一分中心的综合评分结果进行由大到小排序,得到综合评分结果的排序结果。
在实施中,计算机设备将每一分中心的综合评分结果进行由大到小排序,得到综合评分结果的排序结果。
步骤702,根据预设的分中心选取数目,在排序结果中依序选取目标分中心,作为本次合作项目的分中心推荐结果。
在实施中,计算机设备根据预设的分中心选取数目,在排序结果中依序选取目标分中心作为本次合作项目的分中心推荐结果。
其中,若所需分中心数目为1,则选取降序排列结果中第一位的候选分中心作为目标分中心,进行分中心推荐,若所需分中心数目为5,则选取降序排列结果中第一位至第五位的候选分中心作为目标分中心,进行分中心推荐。
本实施例中,通过对分中心的综合评分结果进行排序,确定分中心的推荐顺序,进而根据所需分中心数目依序自动化进行分中心推荐,提高了分中心推荐效率。
应该理解的是,虽然图1-7的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图1-7中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
在一个实施例中,如图8所示,提供了一种分中心推荐装置800,包括:第一获取模块810、第二获取模块820、权重确定模块830、综合评分模块840和推荐模块850,其中:
第一获取模块810,用于获取候选分中心对应的分中心数据,分中心数据中包括疾病领域和对应的合作项目的预实施方案;
第二获取模块820,用于根据疾病领域和对应的合作项目的预实施方案,获取每一分中心对应的指标评分矩阵;指标评分矩阵中包含预实施方案中每一指标的指标评分权重;
权重确定模块830,用于根据指标评估模型的分箱计算,得到每一分中心的预实施方案中每一指标所处的指标分箱区间以及对应的指标评分权重值和分箱证据权重;
综合评分模块840,用于根据预设的评分模型、指标评分矩阵中每一指标的指标评分权重值和分箱证据权重,计算每一分中心的预实施方案的综合评分结果;
推荐模块850,用于根据综合评分结果,在候选分中心中确定目标分中心,作为分中心推荐结果。
在一个实施例中,该装置800还包括:
第三获取模块,用于获取历史合作项目数据样本,历史合作项目数据样本中包含与候选分中心进行历史合作项目的实施方案以及历史合作项目的实施方案的评分结果;
分箱模块,用于根据指标单调性对每一指标进行指标分箱,得到指标分箱结果,并根据评分结果、指标分箱结果以及预设的逻辑斯特回归模型,得到指标评分权重值;
模型训练模块,用于将每一指标分箱结果包含的指标数据输入至曲线评估模型,得到每一指标分箱结果对应的拟合曲线,根据拟合曲线的拟合结果对指标分箱结果和逻辑斯特回归模型进行调整,并在调整后的指标分箱结果和对应的逻辑斯特回归模型下重新进行指标评分权重值的确定,直至拟合曲线的拟合结果达到预设阈值。
在一个实施例中,第三获取模块具体用于获取候选分中心的历史合作项目的实施方案数据,实施方案数据中包含各指标数据值;
对各指标数据值进行缺失值处理和噪声处理,得到处理后的初始历史合作项目数据样本;
通过数据标准化算法对初始历史合作项目数据样本进行数据变换,得到标准化数据,作为历史合作项目数据样本。
在一个实施例中,该装置800还包括:
第一计算模块,用于根据历史合作项目的实施方案中第一评分结果与第二评分结果的所占比例,计算每一分箱结果的分箱证据权重,并根据分箱证据权重计算每一分箱结果的分箱指标价值;
第二计算模块,用于对分箱指标价值进行求和计算,得到每一指标对应的指标价值;
筛选模块,用于根据预设的指标价值阈值与指标价值进行比对,若指标价值大于指标阈值,则保留指标价值对应的指标,得到指标筛选结果;
模型训练模块,用于将指标筛选结果中保留的每一指标的分箱结果包含的指标数据输入至所述曲线评估模型,得到每一所述指标分箱结果对应的拟合曲线,根据所述拟合曲线的拟合结果对所述指标分箱结果和所述逻辑斯特回归模型进行调整,并在调整后的指标分箱结果和对应的所述逻辑斯特回归模型下重新进行指标评分权重值的确定,直至所述拟合曲线的拟合结果达到预设阈值。
在一个实施例中,权重确定模块830具体用于根据训练好的指标单调性分箱标准进行指标分箱计算,确定每一指标的分箱结果;
根据每一分中心对应的预实施方案中每一指标的预设指标值,确定指标的所处指标分箱区间;
根据指标分箱区间和训练好的逻辑斯特回归模型,确定所述预实施方案中每一所述指标对应的分箱证据权重和指标评分权重值。
在一个实施例中,综合评分模块840具体用于计算每一分中心的合作项目的预实施方案中每一指标的分箱证据权重与对应的指标评分权重值的乘积,并将乘积进行求和计算,得到全部指标对应的综合权重;
根据综合权重与评分差值进行相乘计算,得到每一分中心的预实施方案的综合评分差值;评分差值为满分值与基准分值的差值;
根据基准分值与综合评分差值进行求和计算,得到每一分中心的综合评分结果。
在一个实施例中,推荐模块850具体用于将每一分中心的综合评分结果进行由大到小排序,得到综合评分结果的排序结果;
根据预设的分中心选取数目,在排序结果中依序选取目标分中心,作为本次合作项目的分中心推荐结果。
本实施例中,采用分中心推荐装置800,权重确定模块830,进行指标筛选和指标分箱后,在统一的评分标准下,确定指标评分权重,进而综合评分模块840通过评分模型对每一分中心进行综合评分,得到每一分中心的综合评分结果,提高了分中心推荐的准确性。
关于分中心推荐装置的具体限定可以参见上文中对于分中心推荐方法的限定,在此不再赘述。上述分中心推荐装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是终端,其内部结构图可以如图9所示。该计算机设备包括通过系统总线连接的处理器、存储器、通信接口、显示屏和输入装置。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的通信接口用于与外部的终端进行有线或无线方式的通信,无线方式可通过WIFI、运营商网络、NFC(近场通信)或其他技术实现。该计算机程序被处理器执行时以实现一种分中心推荐方法。该计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏,该计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。
本领域技术人员可以理解,图9中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现以下步骤:
获取候选分中心对应的分中心数据,分中心数据中包括疾病领域和对应的合作项目的预实施方案;
根据疾病领域和对应的合作项目的预实施方案,获取每一分中心对应的指标评分矩阵;指标评分矩阵中包含预实施方案中每一指标的指标评分权重;
根据指标评估模型的分箱计算,得到每一分中心的预实施方案中每一指标所处的指标分箱区间以及对应的指标评分权重值和分箱证据权重;
根据预设的评分模型、指标评分矩阵中每一指标的指标评分权重值和分箱证据权重,计算每一分中心的预实施方案的综合评分结果;
根据综合评分结果,在候选分中心中确定目标分中心,作为分中心推荐结果。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
获取历史合作项目数据样本,历史合作项目数据样本中包含与候选分中心进行历史合作项目的实施方案以及历史合作项目的实施方案的评分结果;
根据指标单调性对每一指标进行指标分箱,得到指标分箱结果,并根据所述评分结果、所述指标分箱结果以及预设的逻辑斯特回归模型,得到指标评分权重值;
将每一指标分箱结果包含的指标数据输入至曲线评估模型,得到每一所述指标分箱结果对应的拟合曲线,根据所述拟合曲线的拟合结果对所述指标分箱结果和所述逻辑斯特回归模型进行调整,并在调整后的指标分箱结果和对应的所述逻辑斯特回归模型下重新进行指标评分权重值的确定,直至所述拟合曲线的拟合结果达到预设阈值。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
获取候选分中心的历史合作项目的实施方案数据,实施方案数据中包含各指标数据值;
对各指标数据值进行缺失值处理和噪声处理,得到处理后的初始历史合作项目数据样本;
通过数据标准化算法对初始历史合作项目数据样本进行数据变换,得到标准化数据,作为历史合作项目数据样本。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
根据历史合作项目的实施方案中第一评分结果与第二评分结果的所占比例,计算每一分箱结果的分箱证据权重,并根据分箱证据权重计算每一分箱结果的分箱指标价值;
对分箱指标价值进行求和计算,得到每一指标对应的指标价值;
根据预设的指标价值阈值与指标价值进行比对,若指标价值大于指标阈值,则保留指标价值对应的指标,得到指标筛选结果;
将指标筛选结果中保留的每一指标的分箱结果包含的指标数据输入至所述曲线评估模型,得到每一所述指标分箱结果对应的拟合曲线,根据所述拟合曲线的拟合结果对所述指标分箱结果和所述逻辑斯特回归模型进行调整,并在调整后的指标分箱结果和对应的所述逻辑斯特回归模型下重新进行指标评分权重值的确定,直至所述拟合曲线的拟合结果达到预设阈值。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
根据训练好的指标单调性分箱标准进行指标分箱计算,确定每一指标的分箱结果;
根据每一分中心对应的预实施方案中每一指标的预设指标值,确定指标的所处指标分箱区间;
根据所述指标分箱区间和训练好的逻辑斯特回归模型,确定所述预实施方案中每一所述指标对应的分箱证据权重和指标评分权重值。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
计算每一分中心的合作项目的预实施方案中每一指标的分箱证据权重与对应的指标评分权重值的乘积,并将乘积进行求和计算,得到全部指标对应的综合权重;
根据综合权重与评分差值进行相乘计算,得到每一分中心的预实施方案的综合评分差值;评分差值为满分值与基准分值的差值;
根据基准分值与综合评分差值进行求和计算,得到每一分中心的综合评分结果。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
将每一分中心的综合评分结果进行由大到小排序,得到综合评分结果的排序结果;
根据预设的分中心选取数目,在排序结果中依序选取目标分中心,作为本次合作项目的分中心推荐结果。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现上述各方法实施例中的步骤。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-Only Memory,ROM)、磁带、软盘、闪存或光存储器等。易失性存储器可包括随机存取存储器(Random Access Memory,RAM)或外部高速缓冲存储器。作为说明而非局限,RAM可以是多种形式,比如静态随机存取存储器(Static Random Access Memory,SRAM)或动态随机存取存储器(Dynamic Random Access Memory,DRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。
Claims (10)
1.一种分中心推荐方法,其特征在于,所述方法包括:
获取候选分中心对应的分中心数据,所述分中心数据中包括疾病领域和对应的合作项目的预实施方案;所述候选分中心提供多个不同侧重的预实施方案;
根据所述疾病领域和对应的所述合作项目的预实施方案,获取每一分中心对应的指标评分矩阵;所述指标评分矩阵中包含所述预实施方案中每一指标的指标评分权重;
根据指标评估模型的分箱计算,得到每一分中心的所述预实施方案中每一指标所处的指标分箱区间以及对应的指标评分权重值和分箱证据权重;
根据预设的评分模型、所述指标评分矩阵中每一指标的指标评分权重值和所述分箱证据权重,计算每一分中心的所述预实施方案的综合评分结果;所述分箱证据权重表征指标变量特征;
根据所述综合评分结果,在所述候选分中心中确定目标分中心,作为分中心推荐结果;
其中,所述指标评估模型为逻辑斯特回归模型,在所述根据指标评估模型的分箱计算,得到每一分中心的所述预实施方案中每一指标所处的指标分箱区间以及对应的指标评分权重值和分箱证据权重之前,所述方法还包括:
获取历史合作项目数据样本,所述历史合作项目数据样本中包含与所述候选分中心进行历史合作项目的实施方案以及所述历史合作项目的实施方案的评分结果;
根据指标单调性对每一指标进行指标分箱,得到指标分箱结果,并根据所述评分结果、所述指标分箱结果以及预设的逻辑斯特回归模型,得到指标评分权重值;
将每一指标分箱结果包含的指标数据输入至曲线评估模型,得到每一所述指标分箱结果对应的拟合曲线,根据所述拟合曲线的拟合结果对所述指标分箱结果和所述逻辑斯特回归模型进行调整,并在调整后的指标分箱结果和对应的所述逻辑斯特回归模型下重新进行指标评分权重值的确定,直至所述拟合曲线的拟合结果达到预设阈值。
2.根据权利要求1所述的方法,其特征在于,所述获取历史合作项目数据样本,包括:
获取所述候选分中心的历史合作项目的实施方案数据,所述实施方案数据中包含各指标数据值;
对所述各指标数据值进行缺失值处理和噪声处理,得到处理后的初始历史合作项目数据样本;
通过数据标准化算法对所述初始历史合作项目数据样本进行数据变换,得到标准化数据,作为历史合作项目数据样本。
3.根据权利要求1所述的方法,其特征在于,所述根据指标单调性对每一指标进行指标分箱,得到指标分箱结果,并根据所述评分结果以及预设的逻辑斯特回归模型,得到指标评分权重值之后,所述方法还包括:
根据所述历史合作项目的实施方案中第一评分结果与第二评分结果的所占比例,计算每一分箱结果的分箱证据权重,并根据所述分箱证据权重计算每一分箱结果的分箱指标价值;
对所述分箱指标价值进行求和计算,得到每一指标对应的指标价值;
根据预设的指标价值阈值与所述指标价值进行比对,若所述指标价值大于所述指标阈值,则保留所述指标价值对应的指标,得到指标筛选结果;
所述将每一指标分箱结果包含的指标数据输入至曲线评估模型,得到每一所述指标分箱结果对应的拟合曲线,根据所述拟合曲线的拟合结果对所述指标分箱结果和所述逻辑斯特回归模型进行调整,并在调整后的指标分箱结果和对应的所述逻辑斯特回归模型下重新进行指标评分权重值的确定,直至所述拟合曲线的拟合结果达到预设阈值,包括:
将指标筛选结果中保留的每一指标的分箱结果包含的指标数据输入至所述曲线评估模型,得到每一所述指标分箱结果对应的拟合曲线,根据所述拟合曲线的拟合结果对所述指标分箱结果和所述逻辑斯特回归模型进行调整,并在调整后的指标分箱结果和对应的所述逻辑斯特回归模型下重新进行指标评分权重值的确定,直至所述拟合曲线的拟合结果达到预设阈值。
4.根据权利要求1所述的方法,其特征在于,所述根据指标评估模型的分箱计算,得到每一分中心的所述预实施方案中每一指标所处的指标分箱区间以及对应的指标评分权重值和分箱证据权重,包括:
根据训练好的指标单调性分箱标准进行指标分箱计算,确定每一指标的分箱结果;
根据所述每一分中心对应的预实施方案中每一指标的预设指标值,确定所述指标的所处指标分箱区间;
根据所述指标分箱区间和训练好的逻辑斯特回归模型,确定所述预实施方案中每一所述指标对应的分箱证据权重和指标评分权重值。
5.根据权利要求1所述的方法,其特征在于,所述根据预设的评分模型、所述指标评分矩阵中每一指标的指标评分权重值和所述分箱证据权重,计算每一分中心的所述预实施方案的综合评分结果,包括:
计算每一分中心的合作项目的预实施方案中每一指标的所述分箱证据权重与对应的指标评分权重值的乘积,并将所述乘积进行求和计算,得到全部指标对应的综合权重;
根据所述综合权重与评分差值进行相乘计算,得到所述每一分中心的所述预实施方案的综合评分差值;所述评分差值为满分值与基准分值的差值;
根据所述基准分值与所述综合评分差值进行求和计算,得到所述每一分中心的综合评分结果。
6.根据权利要求1所述的方法,其特征在于,所述根据所述综合评分结果,在所述候选分中心中确定目标分中心,作为分中心推荐结果,包括:
将所述每一分中心的综合评分结果进行由大到小排序,得到所述综合评分结果的排序结果;
根据预设的分中心选取数目,在所述排序结果中依序选取目标分中心,作为本次合作项目的分中心推荐结果。
7.一种分中心推荐装置,其特征在于,所述装置包括:
第一获取模块,用于获取候选分中心对应的分中心数据,所述分中心数据中包括疾病领域和对应的合作项目的预实施方案;所述候选分中心提供多个不同侧重的预实施方案;
第二获取模块,用于根据所述疾病领域和对应的所述合作项目的预实施方案,获取每一分中心对应的指标评分矩阵;所述指标评分矩阵中包含所述预实施方案中每一指标的指标评分权重;
模型处理模块,用于根据指标评估模型的分箱计算,得到每一分中心的所述预实施方案中每一指标所处的指标分箱区间以及对应的指标评分权重值和分箱证据权重;
综合评分模块,用于根据预设的评分模型、所述指标评分矩阵中每一指标的指标评分权重值和所述分箱证据权重,计算每一分中心的所述预实施方案的综合评分结果;所述分箱证据权重表征指标变量特征;
推荐模块,用于根据所述综合评分结果,在所述候选分中心中确定目标分中心,作为分中心推荐结果;
所述装置还包括:
第三获取模块,用于获取历史合作项目数据样本,所述历史合作项目数据样本中包含与所述候选分中心进行历史合作项目的实施方案以及所述历史合作项目的实施方案的评分结果;
分箱模块,用于根据指标单调性对每一指标进行指标分箱,得到指标分箱结果,并根据所述评分结果、所述指标分箱结果以及预设的逻辑斯特回归模型,得到指标评分权重值;
模型训练模块,用于将每一指标分箱结果包含的指标数据输入至曲线评估模型,得到每一所述指标分箱结果对应的拟合曲线,根据所述拟合曲线的拟合结果对所述指标分箱结果和所述逻辑斯特回归模型进行调整,并在调整后的指标分箱结果和对应的所述逻辑斯特回归模型下重新进行指标评分权重值的确定,直至所述拟合曲线的拟合结果达到预设阈值。
8.根据权利要求7所述的装置,其特征在于,第三获取模块具体用于获取所述候选分中心的历史合作项目的实施方案数据,所述实施方案数据中包含各指标数据值;
对所述各指标数据值进行缺失值处理和噪声处理,得到处理后的初始历史合作项目数据样本;
通过数据标准化算法对所述初始历史合作项目数据样本进行数据变换,得到标准化数据,作为历史合作项目数据样本。
9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至6中任一项所述的方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至6中任一项所述的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110360995.2A CN113035299B (zh) | 2021-04-02 | 2021-04-02 | 分中心推荐方法、装置、计算机设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110360995.2A CN113035299B (zh) | 2021-04-02 | 2021-04-02 | 分中心推荐方法、装置、计算机设备和存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113035299A CN113035299A (zh) | 2021-06-25 |
CN113035299B true CN113035299B (zh) | 2022-03-29 |
Family
ID=76453828
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110360995.2A Active CN113035299B (zh) | 2021-04-02 | 2021-04-02 | 分中心推荐方法、装置、计算机设备和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113035299B (zh) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111402017A (zh) * | 2018-12-29 | 2020-07-10 | 顺丰科技有限公司 | 一种基于大数据的信用评分方法和系统 |
US10796801B2 (en) * | 2006-02-13 | 2020-10-06 | David G. Silverman | Method and system for assessing, quantifying, coding and communiicating patient's health and perioperative risk |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11578124B2 (en) * | 2018-05-18 | 2023-02-14 | Janssen Biotech, Inc. | Safe and effective method of treating lupus with anti-IL12/IL23 antibody |
CN109615503A (zh) * | 2018-10-26 | 2019-04-12 | 深圳市元征科技股份有限公司 | 一种信用风险的预测方法及相关设备 |
CN110620696A (zh) * | 2019-09-29 | 2019-12-27 | 杭州安恒信息技术股份有限公司 | 针对企业网络安全态势感知的评分方法和装置 |
-
2021
- 2021-04-02 CN CN202110360995.2A patent/CN113035299B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10796801B2 (en) * | 2006-02-13 | 2020-10-06 | David G. Silverman | Method and system for assessing, quantifying, coding and communiicating patient's health and perioperative risk |
CN111402017A (zh) * | 2018-12-29 | 2020-07-10 | 顺丰科技有限公司 | 一种基于大数据的信用评分方法和系统 |
Non-Patent Citations (1)
Title |
---|
"GIS-based spatial prediction of flood prone areas using standalone frequency ratio,logistic regression,weight of evidence and their ensemble techniques";Mahyat Shafapour Tehrany等;《Geomatics,Natural Hazards and Risk》;20170811;第8卷(第2期);第1538-1561页 * |
Also Published As
Publication number | Publication date |
---|---|
CN113035299A (zh) | 2021-06-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Cinelli et al. | Recommending multiple criteria decision analysis methods with a new taxonomy-based decision support system | |
Karasakal et al. | A multicriteria sorting approach based on data envelopment analysis for R&D project selection problem | |
US20120271612A1 (en) | Predictive modeling | |
Barbati et al. | Optimization of multiple satisfaction levels in portfolio decision analysis | |
CN110196814B (zh) | 一种软件质量评价方法 | |
Kose et al. | Grey theory based MCDM procedure for sniper selection problem | |
CN110197728A (zh) | 糖尿病的预测方法、装置及计算机设备 | |
CN112559900B (zh) | 产品推荐方法、装置、计算机设备和存储介质 | |
Draginčić et al. | AHP-based group decision making approach to supplier selection of irrigation equipment | |
Özpeynirci et al. | An interactive algorithm for multiple criteria constrained sorting problem | |
Ciflikli et al. | Enhancing product quality of a process | |
CN116705310A (zh) | 围术期风险评估的数据集构建方法、装置、设备及介质 | |
Guglielmi et al. | Semiparametric Bayesian models for clustering and classification in the presence of unbalanced in-hospital survival | |
CN118312816A (zh) | 基于成员选择的簇加权聚类集成医学数据处理方法及系统 | |
CN113435713B (zh) | 基于gis技术和两模型融合的风险地图编制方法及系统 | |
US11295325B2 (en) | Benefit surrender prediction | |
Chen et al. | A rough set approach to multiple criteria ABC analysis | |
CN113035299B (zh) | 分中心推荐方法、装置、计算机设备和存储介质 | |
CN112070336A (zh) | 一种基于层次分析法的制造业信息量化分析方法及装置 | |
CN116313086A (zh) | 一种亚健康预测模型构建方法、装置、设备及存储介质 | |
Wirawan et al. | Application of data mining to prediction of timeliness graduation of students (a case study) | |
Zaabar et al. | A two-phase part family formation model to optimize resource planning: a case study in the electronics industry | |
Angesti et al. | Prediction of the Telkom University's Undergraduates Waiting Period for Getting a Job using the CART Algorithm | |
Gehlhaus et al. | The US AI workforce | |
Rigopoulos et al. | Military student assignment using NexClass decision support system |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
TA01 | Transfer of patent application right | ||
TA01 | Transfer of patent application right |
Effective date of registration: 20220304 Address after: 200001 room 505, building a, No. 299, Danshui Road, Huangpu District, Shanghai Applicant after: Shanghai yaomingjinshi Pharmaceutical Technology Co.,Ltd. Address before: Unit 807, 8 / F, building 1, 3 Chaowai West Street, Chaoyang District, Beijing 100020 Applicant before: Beijing yaomingjinshi Pharmaceutical Technology Co.,Ltd. |
|
GR01 | Patent grant | ||
GR01 | Patent grant |