CN116108138A - 临床研究数据处理方法、装置、设备及存储介质 - Google Patents
临床研究数据处理方法、装置、设备及存储介质 Download PDFInfo
- Publication number
- CN116108138A CN116108138A CN202310042533.5A CN202310042533A CN116108138A CN 116108138 A CN116108138 A CN 116108138A CN 202310042533 A CN202310042533 A CN 202310042533A CN 116108138 A CN116108138 A CN 116108138A
- Authority
- CN
- China
- Prior art keywords
- data
- target
- study
- research
- clinical
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000011160 research Methods 0.000 title claims abstract description 211
- 238000003672 processing method Methods 0.000 title claims abstract description 23
- 230000008439 repair process Effects 0.000 claims abstract description 50
- 238000013528 artificial neural network Methods 0.000 claims abstract description 37
- 238000000034 method Methods 0.000 claims abstract description 31
- 238000012545 processing Methods 0.000 claims abstract description 27
- 238000001514 detection method Methods 0.000 claims description 58
- 238000012549 training Methods 0.000 claims description 36
- 238000012360 testing method Methods 0.000 claims description 27
- 230000006870 function Effects 0.000 claims description 21
- 239000011159 matrix material Substances 0.000 claims description 13
- 238000002474 experimental method Methods 0.000 claims description 7
- 238000004458 analytical method Methods 0.000 claims description 6
- 230000005856 abnormality Effects 0.000 claims description 3
- 239000003550 marker Substances 0.000 claims description 3
- 238000004891 communication Methods 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- 238000010586 diagram Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 2
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 238000012443 analytical study Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/3332—Query translation
- G06F16/3334—Selection or weighting of terms from queries, including natural language queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2465—Query processing support for facilitating data mining operations in structured databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3344—Query execution using natural language analysis
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/70—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Public Health (AREA)
- Artificial Intelligence (AREA)
- Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Biomedical Technology (AREA)
- Pathology (AREA)
- Epidemiology (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Fuzzy Systems (AREA)
- Mathematical Physics (AREA)
- Probability & Statistics with Applications (AREA)
- Software Systems (AREA)
- Medical Treatment And Welfare Office Work (AREA)
Abstract
本发明涉及数据处理技术领域,公开了一种临床研究数据处理方法、装置、设备及存储介质,所述方法包括:在检测到目标临床研究的数据存在丢失时,根据目标临床研究的研究类型和研究特性信息确定目标临床研究的历史数据以及同类型临床研究数据;根据目标临床研究的历史数据以及同类型临床研究数据基于预设神经网络对目标临床研究的数据中的丢失部分进行预测;通过目标修复数据对目标临床研究的数据进行修复;通过上述方式,利用目标临床研究的历史数据以及同类型临床研究数预测与丢失部分相适应的目标修复数据,然后通过目标修复数据对目标临床研究的数据进行修复,从而能够有效提高修复临床研究数据的准确性,以及为统计决策提供正确且合理的方向。
Description
技术领域
本发明涉及数据处理技术领域,尤其涉及临床研究数据处理方法、装置、设备及存储介质。
背景技术
随着信息化技术的不断发展,各领域的管理逐步与信息化接轨,尤其是临床研究方面,在进行某项研究时,会产生大量的临床研究数据,但是数据在采集到上传的过程中,或多或少地出现不同程度的丢失,且丢失的数据中也会包含核心数据和隐私数据,而目前修复临川研究数据的方式为平均值填充,即通过丢失部分两端的数据计算平均值,然后将平均值作为丢失的数据,但是绝大多数情况下丢失的数据并不是平均值,且丢失的数据类型还可能为图像,并不是数值,因此,上述方式修复临床研究数据的准确性较低,最终造成统计决策出现偏差或无效。
上述内容仅用于辅助理解本发明的技术方案,并不代表承认上述内容是现有技术。
发明内容
本发明的主要目的在于提供一种临床研究数据处理方法、装置、设备及存储介质,旨在解决现有技术修复临床研究数据的准确性较低,造成统计决策出现偏差或无效的技术问题。
为实现上述目的,本发明提供了一种临床研究数据处理方法,所述临床研究数据处理方法包括以下步骤:
在检测到目标临床研究的数据存在丢失时,获取所述目标临床研究的研究类型和研究特性信息;
根据所述研究类型和研究特性信息确定所述目标临床研究的历史数据以及同类型临床研究数据;
根据所述目标临床研究的历史数据以及同类型临床研究数据基于预设神经网络对目标临床研究的数据中的丢失部分进行预测,得到目标修复数据;
通过所述目标修复数据对目标临床研究的数据进行修复。
可选地,所述在检测到目标临床研究的数据存在丢失时,获取所述目标临床研究的研究类型和研究特性信息,包括:
在检测到目标临床研究的数据存在丢失时,获取所述目标临床研究的剩余数据;
对所述剩余数据进行语义分析,得到临床研究关键字;
根据所述临床研究关键字确定所述目标临床研究的研究类型;
根据所述剩余数据确定所述目标临床研究的研究方向、研究目的以及研究流程;
根据所述研究方向、研究目的以及研究流程生成研究特性信息。
可选地,所述根据所述研究类型和研究特性信息确定所述目标临床研究的历史数据以及同类型临床研究数据,包括:
获取本地研究数据集,根据所述本地研究数据集确定本地研究类型、本地研究特性信息以及若干数量的本地临床研究数据;
根据临床研究关键字在所述若干数量的本地临床研究数据中查询所述目标临床研究的历史数据;
将所述研究类型与所述本地研究类型进行匹配,以及将所述研究特征信息与所述本地研究特性信息进行匹配;
若存在匹配成功的研究类型且存在匹配成功的研究特性信息,则根据匹配成功的研究类型且存在匹配成功的研究特性信息在本地研究数据集中查询同类型临床研究数据。
可选地,所述将所述研究类型与所述本地研究类型进行匹配,以及将所述研究特征信息与所述本地研究特性信息进行匹配之后,还包括:
若不存在匹配成功的研究类型和/或不存在匹配成功的研究特性信息,则获取若干数量的临床实验平台的待缓存研究数据集;
根据所述待缓存研究数据集确定待缓存研究类型、待缓存研究特性信息以及若干数量的待缓存临床研究数据;
根据临床研究关键字在所述若干数量的待缓存临床研究数据中查询所述目标临床研究的历史数据;
将所述研究类型与所述待缓存研究类型进行匹配,以及将所述研究特征信息与所述待缓存研究特性信息进行匹配;
若存在匹配成功的研究类型且存在匹配成功的研究特性信息,则根据匹配成功的研究类型且存在匹配成功的研究特性信息在本地研究数据集中查询同类型临床研究数据。
可选地,所述根据所述目标临床研究的历史数据以及同类型临床研究数据基于预设神经网络对目标临床研究的数据中的丢失部分进行预测,得到目标修复数据,包括:
根据本地研究数据集和若干数量的临床实验平台的待缓存研究数据集生成模型训练数据集;
将所述模型训练数据集划分为临床测试数据集和临床训练数据集;
根据所述临床训练数据集生成目标神经网络参数矩阵;
通过目标径向基函数根据所述目标神经网络参数矩阵和预设神经网络训练目标临床研究数据预测模型;
通过目标损失函数根据所述临床测试数据集对所述目标临床研究数据预测模型进行测试,得到当前模型测试结果;
在所述当前模型测试结果满足预设条件时,由所述目标临床研究数据预测模型根据所述目标临床研究的历史数据以及同类型临床研究数据预测目标临床研究的数据中的丢失部分的目标修复数据。
可选地,所述根据所述目标临床研究的历史数据以及同类型临床研究数据基于预设神经网络对目标临床研究的数据中的丢失部分进行预测,得到目标修复数据之前,还包括:
获取所述目标临床研究的数据的上传时刻;
根据所述上传时刻和所述目标临床研究的数据生成数据上传时刻连续列表;
按照标准临床研究数据规则对所述数据上传时刻连续列表进行检测,得到当前列表检测结果;
在所述当前列表检测结果中存在目标空值时,对所述目标空值的位置进行标记;
在检测完成后,根据标记的位置得到所述目标临床研究的数据中的丢失部分。
可选地,所述通过所述目标修复数据对目标临床研究的数据进行修复之后,还包括:
获取修复后的目标临床研究的数据;
按照标准临床研究数据规则对所述修复后的目标临床研究的数据进行格式检测,得到第一检测结果;
按照标准临床研究数据规则对所述修复后的目标临床研究的数据进行异常检测,得到第二检测结果;
按照标准临床研究数据规则对所述修复后的目标临床研究的数据进行连续性检测,得到第三检测结果;
在所述第一检测结果、第二检测结果以及第三检测结果满足目标临床研究要求时,将所述修复后的目标临床研究的数据上传至区块链进行存储。
此外,为实现上述目的,本发明还提出一种临床研究数据处理装置,所述临床研究数据处理装置包括:
检测模块,用于在检测到目标临床研究的数据存在丢失时,获取所述目标临床研究的研究类型和研究特性信息;
确定模块,用于根据所述研究类型和研究特性信息确定所述目标临床研究的历史数据以及同类型临床研究数据;
预测模块,用于根据所述目标临床研究的历史数据以及同类型临床研究数据基于预设神经网络对目标临床研究的数据中的丢失部分进行预测,得到目标修复数据;
修复模块,用于通过所述目标修复数据对目标临床研究的数据进行修复。
此外,为实现上述目的,本发明还提出一种临床研究数据处理设备,所述临床研究数据处理设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的临床研究数据处理程序,所述临床研究数据处理程序配置为实现如上文所述的临床研究数据处理方法。
此外,为实现上述目的,本发明还提出一种存储介质,所述存储介质上存储有临床研究数据处理程序,所述临床研究数据处理程序被处理器执行时实现如上文所述的临床研究数据处理方法。
本发明提出的临床研究数据处理方法,在检测到目标临床研究的数据存在丢失时,获取所述目标临床研究的研究类型和研究特性信息;根据所述研究类型和研究特性信息确定所述目标临床研究的历史数据以及同类型临床研究数据;根据所述目标临床研究的历史数据以及同类型临床研究数据基于预设神经网络对目标临床研究的数据中的丢失部分进行预测,得到目标修复数据;通过所述目标修复数据对目标临床研究的数据进行修复;通过上述方式,利用目标临床研究的历史数据以及同类型临床研究数预测与丢失部分相适应的目标修复数据,然后通过目标修复数据对目标临床研究的数据进行修复,从而能够有效提高修复临床研究数据的准确性,以及为统计决策提供正确且合理的方向。
附图说明
图1是本发明实施例方案涉及的硬件运行环境的临床研究数据处理设备的结构示意图;
图2为本发明临床研究数据处理方法第一实施例的流程示意图;
图3为本发明临床研究数据处理方法第二实施例的流程示意图;
图4为本发明临床研究数据处理装置第一实施例的功能模块示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。
参照图1,图1为本发明实施例方案涉及的硬件运行环境的临床研究数据处理设备结构示意图。
如图1所示,该临床研究数据处理设备可以包括:处理器1001,例如中央处理器(Central Processing Unit,CPU),通信总线1002、用户接口1003,网络接口1004,存储器1005。其中,通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(Display)、输入单元比如键盘(Keyboard),可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如无线保真(Wireless-Fidelity,Wi-Fi)接口)。存储器1005可以是高速的随机存取存储器(RandomAccess Memory,RAM)存储器,也可以是稳定的非易失性存储器(Non-Volatile Memory,NVM),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。
本领域技术人员可以理解,图1中示出的结构并不构成对临床研究数据处理设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
如图1所示,作为一种存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及临床研究数据处理程序。
在图1所示的临床研究数据处理设备中,网络接口1004主要用于与网络一体化平台工作站进行数据通信;用户接口1003主要用于与用户进行数据交互;本发明临床研究数据处理设备中的处理器1001、存储器1005可以设置在临床研究数据处理设备中,所述临床研究数据处理设备通过处理器1001调用存储器1005中存储的临床研究数据处理程序,并执行本发明实施例提供的临床研究数据处理方法。
基于上述硬件结构,提出本发明临床研究数据处理方法实施例。
参照图2,图2为本发明临床研究数据处理方法第一实施例的流程示意图。
在第一实施例中,所述临床研究数据处理方法包括以下步骤:
步骤S10,在检测到目标临床研究的数据存在丢失时,获取所述目标临床研究的研究类型和研究特性信息。
需要说明的是,本实施例的执行主体为临床研究数据处理设备,还可为其他可实现相同或相似功能的设备,例如数据处理控制器等,本实施例对此不作限制,在本实施例中,以数据处理控制器为例进行说明。
应当理解的是,研究类型指的是目标临床研究所属的类型,该研究类型包括但不限于观察性研究、描述性研究、横断面研究、分析性研究等,研究特性信息指的是目标临床研究的特性信息,该研究特性信息包括但不限于研究方向、研究目的、研究流程以及研究对象等,在检测到目标临床研究的数据与标准临床研究数据在数量或其他比对维度上不一致时,表明目标临床研究的数据存在丢失,此时需要获取目标临床研究的研究类型和研究特性信息该丢失的数据可以为目标临床研究的部分数据,例如,目标临床研究的数据包括a、b、c以及d,此时丢失部分的数据可以为b,但是该b数据已经丢失,在检测到目标临床研究的数据存在丢失时无法知晓数据为b。
进一步地,步骤S10,包括:在检测到目标临床研究的数据存在丢失时,获取所述目标临床研究的剩余数据;对所述剩余数据进行语义分析,得到临床研究关键字;根据所述临床研究关键字确定所述目标临床研究的研究类型;根据所述剩余数据确定所述目标临床研究的研究方向、研究目的以及研究流程;根据所述研究方向、研究目的以及研究流程生成研究特性信息。
可以理解的是,剩余数据指的是目标临床研究的数据中除丢失部分数据之外的数据,该剩余数据的数量大于丢失部分的数据,临床研究关键字指的是能够唯一识别临床研究数据的关键字,该临床研究关键字包括标题关键字和正文关键字,且得到临床研究关键字的方式可以为语义分析、词义分析、句法分析,然后根据临床研究关键字确定目标临床研究的研究类型,研究方向指的是进行目标临床研究的大方向,研究目的指的是进行目标临床研究后的研究结果,研究流程指的是从开始目标临床研究到结束目标临床研究所经过的流程,此时的研究方向、研究目的以及研究流程均可以为目标临床研究的研究特性信息。
步骤S20,根据所述研究类型和研究特性信息确定所述目标临床研究的历史数据以及同类型临床研究数据。
可以理解的是,历史数据指的是目标临床研究在当前时刻之前的数据,由于目标临川研究的完成需要在规定时间内多次重复执行相同的流程,因此,同一个临床研究存在不同时刻的数据,将当前时刻之前的数据称作历史数据,同类型临床研究数据指的是与目标临床研究的研究类型相同的临床研究数据,该目标临床研究的历史数据以及同类型临床研究数据均是根据研究类型和研究特性信息确定的。
进一步地,步骤S20,包括:获取本地研究数据集,根据所述本地研究数据集确定本地研究类型、本地研究特性信息以及若干数量的本地临床研究数据;根据临床研究关键字在所述若干数量的本地临床研究数据中查询所述目标临床研究的历史数据;将所述研究类型与所述本地研究类型进行匹配,以及将所述研究特征信息与所述本地研究特性信息进行匹配;若存在匹配成功的研究类型且存在匹配成功的研究特性信息,则根据匹配成功的研究类型且存在匹配成功的研究特性信息在本地研究数据集中查询同类型临床研究数据。
应当理解的是,本地研究数据集指的是由存储在用于临床研究本地的各个研究数据构成的集合,本地研究类型指的是本地研究数据集中各个研究数据的类型,本地研究特性信息指的是本地研究数据集中各个临床研究的特征信息,然后根据临床研究关键字在若干数量的本地临床研究数据中通过遍历的方式查询出目标临床研究的历史数据,然后将研究类型与本地研究类型进行匹配,以及将研究特征信息与本地研究特性信息进行匹配,在两者均存在匹配成功的研究类型和研究特性信息,通过研究类型、研究特性信息以及临床研究数据的映射关系在本地研究数据集中查询出相对应的临床研究数据,并将该临床研究数据作为同类型临床研究数据。
进一步地,所述将所述研究类型与所述本地研究类型进行匹配,以及将所述研究特征信息与所述本地研究特性信息进行匹配之后,还包括:若不存在匹配成功的研究类型和/或不存在匹配成功的研究特性信息,则获取若干数量的临床实验平台的待缓存研究数据集;根据所述待缓存研究数据集确定待缓存研究类型、待缓存研究特性信息以及若干数量的待缓存临床研究数据;根据临床研究关键字在所述若干数量的待缓存临床研究数据中查询所述目标临床研究的历史数据;将所述研究类型与所述待缓存研究类型进行匹配,以及将所述研究特征信息与所述待缓存研究特性信息进行匹配;若存在匹配成功的研究类型且存在匹配成功的研究特性信息,则根据匹配成功的研究类型且存在匹配成功的研究特性信息在本地研究数据集中查询同类型临床研究数据。
可以理解的是,在满足研究类型与本地研究类型之间或研究特征信息与本地研究特性信息之间不存在匹配成功的研究类型和研究特性信息时,表明本地是无法查询到同类型临床研究数据或目标临床研究的历史数据,此时需要借助存储在区块链上的若干数量的临床实验平台的待缓存研究数据集。
步骤S30,根据所述目标临床研究的历史数据以及同类型临床研究数据基于预设神经网络对目标临床研究的数据中的丢失部分进行预测,得到目标修复数据。
应当理解的是,预设神经网络指的是用于训练目标临床研究数据预测模型的神经网络,该预设神经网络可以为径向基函数神经网络(Radial Basis FunctionNeuralNetwork,RBF),目标修复数据指的是用于修复目标临床研究的数据的临床研究数据,具体是基于预设神经网络根据目标临床研究的历史数据以及同类型临床研究数据预测与数据中的丢失部分相对应的目标修复数据。
进一步地,步骤S30之前,还包括:获取所述目标临床研究的数据的上传时刻;根据所述上传时刻和所述目标临床研究的数据生成数据上传时刻连续列表;按照标准临床研究数据规则对所述数据上传时刻连续列表进行检测,得到当前列表检测结果;在所述当前列表检测结果中存在目标空值时,对所述目标空值的位置进行标记;在检测完成后,根据标记的位置得到所述目标临床研究的数据中的丢失部分。
可以理解的是,本实施例中的目标临床研究的数据采用的上传方式为实时上传,上传时刻指的是上传目标临床研究的数据的时刻,数据上传时刻连续列表指的是由各个上传时刻与其相对应的目标临床研究的数据生成的列表,在得到数据上传时刻连续列表的当前列表检测结果,判断当前列表检测结果中是否存在目标空值,若是,则表明上传时刻未对应目标临床研究的数据,此时将目标空值的位置进行标记,例如,该标记位置为第三个时刻对应的目标临床研究的数据的位置,则表示为SJ研究[2],此时SJ研究[2]即为目标临床研究的数据中的丢失部分。
步骤S40,通过所述目标修复数据对目标临床研究的数据进行修复。
可以理解的是,在得到目标修复数据后,将目标修复数据填补至目标临床研究的缺失部分,以完成对目标临床研究的数据的修复。
进一步地,步骤S40之后,还包括:获取修复后的目标临床研究的数据;按照标准临床研究数据规则对所述修复后的目标临床研究的数据进行格式检测,得到第一检测结果;按照标准临床研究数据规则对所述修复后的目标临床研究的数据进行异常检测,得到第二检测结果;按照标准临床研究数据规则对所述修复后的目标临床研究的数据进行连续性检测,得到第三检测结果;在所述第一检测结果、第二检测结果以及第三检测结果满足目标临床研究要求时,将所述修复后的目标临床研究的数据上传至区块链进行存储。
应当理解的是,标准临床研究数据规则指的是由若干数量的标准临床研究数据构成的规则,该标准临床研究数据规则至少包括三个检测维度,分别为格式检测维度、异常检测维度以及连续性检测维度,在修改完成后,由目标修复数据和目标临床研究的剩余数据构成修复后的目标临床研究的数据,然后利用标准临床研究数据规则分别从是三个检测维度对修复后的目标临床研究的数据进行检测,以得到第一检测结果、第二检测结果以及第三检测结果,该第一检测结果指的是修复后的目标临床研究的数据在格式检测维度的检测结果,该第二检测结果指的是修复后的目标临床研究的数据在异常检测维度的检测结果,该第三检测结果指的是修复后的目标临床研究的数据在连续性检测维度的检测结果,然后判断第一检测结果、第二检测结果以及第三检测结果是否满足目标临床研究要求,若是,则将修复后的目标临床研究的数据上传至区块链进行存储,以保证目标临床研究的数据的安全性。
本实施例在检测到目标临床研究的数据存在丢失时,获取所述目标临床研究的研究类型和研究特性信息;根据所述研究类型和研究特性信息确定所述目标临床研究的历史数据以及同类型临床研究数据;根据所述目标临床研究的历史数据以及同类型临床研究数据基于预设神经网络对目标临床研究的数据中的丢失部分进行预测,得到目标修复数据;通过所述目标修复数据对目标临床研究的数据进行修复;通过上述方式,利用目标临床研究的历史数据以及同类型临床研究数预测与丢失部分相适应的目标修复数据,然后通过目标修复数据对目标临床研究的数据进行修复,从而能够有效提高修复临床研究数据的准确性,以及为统计决策提供正确且合理的方向。
在一实施例中,如图3所述,基于第一实施例提出本发明临床研究数据处理方法第二实施例,所述步骤S30,包括:
步骤S301,根据本地研究数据集和若干数量的临床实验平台的待缓存研究数据集生成模型训练数据集。
应当理解的是,模型训练数据集指的是用于训练目标临床研究数据预测模型的数据集,该模型训练数据集是由本地研究数据集和若干数量的临床实验平台的待缓存研究数据集组合并生成的。
步骤S302,将所述模型训练数据集划分为临床测试数据集和临床训练数据集。
可以理解的是,在得到模型训练数据集后,按照特定的比例将模型训练数据集划分为临床测试数据集和临床训练数据集,例如,将模型训练数据集的10%划分为临床测试数据集,将模型训练数据集的90%划分为临床训练数据集。
步骤S303,根据所述临床训练数据集生成目标神经网络参数矩阵。
应当理解的是,目标神经网络参数矩阵指的是由临床训练数据集中的各个参数构成的矩阵,例如,临床训练数据集中的各个参数表示为,则目标神经网络参数矩阵为,其中,T表示目标临床研究的数据的上传时刻。
步骤S304,通过目标径向基函数根据所述目标神经网络参数矩阵和预设神经网络训练目标临床研究数据预测模型。
可以理解的是,目标径向基础函数指的是用于目标临床研究的数据的上传时刻训练的函数,该目标径向基础函数可以为整体性能优的逆-MultiQuadric 基函数,然后将目标神经网络参数矩阵输入至预设神经网络,再由预设神经网络利用目标径向基函数进行训练,以得到目标临床研究数据预测模型,训练目标临床研究数据预测模型的具体方式为:
;
其中,表示目标临床研究数据预测模型,表示插值中心,表示目标径向基函数,表示用于提高预测模型训练精度的多项式,表示临床训练数据集中的各个参数。
应当理解的是,目标径向基函数可以表示为:,其中,表示当前插值中心的标识点与相邻插值中心标识间的间隔,且,表示相邻插值中心。
步骤S305,通过目标损失函数根据所述临床测试数据集对所述目标临床研究数据预测模型进行测试,得到当前模型测试结果。
应当理解的是,目标损失函数指的是用于测试目标临床研究数据预测模型的性能的损失函数,该目标损失函数可以为softmax,然后利用目标损失函数根据临床测试数据集对目标临床研究数据预测模型进行测试。
步骤S306,在所述当前模型测试结果满足预设条件时,由所述目标临床研究数据预测模型根据所述目标临床研究的历史数据以及同类型临床研究数据预测目标临床研究的数据中的丢失部分的目标修复数据。
可以理解的是,在得到当前模型测试结果后,判断当前模型测试结果是否满足预设条件,若是,则表明目标临床研究数据预测模型合格,此时将目标临床研究的历史数据以及同类型临床研究数据输入至目标临床研究数据预测模型,由目标临床研究数据预测模型利用目标临床研究的历史数据以及同类型临床研究数据预测目标临床研究的数据中的丢失部分的目标修复数据。
本实施例根据本地研究数据集和若干数量的临床实验平台的待缓存研究数据集生成模型训练数据集;将所述模型训练数据集划分为临床测试数据集和临床训练数据集;根据所述临床训练数据集生成目标神经网络参数矩阵;通过目标径向基函数根据所述目标神经网络参数矩阵和预设神经网络训练目标临床研究数据预测模型;通过目标损失函数根据所述临床测试数据集对所述目标临床研究数据预测模型进行测试,得到当前模型测试结果;在所述当前模型测试结果满足预设条件时,由所述目标临床研究数据预测模型根据所述目标临床研究的历史数据以及同类型临床研究数据预测目标临床研究的数据中的丢失部分的目标修复数据;通过上述方式,通过目标径向基函数根据目标神经网络参数矩阵和预设神经网络训练目标临床研究数据预测模型,然后在目标临床研究数据预测模型满足预设条件时,利用目标临床研究数据预测模型预测目标临床研究的数据中的丢失部分的目标修复数据,从而能够有效提高预测目标修复数据的准确性。
此外,本发明实施例还提出一种存储介质,所述存储介质上存储有临床研究数据处理程序,所述临床研究数据处理程序被处理器执行时实现如上文所述的临床研究数据处理方法的步骤。
由于本存储介质采用了上述所有实施例的全部技术方案,因此至少具有上述实施例的技术方案所带来的所有有益效果,在此不再一一赘述。
此外,参照图4,本发明实施例还提出一种临床研究数据处理装置,所述临床研究数据处理装置包括:
检测模块10,用于在检测到目标临床研究的数据存在丢失时,获取所述目标临床研究的研究类型和研究特性信息。
确定模块20,用于根据所述研究类型和研究特性信息确定所述目标临床研究的历史数据以及同类型临床研究数据。
预测模块30,用于根据所述目标临床研究的历史数据以及同类型临床研究数据基于预设神经网络对目标临床研究的数据中的丢失部分进行预测,得到目标修复数据。
修复模块40,用于通过所述目标修复数据对目标临床研究的数据进行修复。
本实施例在检测到目标临床研究的数据存在丢失时,获取所述目标临床研究的研究类型和研究特性信息;根据所述研究类型和研究特性信息确定所述目标临床研究的历史数据以及同类型临床研究数据;根据所述目标临床研究的历史数据以及同类型临床研究数据基于预设神经网络对目标临床研究的数据中的丢失部分进行预测,得到目标修复数据;通过所述目标修复数据对目标临床研究的数据进行修复;通过上述方式,利用目标临床研究的历史数据以及同类型临床研究数预测与丢失部分相适应的目标修复数据,然后通过目标修复数据对目标临床研究的数据进行修复,从而能够有效提高修复临床研究数据的准确性,以及为统计决策提供正确且合理的方向。
需要说明的是,以上所描述的工作流程仅仅是示意性的,并不对本发明的保护范围构成限定,在实际应用中,本领域的技术人员可以根据实际的需要选择其中的部分或者全部来实现本实施例方案的目的,此处不做限制。
另外,未在本实施例中详尽描述的技术细节,可参见本发明任意实施例所提供的临床研究数据处理方法,此处不再赘述。
本发明所述临床研究数据处理装置的其他实施例或具有实现方法可参照上述各方法实施例,此处不再赘余。
此外,需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如只读存储器(Read Only Memory,ROM)/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,一体化平台工作站,或者网络设备等)执行本发明各个实施例所述的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。
Claims (10)
1.一种临床研究数据处理方法,其特征在于,所述临床研究数据处理方法包括以下步骤:
在检测到目标临床研究的数据存在丢失时,获取所述目标临床研究的研究类型和研究特性信息;
根据所述研究类型和研究特性信息确定所述目标临床研究的历史数据以及同类型临床研究数据;
根据所述目标临床研究的历史数据以及同类型临床研究数据基于预设神经网络对目标临床研究的数据中的丢失部分进行预测,得到目标修复数据;
通过所述目标修复数据对目标临床研究的数据进行修复。
2.如权利要求1所述的临床研究数据处理方法,其特征在于,所述在检测到目标临床研究的数据存在丢失时,获取所述目标临床研究的研究类型和研究特性信息,包括:
在检测到目标临床研究的数据存在丢失时,获取所述目标临床研究的剩余数据;
对所述剩余数据进行语义分析,得到临床研究关键字;
根据所述临床研究关键字确定所述目标临床研究的研究类型;
根据所述剩余数据确定所述目标临床研究的研究方向、研究目的以及研究流程;
根据所述研究方向、研究目的以及研究流程生成研究特性信息。
3.如权利要求1所述的临床研究数据处理方法,其特征在于,所述根据所述研究类型和研究特性信息确定所述目标临床研究的历史数据以及同类型临床研究数据,包括:
获取本地研究数据集,根据所述本地研究数据集确定本地研究类型、本地研究特性信息以及若干数量的本地临床研究数据;
根据临床研究关键字在所述若干数量的本地临床研究数据中查询所述目标临床研究的历史数据;
将所述研究类型与所述本地研究类型进行匹配,以及将所述研究特征信息与所述本地研究特性信息进行匹配;
若存在匹配成功的研究类型且存在匹配成功的研究特性信息,则根据匹配成功的研究类型且存在匹配成功的研究特性信息在本地研究数据集中查询同类型临床研究数据。
4.如权利要求3所述的临床研究数据处理方法,其特征在于,所述将所述研究类型与所述本地研究类型进行匹配,以及将所述研究特征信息与所述本地研究特性信息进行匹配之后,还包括:
若不存在匹配成功的研究类型和/或不存在匹配成功的研究特性信息,则获取若干数量的临床实验平台的待缓存研究数据集;
根据所述待缓存研究数据集确定待缓存研究类型、待缓存研究特性信息以及若干数量的待缓存临床研究数据;
根据临床研究关键字在所述若干数量的待缓存临床研究数据中查询所述目标临床研究的历史数据;
将所述研究类型与所述待缓存研究类型进行匹配,以及将所述研究特征信息与所述待缓存研究特性信息进行匹配;
若存在匹配成功的研究类型且存在匹配成功的研究特性信息,则根据匹配成功的研究类型且存在匹配成功的研究特性信息在本地研究数据集中查询同类型临床研究数据。
5.如权利要求1所述的临床研究数据处理方法,其特征在于,所述根据所述目标临床研究的历史数据以及同类型临床研究数据基于预设神经网络对目标临床研究的数据中的丢失部分进行预测,得到目标修复数据,包括:
根据本地研究数据集和若干数量的临床实验平台的待缓存研究数据集生成模型训练数据集;
将所述模型训练数据集划分为临床测试数据集和临床训练数据集;
根据所述临床训练数据集生成目标神经网络参数矩阵;
通过目标径向基函数根据所述目标神经网络参数矩阵和预设神经网络训练目标临床研究数据预测模型;
通过目标损失函数根据所述临床测试数据集对所述目标临床研究数据预测模型进行测试,得到当前模型测试结果;
在所述当前模型测试结果满足预设条件时,由所述目标临床研究数据预测模型根据所述目标临床研究的历史数据以及同类型临床研究数据预测目标临床研究的数据中的丢失部分的目标修复数据。
6.如权利要求1所述的临床研究数据处理方法,其特征在于,所述根据所述目标临床研究的历史数据以及同类型临床研究数据基于预设神经网络对目标临床研究的数据中的丢失部分进行预测,得到目标修复数据之前,还包括:
获取所述目标临床研究的数据的上传时刻;
根据所述上传时刻和所述目标临床研究的数据生成数据上传时刻连续列表;
按照标准临床研究数据规则对所述数据上传时刻连续列表进行检测,得到当前列表检测结果;
在所述当前列表检测结果中存在目标空值时,对所述目标空值的位置进行标记;
在检测完成后,根据标记的位置得到所述目标临床研究的数据中的丢失部分。
7.如权利要求1至6中任一项所述的临床研究数据处理方法,其特征在于,所述通过所述目标修复数据对目标临床研究的数据进行修复之后,还包括:
获取修复后的目标临床研究的数据;
按照标准临床研究数据规则对所述修复后的目标临床研究的数据进行格式检测,得到第一检测结果;
按照标准临床研究数据规则对所述修复后的目标临床研究的数据进行异常检测,得到第二检测结果;
按照标准临床研究数据规则对所述修复后的目标临床研究的数据进行连续性检测,得到第三检测结果;
在所述第一检测结果、第二检测结果以及第三检测结果满足目标临床研究要求时,将所述修复后的目标临床研究的数据上传至区块链进行存储。
8.一种临床研究数据处理装置,其特征在于,所述临床研究数据处理装置包括:
检测模块,用于在检测到目标临床研究的数据存在丢失时,获取所述目标临床研究的研究类型和研究特性信息;
确定模块,用于根据所述研究类型和研究特性信息确定所述目标临床研究的历史数据以及同类型临床研究数据;
预测模块,用于根据所述目标临床研究的历史数据以及同类型临床研究数据基于预设神经网络对目标临床研究的数据中的丢失部分进行预测,得到目标修复数据;
修复模块,用于通过所述目标修复数据对目标临床研究的数据进行修复。
9.一种临床研究数据处理设备,其特征在于,所述临床研究数据处理设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的临床研究数据处理程序,所述临床研究数据处理程序配置有实现如权利要求1至7中任一项所述的临床研究数据处理方法。
10.一种存储介质,其特征在于,所述存储介质上存储有临床研究数据处理程序,所述临床研究数据处理程序被处理器执行时实现如权利要求1至7中任一项所述的临床研究数据处理方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310042533.5A CN116108138B (zh) | 2023-01-28 | 2023-01-28 | 临床研究数据处理方法、装置、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310042533.5A CN116108138B (zh) | 2023-01-28 | 2023-01-28 | 临床研究数据处理方法、装置、设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116108138A true CN116108138A (zh) | 2023-05-12 |
CN116108138B CN116108138B (zh) | 2023-10-20 |
Family
ID=86266948
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310042533.5A Active CN116108138B (zh) | 2023-01-28 | 2023-01-28 | 临床研究数据处理方法、装置、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116108138B (zh) |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102622880A (zh) * | 2012-01-09 | 2012-08-01 | 北京捷易联科技有限公司 | 一种交通信息数据修复方法及装置 |
US20160135755A1 (en) * | 2012-10-24 | 2016-05-19 | Zte Corporation | Remote home healthcare system |
CN112381303A (zh) * | 2020-11-19 | 2021-02-19 | 北京嘀嘀无限科技发展有限公司 | 一种任务指标数据预测方法和系统 |
CN113900861A (zh) * | 2021-11-01 | 2022-01-07 | 浙江吉利控股集团有限公司 | 传感器数据的修复方法、装置、设备及存储介质 |
CN114155977A (zh) * | 2021-12-09 | 2022-03-08 | 上海妙一生物科技有限公司 | 一种临床研究项目的数据处理方法和装置 |
CN114285728A (zh) * | 2021-12-27 | 2022-04-05 | 中国电信股份有限公司 | 一种预测模型训练方法、流量预测方法、装置及存储介质 |
CN114936211A (zh) * | 2022-07-19 | 2022-08-23 | 深圳市星卡软件技术开发有限公司 | 一种汽车诊断数据处理方法、装置、设备及介质 |
-
2023
- 2023-01-28 CN CN202310042533.5A patent/CN116108138B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102622880A (zh) * | 2012-01-09 | 2012-08-01 | 北京捷易联科技有限公司 | 一种交通信息数据修复方法及装置 |
US20160135755A1 (en) * | 2012-10-24 | 2016-05-19 | Zte Corporation | Remote home healthcare system |
CN112381303A (zh) * | 2020-11-19 | 2021-02-19 | 北京嘀嘀无限科技发展有限公司 | 一种任务指标数据预测方法和系统 |
CN113900861A (zh) * | 2021-11-01 | 2022-01-07 | 浙江吉利控股集团有限公司 | 传感器数据的修复方法、装置、设备及存储介质 |
CN114155977A (zh) * | 2021-12-09 | 2022-03-08 | 上海妙一生物科技有限公司 | 一种临床研究项目的数据处理方法和装置 |
CN114285728A (zh) * | 2021-12-27 | 2022-04-05 | 中国电信股份有限公司 | 一种预测模型训练方法、流量预测方法、装置及存储介质 |
CN114936211A (zh) * | 2022-07-19 | 2022-08-23 | 深圳市星卡软件技术开发有限公司 | 一种汽车诊断数据处理方法、装置、设备及介质 |
Also Published As
Publication number | Publication date |
---|---|
CN116108138B (zh) | 2023-10-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8935258B2 (en) | Identification of sample data items for re-judging | |
CN110033018B (zh) | 图形相似度判断方法、装置及计算机可读存储介质 | |
Gong et al. | Evolutionary generation of test data for many paths coverage based on grouping | |
US20200364216A1 (en) | Method, apparatus and storage medium for updating model parameter | |
CN112069329B (zh) | 文本语料的处理方法、装置、设备及存储介质 | |
CN115392037A (zh) | 设备故障预测方法、装置、设备及存储介质 | |
CN111402951A (zh) | 拷贝数变异预测方法、装置、计算机设备和存储介质 | |
CN109634820A (zh) | 一种云端移动端协同的故障预警方法、相关设备及系统 | |
KR102054500B1 (ko) | 설계 도면 제공 방법 | |
CN114997036A (zh) | 基于深度学习的网络拓扑重构方法、装置和设备 | |
CN116108138B (zh) | 临床研究数据处理方法、装置、设备及存储介质 | |
CN113609216A (zh) | 基于区块链的产品质量诊断方法、装置、设备及存储介质 | |
CN117093477A (zh) | 一种软件质量评估方法、装置、计算机设备及存储介质 | |
CN117112742A (zh) | 一种对话模型优化方法、装置、计算机设备和存储介质 | |
CN111797211A (zh) | 业务信息搜索方法、装置、计算机设备和存储介质 | |
CN116168403A (zh) | 医疗数据分类模型训练方法、分类方法、装置及相关介质 | |
CN110110280B (zh) | 对坐标的曲线积分计算方法、装置、设备及存储介质 | |
CN111401055A (zh) | 从金融资讯提取脉络信息的方法和装置 | |
CN116975299B (zh) | 文本数据的判别方法、装置、设备及介质 | |
CN116992294B (zh) | 卫星测控训练评估方法、装置、设备及存储介质 | |
CN116578690B (zh) | 一种基于人工智能的保险客服服务方法与系统 | |
CN115906089B (zh) | 一种基于二进制函数相似性的漏洞检测方法与系统 | |
JP7439923B2 (ja) | 学習方法、学習装置及びプログラム | |
US20240078848A1 (en) | Repair content prediction method, repair content prediction device, computer-readable recording medium recording a program, and method for creating repair content prediction model | |
CN117216650A (zh) | 一种目标对象风险行为预警方法及相关设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |