CN116975297A - 一种用于评估临床试验风险的方法 - Google Patents
一种用于评估临床试验风险的方法 Download PDFInfo
- Publication number
- CN116975297A CN116975297A CN202311226278.6A CN202311226278A CN116975297A CN 116975297 A CN116975297 A CN 116975297A CN 202311226278 A CN202311226278 A CN 202311226278A CN 116975297 A CN116975297 A CN 116975297A
- Authority
- CN
- China
- Prior art keywords
- data
- risk
- clinical
- clinical trial
- feature
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 37
- 238000012360 testing method Methods 0.000 claims abstract description 237
- 238000012937 correction Methods 0.000 claims abstract description 62
- 238000011156 evaluation Methods 0.000 claims abstract description 61
- 239000013598 vector Substances 0.000 claims abstract description 54
- 238000007781 pre-processing Methods 0.000 claims abstract description 7
- 239000011159 matrix material Substances 0.000 claims description 34
- 238000012512 characterization method Methods 0.000 claims description 24
- 238000012163 sequencing technique Methods 0.000 claims description 11
- 230000011218 segmentation Effects 0.000 claims description 6
- 238000012216 screening Methods 0.000 claims description 3
- 238000012502 risk assessment Methods 0.000 description 10
- QVGXLLKOCUKJST-UHFFFAOYSA-N atomic oxygen Chemical compound [O] QVGXLLKOCUKJST-UHFFFAOYSA-N 0.000 description 8
- 239000008280 blood Substances 0.000 description 8
- 210000004369 blood Anatomy 0.000 description 8
- 229910052760 oxygen Inorganic materials 0.000 description 8
- 239000001301 oxygen Substances 0.000 description 8
- 230000008569 process Effects 0.000 description 6
- 238000007726 management method Methods 0.000 description 3
- 238000011002 quantification Methods 0.000 description 3
- 239000003814 drug Substances 0.000 description 2
- 229940079593 drug Drugs 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 238000007689 inspection Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 230000004075 alteration Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000036772 blood pressure Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000035790 physiological processes and functions Effects 0.000 description 1
- 230000006461 physiological response Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
- G06F40/295—Named entity recognition
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/20—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H70/00—ICT specially adapted for the handling or processing of medical references
- G16H70/20—ICT specially adapted for the handling or processing of medical references relating to practices or guidelines
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Theoretical Computer Science (AREA)
- Public Health (AREA)
- Medical Informatics (AREA)
- General Health & Medical Sciences (AREA)
- General Physics & Mathematics (AREA)
- Epidemiology (AREA)
- Primary Health Care (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- Biomedical Technology (AREA)
- Databases & Information Systems (AREA)
- Pathology (AREA)
- Computational Linguistics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Artificial Intelligence (AREA)
- Bioethics (AREA)
- Medical Treatment And Welfare Office Work (AREA)
Abstract
本发明提供了一种用于评估临床试验风险的方法,属于临床试验技术领域,包括:基于当前临床试验项目的临床试验数据中的特征数据,构建出临床试验数据的多个特征数据集合;对特征数据集合中的数据进行预处理操作,获取特征数据集合的特征向量;基于临床试验数据的所有特征数据集合的特征向量,获得临床试验数据的初评风险等级;基于临床试验数据中所有风险影响数据在当前临床试验项目的不同试验类别层次对应的预设校正系数,对初评风险等级进行校正,获得临床试验数据的终评风险等级;用以在基于临床试验数据中的特征数据评估出临床试验数据的初评风险等级的基础上对其进行进一步校正,保证了临床试验风险评估的准确度。
Description
技术领域
本发明涉及临床试验技术领域,特别涉及一种用于评估临床试验风险的方法。
背景技术
目前,临床试验是通过药物或器械对试验者进行操作后观察试验者的生理反应,以获得相应临床操作的试验结果的过程。但是,由于试验结果的不完全可控性质,在试验过程中可能出现各种各样的危险情况,轻则导致试验失败,重则对试验者的生理状态产生危害。因此,评估临床试验风险也是临床试验中的重要一环,现有技术中多通过预设的评估指标和评估方式对临床试验数据进行评估以评估出临床试验的风险。
但是,现有技术的临床试验风险评估方法中未考虑到临床试验数据中对风险评估产生影响的风险影响数据对该临床试验在不同试验类别层次下的误差情况不同,也会造成与风险评估基准之间存在不同的偏差情况,因此,采用固定的评估依据难以覆盖所有试验产生的情况,导致临床试验风险评估不够精准。例如:公开号为“CN111695835B“、专利名称为”用于评估临床试验风险的方法 ”,公开日为2021年4月16日的中国发明专利,其公开了一种用于评估临床试验风险的方法,将采集获得的数据划分成为两种类别,即与受试者安全性关联的关键数据以及数据质量数据两个维度对临床试验参与医院进行风险评估。根据本申请的方法,能够将多种临床试验数据结合后进行风险量化以得到临床试验安全性风险分项指标数据、数据质量风险分项指标数据和临床试验参与医院的风险指标数据,根据临床试验风险等级调配监查人力资源精准的进入临床试验参与医院中。并以具体的安全性风险分项指标数据和数据质量风险分项指标数据为依据以监查各个组成的数据指标的风险程度,执行相应的监查工作达到实时的管控临床试验的目的,维护受试者权益提高临床试验质量。但是,该专利是以多种临床试验数据结合后风险量化获得的风险分项指标数据以监察临床试验数据中各个组成的数据指标的风险程度,其中以多种临床试验数据集合后风险量化后的风险分项指标数据为风险评估基准,难免会出现误差,而该专利又未考虑到临床试验数据中对风险评估产生影响的风险影响数据对该临床试验在不同试验类别层次下的试验造成的不同误差情况,也会造成与风险评估基准之间存在不同的偏差情况,因此,导致临床试验风险评估不够精准。
因此,本发明提出了一种用于评估临床试验风险的方法。
发明内容
本发明提供一种用于评估临床试验风险的方法,用以在基于临床试验数据中的特征数据评估出临床试验数据的初评风险等级的基础上对其进行进一步校正,保证了临床试验风险评估的准确度。
本发明提供一种用于评估临床试验风险的方法,包括:
S1:基于当前临床试验项目的临床试验数据中的特征数据,构建出临床试验数据的多个特征数据集合;
S2:对特征数据集合中的数据进行预处理操作,获取特征数据集合的特征向量;
S3:基于临床试验数据的所有特征数据集合的特征向量,获得临床试验数据的初评风险等级;
S4:基于临床试验数据中所有风险影响数据在当前临床试验项目的不同试验类别层次对应的预设校正系数,对初评风险等级进行校正,获得临床试验数据的终评风险等级。
优选的,S1:基于当前临床试验项目的临床试验数据中的特征数据,构建出临床试验数据的多个特征数据集合,包括:
在当前临床试验项目的临床试验数据中筛选出非标准格式文本,对非标准格式文本进行分词处理,获取若干个实体词组;
将实体词组与标准特征词组库中的标准数据类目词组进行匹配,获取实体词组对应的一个或多个标准数据类目词组;
将临床试验数据中的非标准格式文本中所有实体词组对应的一个或多个标准数据类目词组下对应的部分临床试验数据,当作非标准格式文本的特征数据;
将临床试验数据中标准格式文本中与标准特征词组库中的标准数据类目词组完全匹配的标准数据类目词组下对应的部分临床试验数据,当作标准格式文本的特征数据;
基于临床试验数据中的所有特征数据,对临床试验者的临床试验数据进行分类,获得临床试验数据的多个特征数据集合。
优选的,基于临床试验数据中的所有特征数据,对临床试验者的临床试验数据进行分类,获得临床试验数据的多个特征数据集合,包括:
确定出每个特征数据在预设试验数据类型库中每个数据类型的数据群中的命中率;
将特征数据在试验数据类型库中命中率最高的数据类型,确定为特征数据的数据类型;
将临床试验数据中数据类型连续相同的特征数据进行汇总,获得多个特征数据集合。
优选的,S2:对特征数据集合中的数据进行预处理操作,获取特征数据集合的特征向量,包括:
基于风险影响数据列表,在特征数据集合中提取出风险影响数据;
基于预设数据表征方式,确定出每个风险影响数据的风险影响数据表征值;
基于特征数据集合中所有风险影响数据的风险影响数据表征值,生成特征向量。
优选的,S3:基于临床试验数据的所有特征数据集合的特征向量,获得临床试验数据的初评风险等级,包括:
构建出临床试验数据的单个特征数据集合的特征向量的权重矩阵A:
;
其中,,…,/>分别为当前特征向量中第一个、…、第m个风险影响数据表征值对应的风险影响数据与试验对象身体状况之间的预设关联权重,/>,…,/>分别为当前特征向量中第一个、…、第m个风险影响数据表征值对应的风险影响数据对当前临床试验项目的预设影响权重,/>,…,/>分别为当前特征向量中第一个、…、第m个风险影响数据表征值对应的风险影响数据的预设自身权重因子;
基于临床试验数据的所有特征向量和对应的权重矩阵A,搭建出临床试验数据的风险表征矩阵E:
;
其中,为风险表征矩阵E中的第i个行向量,/>为临床试验数据的第i个特征向量,n为临床试验数据的特征向量总数;
基于临床试验数据的风险表征矩阵E,获得临床试验数据的初评风险等级。
优选的,基于临床试验数据的风险表征矩阵E,获得临床试验数据的初评风险等级,包括:
计算出临床试验数据的风险表征矩阵E与每个标准风险等级的标准风险表征矩阵的相似度;
将最大相似度的标准风险表征矩阵对应的标准风险等级,当作临床试验数据的初评风险等级。
优选的,S4:基于临床试验数据中所有风险影响数据在当前临床试验项目的不同试验类别层次对应的预设校正系数,对初评风险等级进行校正,获得临床试验数据的终评风险等级,包括:
基于临床试验数据中所有风险影响数据在当前临床试验项目的不同试验类别层次对应的预设校正系数,计算出初评风险等级的校正系数;
基于校正系数对初评风险等级进行等级校正,获得临床试验数据的终评风险等级。
优选的,基于临床试验数据中所有风险影响数据在当前临床试验项目的不同试验类别层次对应的预设校正系数,计算出初评风险等级的校正系数,包括:
按照类别层次范围从大到小的原则,对当前临床试验项目的所有试验类别层次进行排序,获得每个试验类别层次的排序序数,并将排序序数和最大排序序数的比值当作对应试验类别层次的校正权重;
将临床试验数据中每个风险影响数据在当前临床试验项目的所有试验类别层次对应的预设校正系数和对校正权重的乘积之和,当作对应风险影响数据的子校正系数;
将临床试验数据中所有风险影响数据的子校正系数和风险影响数据的预设校正权重的乘积的均值,当作初评风险等级的校正系数。
优选的,用于评估临床试验风险的方法,还包括:
获取所有监管人员的职能信息和数量信息;
提取临床试验数据中的试验项目信息;
基于试验项目信息、监管人员的职能信息和数量信息以及风险等级信息,为当前临床试验项目分配监管人员,获得监管人员分配结果。
优选的,获得监管人员分配结果之后,包括:
基于监管人员分配结果,生成监管人员分配建议信息;
将监管人员分配建议信息发送至任务管理端。
本发明区别于现有技术的有益效果为:在临床试验数据中提取出特征数据,并构建出特征数据集合,基于特征数据集合确定出表征临床试验数据中有关试验风险的特征向量,实现对临床试验数据中与试验风险有关的风险影响数据的有效提取和特征数据的简化,基于特征向量实现对临床试验风险的初评,其次更进一步地,考虑到临床试验户数据中的风险影响数据对基于当前风险评估基础评估当前临床试验项目在不同试验类别层次下的大量试验的误差,基于其对应的预设校正系数实现对初评风险等级的进一步校正,进而提高了临床试验风险的评估准确度。
本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。
附图说明
附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。在附图中:
图1为本发明实施例中的一种用于评估临床试验风险的方法示意图。
具体实施方式
以下结合附图对本发明的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本发明,并不用于限定本发明。
实施例1:本发明提供了一种用于评估临床试验风险的方法,参考图1,包括:
S1:基于当前临床试验项目(即为当前需要被该实施例中的用于评估临床试验风险的方法进行临床试验风险评估的临床试验项目)的临床试验数据(即为与当前临床试验项目及其最新进行情况相关的数据,例如项目类型、试验者的实时生理状态信息(例如试验者的实时血压情况和血氧情况)、试验进度数据(例如当前已注入药物量))中的特征数据(即为与临床试验风险有关的信息数据,例如:试验者的生理状态数据),构建出临床试验数据的多个特征数据集合(即为包含相同数据类型的特征数据的集合,例如:数据类型可以是离散型数据和连续型数据;又或者数据类型可以根据数据时效性分类,可以分为实时获取的和历史获取的两种,等);
S2:对特征数据集合中的数据进行预处理操作,获取特征数据集合的特征向量(即为对特征数据进行相应处理以获得其对应的向量化表示的结果);
步骤S1和S2在临床试验数据中提取出特征数据,并构建出特征数据集合,基于特征数据集合确定出表征临床试验数据中有关试验风险的特征向量,实现对临床试验数据中与试验风险有关的风险影响数据的有效提取和特征数据的简化;
S3:基于临床试验数据的所有特征数据集合的特征向量,获得临床试验数据的初评风险等级(即为基于临床试验数据中的所有特征数据集合对临床试验进行风险初评后获得的表征其初评风险大小的等级);
步骤S3基于特征向量实现对临床试验风险的初评;
S4:基于临床试验数据中所有风险影响数据在当前临床试验项目的不同试验类别层次(试验类别层次包含从高到低的多个,试验类别层次越高其对应的类别下包含的试验总个数越多,试验类别层次越低其对应的类别下包含的试验总个数越少,例如:按照试验目的分类可以分为临床药理学研究、探索性临床试验、确定性临床试验等,继续按照其试验目的下的不同试验阶段划分,可以划分为临床药理学研究一期、临床药理学研究二期、临床药理学要求三期等)对应的预设校正系数(预设的对属于对应试验类别层次的临床试验的初评风险等级进行校正的校正系数,校正系数是通过对应试验类别层次下的临床试验项目的初评风险等级与人工评价出的风险等级之间的误差确定的),对初评风险等级进行校正,获得临床试验数据的终评风险等级(即为对初评风险等级进行校正后获得的表征当前临床试验的风险等级的等级数值)。
步骤S4更进一步地,考虑到临床试验户数据中的风险影响数据对基于当前风险评估基础评估当前临床试验项目在不同试验类别层次下的大量试验的误差,基于其对应的预设校正系数实现对初评风险等级的进一步校正,进而提高了临床试验风险的评估准确度。
实施例2:在实施例1的基础上,S1:基于当前临床试验项目的临床试验数据中的特征数据,构建出临床试验数据的多个特征数据集合,包括:
在当前临床试验项目的临床试验数据中筛选出非标准格式文本(即为不符合预设标准格式的文本,例如标点负号等不具备具体含义的字符,或者非文字字符),对非标准格式文本进行分词处理(分词处理例如基于最大匹配分词算法),获取若干个实体词组(即为对非标准文本格式进行分词后获得的多个词组);
将实体词组与标准特征词组库(即为预设的包含表征与临床试验风险评估有关的特征数据对应的标准数据类目的词组的词库)中的标准数据类目词组(即为标准特征词组库中包含的表征与临床试验风险评估有关的特征数据对应的标准数据类目的词组)进行匹配,获取实体词组对应的一个或多个标准数据类目词组(即为查询实体词组和标准数据类目词组之间的词义相近度,将与实体词组的词义相近度超出预设的词义相近度阈值的标准数据类目词组,当作实体词组对应的一个或多个标准数据类目词组);
将临床试验数据中的非标准格式文本中所有实体词组对应的一个或多个标准数据类目词组下对应的部分临床试验数据(例如标准数据类目词组为“试验者的血氧数据”,则将该词组下对应的试验者的具体血氧数据当作其标准数据类目词组下对应的部分临床试验数据),当作非标准格式文本的特征数据;
将临床试验数据中标准格式文本(即为符合预设标准格式的文本,预设标准格式例如有不可以是例如标点负号等的不具备具体含义的字符,也不可以是非文字字符)中与标准特征词组库中的标准数据类目词组完全匹配的标准数据类目词组下对应的部分临床试验数据,当作标准格式文本的特征数据;
基于临床试验数据中的所有特征数据,对临床试验者的临床试验数据进行分类,获得临床试验数据的多个特征数据集合。
上述技术通过匹配法在临床试验数据中包含的文本信息中筛选出表征特征数据的类目的词组,并将其词组对应的部分临床试验数据当作特征数据,实现特征数据的准确高效提取,并通过对特征数据的进一步分类获得特征数据集合。
实施例3:在实施例1的基础上,基于临床试验数据中的所有特征数据,对临床试验者的临床试验数据进行分类,获得临床试验数据的多个特征数据集合,包括:
确定出每个特征数据在预设试验数据类型库(即为预设的包含多种临床试验数据类型的实际临床试验数据群的数据库)中每个数据类型的数据群(即为预设试验数据类型库中不同数据类型的数据集群,其中数据类型可以是以数据是否连续的性质为分类标准的各种数据类型,例如离散型数据和连续型数据,或以时效性为分类标准的各种数据类型)中的命中率(即为表征特征数据和每个数据类型的数据群中的每个数据之间的数据重合率,具体计算方式为:确定出其二者之间的重合数据的数据量,将重合数据量和特征数据的数据量的比值,当作特征数据在数据群中对应单项数据中的命中率,并将特征数据在数据群中所有单项数据中的命中率的均值当作特征数据在对应数据类型的数据群中的命中率);
将特征数据在试验数据类型库中命中率最高的数据类型,确定为特征数据的数据类型;
将临床试验数据中数据类型连续相同的特征数据进行汇总,获得多个特征数据集合。
基于特征数据在预设试验数据类型库中每个数据类型的数据群中的命中率确定出特征数据的数据类型,并进一步基于数据类型对特征数据进行汇总,获得特征数据集合,实现特征数据的类型确定和分类汇总。
实施例4:在实施例1的基础上,S2:对特征数据集合中的数据进行预处理操作,获取特征数据集合的特征向量,包括:
基于风险影响数据列表(即为预设的包含预设的风险影响数据的列表),在特征数据集合中提取出风险影响数据;
基于预设数据表征方式(即为每种风险影响数据对应的预设的用单个数值表征其风险影响数据的方式,例如试验者的血氧数据可以表示为0或1,当其在预设的正常范围内时,则将其表示为1,当其超出预设的正常范围时,则将其表示为0),确定出每个风险影响数据的风险影响数据表征值(即为用预设数据表征方式表示风险影响数据时对应的数值);
基于特征数据集合中所有风险影响数据的风险影响数据表征值,生成特征向量(特征向量为由对应特征集合中包含的所有风险影响数据对应的风险影响数据表征值组成的列向量,例如:特征数据集合中所有风险影响数据的风险影响数据表征值有A1,A2,A3,则生成的特征向量为[A1,A2,A3]T)。
上述过程在特征数据中提取出了风险影响数据,并基于预设数据表征方式实现了对风险影响数据的简化数值表示,并进一步地基于风险影响数据表征值实现对特征集合的向量表示。
实施例5:在实施例1的基础上,S3:基于临床试验数据的所有特征数据集合的特征向量,获得临床试验数据的初评风险等级,包括:
构建出临床试验数据的单个特征数据集合的特征向量的权重矩阵A(即为表征特征向量对应的所有风险影响数据对当前临床试验项目的风险等级的影响程度的矩阵):
;
其中,,…,/>分别为当前特征向量中第一个、…、第m个风险影响数据表征值对应的风险影响数据与试验对象身体状况之间的预设关联权重(即为通过预设的关联权重列表确定出的、表征单项风险影响数据对试验对象身体状况的影响程度的数值),/>,…,分别为当前特征向量中第一个、…、第m个风险影响数据表征值对应的风险影响数据对当前临床试验项目的预设影响权重(即为通过预设的影响权重列表确定出的、表征单项风险影响数据对当前临床试验项目的影响程度的数值),/>,…,/>分别为当前特征向量中第一个、…、第m个风险影响数据表征值对应的风险影响数据的预设自身权重因子(通过预设的自身权重因子列表确定出的、表征单项风险影响数据在评估临床试验风险程度时的重要程度的数值);
基于临床试验数据的所有特征向量和对应的权重矩阵A,搭建出临床试验数据的风险表征矩阵E(即为表征临床试验数据体现出的当前临床试验项目的风险程度的矩阵):
;
其中,为风险表征矩阵E中的第i个行向量,/>为临床试验数据的第i个特征向量(特征向量是由对应特征集合中包含的m个风险影响数据对应的风险影响数据表征值组成的列向量),n为临床试验数据的特征向量总数;
基于临床试验数据的风险表征矩阵E,获得临床试验数据的初评风险等级。
上述过程通过构建特征向量的权重矩阵,并基于临床试验数据中所有特征数据集合的特征向量的权重矩阵和特征向量,搭建出临床试验数据的风险表征矩阵,实现了基于临床试验数据对当前临床试验项目的风险程度的准确评估。
实施例6:在实施例5的基础上,基于临床试验数据的风险表征矩阵E,获得临床试验数据的初评风险等级,包括:
计算出临床试验数据的风险表征矩阵E与每个标准风险等级(预设的临床试验的风险等级)的标准风险表征矩阵(即为标准风险等级对应的预设的标准情况下的风险表征矩阵)的相似度(相似度的具体计算方式为:确定出风险表征矩阵与表征风险等级表征矩阵中位置相同数值相同的数值总数,将位置相同数值相同的数值总数与风险表征矩阵的比值,当作其二者的相似度);
将最大相似度的标准风险表征矩阵对应的标准风险等级,当作临床试验数据的初评风险等级。
通过风险表征矩阵的匹配,在标准风险等级中筛选出临床试验数据的初评风险等级,实现对当前临床项目的风险评估,也实现了风险等级的标准化。
实施例7:在实施例1的基础上,S4:基于临床试验数据中所有风险影响数据在当前临床试验项目的不同试验类别层次对应的预设校正系数,对初评风险等级进行校正,获得临床试验数据的终评风险等级,包括:
基于临床试验数据中所有风险影响数据在当前临床试验项目的不同试验类别层次对应的预设校正系数,计算出初评风险等级的校正系数(即为对初评风险等级进行校正时所需要依据的校正系数);
基于校正系数对初评风险等级进行等级校正,获得临床试验数据的终评风险等级。
上述过程考虑到临床试验户数据中的风险影响数据对基于当前风险评估基础评估当前临床试验项目在不同试验类别层次下的大量试验的误差,基于其对应的预设校正系数实现对初评风险等级的进一步校正,进而提高了临床试验风险的评估准确度。
实施例8:在实施例7的基础上,基于临床试验数据中所有风险影响数据在当前临床试验项目的不同试验类别层次对应的预设校正系数,计算出初评风险等级的校正系数,包括:
按照类别层次范围从大到小的原则(类别层次越高其对应的类别层次范围越大,反之亦然,类别层次范围表征符合其对应类别层次的试验数量的大小),对当前临床试验项目的所有试验类别层次进行排序,获得每个试验类别层次的排序序数,并将排序序数和最大排序序数的比值当作对应试验类别层次的校正权重(即表征试验类别层次的预设校正系数在最终确定出的校正系数的重要程度的数值,也是表征试验类别层次在所有试验类别层次中的重要程度的数值);
将临床试验数据中每个风险影响数据在当前临床试验项目的所有试验类别层次对应的预设校正系数和对校正权重的乘积之和,当作对应风险影响数据的子校正系数(即为表征考虑到试验类别层次对应的校正权重时确定出的风险影响数据在对应试验类别层次下的校正系数);
将临床试验数据中所有风险影响数据的子校正系数和风险影响数据的预设校正权重的乘积的均值,当作初评风险等级的校正系数。
上述过程在确定初评风险等级的预设校正系数时考虑到了不同试验类别层次的校正权重,使得最终确定出的初评风险等级的校正系数充分考虑到了风险影响数据对基于当前风险评估基础评估当前临床试验项目在不同试验类别层次下的大量试验的误差,提高了校正系数的准确度。
实施例9:在实施例1的基础上,还包括:
获取所有监管人员的职能信息(例如监管人员负责的工作内容)和数量信息(例如可负责A工作内容的监管人员的总数);
提取临床试验数据中的试验项目信息(例如包含需要监管人员参与的具体试验环节名称);
基于试验项目信息、监管人员的职能信息和数量信息以及风险等级信息,为当前临床试验项目分配监管人员(可以根据管理部门输入的监管分配原则进行分配),获得监管人员分配结果。
基于当前临床试验项目的风险评估结果完成进一步地监管人员分配工作。
实施例10:在实施例9的基础上,获得监管人员分配结果之后,包括:
基于监管人员分配结果,生成监管人员分配建议信息(即为包含监管人员分配结果的信息);
将监管人员分配建议信息发送至任务管理端(即为实际负责监管人员分配工作的部门的通讯端)。
基于监管人员分配结果实现进一步地监管人员分配建议和建议传输。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。
Claims (9)
1.一种用于评估临床试验风险的方法,其特征在于,包括:
S1:基于当前临床试验项目的临床试验数据中的特征数据,构建出临床试验数据的多个特征数据集合;
S2:对特征数据集合中的数据进行预处理操作,获取特征数据集合的特征向量;
S3:基于临床试验数据的所有特征数据集合的特征向量,获得临床试验数据的初评风险等级;
S4:基于临床试验数据中所有风险影响数据在当前临床试验项目的不同试验类别层次对应的预设校正系数,对初评风险等级进行校正,获得临床试验数据的终评风险等级;
其中,S1:基于当前临床试验项目的临床试验数据中的特征数据,构建出临床试验数据的多个特征数据集合,包括:
在当前临床试验项目的临床试验数据中筛选出非标准格式文本,对非标准格式文本进行分词处理,获取若干个实体词组;
将实体词组与标准特征词组库中的标准数据类目词组进行匹配,获取实体词组对应的一个或多个标准数据类目词组;
将临床试验数据中的非标准格式文本中所有实体词组对应的一个或多个标准数据类目词组下对应的部分临床试验数据,当作非标准格式文本的特征数据;
将临床试验数据中标准格式文本中与标准特征词组库中的标准数据类目词组完全匹配的标准数据类目词组下对应的部分临床试验数据,当作标准格式文本的特征数据;
基于临床试验数据中的所有特征数据,对临床试验者的临床试验数据进行分类,获得临床试验数据的多个特征数据集合。
2.根据权利要求1所述的用于评估临床试验风险的方法,其特征在于,基于临床试验数据中的所有特征数据,对临床试验者的临床试验数据进行分类,获得临床试验数据的多个特征数据集合,包括:
确定出每个特征数据在预设试验数据类型库中每个数据类型的数据群中的命中率;
将特征数据在试验数据类型库中命中率最高的数据类型,确定为特征数据的数据类型;
将临床试验数据中数据类型连续相同的特征数据进行汇总,获得多个特征数据集合。
3.根据权利要求1所述的用于评估临床试验风险的方法,其特征在于,S2:对特征数据集合中的数据进行预处理操作,获取特征数据集合的特征向量,包括:
基于风险影响数据列表,在特征数据集合中提取出风险影响数据;
基于预设数据表征方式,确定出每个风险影响数据的风险影响数据表征值;
基于特征数据集合中所有风险影响数据的风险影响数据表征值,生成特征向量。
4.根据权利要求1所述的用于评估临床试验风险的方法,其特征在于,S3:基于临床试验数据的所有特征数据集合的特征向量,获得临床试验数据的初评风险等级,包括:
构建出临床试验数据的单个特征数据集合的特征向量的权重矩阵A:
;
其中,,…,/>分别为当前特征向量中第一个、…、第m个风险影响数据表征值对应的风险影响数据与试验对象身体状况之间的预设关联权重,/>,…,/>分别为当前特征向量中第一个、…、第m个风险影响数据表征值对应的风险影响数据对当前临床试验项目的预设影响权重,/>,…,/>分别为当前特征向量中第一个、…、第m个风险影响数据表征值对应的风险影响数据的预设自身权重因子;
基于临床试验数据的所有特征向量和对应的权重矩阵A,搭建出临床试验数据的风险表征矩阵E:
;
;
其中,为风险表征矩阵E中的第i个行向量,/>为临床试验数据的第i个特征向量,n为临床试验数据的特征向量总数;
基于临床试验数据的风险表征矩阵E,获得临床试验数据的初评风险等级。
5.根据权利要求4所述的用于评估临床试验风险的方法,其特征在于,基于临床试验数据的风险表征矩阵E,获得临床试验数据的初评风险等级,包括:
计算出临床试验数据的风险表征矩阵E与每个标准风险等级的标准风险表征矩阵的相似度;
将最大相似度的标准风险表征矩阵对应的标准风险等级,当作临床试验数据的初评风险等级。
6.根据权利要求1所述的用于评估临床试验风险的方法,其特征在于,S4:基于临床试验数据中所有风险影响数据在当前临床试验项目的不同试验类别层次对应的预设校正系数,对初评风险等级进行校正,获得临床试验数据的终评风险等级,包括:
基于临床试验数据中所有风险影响数据在当前临床试验项目的不同试验类别层次对应的预设校正系数,计算出初评风险等级的校正系数;
基于校正系数对初评风险等级进行等级校正,获得临床试验数据的终评风险等级。
7.根据权利要求6所述的用于评估临床试验风险的方法,其特征在于,基于临床试验数据中所有风险影响数据在当前临床试验项目的不同试验类别层次对应的预设校正系数,计算出初评风险等级的校正系数,包括:
按照类别层次范围从大到小的原则,对当前临床试验项目的所有试验类别层次进行排序,获得每个试验类别层次的排序序数,并将排序序数和最大排序序数的比值当作对应试验类别层次的校正权重;
将临床试验数据中每个风险影响数据在当前临床试验项目的所有试验类别层次对应的预设校正系数和对校正权重的乘积之和,当作对应风险影响数据的子校正系数;
将临床试验数据中所有风险影响数据的子校正系数和风险影响数据的预设校正权重的乘积的均值,当作初评风险等级的校正系数。
8.根据权利要求1所述的用于评估临床试验风险的方法,其特征在于,还包括:
获取所有监管人员的职能信息和数量信息;
提取临床试验数据中的试验项目信息;
基于试验项目信息、监管人员的职能信息和数量信息以及风险等级信息,为当前临床试验项目分配监管人员,获得监管人员分配结果。
9.根据权利要求8所述的用于评估临床试验风险的方法,其特征在于,获得监管人员分配结果之后,包括:
基于监管人员分配结果,生成监管人员分配建议信息;
将监管人员分配建议信息发送至任务管理端。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311226278.6A CN116975297B (zh) | 2023-09-22 | 2023-09-22 | 一种用于评估临床试验风险的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311226278.6A CN116975297B (zh) | 2023-09-22 | 2023-09-22 | 一种用于评估临床试验风险的方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116975297A true CN116975297A (zh) | 2023-10-31 |
CN116975297B CN116975297B (zh) | 2023-12-01 |
Family
ID=88483457
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311226278.6A Active CN116975297B (zh) | 2023-09-22 | 2023-09-22 | 一种用于评估临床试验风险的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116975297B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117573812A (zh) * | 2024-01-16 | 2024-02-20 | 中国中医科学院西苑医院 | 临床试验数据处理方法、装置及相关设备 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106874663A (zh) * | 2017-01-26 | 2017-06-20 | 中电科软件信息服务有限公司 | 心脑血管疾病风险预测方法及系统 |
CN110516073A (zh) * | 2019-08-30 | 2019-11-29 | 北京百度网讯科技有限公司 | 一种文本分类方法、装置、设备和介质 |
US20200365239A1 (en) * | 2019-05-16 | 2020-11-19 | Hcl Technologies Limited | System and method for generating clinical trial protocol design document with selection of patient and investigator |
CN112908436A (zh) * | 2021-02-09 | 2021-06-04 | 北京药明津石医药科技有限公司 | 临床试验数据结构化方法、临床试验推荐方法和装置 |
CN113159502A (zh) * | 2020-06-23 | 2021-07-23 | 上海用正医药科技有限公司 | 用于评估临床试验风险的方法 |
-
2023
- 2023-09-22 CN CN202311226278.6A patent/CN116975297B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106874663A (zh) * | 2017-01-26 | 2017-06-20 | 中电科软件信息服务有限公司 | 心脑血管疾病风险预测方法及系统 |
US20200365239A1 (en) * | 2019-05-16 | 2020-11-19 | Hcl Technologies Limited | System and method for generating clinical trial protocol design document with selection of patient and investigator |
CN110516073A (zh) * | 2019-08-30 | 2019-11-29 | 北京百度网讯科技有限公司 | 一种文本分类方法、装置、设备和介质 |
CN113159502A (zh) * | 2020-06-23 | 2021-07-23 | 上海用正医药科技有限公司 | 用于评估临床试验风险的方法 |
CN112908436A (zh) * | 2021-02-09 | 2021-06-04 | 北京药明津石医药科技有限公司 | 临床试验数据结构化方法、临床试验推荐方法和装置 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117573812A (zh) * | 2024-01-16 | 2024-02-20 | 中国中医科学院西苑医院 | 临床试验数据处理方法、装置及相关设备 |
CN117573812B (zh) * | 2024-01-16 | 2024-03-29 | 中国中医科学院西苑医院 | 临床试验数据处理方法、装置及相关设备 |
Also Published As
Publication number | Publication date |
---|---|
CN116975297B (zh) | 2023-12-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN116975297B (zh) | 一种用于评估临床试验风险的方法 | |
Franco et al. | Discrimination comes in layers: Dimensions of discrimination and mental health for multiracial people. | |
Edelen et al. | Quantifying ‘problematic’DIF within an IRT framework: Application to a cancer stigma index | |
Sanfilippo et al. | Trial sequential analysis: the evaluation of the robustness of meta-analyses findings and the need for further research | |
CN112598184B (zh) | 一种戒毒人员复吸风险预测的方法和装置 | |
Ashraf et al. | Classical and modern methods in item analysis of test tools | |
Hoijtink | The measurement of latent traits by proximity items | |
CN109102888A (zh) | 一种人体健康评分方法 | |
Richetelli et al. | Forensic footwear reliability: part III—positive predictive value, error rates, and inter‐rater reliability | |
Li | A modified higher-order DINA model for detecting differential item functioning and differential attribute functioning | |
CN111951924A (zh) | 一种异常用药行为检测方法及系统 | |
Crosby | Implications of prior probability elicitation on auditor sample size decisions | |
Yovanoff et al. | Determining cutoff scores on a developmental screening measure: Use of receiver operating characteristics and item response theory | |
Qiu et al. | An online test for goodness-of-fit in logistic regression model | |
CN108334727B (zh) | 一种评价毒理学数据可靠性的方法及系统 | |
CN111369140B (zh) | 一种教学评价系统及方法 | |
CN116350203B (zh) | 一种体质测试数据处理方法及系统 | |
CN112151174A (zh) | 一种基于体检数据的用户健康信息分析方法、系统 | |
CN115035974B (zh) | 一种心理测评数据管理系统及方法 | |
CN116051053A (zh) | 一种科技项目申报流程精细化管理系统 | |
CN116167659A (zh) | 一种碳市场碳排放数据质量评价方法 | |
CN114420289A (zh) | 眼健康指数评估系统 | |
CN114693587A (zh) | 眼底图像的数据标注的质量控制方法及质量控制系统 | |
CN113555124A (zh) | 一种基于机器学习的血常规样本差值核查方法 | |
JP2018142248A (ja) | 答案採点システム及び答案採点方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |