CN115662554A - 一种多组学临床试验受试者匹配方法及装置 - Google Patents

一种多组学临床试验受试者匹配方法及装置 Download PDF

Info

Publication number
CN115662554A
CN115662554A CN202211688448.8A CN202211688448A CN115662554A CN 115662554 A CN115662554 A CN 115662554A CN 202211688448 A CN202211688448 A CN 202211688448A CN 115662554 A CN115662554 A CN 115662554A
Authority
CN
China
Prior art keywords
data
clinical
potential
subjects
list
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211688448.8A
Other languages
English (en)
Inventor
徐全
刘跃跃
李飞虹
黄晓倩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Qiuzhen Medical Equipment Co ltd
Original Assignee
Beijing Qiuzhen Medical Equipment Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Qiuzhen Medical Equipment Co ltd filed Critical Beijing Qiuzhen Medical Equipment Co ltd
Priority to CN202211688448.8A priority Critical patent/CN115662554A/zh
Publication of CN115662554A publication Critical patent/CN115662554A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Medical Treatment And Welfare Office Work (AREA)

Abstract

本发明提供了一种多组学临床试验受试者匹配方法及装置,对原始临床试验数据进行处理,得到结构化的入排标准数据,并在获取临床试验潜在受试者的临床信息以及多组学检测结果数据之后,通过将潜在受试者的临床信息以及多组学检测结果数据分别与入排标准数据进行匹配,实现试验与受试者之间的双向精准匹配,有效提高了受试者筛选效率,从而提升了受试者的招募效率。

Description

一种多组学临床试验受试者匹配方法及装置
技术领域
本发明涉及计算机技术领域,更具体的,涉及一种多组学临床试验受试者匹配方法及装置。
背景技术
多组学基因检测技术近些年有了急速的发展,并且在临床上得到了广泛的应用。基于组学标志物设计的临床试验也越来越多,尤其在肿瘤的精准治疗领域,最经典的有篮式试验(Basket Trial)和伞式试验(Umbrella Trial)。组学标志物的引入,使得包括肿瘤在内的多种疾病诊疗效果得到了显著的提升。但与此同时,也使得试验设计变得更加复杂,入排条件更加多样。
目前一般通过人工或半人工的方式筛选符合入排条件的受试者,这些工作需要大量的人力,受试者的筛选所需时间较长,容易造成错漏,导致受试者的招募也变得更加困难,周期也更长了。
发明内容
有鉴于此,本发明提供了一种多组学临床试验受试者匹配方法及装置,实现试验与受试者之间的双向精准匹配,有效提高了受试者筛选效率,从而提升了受试者的招募效率。
为了实现上述发明目的,本发明提供的具体技术方案如下:
第一方面,本发明实施例提供了一种多组学临床试验受试者匹配方法,包括:
获取原始临床试验数据,并对所述原始临床试验数据进行处理,得到结构化的入排标准数据;
获取临床试验潜在受试者的临床信息以及多组学检测结果数据;
将潜在受试者的临床信息以及多组学检测结果数据分别与所述入排标准数据进行匹配,确定临床信息以及多组学检测结果数据均符合入排标准的目标潜在受试者。
在一些实施例中,所述获取原始临床试验数据,并对所述原始临床试验数据进行处理,得到结构化的入排标准数据,包括:
获取所述原始临床试验数据;
对所述原始临床试验数据进行解析,得到结构化的元信息;
利用自然语言处理技术,对所述元信息进行实体标注、入排标准标注以及标准化处理,得到结构化的所述入排标准数据。
在一些实施例中,在得到结构化的所述入排标准数据之后,所述方法还包括:
响应于入排标准编辑指令,根据所述入排标准编辑指令对所述入排标准数据进行修改或补充。
在一些实施例中,所述将潜在受试者的临床信息以及多组学检测结果数据分别与所述入排标准数据进行匹配,确定临床信息以及多组学检测结果数据均符合入排标准的目标潜在受试者,包括:
将潜在受试者的多组学检测结果与所述入排标准数据中的组学数据实体进行匹配,从潜在受试者中筛选出第一潜在受试者列表;
根据所述入排标准数据中的组学数据条件间的逻辑关系以及各自所属的入组或排除类别,从所述第一潜在受试者列表中筛选出第二潜在受试者列表;
将所述第二潜在受试者列表中的潜在受试者的临床信息与所述入排标准数据中的临床数据实体进行匹配,从所述第二潜在受试者列表中筛选出第三潜在受试者列表;
根据所述入排标准数据中的临床条件间的逻辑关系以及各自所属的入组或排除类别,从所述第三潜在受试者列表中筛选出第四潜在受试者列表,得到所述目标潜在受试者。
在一些实施例中,所述将潜在受试者的临床信息以及多组学检测结果数据分别与所述入排标准数据进行匹配,确定临床信息以及多组学检测结果数据均符合入排标准的目标潜在受试者,包括:
将潜在受试者的临床信息与所述入排标准数据中的临床数据实体进行匹配,从潜在受试者中筛选出第五潜在受试者列表;
根据所述入排标准数据中的临床条件间的逻辑关系以及各自所属的入组或排除类别,从所述第五潜在受试者列表中筛选出第六潜在受试者列表;
将所述第六潜在受试者列表中的潜在受试者的多组学检测结果与所述入排标准数据中的组学数据实体进行匹配,从所述第六潜在受试者列表中筛选出第七潜在受试者列表;
根据所述入排标准数据中的组学数据条件间的逻辑关系以及各自所属的入组或排除类别,从所述第七潜在受试者列表中筛选出第八潜在受试者列表,得到所述目标潜在受试者。
在一些实施例中,在确定临床信息以及多组学检测结果数据均符合入排标准的目标潜在受试者之后,所述方法还包括:
将所述目标潜在受试者的数量发送到研究者端;
将所述目标潜在受试者的临床信息以及多组学检测结果数据发送到医生端;
将所述目标潜在受试者的临床信息以及多组学检测结果数据发送到相应的受试者端。
在一些实施例中,所述方法还包括:
在接收到所述医生端或所述受试者端提交的评估申请的情况下,将所述评估申请发送到所述研究者端,所述评估申请是在所述医生端或所述受试者端对所述目标潜在受试者进行人工筛选后提交的,包括人工筛选后确定的潜在受试者的临床信息以及多组学检测结果数据。
在一些实施例中,在将所述评估申请发送到所述研究者端之后,所述方法还包括:
在接收到所述研究者端发送的通过申请列表的情况下,将所述通过申请列表中的潜在受试者加入目标临床试验列表中。
在一些实施例中,所述方法还包括:
按照预设第一维度对所述入排标准数据进行统计分析;
按照预设第二维度对潜在受试者的临床信息以及多组学检测结果数据进行统计分析;
按照预设第三维度对所述目标潜在受试者进行统计分析。
第二方面,本发明实施例提供了一种多组学临床试验受试者匹配装置,包括:
试验数据处理单元,用于获取原始临床试验数据,并对所述原始临床试验数据进行处理,得到结构化的入排标准数据;
样本数据获取单元,用于获取临床试验潜在受试者的临床信息以及多组学检测结果数据;
双向匹配单元,用于将潜在受试者的临床信息以及多组学检测结果数据分别与所述入排标准数据进行匹配,确定临床信息以及多组学检测结果数据均符合入排标准的目标潜在受试者。
在一些实施例中,所述试验数据处理单元,具体用于:
获取所述原始临床试验数据;
对所述原始临床试验数据进行解析,得到结构化的元信息;
利用自然语言处理技术,对所述元信息进行实体标注、入排标准标注以及标准化处理,得到结构化的所述入排标准数据。
在一些实施例中,所述试验数据处理单元,还用于在得到结构化的所述入排标准数据之后,响应于入排标准编辑指令,根据所述入排标准编辑指令对所述入排标准数据进行修改或补充。
在一些实施例中,所述双向匹配单元,具体用于:
将潜在受试者的多组学检测结果与所述入排标准数据中的组学数据实体进行匹配,从潜在受试者中筛选出第一潜在受试者列表;
根据所述入排标准数据中的组学数据条件间的逻辑关系以及各自所属的入组或排除类别,从所述第一潜在受试者列表中筛选出第二潜在受试者列表;
将所述第二潜在受试者列表中的潜在受试者的临床信息与所述入排标准数据中的临床数据实体进行匹配,从所述第二潜在受试者列表中筛选出第三潜在受试者列表;
根据所述入排标准数据中的临床条件间的逻辑关系以及各自所属的入组或排除类别,从所述第三潜在受试者列表中筛选出第四潜在受试者列表,得到所述目标潜在受试者。
在一些实施例中,所述双向匹配单元,具体用于:
将潜在受试者的临床信息与所述入排标准数据中的临床数据实体进行匹配,从潜在受试者中筛选出第五潜在受试者列表;
根据所述入排标准数据中的临床条件间的逻辑关系以及各自所属的入组或排除类别,从所述第五潜在受试者列表中筛选出第六潜在受试者列表;
将所述第六潜在受试者列表中的潜在受试者的多组学检测结果与所述入排标准数据中的组学数据实体进行匹配,从所述第六潜在受试者列表中筛选出第七潜在受试者列表;
根据所述入排标准数据中的组学数据条件间的逻辑关系以及各自所属的入组或排除类别,从所述第七潜在受试者列表中筛选出第八潜在受试者列表,得到所述目标潜在受试者。
在一些实施例中,所述装置还包括:
匹配数据发送单元,用于将所述目标潜在受试者的数量发送到研究者端;将所述目标潜在受试者的临床信息以及多组学检测结果数据发送到医生端;将所述目标潜在受试者的临床信息以及多组学检测结果数据发送到相应的受试者端。
在一些实施例中,所述装置还包括:
评估申请收发单元,用于在接收到所述医生端或所述受试者端提交的评估申请的情况下,将所述评估申请发送到所述研究者端,所述评估申请是在所述医生端或所述受试者端对所述目标潜在受试者进行人工筛选后提交的,包括人工筛选后确定的潜在受试者的临床信息以及多组学检测结果数据。
在一些实施例中,所述装置还包括:
临床试验列表确定单元,用于在接收到所述研究者端发送的通过申请列表的情况下,将所述通过申请列表中的潜在受试者加入目标临床试验列表中。
在一些实施例中,所述装置还包括:
统计分析单元,用于按照预设第一维度对所述入排标准数据进行统计分析;按照预设第二维度对潜在受试者的临床信息以及多组学检测结果数据进行统计分析;按照预设第三维度对所述目标潜在受试者进行统计分析。
相对于现有技术,本发明的有益效果如下:
本发明公开的一种多组学临床试验受试者匹配方法及装置,对原始临床试验数据进行处理,得到结构化的入排标准数据,并在获取临床试验潜在受试者的临床信息以及多组学检测结果数据之后,通过将潜在受试者的临床信息以及多组学检测结果数据分别与入排标准数据进行匹配,实现试验与受试者之间的双向精准匹配,有效提高了受试者筛选效率,从而提升了受试者的招募效率。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本发明实施例公开的一种多组学临床试验受试者匹配方法的流程示意图;
图2为本发明实施例公开的一种多组学临床试验受试者匹配方法的部分方法流程示意图;
图3为本发明实施例公开的一种多组学临床试验受试者匹配方法的部分方法流程示意图;
图4为本发明实施例公开的一种多组学临床试验受试者匹配方法的部分方法流程示意图;
图5为本发明实施例公开的一种多组学临床试验受试者匹配装置的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明提供的一种多组学临床试验受试者匹配方法,应用于试验与受试者之间双向匹配的场景,从而根据试验与受试者的匹配结果招募受试者。
请参阅图1,本实施例公开的一种多组学临床试验受试者匹配方法,具体包括以下步骤:
S101:获取原始临床试验数据,并对原始临床试验数据进行处理,得到结构化的入排标准数据;
具体的,通过从临床试验数据源批量下载临床试验数据,获取原始临床试验数据,并对原始临床诗句进行解析、识别、标准化处理等,得到结构化的入排标准数据。
结构化的入排标准数据包括:入排标准条件对应的生物医学实体、入排标准条件之间的逻辑关系、入排类别等。其中,入排标准条件对应的生物医学实体包括组学数据实体(如基因、变异等)和临床数据实体(如疾病、药物等)。入排标准条件之间的逻辑关系包括:组学数据条件间的逻辑关系和临床条件间的逻辑关系,逻辑关系包括:and(与)、or(或)、not(非)。入排类别包括:入组、排除类别。
S102:获取临床试验潜在受试者的临床信息以及多组学检测结果数据;
具体的,通过连接多组学检测结果解读系统,获取临床验潜在受试者的临床信息以及多组学检测结果数据,其中,多组学检测结果解读系统为现有系统,存储有样本的多组学检测结果数据以及潜在受试者的临床信息,临床信息包括:编号、性别、年龄、临床诊断、用药史、疾病史、家族史、送检医生等,多组学检测结果数据包括:基因点突变、拷贝数变异、结构变异等基因组变异、基因转录或表达水平的变异,以及表观遗传学变异等。
S103:将潜在受试者的临床信息以及多组学检测结果数据分别与入排标准数据进行匹配,确定临床信息以及多组学检测结果数据均符合入排标准的目标潜在受试者。
即将潜在受试者的临床信息与入排标准数据进行匹配,将潜在受试者的多组学检测结果数据与入排标准数据进行匹配,得到临床信息以及多组学检测结果数据均符合入排标准的目标潜在受试者。
可见,本实施例公开的一种多组学临床试验受试者匹配方法,对原始临床试验数据进行处理,得到结构化的入排标准数据,并在获取临床试验潜在受试者的临床信息以及多组学检测结果数据之后,通过将潜在受试者的临床信息以及多组学检测结果数据分别与入排标准数据进行匹配,实现试验与受试者之间的双向精准匹配,有效提高了受试者筛选效率,从而提升了受试者的招募效率。
请参阅图2,本实施例公开了上述实施例中S101的一种可选实现方式,具体包括:
S201:获取原始临床试验数据;
原始临床试验数据可以是从ClinicalTrials.gov数据库批量下载的AllAPIXML.zip数据文件,AllAPIXML.zip数据文件是一系列XML格式文件组成的压缩包,经过解压缩处理后得到几十万个XML格式的文件,每一个文件记录了一个临床试验的信息。
S202:对原始临床试验数据进行解析,得到结构化的元信息;
对上述解压得到的XML格式的数据文件进行解析,提取出数据信息,并转化为结构化的元信息,以及BioC格式。
其中,结构化的元信息是tsv格式的文本数据,记录了每一个临床试验的基础信息,如NCTID,简要标题、详细标题、简要说明、详细描述、期别、招聘状态、各节点起始日期和终止日期等等,同时也包括临床试验中心相关信息,如中心名称、国别、省份/州、城市、邮编、联系人、联系方式等字段信息。BioC格式的数据交互格式是一种由National Centerfor Biotechnology Information(NCBI,美国国家生物信息中心)创造的一种生物医学文本处理及交互格式,包含基于XML和基于JSON的两种具体格式,在本实施例中,可以选择其中的JSON格式,即BioC-JSON格式。
S203:利用自然语言处理技术,对元信息进行实体标注、入排标准标注以及标准化处理,得到结构化的入排标准数据。
自然语言处理技术(Natural Language Processing,NLP)可以为DNorm,GNormPlus, tmVar, tmChem, Criteria2Query等,本实施例不做具体限定。
利用自然语言处理技术对BioC-JSON格式的元信息中各试验中涉及到的各类生物医学实体和入排标准进行自动化实体标注,标注结果同步进行标准化处理,处理完毕的结果更新至BioC-JSON中进行存储,即得到结构化的入排标准数据。
其中,标准化处理具体包括:根据预先构建的非标准词条与标准词条之间的映射关系表,将标注结果中的非标准词条转化为标准词条。例如HER2这个基因,临床上很常用,但是在科学领域,它并不是标准的基因符号,HER2对应的标准符号为ERBB2,通过标准化处理,将HER2转化为ERBB2。可以理解的是,如果不做标准化处理,如果有的临床试验中该基因用ERBB2表示,有的用HER2表示,那后续的程序就无法知道这两个基因实际上表示的是同一个基因,也就不能更准确地构建上层应用。
进一步,为了提高入排标准数据的准确性,在得到结构化的入排标准数据之后,还可以对BioC-JSON格式的入排标准数据进行渲染,渲染成HTML的格式在浏览器中进行展示,对其中标注出来的实体进行高亮显示,标注人员可在浏览器中对标注结果进行审核,通过发送入排标准编辑指令,对标注有误或者有遗漏的地方进行修改或补充,修改或补充后的数据再以BioC-JSON格式进行存储。完成当前临床试验全部标注结果的校验后,点击提交即可完成校验操作,在有必要的时候,可以设置多人进行多重校验,即按照预设顺序多个标注人依次进行校验,完成全部标注结果的校验,以更好地确保标注结果的准确性。
请参阅图3,本实施例公开了上述实施例中S103的一种可选实现方式,具体包括:
S301:将潜在受试者的多组学检测结果与入排标准数据中的组学数据实体进行匹配,从潜在受试者中筛选出第一潜在受试者列表;
具体的,将潜在受试者的多组学检测结果与入排标准数据中的基因点突变、拷贝数变异、结构变异等基因组变异、基因转录或表达水平的变异,以及表观遗传学变异等与入排标准数据中的组学数据实体进行匹配。
S302:根据入排标准数据中的组学数据条件间的逻辑关系以及各自所属的入组或排除类别,从第一潜在受试者列表中筛选出第二潜在受试者列表;
S303:将第二潜在受试者列表中的潜在受试者的临床信息与入排标准数据中的临床数据实体进行匹配,从第二潜在受试者列表中筛选出第三潜在受试者列表;
具体的,将第二潜在受试者列表中的潜在受试者的临床信息中的年龄、性别、用药史、疾病分期等信息与入排标准数据中的临床数据实体进行匹配。
S304:根据入排标准数据中的临床条件间的逻辑关系以及各自所属的入组或排除类别,从第三潜在受试者列表中筛选出第四潜在受试者列表,得到目标潜在受试者。
例如,在第一潜在受试者列表中的的潜在受试者有的有HER2蛋白表达、有的有EGFR基因的突变,有的既有HER2蛋白表达又有EGFR基因的突变。若某个临床试验要求患者要有HER2蛋白表达,同时要有EGFR基因的突变,则入排标准数据中的组学数据条件间的逻辑关系为(HER2表达阳性 and EGFR基因突变),若某个临床试验要求患者要有HER2蛋白表达,或者有EGFR基因的突变,则入排标准数据中的组学数据条件间的逻辑关系为(HER2表达阳性 or EGFR基因突变)。不同的逻辑关系,可以用户判定患者是否适合于当前临床试验。比如某患者a,检测出了HER2基因表达,但是没有EGFR基因突变,那对应逻辑关系为“and”的,就不匹配了,而对于逻辑关系为“or”则是匹配的。
入排标准数据中的临床条件间的逻辑关系与组学数据条件间的逻辑关系同理,例如临床试验涉及的各种疾病等临床数据实体之间的逻辑关系是and、or、还是not的关系。
请参阅图4,本实施例公开了上述实施例中S103的另一种可选实现方式,具体包括:
S401:将潜在受试者的临床信息与入排标准数据中的临床数据实体进行匹配,从潜在受试者中筛选出第五潜在受试者列表;
S402:根据入排标准数据中的临床条件间的逻辑关系以及各自所属的入组或排除类别,从第五潜在受试者列表中筛选出第六潜在受试者列表;
S403:将第六潜在受试者列表中的潜在受试者的多组学检测结果与入排标准数据中的组学数据实体进行匹配,从第六潜在受试者列表中筛选出第七潜在受试者列表;
S404:根据入排标准数据中的组学数据条件间的逻辑关系以及各自所属的入组或排除类别,从第七潜在受试者列表中筛选出第八潜在受试者列表,得到目标潜在受试者。
本实施例中的将潜在受试者的临床信息与入排标准数据进行匹配的实现方式,将潜在受试者的多组学检测结果数据与入排标准数据进行匹配的实现方式,请参阅图3对应的实施例,这里不再赘述。
进一步,本发明提供的一种多组学临床试验受试者匹配方法对应的系统还包括研究者端、医生端和受试者端。其中,研究者端可供研究者方登录系统,对系统收录的临床试验信息进行维护,或者添加暂未收录的临床试验信息,信息包括但不限于:临床试验基础信息、入排标准描述信息和结构化信息、研究中心信息(中心名称、地点、联系人、联系方式等)等。同时,也可以查看系统中匹配上的潜在受试者的数量。医生端可供医生方登录系统,对系统中收录的潜在受试者信息进行维护,或者添加暂未收录的潜在受试者信息,信息包括但不限于:潜在受试者临床信息(如编号、性别、年龄、临床诊断)以及组学检测结果数据(如基因点突变、拷贝数变异、结构变异等基因组变异,以及基因转录/表达水平的变异和表观遗传学变异等)等。同时,也可以查看到各个潜在受试者符合条件的临床试验列表,并可详细查看各潜在受试者与各临床试验的详细匹配情况。受试者端功能类似于医生端亚模块,区别在于,潜在受试者端亚模块只能添加或编辑自己的信息,而医生端亚模块在经过授权认证后,可以管理自己患者的信息。
在此基础上,在确定临床信息以及多组学检测结果数据均符合入排标准的目标潜在受试者之后,还可以将目标潜在受试者的数量发送到研究者端,将目标潜在受试者的临床信息以及多组学检测结果数据发送到医生端,将目标潜在受试者的临床信息以及多组学检测结果数据发送到相应的受试者端。
医生端和受试者端可以对各样本匹配上的临床试验进行筛选,即对潜在目标临床试验列表进行人工筛选,并在系统中提交评估申请,研究者端可以查看到本机构临床试验所收到的评估申请,并查看该评估申请对应的潜在受试者的全部信息(除个人ID信息外,如姓名、身份证号、手机号等),结合该临床试验的入排条件进行进一步的评估,初步判断潜在受试者是否符合入组条件,是的话选择通过申请,该试验进入到最终的目标临床试验列表中,且随后双方可以线下联系,进一步确定入组相关事宜;否的话即中止匹配工作,该临床试验不会进入到最终的目标临床试验列表中。
在本实施例中,上述每次筛选得到的潜在受试者列表均在系统中记录,医生端和受试者端的用户可以随时回顾列表中的临床试验,并可从中捞出特定的临床试验,放到最终的目标临床试验中,并可为此填写加入理由,以补充目标临床试验列表。
进一步,本实施例还可以按照预设第一维度对入排标准数据进行统计分析,按照预设第二维度对潜在受试者的临床信息以及多组学检测结果数据进行统计分析,按照预设第三维度对目标潜在受试者进行统计分析。例如对入排标准进行统计分析,包括但不限于疾病、基因、变异、药物/化合物等,以及各自入组或排除标准分类,对潜在受试者的临床信息和多组学检测结果数据进行统计分析,对匹配结果进行综合统计分析,这些不同维度的统计分析可以为后续更精准的临床试验设计提供数据支撑。
基于上述实施例公开的一种多组学临床试验受试者匹配方法,本实施例对应公开了一种多组学临床试验受试者匹配装置,请参阅图5,该装置包括:
试验数据处理单元501,用于获取原始临床试验数据,并对所述原始临床试验数据进行处理,得到结构化的入排标准数据;
样本数据获取单元502,用于获取临床试验潜在受试者的临床信息以及多组学检测结果数据;
双向匹配单元503,用于将潜在受试者的临床信息以及多组学检测结果数据分别与所述入排标准数据进行匹配,确定临床信息以及多组学检测结果数据均符合入排标准的目标潜在受试者。
在一些实施例中,所述试验数据处理单元501,具体用于:
获取所述原始临床试验数据;
对所述原始临床试验数据进行解析,得到结构化的元信息;
利用自然语言处理技术,对所述元信息进行实体标注、入排标准标注以及标准化处理,得到结构化的所述入排标准数据。
在一些实施例中,所述试验数据处理单元501,还用于在得到结构化的所述入排标准数据之后,响应于入排标准编辑指令,根据所述入排标准编辑指令对所述入排标准数据进行修改或补充。
在一些实施例中,所述双向匹配单元503,具体用于:
将潜在受试者的多组学检测结果与所述入排标准数据中的组学数据实体进行匹配,从潜在受试者中筛选出第一潜在受试者列表;
根据所述入排标准数据中的组学数据条件间的逻辑关系以及各自所属的入组或排除类别,从所述第一潜在受试者列表中筛选出第二潜在受试者列表;
将所述第二潜在受试者列表中的潜在受试者的临床信息与所述入排标准数据中的临床数据实体进行匹配,从所述第二潜在受试者列表中筛选出第三潜在受试者列表;
根据所述入排标准数据中的临床条件间的逻辑关系以及各自所属的入组或排除类别,从所述第三潜在受试者列表中筛选出第四潜在受试者列表,得到所述目标潜在受试者。
在一些实施例中,所述双向匹配单元503,具体用于:
将潜在受试者的临床信息与所述入排标准数据中的临床数据实体进行匹配,从潜在受试者中筛选出第五潜在受试者列表;
根据所述入排标准数据中的临床条件间的逻辑关系以及各自所属的入组或排除类别,从所述第五潜在受试者列表中筛选出第六潜在受试者列表;
将所述第六潜在受试者列表中的潜在受试者的多组学检测结果与所述入排标准数据中的组学数据实体进行匹配,从所述第六潜在受试者列表中筛选出第七潜在受试者列表;
根据所述入排标准数据中的组学数据条件间的逻辑关系以及各自所属的入组或排除类别,从所述第七潜在受试者列表中筛选出第八潜在受试者列表,得到所述目标潜在受试者。
在一些实施例中,所述装置还包括:
匹配数据发送单元,用于将所述目标潜在受试者的数量发送到研究者端;将所述目标潜在受试者的临床信息以及多组学检测结果数据发送到医生端;将所述目标潜在受试者的临床信息以及多组学检测结果数据发送到相应的受试者端。
在一些实施例中,所述装置还包括:
评估申请收发单元,用于在接收到所述医生端或所述受试者端提交的评估申请的情况下,将所述评估申请发送到所述研究者端,所述评估申请是在所述医生端或所述受试者端对所述目标潜在受试者进行人工筛选后提交的,包括人工筛选后确定的潜在受试者的临床信息以及多组学检测结果数据。
在一些实施例中,所述装置还包括:
临床试验列表确定单元,用于在接收到所述研究者端发送的通过申请列表的情况下,将所述通过申请列表中的潜在受试者加入目标临床试验列表中。
在一些实施例中,所述装置还包括:
统计分析单元,用于按照预设第一维度对所述入排标准数据进行统计分析;按照预设第二维度对潜在受试者的临床信息以及多组学检测结果数据进行统计分析;按照预设第三维度对所述目标潜在受试者进行统计分析。
本实施例公开的一种多组学临床试验受试者匹配装置,对原始临床试验数据进行处理,得到结构化的入排标准数据,并在获取临床试验潜在受试者的临床信息以及多组学检测结果数据之后,通过将潜在受试者的临床信息以及多组学检测结果数据分别与入排标准数据进行匹配,实现试验与受试者之间的双向精准匹配,有效提高了受试者筛选效率,从而提升了受试者的招募效率。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。
上述各个实施例之间可任意组合,对所公开的实施例的上述说明,本说明书中各实施例中记载的特征可以相互替换或者组合,使本领域专业技术人员能够实现或使用本申请。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (10)

1.一种多组学临床试验受试者匹配方法,其特征在于,包括:
获取原始临床试验数据,并对所述原始临床试验数据进行处理,得到结构化的入排标准数据;
获取临床试验潜在受试者的临床信息以及多组学检测结果数据;
将潜在受试者的临床信息以及多组学检测结果数据分别与所述入排标准数据进行匹配,确定临床信息以及多组学检测结果数据均符合入排标准的目标潜在受试者。
2.根据权利要求1所述的方法,其特征在于,所述获取原始临床试验数据,并对所述原始临床试验数据进行处理,得到结构化的入排标准数据,包括:
获取所述原始临床试验数据;
对所述原始临床试验数据进行解析,得到结构化的元信息;
利用自然语言处理技术,对所述元信息进行实体标注、入排标准标注以及标准化处理,得到结构化的所述入排标准数据。
3.根据权利要求2所述的方法,其特征在于,在得到结构化的所述入排标准数据之后,所述方法还包括:
响应于入排标准编辑指令,根据所述入排标准编辑指令对所述入排标准数据进行修改或补充。
4.根据权利要求1所述的方法,其特征在于,所述将潜在受试者的临床信息以及多组学检测结果数据分别与所述入排标准数据进行匹配,确定临床信息以及多组学检测结果数据均符合入排标准的目标潜在受试者,包括:
将潜在受试者的多组学检测结果与所述入排标准数据中的组学数据实体进行匹配,从潜在受试者中筛选出第一潜在受试者列表;
根据所述入排标准数据中的组学数据条件间的逻辑关系以及各自所属的入组或排除类别,从所述第一潜在受试者列表中筛选出第二潜在受试者列表;
将所述第二潜在受试者列表中的潜在受试者的临床信息与所述入排标准数据中的临床数据实体进行匹配,从所述第二潜在受试者列表中筛选出第三潜在受试者列表;
根据所述入排标准数据中的临床条件间的逻辑关系以及各自所属的入组或排除类别,从所述第三潜在受试者列表中筛选出第四潜在受试者列表,得到所述目标潜在受试者。
5.根据权利要求1所述的方法,其特征在于,所述将潜在受试者的临床信息以及多组学检测结果数据分别与所述入排标准数据进行匹配,确定临床信息以及多组学检测结果数据均符合入排标准的目标潜在受试者,包括:
将潜在受试者的临床信息与所述入排标准数据中的临床数据实体进行匹配,从潜在受试者中筛选出第五潜在受试者列表;
根据所述入排标准数据中的临床条件间的逻辑关系以及各自所属的入组或排除类别,从所述第五潜在受试者列表中筛选出第六潜在受试者列表;
将所述第六潜在受试者列表中的潜在受试者的多组学检测结果与所述入排标准数据中的组学数据实体进行匹配,从所述第六潜在受试者列表中筛选出第七潜在受试者列表;
根据所述入排标准数据中的组学数据条件间的逻辑关系以及各自所属的入组或排除类别,从所述第七潜在受试者列表中筛选出第八潜在受试者列表,得到所述目标潜在受试者。
6.根据权利要求1所述的方法,其特征在于,在确定临床信息以及多组学检测结果数据均符合入排标准的目标潜在受试者之后,所述方法还包括:
将所述目标潜在受试者的数量发送到研究者端;
将所述目标潜在受试者的临床信息以及多组学检测结果数据发送到医生端;
将所述目标潜在受试者的临床信息以及多组学检测结果数据发送到相应的受试者端。
7.根据权利要求6所述的方法,其特征在于,所述方法还包括:
在接收到所述医生端或所述受试者端提交的评估申请的情况下,将所述评估申请发送到所述研究者端,所述评估申请是在所述医生端或所述受试者端对所述目标潜在受试者进行人工筛选后提交的,包括人工筛选后确定的潜在受试者的临床信息以及多组学检测结果数据。
8.根据权利要求7所述的方法,其特征在于,在将所述评估申请发送到所述研究者端之后,所述方法还包括:
在接收到所述研究者端发送的通过申请列表的情况下,将所述通过申请列表中的潜在受试者加入目标临床试验列表中。
9.根据权利要求1所述的方法,其特征在于,所述方法还包括:
按照预设第一维度对所述入排标准数据进行统计分析;
按照预设第二维度对潜在受试者的临床信息以及多组学检测结果数据进行统计分析;
按照预设第三维度对所述目标潜在受试者进行统计分析。
10.一种多组学临床试验受试者匹配装置,其特征在于,包括:
试验数据处理单元,用于获取原始临床试验数据,并对所述原始临床试验数据进行处理,得到结构化的入排标准数据;
样本数据获取单元,用于获取临床试验潜在受试者的临床信息以及多组学检测结果数据;
双向匹配单元,用于将潜在受试者的临床信息以及多组学检测结果数据分别与所述入排标准数据进行匹配,确定临床信息以及多组学检测结果数据均符合入排标准的目标潜在受试者。
CN202211688448.8A 2022-12-28 2022-12-28 一种多组学临床试验受试者匹配方法及装置 Pending CN115662554A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211688448.8A CN115662554A (zh) 2022-12-28 2022-12-28 一种多组学临床试验受试者匹配方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211688448.8A CN115662554A (zh) 2022-12-28 2022-12-28 一种多组学临床试验受试者匹配方法及装置

Publications (1)

Publication Number Publication Date
CN115662554A true CN115662554A (zh) 2023-01-31

Family

ID=85023090

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211688448.8A Pending CN115662554A (zh) 2022-12-28 2022-12-28 一种多组学临床试验受试者匹配方法及装置

Country Status (1)

Country Link
CN (1) CN115662554A (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106815360A (zh) * 2017-01-22 2017-06-09 嘉兴太美医疗科技有限公司 临床研究受试者招募条件排查方法
US20200185063A1 (en) * 2016-06-05 2020-06-11 Berg Llc Systems and methods for patient stratification and identification of potential biomarkers
CN112489774A (zh) * 2020-11-30 2021-03-12 中国人民解放军陆军军医大学第二附属医院 一种临床试验受试者招募系统
CN113139365A (zh) * 2021-04-06 2021-07-20 上海有临医药科技有限公司 临床试验受试者招募方法及设备
US20210319907A1 (en) * 2018-10-12 2021-10-14 Human Longevity, Inc. Multi-omic search engine for integrative analysis of cancer genomic and clinical data
US20220084633A1 (en) * 2020-09-16 2022-03-17 Dascena, Inc. Systems and methods for automatically identifying a candidate patient for enrollment in a clinical trial

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20200185063A1 (en) * 2016-06-05 2020-06-11 Berg Llc Systems and methods for patient stratification and identification of potential biomarkers
CN106815360A (zh) * 2017-01-22 2017-06-09 嘉兴太美医疗科技有限公司 临床研究受试者招募条件排查方法
US20210319907A1 (en) * 2018-10-12 2021-10-14 Human Longevity, Inc. Multi-omic search engine for integrative analysis of cancer genomic and clinical data
US20220084633A1 (en) * 2020-09-16 2022-03-17 Dascena, Inc. Systems and methods for automatically identifying a candidate patient for enrollment in a clinical trial
CN112489774A (zh) * 2020-11-30 2021-03-12 中国人民解放军陆军军医大学第二附属医院 一种临床试验受试者招募系统
CN113139365A (zh) * 2021-04-06 2021-07-20 上海有临医药科技有限公司 临床试验受试者招募方法及设备

Similar Documents

Publication Publication Date Title
Battram et al. The EWAS Catalog: a database of epigenome-wide association studies
Vassy et al. The impact of whole-genome sequencing on the primary care and outcomes of healthy adult patients: a pilot randomized trial
US20200381087A1 (en) Systems and methods of clinical trial evaluation
Bueno et al. New trends of emerging technologies in digital pathology
Newton et al. Validation of electronic medical record-based phenotyping algorithms: results and lessons learned from the eMERGE network
Qureshi Collection and use of cancer family history in primary care
Kho et al. Practical challenges in integrating genomic data into the electronic health record
McCowan et al. Collection of cancer stage data by classifying free-text medical reports
Cicero et al. Prevalence of idiopathic REM behavior disorder: a systematic review and meta-analysis
Papez et al. Transforming and evaluating the UK Biobank to the OMOP Common Data Model for COVID-19 research and beyond
AU2020326626A1 (en) Data-based mental disorder research and treatment systems and methods
Tong et al. An augmented estimation procedure for EHR-based association studies accounting for differential misclassification
CN111145846A (zh) 临床试验患者招募方法及装置、电子设备和存储介质
Butte Big data opens a window onto wellness
Sekeres et al. The National MDS Natural History Study: design of an integrated data and sample biorepository to promote research studies in myelodysplastic syndromes
AU2019359878A1 (en) Data based cancer research and treatment systems and methods
RADIANT Study Group Balasubramanyam Ashok Redondo Maria J. Craigen William Dai Hongzheng Davis Ansley Desai Dimpi Dussan Monica Faruqi Jordana Gaba Ruchi Gonzalez Iliana Jhangiani Shalini Kubota-Mishra Elizabeth Liu Pengfei Murdock David Posey Jennifer Ram Nalini Sabo Aniko Sisley Stephanie Tosur Mustafa Venner Eric Astudillo Marcela Cardenas Adriana Fang Mary Ann Hattery Erica Ideouzu Adrienne Jimenez Julizza Kikani Nupur Montes Graciela O’Brien Nikalina G. Wong Lee-Jun Goland Robin Chung Wendy K. Evans Anabel Gandica Rachelle Leibel Rudolph Mofford Kaisha Pring James Evans-Molina Carmella Anwar Farrah Monaco Gabriela Neyman Anna Saeed Zeb Sims Emily Spall Maria Hernandez-Perez Marimar Mather Kieren Moors Kelly Udler Miriam S. Florez Jose C. Calverley Melissa Chen Victoria Chu Kathy Cromer Sara Deutsch Aaron Faciebene Mariella Greaux Evelyn Koren Dorit Kreienkamp Raymond Larkin Mary Marshall William Ricevuto Pam Sabean Amy Thangthaeng Nopporn Han Christopher Sherwood Jordan Billings Liana K. Banerji Mary Ann Bally Kylnt Brown Necole Ji Beisi Soni Lina Lee Melissa Abrams Jennifer Thomas Lorraine Abrams Jennifer Skiwiersky Samara Philipson Louis H. Greeley Siri Atma W. Bell Graeme Banogon Shanna Desai Jui Ehrmann David Letourneau-Freiberg Lisa R. Naylor Rochelle N. Papciak Erin Friedman Ross Lainie Sundaresan Manu Bender Colleen Tian Persephone Rasouli Neda Kashkouli Mohsen Bahmani Baker Chelsea Her Andrew King Courtney Pyreddy Avinash Singh Vatsala Barklow Jules Farhat Noosha Lorch Rebecca Odean Carter Schleis Gregory Underkofler Chantal Pollin Toni I. Bryan Hadley Maloney Kristin Miller Ryan Newton Paula Nikita Maria Eleni Nwaba Devon Silver Kristi Tiner Jessica Whitlatch Hilary Palmer Kathleen Riley Stephanie Streeten Elizabeth Oral Elif A. Broome David Dill Gomes Anabela Foss de Freitas Maria Gregg Brigid Grigoryan Seda Imam Salman Sonmez Ince Melda Neidert Adam Richison Carman Akinci Baris Hench Rita Buse John Armstrong Chase Christensen Chad Diner Jamie Fraser Rachael Fulghum Karla Ghorbani Tahereh Kass Alex Klein Klara Kirkman M. Sue Hirsch Irl B. Baran Jesica Dong Xiaofu Kahn Steven E. Khakpour Dori Mandava Patali Sameshima Lori Kalerus Thanmai Pihoker Catherine Loots Beth Santarelli Kathleen Pascual Cisco Niswender Kevin Edwards Norma Gregory Justin Powers Alvin Ramirez Andrea Scott Jennifer Smith Jordan Urano Fumihiko Hughes Jing Hurst Stacy McGill Janet Stone Stephen May Jennifer https://orcid. org/0000-0003-4526-888X Krischer Jeffrey P. Adusumalli Rajesh Albritton Bruce Aquino Analia Bransford Paul Cadigan Nicholas Gandolfo Laura Garmeson Jennifer Gomes Joseph Gowing Robert Karges Christina Kirk Callyn Muller Sarah Morissette Jean Parikh Hemang M. Perez-Laras Francisco Remedios Cassandra L. Ruiz Pablo Sulman Noah Toth Michael Wurmser Lili Eberhard Christopher Fiske Steven Hutchinson Brandy Nekkanti Sidhvi Wood Rebecca Florez Jose C. Alkanaq Ahmed Brandes MacKenzie Burtt Nöel Flannick Jason Olorunfemi Phebe Udler Miriam S. Caulkins Lizz Wasserfall Clive Winter William Pittman David Akolkar Beena Lee Christine Carey David J. Hood Daniel Marcovina Santica M. Newgard Christopher B. The rare and atypical diabetes network (RADIANT) study: design and early results
CN113628751A (zh) 胃癌预后预测方法、装置及电子设备
Tseng et al. An open dataset of annotated metaphase cell images for chromosome identification
Maurits et al. A framework for employing longitudinally collected multicenter electronic health records to stratify heterogeneous patient populations on disease history
CN111180027B (zh) 一种基于医疗大数据的患者画像相关性规则筛选方法及装置
Yeasmeen et al. Understanding the participation of breast screening among women born in predominantly Muslim countries living in Victoria, Australia from record-linkage data
CN115662554A (zh) 一种多组学临床试验受试者匹配方法及装置
US20230072155A1 (en) Method and system for incorporating patient information
Spies et al. Development of a modular ICF-based core set for the German substance use disorders treatment

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20230131

RJ01 Rejection of invention patent application after publication