CN113948165A - 受试者筛选方法、系统、设备及计算机可读存储介质 - Google Patents

受试者筛选方法、系统、设备及计算机可读存储介质 Download PDF

Info

Publication number
CN113948165A
CN113948165A CN202111558014.1A CN202111558014A CN113948165A CN 113948165 A CN113948165 A CN 113948165A CN 202111558014 A CN202111558014 A CN 202111558014A CN 113948165 A CN113948165 A CN 113948165A
Authority
CN
China
Prior art keywords
sign
subject
feature
expected
stage
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202111558014.1A
Other languages
English (en)
Other versions
CN113948165B (zh
Inventor
覃龙
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yilinyun (Ningbo) Technology Co.,Ltd.
Original Assignee
Yilinyun Shenzhen Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yilinyun Shenzhen Technology Co ltd filed Critical Yilinyun Shenzhen Technology Co ltd
Priority to CN202111558014.1A priority Critical patent/CN113948165B/zh
Publication of CN113948165A publication Critical patent/CN113948165A/zh
Application granted granted Critical
Publication of CN113948165B publication Critical patent/CN113948165B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/20ICT specially adapted for the handling or processing of patient-related medical or healthcare data for electronic clinical trials or questionnaires
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/60ICT specially adapted for the handling or processing of patient-related medical or healthcare data for patient-specific data, e.g. for electronic patient records
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/30ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment

Landscapes

  • Engineering & Computer Science (AREA)
  • Medical Informatics (AREA)
  • Health & Medical Sciences (AREA)
  • Public Health (AREA)
  • Epidemiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Artificial Intelligence (AREA)
  • Biomedical Technology (AREA)
  • Databases & Information Systems (AREA)
  • Pathology (AREA)
  • Investigating Or Analysing Biological Materials (AREA)

Abstract

本发明公开了一种受试者筛选方法,所述受试者筛选方法包括以下步骤:获取受试者的体征信息和临床研究项目的方案信息;基于体征特征提取模型和预设特征预测模型,对所述体征信息进行特征提取和预测,获得所述受试者的各阶段体征特征;基于期望特征提取模型,分别对各所述阶段期望特征进行特征提取,得到各阶段期望特征;对所述各阶段体征特征和所述各阶段期望特征进行分阶段匹配,获得所述受试者与所述临床研究项目的综合匹配度;根据所述综合匹配度,筛选出所述临床研究项目对应的目标受试者。本发明还公开了一种受试者筛选系统、设备和计算机可读存储介质。本发明提高了筛选出的目标受试者与临床试验整体方案的契合程度。

Description

受试者筛选方法、系统、设备及计算机可读存储介质
技术领域
本发明涉及人工智能领域,尤其涉及一种受试者筛选方法、系统、设备及计算机可读存储介质。
背景技术
医学临床试验是现代循证医学研究的重要手段,在广泛的医学领域和药物研究方面都起到重要的作用。在进行医学临床试验前,往往需要招募一定数量的、符合对应入排标准的受试者。然而,随着试验地逐步推进受试者的体征信息也会产生较大的波动,此时的受试者体征不一定符合后续试验阶段的预期体征。在此情况下,往往需要对受试者的体征信息进行调整。从而对于该临床试验而言,会极大地拖延试验进程,甚至进一步地可能会导致该临床试验的失败。即受试者虽然符合了该临床试验的入排标准,但与该临床试验整体方案的契合程度偏低。
发明内容
本发明的主要目的在于提供一种受试者筛选方法,旨在解决受试者与临床试验整体方案的契合程度偏低的技术问题。
为实现上述目的,本发明提供一种受试者筛选方法,所述受试者筛选方法包括以下步骤:
获取受试者的体征信息和临床研究项目的方案信息;
基于体征特征提取模型和预设特征预测模型,对所述体征信息进行特征提取和预测,获得所述受试者的各阶段体征特征;
基于期望特征提取模型,对所述方案信息进行特征提取,得到各阶段期望特征;
对所述各阶段体征特征和所述各阶段期望特征进行分阶段匹配,获得所述受试者与所述临床研究项目的综合匹配度;
根据所述综合匹配度,筛选出所述临床研究项目对应的目标受试者。
优选地,所述各阶段体征特征包括当前体征特征和后续阶段体征特征,所述基于体征特征提取模型和预设特征预测模型,对所述体征信息进行特征提取和预测,获得所述受试者的各阶段体征特征的步骤包括:
基于所述体征特征提取模型,对所述体征信息进行特征提取,获得所述受试者的当前体征特征;
基于预设特征预测模型,对所述当前体征特征进行特征预测,获得所述受试者的后续阶段体征特征。
优选地,在所述基于所述体征特征提取模型,对所述体征信息进行特征提取,获得所述受试者的当前体征特征的步骤之前,所述受试者筛选方法还包括:
获取第一期望样本特征集和第一体征信息样本集;
基于待训练体征特征提取模型,对所述第一体征信息样本集进行特征提取,获得第一体征样本特征集;
根据所述第一体征样本特征集和所述第一期望样本特征集,计算第一对比损失;
根据所述第一对比损失,优化所述待训练体征特征提取模型,获得所述体征特征提取模型。
优选地,在所述基于预设特征预测模型,对所述当前体征特征进行特征预测,获得所述受试者的后续阶段体征特征的步骤之前,所述受试者筛选方法还包括:
获取训练体征特征以及所述训练体征特征对应的真实后续体征样本特征;
依据待训练特征预测模型,将所述训练体征特征转换为训练后续体征特征;
依据所述训练后续体征特征和所述真实后续体征样本特征构建的模型损失,迭代优化所述待训练特征预测模型,得到所述预设特征预测模型。
优选地,在所述根据所述各阶段期望信息,基于期望特征提取模型,获得所述临床研究项目的各阶段期望特征的步骤之前,所述受试者筛选方法包括:
获取第二体征样本特征集和第二期望信息样本集;
基于待训练期望特征提取模型,对所述第二期望信息样本集进行特征提取,获得第二期望样本特征集;
根据所述第二体征样本特征集和所述第二期望样本特征集,计算第二对比损失;
根据所述第二对比损失,优化所述待训练期望特征提取模型,获得所述期望特征提取模型。
优选地,所述各阶段体征特征包括当前体征特征与后续体征特征,所述各阶段期望特征包括当前期望特征与后续期望特征,所述对所述各阶段体征特征和所述各阶段期望特征进行分阶段匹配,获得所述受试者与所述临床研究项目的综合匹配度的步骤还包括:
计算所述当前体征特征和所述当前期望特征的当前匹配度;
计算所述后续体征特征和所述后续期望特征的后续匹配度;
将所述当前匹配度与后续匹配度的平均值作为所述受试者与所述临床研究项目的综合匹配度。
优选地,所述对所述各阶段体征特征和所述各阶段期望特征进行分阶段匹配,获得所述受试者与所述临床研究项目的综合匹配度的步骤包括:
根据所述受试者各阶段体征特征,分别计算所述受试者与所述临床研究项目的各阶段期望特征之间的汉明距离;
根据所述汉明距离,获得所述受试者与所述临床研究项目的综合匹配度。
此外,为实现以上目的,本发明还提供一种受试者筛选系统,所述受试者筛选系统包括:
获取模块,用于获取受试者的体征信息和临床研究项目的方案信息;
受试者模块,用于基于体征特征提取模型和预设特征预测模型,对所述体征信息进行特征提取和预测,获得所述受试者的各阶段体征特征;
项目模块,用于基于期望特征提取模型,分别对所述各阶段期望特征进行特征提取,得到各阶段期望特征;
匹配模块,用于对所述各阶段体征特征和所述各阶段期望特征进行分阶段匹配,获得所述受试者与所述临床研究项目的综合匹配度;
筛选模块,用于根据所述综合匹配度,筛选出所述临床研究项目对应的目标受试者。
此外,为实现以上目的,本发明还提供一种受试者筛选设备,所述受试者筛选设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如上所述任一项所述的受试者筛选方法的步骤。
此外,为实现以上目的,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有受试者筛选程序,所述受试者筛选程序被处理器执行时实现如上所述任一项所述的受试者筛选方法的步骤。
本发明提出的一种受试者筛选方法,首先通过获取受试者的体征信息和临床研究项目的方案信息,再基于体征特征提取模型和预设特征预测模型,对所述体征信息进行特征提取和预测,由此获得所述受试者的当前体征特征,以及根据当前体征特征预测的后续阶段体征特征,即获得所述受试者对应临床研究项目各个阶段的各阶段体征特征。其次,基于期望特征提取模型,分别对所述方案信息进行特征提取,其中所述方案信息中包括入排标准以及后期各阶段期望体征分别提取得到了临床研究项目的各阶段期望特征。最后,再对所述各阶段体征特征和所述各阶段期望特征进行分阶段匹配(即对受试者当前体征特征与临床研究项目的入排标准对应的期望特征匹配,受试者后续体征特征与临床研究项目的后续期望体征对应的期望特征匹进行匹配),根据受试者和临床研究项目在各阶段的匹配率,最终获得所述受试者与所述临床研究项目的综合匹配度;根据所述综合匹配度,筛选出所述临床研究项目对应的目标受试者。本发明结合了体征特征提取模型和预设特征预测模型,来提取并预测出受试者各阶段的体征特征,再基于期望特征提取模型从临床研究项目的方案信息提取出临床研究项目各阶段的期望特征,最后进行分阶段匹配,获得受试者和临床研究项目在各阶段的匹配度,进而获得了受试者与临床研究项目的综合匹配度,最终筛选出所述临床研究项目对应的目标受试者。本发明在受试者当前体征与临床研究项目的入排标准的基础上,通过预设特征预测模型预测了受试者后续的体征特征得以实现受试者与临床研究项目的后续期望体征进行匹配,从而获得受试者与临床研究项目的综合匹配度,而不仅仅是依靠受试者当前体征进行匹配判断,从而提高了筛选出的目标受试者与临床试验整体方案的契合程度。
附图说明
图1是本发明实施例方案涉及的硬件运行环境的受试者筛选设备结构示意图;
图2为本发明受试者筛选方法第一实施例的流程示意图;
图3本发明实施例方案涉及的系统结构示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
如图1所示,图1是本发明实施例方案涉及的硬件运行环境的受试者筛选设备结构示意图。
如图1所示,本发明实施例受试者筛选设备可以包括:处理器1001,例如CPU,网络接口1004,用户接口1003,存储器1005,通信总线1002。其中,通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(Display)、输入单元比如键盘(Keyboard),可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。存储器1005可以是高速RAM存储器,也可以是稳定的存储器(non-volatile memory),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。
可选地,该受试者筛选设备还可以包括摄像头、RF(Radio Frequency,射频)电路,传感器、音频电路、WiFi模块等等。其中,传感器比如光传感器、运动传感器以及其他传感器。具体地,光传感器可包括环境光传感器及接近传感器,其中,环境光传感器可根据环境光线的明暗来调节显示屏的亮度,关闭显示屏和/或背光。作为运动传感器的一种,重力加速度传感器可检测各个方向上(一般为三轴)加速度的大小,静止时可检测出重力的大小及方向,可用于识别姿态的应用(比如横竖屏切换、磁力计姿态校准)、振动识别相关功能(比如计步器、敲击)等;当然,还可配置陀螺仪、气压计、湿度计、温度计、红外线传感器等其他传感器,在此不再赘述。
本领域技术人员可以理解,图1中示出的受试者筛选设备结构并不构成对受试者筛选设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
如图1所示,作为一种计算机存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及受试者筛选应用程序。
参照图2,本发明第一实施例提供一种受试者筛选方法,所述受试者筛选方法包括:
步骤S100,获取受试者的体征信息和临床研究项目的方案信息;
具体地,可以通过受试者自主填写的资料以及体检报告获得受试者的体征信息。其中所述体征信息包括:受试者的年龄、血型、病史、BIM指数以及其他的生理、心理数据。可以通过临床研究项目的方案信息,获得所述临床研究项目对受试者的当前期望体征(即入排标准)以及在后续阶段对受试者的期望体征,如年龄、血型、是否具有特定的疾病以及其他对受试者体征的要求。其中,该临床研究项目在后续阶段对受试者的期望体征,可以是根据以往相同或相似的其他临床研究项目的基础上对本临床研究项目后续阶段受试者体征的推断,也可以是根据本临床项目的试验方案对后续阶段受试者的预期体征。
步骤S200,基于体征特征提取模型和预设特征预测模型,对所述体征信息进行特征提取和预测,获得所述受试者的各阶段体征特征;
具体地,通过已训练的体征特征提取模型,对所述体征信息进行特征提取,获得受试者的当前体征特征,然后再基于已训练的预设特征预测模型对所述当前体征特征进行特征预测,获得受试者在临床研究项目后续阶段的体征特征,从而获得所述受试者在临床研究项目中各阶段的体征特征。其中,所述各阶段体征特征的形式可以是向量或者矩阵等。
在另一实施例中,步骤S200的步骤包括以下步骤:
步骤S210,基于所述体征特征提取模型,对所述体征信息进行特征提取,获得所述受试者的当前体征特征;
具体地,通过预设的训练样本集对待训练体征特征提取模型进行训练,而后将训练后的所述待训练体征特征提取模型作为体征特征提取模型。然后基于所述体征特征提取模型对所述体征信息进行特征提取,获得受试者当前的体征特征。
在另一实施例中,在步骤S210之前,所述受试者筛选方法还包括以下步骤:
步骤a1,获取第一期望样本特征集和第一体征信息样本集;
步骤a2,基于待训练体征特征提取模型,对所述第一体征信息样本集进行特征提取,获得第一体征样本特征集;
步骤a3,根据所述第一体征样本特征集和所述第一期望样本特征集,计算第一对比损失;
步骤a4,根据所述第一对比损失,优化所述待训练体征特征提取模型,获得所述体征特征提取模型。
具体地,首先获取第一期望样本特征集和第一体征信息样本集,然后基于待训练体征特征提取模型,对所述第一体征信息样本集进行特征提取,获得第一体征样本特征集。在所述第一期望样本特征集中确定第一体征样本集中的每一第一体征样本特征对应的正样本特征以及至少一个负样本特征。依据所述第一体征样本特征与对应的正样本特征之间的差异度,以及所述第一体征样本特征与对应的至少一个负样本特征之间的差异度,计算所述第一体征样本特征对应的对比损失,进一步地,对所述每一第一体征样本特征对应的对比损失进行求和,得到所述第一对比损失。
其中,所述在所述第一期望样本特征集中确定第一体征样本集中的每一第一体征样本特征对应的正样本特征以及至少一个负样本特征步骤包括:
获取所述第一体征样本特征对应的样本ID,进而将所述样本ID对应的第一期望样本特征作为所述第一体征样本特征对应的正样本特征,以及将除所述正样本特征之外的各第一期望样本特征作为所述第一体征样本特征对应的负样本特征。
其中,计算所述对比损失的具体公式如下:
Figure 780285DEST_PATH_IMAGE001
其中LN为所述对比损失,f(x)T为所述体征样本特征,f(x+)为所述期望样本特征集中与所述体征信息样本对应的正样本特征,f(xj -)为所述期望样本特征集包括与所述体征信息样本对应的第j个负样本特征,N-1为负样本特征的数量。
最后根据所述第一对比损失,对所述待训练体征特征提取模型进行重新训练,当满足预设优化训练结束条件时,则完成对所述待训练体征特征提取模型的优化,将完成优化的所述待训练体征特征提取模型作为所述体征特征提取模型。其中,所述预设优化训练结束条件包括迭代次数达到最大迭代次数阈值和对比损失收敛等。例如,对所述待训练体征特征提取模型进行重新训练至对比损失收敛,则所述待训练体征特征提取模型收敛,完成对所述待训练体征特征提取模型的优化,并将优化后的所述待训练体征特征提取模型作为所述体征特征提取模型。本实施例中,通过采用期望样本特征集和至少一个与所述期望样本特征集中期望样本特征相对应的体征信息样本对待训练体征特征提取模型进行训练直至待训练体征特征提取模型满足预设优化条件。在本实施例中,一方面,无需人工进行标注标签,提高了效率,节省了资源;另一方面,则是相比于监督学习,本实施例通过对比学习最终获得的体征特征提取模型能够具有更强的鲁棒性。
步骤S220,基于预设特征预测模型,对所述当前体征特征进行特征预测,获得所述受试者的后续阶段体征特征。
具体地,基于已训练的预设特征预测模型,对所述当前的体征特征进行特征预测,由此获得受试者在临床研究项目中后续阶段的体征特征。
在另一实施例中,在步骤S220之前,所述受试者筛选方法还包括以下步骤:
步骤b1,获取训练体征特征以及所述训练体征特征对应的真实后续体征样本特征;
步骤b2,依据待训练特征预测模型,将所述训练体征特征转换为训练后续体征特征;
步骤b3,依据所述训练后续体征特征和所述真实后续体征样本特征构建的模型损失,迭代优化所述待训练特征预测模型,得到所述预设特征预测模型。
具体地,首先,获取训练体征特征和与该训练体征特征对应的真实后续体征样本特征。其次,将训练体征特征输入所述待训练特征预测模型,然后待训练特征预测模型输出训练后续体征特征。再次,计算所述训练后续体征特征与真实后续体征样本特征之间的差值,获得所述待训练特征预测模型的模型损失,最后根据所述模型损失对所述待训练特征预测模型进行重新训练,当满足预设迭代优化训练结束条件时,则完成对所述待训练特征预测模型的迭代优化,将完成迭代优化的所述待训练特征预测模型作为所述预设特征预测模型。其中,所述预设迭代优化训练结束条件包括迭代最大迭代次数阈值和模型损失等。例如,当所述模型损失收敛时,则所述待训练特征预测模型收敛,完成所述待训练特征预测模型的迭代优化,将完成迭代优化的所述待训练特征预测模型作为所述预设特征预测模型。本实施例中,通过计算所述待训练特征预测模型输出的训练后续体征特征和真实后续体征样本特征的模型损失,并根据所述模型损失对所述待训练特征预测模型进行迭代优化,从而使得最终获得的预设特征预测模型输出结果的准确率更高。
步骤S300,基于期望特征提取模型,分别对各所述阶段期望特征进行特征提取,得到各阶段期望特征;
具体地,根据通过已训练的期望特征提取模型,对所述方案信息进行特征提取,获得临床研究项目的当前期望特征(即入排标准特征)以及后续期望特征,即获得临床研究项目各阶段的期望特征。其中,所述各阶段期望特征的形式可以是向量或者矩阵等。
在另一实例中,在步骤S300之前,所述受试者筛选方法还包括以下步骤:
步骤c1,获取第二体征样本特征集和第二期望信息样本集;
步骤c2,基于待训练期望特征提取模型,对所述第二期望信息样本集进行特征提取,获得第二期望样本特征集;
步骤c3,根据所述第二体征样本特征集和所述第二期望样本特征集,计算第二对比损失;
步骤c4,根据所述第二对比损失,优化所述待训练期望特征提取模型,获得所述期望特征提取模型。
具体地,首先获取第二体征样本特征集和第二期望信息样本集,然后基于待训练期望特征提取模型,对所述第二期望信息样本集进行特征提取,获得第二期望样本特征集。在所述第二体征样本特征集中确定第二期望样本集中的每一第二期望样本特征对应的正样本特征以及至少一个负样本特征。依据所述第二期望样本特征与对应的正样本特征之间的差异度,以及所述第二期望样本特征与对应的至少一个负样本特征之间的差异度,计算所述第二期望样本特征对应的对比损失,进一步地,对所述每一第二期望样本特征对应的对比损失进行求和,得到所述第二对比损失。
其中,所述在所述第二体征样本特征集中确定第二期望样本集中的每一第二期望样本特征对应的正样本特征以及至少一个负样本特征步骤包括:
获取所述第二期望样本特征对应的样本ID,进而将所述样本ID对应的第二体征样本特征作为所述第二期望样本特征对应的正样本特征,以及将除所述正样本特征之外的各第二体征样本特征作为所述第二期望样本特征对应的负样本特征。
最后根据所述第二对比损失,对所述待训练期望特征提取模型进行重新训练,当满足预设优化训练结束条件时,则完成对所述待训练期望特征提取模型的优化,将完成优化的所述待训练期望特征提取模型作为所述期望特征提取模型。其中,所述预设优化训练结束条件包括迭代次数达到最大迭代次数阈值和对比损失收敛等。例如,对所述待训练期望特征提取模型进行重新训练至对比损失收敛,则所述待训练期望特征提取模型收敛,完成对所述待训练期望特征提取模型的优化,并将优化后的所述待训练期望特征提取模型作为所述期望特征提取模型。本实施例中,通过采用体征样本特征集和至少一个与所述体征样本特征集中体征样本特征相对应的期望信息样本对待训练体征特征提取模型进行训练直至待训练期望特征提取模型满足预设优化条件。在本实施例中,一方面,无需人工进行标注标签,提高了效率,节省了资源;另一方面,则是相比于监督学习,本实施例通过对比学习最终获得的期望特征提取模型能够具有更强的鲁棒性。
步骤S400,对所述各阶段体征特征和所述各阶段期望特征进行分阶段匹配,获得所述受试者与所述临床研究项目的匹配度;
具体地,通过分别计算受试者各阶段体征特征和临床研究项目在对应阶段的期望特征之间的汉明距离或者相似度等方式,获得受试者和临床研究项目在各阶段时的匹配度,再根据所述各阶段匹配度,在受试者当前体征特征与所述临床研究项目当前期望特征(即入排标准特征)的匹配度达到预设匹配度阈值的前提下,计算得出所述受试者与所述临床研究项目整体的匹配度,例如通过算数平均值或加权平均值等方式。
在另一实施例中,所述各阶段体征特征包括当前体征特征与后续体征特征,所述各阶段期望特征包括当前期望特征与后续期望特征,步骤S400还包括以下步骤:
步骤d1,计算所述当前体征特征和所述当前期望特征的当前匹配度;
步骤d2,计算所述后续体征特征和所述后续期望特征的后续匹配度;
步骤d3,当所述当前匹配度超过预设匹配度阈值时,将所述当前匹配度与后续匹配度的平均值作为所述受试者与所述临床研究项目的综合匹配度。
具体地,所述各阶段体征特征包括当前体征特征与后续体征特征,其中后续体征特征可以包括第二阶段体征特征,第三阶段体征特征,直至第N阶段体征特征。所述各阶段期望特征包括当前期望特征与后续期望特征,其中后续期望特征可以包括第二阶段期望特征,第三阶段期望特征,直至第N阶段期望特征。所述体征特征与期望特征的阶段数目均与临床研究项目所需要进行试验的阶段相等。继而计算所述当前体征特征和对应的当前期望特征之间的匹配度(即当前匹配度),并计算所述后续体征特征和对应的后续期望特征的匹配度(即后续匹配度)。最后,当所述当前匹配度超过预设入排阈值(即受试者满足所述临床研究项目的入排标准)时,将所述当前匹配度与后续匹配度的平均值作为所述受试者与所述临床研究项目的综合匹配度。所述平均值可以是算数平均值或加权平均值等。
在另一实施例中,步骤S400包括以下步骤:
步骤e1,根据所述受试者各阶段体征特征,分别计算所述受试者与所述临床研究项目的各阶段期望特征之间的汉明距离;
步骤e2,根据所述汉明距离,获得所述受试者与所述临床研究项目的综合匹配度。
具体地,根据所述受试者各阶段体征特征,分别计算所述受试者与所述临床研究项目的各阶段期望特征之间的汉明距离,即计算受试者当前的体征特征与对应的期望特征之间的汉明距离,以及计算后续阶段的体征特征与对应的期望特征之间的汉明距离,从而获得受试者与临床研究项目在各阶段时对应的汉明距离。假设,临床研究项目分为三个阶段,则计算受试者当前体征特征与临床研究项目一阶段期望特征之间的第一汉明距离,然后计算受试者二阶段体征特征与临床研究项目二阶段期望特征之间的第二汉明距离,计算受试者三阶段体征特征与临床研究项目三阶段期望特征之间的第三汉明距离。最后,当所述第一汉明距离小于预设汉明距离阈值(即受试者满足所述临床研究项目的入排标准)时,将所述各阶段的汉明距离的平均值作为最终汉明距离,并将所述最终汉明距离转化为匹配度,则获得所述受试者与所述临床研究项目的综合匹配度。其中,汉明距离越大则匹配度越小,汉明距离越小则匹配度越大。
步骤S500,根据所述综合匹配度,筛选出所述临床研究项目对应的目标受试者。
具体地,在获得所述综合匹配度后,可以筛选出综合匹配度超过预设匹配度阈值的受试者作为所述临床研究项目对应的目标受试者。若有人数要求,则进一步筛选出综合匹配度较高的预设人数受试者作为所述临床研究项目对应的目标受试者。
在本实施例中,首先通过获取受试者的体征信息和临床研究项目的方案信息,再基于体征特征提取模型和预设特征预测模型,对所述体征信息进行特征提取和预测,由此获得所述受试者的当前体征特征,以及根据当前体征特征预测的后续阶段体征特征,即获得所述受试者对应临床研究项目各个阶段的各阶段体征特征。其次,基于期望特征提取模型,分别对所述方案信息进行特征提取,其中所述方案信息中包括入排标准以及后期各阶段期望体征分别提取得到了临床研究项目的各阶段期望特征。最后,再对所述各阶段体征特征和所述各阶段期望特征进行分阶段匹配(即对受试者当前体征特征与临床研究项目的入排标准对应的期望特征匹配,受试者后续体征特征与临床研究项目的后续期望体征对应的期望特征匹进行匹配),根据受试者和临床研究项目在各阶段的匹配率,最终获得所述受试者与所述临床研究项目的综合匹配度;根据所述综合匹配度,筛选出所述临床研究项目对应的目标受试者。本发明结合了体征特征提取模型和预设特征预测模型,来提取并预测出受试者各阶段的体征特征,再基于期望特征提取模型从临床研究项目的方案信息提取出临床研究项目各阶段的期望特征,最后进行分阶段匹配,获得受试者和临床研究项目在各阶段的匹配度,进而获得了受试者与临床研究项目的综合匹配度,最终筛选出所述临床研究项目对应的目标受试者。本发明在受试者当前体征与临床研究项目的入排标准的基础上,通过预设特征预测模型预测了受试者后续的体征特征得以实现受试者与临床研究项目的后续期望体征进行匹配,从而获得受试者与临床研究项目的综合匹配度,而不仅仅是依靠受试者当前体征进行匹配判断,从而提高了筛选出的目标受试者与临床试验整体方案的契合程度。
参照图3,本发明实施例还提供一种受试者筛选系统,所述受试者筛选系统包括:
获取模块10,用于获取受试者的体征信息和临床研究项目的方案信息;
受试者模块20,用于基于体征特征提取模型和预设特征预测模型,对所述体征信息进行特征提取和预测,获得所述受试者的各阶段体征特征;
项目模块30,用于基于期望特征提取模型,对所述方案信息进行特征提取,得到各阶段期望特征;
匹配模块40,用于对所述各阶段体征特征和所述各阶段期望特征进行分阶段匹配,获得所述受试者与所述临床研究项目的综合匹配度;
筛选模块50,用于根据所述综合匹配度,筛选出所述临床研究项目对应的目标受试者。
更进一步地,所述受试者筛选系统还包括:受试者模块20包括体征特征提取模块和特征预测模块;
所述体征特征提取模块,用于基于所述体征特征提取模型,对所述体征信息进行特征提取,获得所述受试者的当前体征特征;
所述特征预测模块,用于基于预设特征预测模型,对所述当前体征特征进行特征预测,获得所述受试者的后续阶段体征特征。
更进一步地,所述受试者筛选系统还包括:第一训练模块;
所述第一训练模块,用于获取第一期望样本特征集和第一体征信息样本集;基于待训练体征特征提取模型,对所述第一体征信息样本集进行特征提取,获得第一体征样本特征集;根据所述第一体征样本特征集和所述第一期望样本特征集,计算第一对比损失;根据所述第一对比损失,优化所述待训练体征特征提取模型,获得所述体征特征提取模型。
更进一步地,所述受试者筛选系统还包括:第二训练模块;
所述第二训练模块,用于获取训练体征特征以及所述训练体征特征对应的真实后续体征样本特征;依据待训练特征预测模型,将所述训练体征特征转换为训练后续体征特征;依据所述训练后续体征特征和所述真实后续体征样本特征构建的模型损失,迭代优化所述待训练特征预测模型,得到所述预设特征预测模型。
更进一步地,所述受试者筛选系统还包括:第三训练模块;
所述第三训练模块,用于获取第二体征样本特征集和第二期望信息样本集;基于待训练期望特征提取模型,对所述第二期望信息样本集进行特征提取,获得第二期望样本特征集;根据所述第二体征样本特征集和所述第二期望样本特征集,计算第二对比损失;根据所述第二对比损失,优化所述待训练期望特征提取模型,获得所述期望特征提取模型。
更进一步地,所述受试者筛选系统还包括:所述各阶段体征特征包括当前体征特征与后续体征特征,所述各阶段期望特征包括当前期望特征与后续期望特征,匹配模块40包括第一匹配模块;
所述第一匹配模块,用于计算所述当前体征特征和所述当前期望特征的当前匹配度;计算所述后续体征特征和所述后续期望特征的后续匹配度;当所述当前匹配度超过预设匹配度阈值时,将所述当前匹配度与后续匹配度的平均值作为所述受试者与所述临床研究项目的综合匹配度。
更进一步地,所述受试者筛选系统还包括:匹配模块40还包括第二匹配模块;
所述第二匹配模块,用于根据所述受试者各阶段体征特征,分别计算所述受试者与所述临床研究项目的各阶段期望特征之间的汉明距离;
根据所述汉明距离,获得所述受试者与所述临床研究项目的综合匹配度。
此外,本发明实施例还提出一种计算机存储介质。
所述计算机存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现上述实施例提供的受试者筛选方法的操作,具体实现步骤可参照上述实施例,此处不多做赘述。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体/操作/对象与另一个实体/操作/对象区分开来,而不一定要求或者暗示这些实体/操作/对象之间存在任何这种实际的关系或者顺序;术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。
对于装置实施例而言,由于其基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。以上所描述的装置实施例仅仅是示意性的,其中作为分离部件说明的单元可以是或者也可以不是物理上分开的。可以根据实际的需要选择中的部分或者全部模块来实现本发明方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在如上所述的一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器或者网络设备等)执行本发明各个实施例所述的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (10)

1.一种受试者筛选方法,其特征在于,所述受试者筛选方法包括以下步骤:
获取受试者的体征信息和临床研究项目的方案信息;
基于体征特征提取模型和预设特征预测模型,对所述体征信息进行特征提取和预测,获得所述受试者的各阶段体征特征;
基于期望特征提取模型,对所述方案信息进行特征提取,得到各阶段期望特征;
对所述各阶段体征特征和所述各阶段期望特征进行分阶段匹配,获得所述受试者与所述临床研究项目的综合匹配度;
根据所述综合匹配度,筛选出所述临床研究项目对应的目标受试者。
2.如权利要求1所述的受试者筛选方法,其特征在于,所述各阶段体征特征包括当前体征特征和后续阶段体征特征,所述基于体征特征提取模型和预设特征预测模型,对所述体征信息进行特征提取和预测,获得所述受试者的各阶段体征特征的步骤包括:
基于所述体征特征提取模型,对所述体征信息进行特征提取,获得所述受试者的当前体征特征;
基于预设特征预测模型,对所述当前体征特征进行特征预测,获得所述受试者的后续阶段体征特征。
3.如权利要求2所述的受试者筛选方法,其特征在于,在所述基于所述体征特征提取模型,对所述体征信息进行特征提取,获得所述受试者的当前体征特征的步骤之前,所述受试者筛选方法还包括:
获取第一期望样本特征集和第一体征信息样本集;
基于待训练体征特征提取模型,对所述第一体征信息样本集进行特征提取,获得第一体征样本特征集;
根据所述第一体征样本特征集和所述第一期望样本特征集,计算第一对比损失;
根据所述第一对比损失,优化所述待训练体征特征提取模型,获得所述体征特征提取模型。
4.如权利要求2所述的受试者筛选方法,其特征在于,在所述基于预设特征预测模型,对所述当前体征特征进行特征预测,获得所述受试者的后续阶段体征特征的步骤之前,所述受试者筛选方法还包括:
获取训练体征特征以及所述训练体征特征对应的真实后续体征样本特征;
依据待训练特征预测模型,将所述训练体征特征转换为训练后续体征特征;
依据所述训练后续体征特征和所述真实后续体征样本特征构建的模型损失,迭代优化所述待训练特征预测模型,得到所述预设特征预测模型。
5.如权利要求1所述的受试者筛选方法,其特征在于,在所述基于期望特征提取模型,对所述方案信息进行特征提取,得到各阶段期望特征的步骤之前,所述受试者筛选方法包括:
获取第二体征样本特征集和第二期望信息样本集;
基于待训练期望特征提取模型,对所述第二期望信息样本集进行特征提取,获得第二期望样本特征集;
根据所述第二体征样本特征集和所述第二期望样本特征集,计算第二对比损失;
根据所述第二对比损失,优化所述待训练期望特征提取模型,获得所述期望特征提取模型。
6.如权利要求1所述的受试者筛选方法,其特征在于,所述各阶段体征特征包括当前体征特征与后续体征特征,所述各阶段期望特征包括当前期望特征与后续期望特征,所述对所述各阶段体征特征和所述各阶段期望特征进行分阶段匹配,获得所述受试者与所述临床研究项目的综合匹配度的步骤还包括:
计算所述当前体征特征和所述当前期望特征的当前匹配度;
计算所述后续体征特征和所述后续期望特征的后续匹配度;
当所述当前匹配度超过预设匹配度阈值时,将所述当前匹配度与后续匹配度的平均值作为所述受试者与所述临床研究项目的综合匹配度。
7.如权利要求1所述的受试者筛选方法,其特征在于,所述对所述各阶段体征特征和所述各阶段期望特征进行分阶段匹配,获得所述受试者与所述临床研究项目的综合匹配度的步骤包括:
根据所述受试者各阶段体征特征,分别计算所述受试者与所述临床研究项目的各阶段期望特征之间的汉明距离;
根据所述汉明距离,获得所述受试者与所述临床研究项目的综合匹配度。
8.一种受试者筛选系统,其特征在于,所述受试者筛选系统包括:
获取模块,用于获取受试者的体征信息和临床研究项目的方案信息;
受试者模块,用于基于体征特征提取模型和预设特征预测模型,对所述体征信息进行特征提取和预测,获得所述受试者的各阶段体征特征;
项目模块,用于基于期望特征提取模型,对所述方案信息进行特征提取,得到各阶段期望特征;
匹配模块,用于对所述各阶段体征特征和所述各阶段期望特征进行分阶段匹配,获得所述受试者与所述临床研究项目的综合匹配度;
筛选模块,用于根据所述综合匹配度,筛选出所述临床研究项目对应的目标受试者。
9.一种受试者筛选设备,其特征在于,所述受试者筛选设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如权利要求1至7中任一项所述的受试者筛选方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有受试者筛选程序,所述受试者筛选程序被处理器执行时实现如权利要求1至7中任一项所述的受试者筛选方法的步骤。
CN202111558014.1A 2021-12-20 2021-12-20 受试者筛选方法、系统、设备及计算机可读存储介质 Active CN113948165B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111558014.1A CN113948165B (zh) 2021-12-20 2021-12-20 受试者筛选方法、系统、设备及计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111558014.1A CN113948165B (zh) 2021-12-20 2021-12-20 受试者筛选方法、系统、设备及计算机可读存储介质

Publications (2)

Publication Number Publication Date
CN113948165A true CN113948165A (zh) 2022-01-18
CN113948165B CN113948165B (zh) 2022-04-01

Family

ID=79339187

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111558014.1A Active CN113948165B (zh) 2021-12-20 2021-12-20 受试者筛选方法、系统、设备及计算机可读存储介质

Country Status (1)

Country Link
CN (1) CN113948165B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116894191A (zh) * 2023-09-11 2023-10-17 亦康(北京)医药科技有限公司 算法模型训练、匹配方法、装置、电子设备及介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016208776A1 (ja) * 2015-06-25 2016-12-29 株式会社国際電気通信基礎技術研究所 多器官連関システムを基盤とした予測装置、及び予測プログラム
US20170039345A1 (en) * 2015-07-13 2017-02-09 Biodesix, Inc. Predictive test for melanoma patient benefit from antibody drug blocking ligand activation of the T-cell programmed cell death 1 (PD-1) checkpoint protein and classifier development methods
CN111933212A (zh) * 2020-08-26 2020-11-13 腾讯科技(深圳)有限公司 一种基于机器学习的临床组学数据处理方法及装置
CN113066543A (zh) * 2021-04-12 2021-07-02 北京药明津石医药科技有限公司 临床研究协调员排程方法、装置、计算机设备和存储介质
CN113257377A (zh) * 2021-06-04 2021-08-13 联仁健康医疗大数据科技股份有限公司 确定目标用户的方法、装置、电子设备及存储介质
CN113314192A (zh) * 2021-06-17 2021-08-27 医渡云(北京)技术有限公司 临床试验数据处理系统、方法、设备及存储介质

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016208776A1 (ja) * 2015-06-25 2016-12-29 株式会社国際電気通信基礎技術研究所 多器官連関システムを基盤とした予測装置、及び予測プログラム
US20170039345A1 (en) * 2015-07-13 2017-02-09 Biodesix, Inc. Predictive test for melanoma patient benefit from antibody drug blocking ligand activation of the T-cell programmed cell death 1 (PD-1) checkpoint protein and classifier development methods
CN111933212A (zh) * 2020-08-26 2020-11-13 腾讯科技(深圳)有限公司 一种基于机器学习的临床组学数据处理方法及装置
CN113066543A (zh) * 2021-04-12 2021-07-02 北京药明津石医药科技有限公司 临床研究协调员排程方法、装置、计算机设备和存储介质
CN113257377A (zh) * 2021-06-04 2021-08-13 联仁健康医疗大数据科技股份有限公司 确定目标用户的方法、装置、电子设备及存储介质
CN113314192A (zh) * 2021-06-17 2021-08-27 医渡云(北京)技术有限公司 临床试验数据处理系统、方法、设备及存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
文玲子等: "基于临床试验的受试者招募过程分析及建议", 《中医杂志》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116894191A (zh) * 2023-09-11 2023-10-17 亦康(北京)医药科技有限公司 算法模型训练、匹配方法、装置、电子设备及介质
CN116894191B (zh) * 2023-09-11 2023-12-01 亦康(北京)医药科技有限公司 算法模型训练、匹配方法、装置、电子设备及介质

Also Published As

Publication number Publication date
CN113948165B (zh) 2022-04-01

Similar Documents

Publication Publication Date Title
CN109471945B (zh) 基于深度学习的医疗文本分类方法、装置及存储介质
CN112329964B (zh) 用于推送信息的方法、装置、设备以及存储介质
CN110929807B (zh) 图像分类模型的训练方法、图像分类方法及装置
JP2022505775A (ja) 画像分類モデルの訓練方法、画像処理方法及びその装置、並びにコンピュータプログラム
CN112784778B (zh) 生成模型并识别年龄和性别的方法、装置、设备和介质
WO2020147369A1 (zh) 自然语言处理方法、训练方法及数据处理设备
CN111340213B (zh) 神经网络的训练方法、电子设备、存储介质
CN113948165B (zh) 受试者筛选方法、系统、设备及计算机可读存储介质
CN115661909B (zh) 人脸图像处理方法、设备及计算机可读存储介质
CN114360674A (zh) 基于医疗健康大数据的慢性病诊疗方案预测方法
CN111797148A (zh) 数据处理方法、装置、存储介质及电子设备
CN113869496A (zh) 一种神经网络的获取方法、数据处理方法以及相关设备
CN111104874A (zh) 人脸年龄预测方法及模型的训练方法、装置及电子设备
CN112529149A (zh) 一种数据处理方法及相关装置
CN115862840A (zh) 关节疼痛疾病的智能辅助诊断方法和装置
CN112328896B (zh) 用于输出信息的方法、装置、电子设备和介质
CN113065634B (zh) 一种图像处理方法、神经网络的训练方法以及相关设备
CN114169393A (zh) 一种图像分类方法及其相关设备
CN113762046A (zh) 图像识别方法、装置、设备以及存储介质
CN110377741B (zh) 文本分类方法、智能终端及计算机可读存储介质
CN116705196A (zh) 基于符号图神经网络的药物靶标互作用预测方法及装置
CN109543187B (zh) 电子病历特征的生成方法、装置及存储介质
CN115795025A (zh) 一种摘要生成方法及其相关设备
CN113989562B (zh) 模型训练、图像分类方法和装置
CN116088717A (zh) 一种模型的训练方法、数据处理方法以及相关设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CP03 Change of name, title or address

Address after: 518000 podium building 206, building 12, Shenzhen Bay science and technology ecological park, No. 18, Keji South Road, high tech Zone, Yuehai street, Nanshan District, Shenzhen, Guangdong

Patentee after: Yilinyun (Shenzhen) Technology Co.,Ltd.

Address before: 518000 podium building 213, building 12, Shenzhen Bay science and technology ecological park, No. 18, Keji South Road, community, high tech Zone, Yuehai street, Nanshan District, Shenzhen, Guangdong

Patentee before: Yilinyun (Shenzhen) Technology Co.,Ltd.

CP03 Change of name, title or address
CP03 Change of name, title or address

Address after: Room 219-5, Building 1, No. 39 Qiyuan Road, Qianwan New District, Ningbo City, Zhejiang Province 315000

Patentee after: Yilinyun (Ningbo) Technology Co.,Ltd.

Country or region after: China

Address before: 518000 podium building 206, building 12, Shenzhen Bay science and technology ecological park, No. 18, Keji South Road, high tech Zone, Yuehai street, Nanshan District, Shenzhen, Guangdong

Patentee before: Yilinyun (Shenzhen) Technology Co.,Ltd.

Country or region before: China