不良事件和合并用药的关联性判断方法及系统
技术领域
本发明主要涉及临床试验研究领域,具体地涉及一种不良事件和合并用药的关联性判断方法和系统。
背景技术
在药物临床试验研究过程中,需要对研究过程中所涉及的数据进行管理,发现所收集的数据中潜在的问题,这些问题可以包括例如违反方案、逻辑矛盾、缺失不完整、违反常识等。数据管理人员将所发现的问题内容和临床试验研究者进行进一步沟通,确保数据的真实性,保证统计结果不失真。
在药物临床试验中通常使用病例报告表(Case Report Form,CRF)记录每一名受试者在试验过程中的相关数据。病例报告表中通常包括两个特定页面,分别是不良事件(Adverse Event,AE)页面和合并用药(Concomitant Medication,CM)页面。不良事件指临床试验中的受试者在使用药物后出现的任何非期望的医学事件。合并用药指受试者在临床试验过程中除常规研究药物外服用的其他药物(包括化学药品、生物制品、中成药等)。通常在病例报告表的AE页面会询问针对某一不良事件的处理措施是什么?该处理措施可能是药物治疗或非药物治疗。若研究者选择了药物治疗,那么在相应的CM页面应该有匹配的记录,即AE页面和CM页面之间具有一定关联性和匹配度。在数据管理流程中,需要对AE页面和CM页面之间的关联性进行核查。例如:AE页面记录了病人发生了头痛,而治疗措施是药物治疗,因此数据管理人员需核查在CM页面是否有记录了能治疗头痛的药物。
在传统的数据管理流程中,为了核查不良事件和合并用药的情况,首先需要人工判断每种药物的适应症。针对上述的例子,数据管理人员需要在CM页面中逐条查看已记录的药物,并判断有没有治疗头痛的药物。在此过程中,若数据管理人员不熟悉某种药物的治疗范围,就需要通过上网等方式检索该药物的药品说明书,并人工判断说明书中的内容,以确定该药物是否能治疗头痛这一不良事件。当某药物的适应症对应该不良事件时,则在第二步,需要判断受试者使用该药物的日期和该条不良事件的发生起始日期之间是否有逻辑性。用药开始日期不能在不良事件开始日期之前,否则只能定性为预防用药,而不是治疗用药。若日期也匹配的话,则数据管理人员可以判断研究者在AE页面和CM页面填写的数据无误。如果发现不能匹配的情况,则说明研究者填写的数据有问题,需要和研究人员进一步沟通以解决该问题。
根据传统的数据管理流程,需要耗费大量的人力,工作效率低,且错误率高。
发明内容
本发明所要解决的技术问题是提供一种高效准确的完成AE页面和CM页面之间的关联性判断的方法和系统。
本发明为解决上述技术问题而采用的技术方案是一种不良事件和合并用药的关联性判断方法,其特征在于,包括以下步骤:呈现合并用药页面,在所述合并用药页面接收对应于临床试验受试者的合并用药记录的第一输入,所述合并用药记录至少包括药品名称和开始日期;呈现不良事件页面,在所述不良事件页面接收对应于所述临床试验受试者的不良事件信息的第二输入,所述不良事件信息至少包括不良事件名称和开始日期;响应于触发操作,在所述不良事件页面触发对选定的不良事件及其所对应的至少一项合并用药的关联性计算,获得关联性判断结果;以及呈现关联性判断结果页面,在所述关联性判断结果页面显示所述不良事件及其所对应的至少一项合并用药的关联性判断结果。
在本发明的一实施例中,在所述触发操作之前,还包括:按照合并用药记录和不良事件的逻辑关系制定过滤规则,根据所述过滤规则对所述合并用药记录进行过滤,在所述关联性判断结果页面显示未通过过滤的合并用药与所述选定的不良事件的关联性判断结果为零。
在本发明的一实施例中,所述过滤规则包括:所述合并用药的开始日期要晚于或等于所述不良事件的开始日期。
在本发明的一实施例中,还包括在所述关联性判断结果页面响应于对所述至少一项合并用药的剂型的选择,呈现所选择的剂型的药品说明书。
在本发明的一实施例中,对选定的不良事件及其所对应的至少一项合并用药的关联性计算,包括以下步骤:获取所述合并用药的药品说明书;从所述药品说明书中提取多个适应症关键词;从预训练的词向量中提取所述多个适应症关键词的向量表示;在所述药品说明书中统计所述多个适应症关键词的词频;根据所述词频为所述多个适应症关键词分配权重,将所述多个适应症关键词结合权重融合生成合并用药向量表示;计算所述不良事件的向量表示和所述合并用药向量表示的相似度;以及将所述相似度作为所述关联性判断结果。
在本发明的一实施例中,计算所述不良事件的向量表示和所述合并用药向量表示的相似度的方法包括采用余弦相似度算法。
在本发明的一实施例中,所述药品说明书是由网络爬虫获得。
在本发明的一实施例中,获得所述预训练的词向量的步骤包括:收集医学语料,所述医学语料包括药物名称、疾病和症状;对所述医学语料进行分词,获得分词结果;以及训练所述分词结果获得词向量。
在本发明的一实施例中,通过隐马尔科夫模型对所述医学语料进行分词。
在本发明的一实施例中,通过word2vec算法训练所述分词结果。
本发明为解决上述技术问题还提出一种不良事件和合并用药的关联性判断系统,包括:存储器,用于存储可由处理器执行的指令;处理器,用于执行所述指令以实现如上所述的方法。
本发明为解决上述技术问题还提出一种存储有计算机程序代码的计算机可读介质,所述计算机程序代码在由处理器执行时实现如上所述的方法。
本发明的技术方案从网络获取大量的药品说明书,通过语义分析和处理技术,对不良事件和合并用药之间的关联性进行计算,计算结果精确、准确性高,并且通过页面形象直观的显示和更新关联性判断结果,从整体上提高了数据管理流程的效率。
附图说明
为让本发明的上述目的、特征和优点能更明显易懂,以下结合附图对本发明的具体实施方式作详细说明,其中:
图1是本发明一实施例的不良事件和合并用药的关联性判断方法的示例性流程图;
图2是本发明一实施例的关联性判断方法中的合并用药页面的示意图;
图3是本发明一实施例的关联性判断方法中的不良事件页面的示意图;
图4是本发明一实施例的关联性判断方法中的关联性判断结果的计算方法的示例性流程图;
图5A和5B本发明一实施例的关联性判断方法中的关联性判断结果页面的示意图。
具体实施方式
为让本发明的上述目的、特征和优点能更明显易懂,以下结合附图对本发明的具体实施方式作详细说明。
在下面的描述中阐述了很多具体细节以便于充分理解本发明,但是本发明还可以采用其它不同于在此描述的其它方式来实施,因此本发明不受下面公开的具体实施例的限制。
如本申请和权利要求书中所示,除非上下文明确提示例外情形,“一”、“一个”、“一种”和/或“该”等词并非特指单数,也可包括复数。一般说来,术语“包括”与“包含”仅提示包括已明确标识的步骤和元素,而这些步骤和元素不构成一个排它性的罗列,方法或者设备也可能包含其他的步骤或元素。
本申请中使用了流程图用来说明根据本申请的实施例的系统所执行的操作。应当理解的是,前面或下面操作不一定按照顺序来精确地执行。相反,可以按照倒序或同时处理各种步骤。同时,或将其他操作添加到这些过程中,或从这些过程移除某一步或数步操作。
图1是本发明一实施例的不良事件和合并用药的关联性判断方法的示例性流程图。图2-5B是在该实施例的关联性判断方法的过程中所涉及到的页面的示意图。下面结合图1和图2-5B来说明该实施例的关联性判断方法的步骤。具体地,参考图1所示,该实施例的关联性判断方法包括以下步骤:
步骤110,呈现合并用药页面,在合并用药页面接收对应于临床试验受试者的合并用药记录的第一输入。这里的合并用药记录至少包括药品名称和开始日期。
图2是本发明一实施例的关联性判断方法中的合并用药页面的示意图。参考图2所示,在该合并用药页面200中包括一询问框210,其中的内容为:“受试者是否发生合并用药?”。在该询问框210的右边包括相应的回答区域211,其中显示的内容为:“是”,表示该受试者发生了合并用药。
需要说明,在步骤110之前应该在病例报告表中选定了某一临床试验受试者。本发明的关联性判断方法可以是针对某一特定的临床试验受试者的不良事件和合并用药的关联性进行判断,也可以是针对某一类具有相同特征的临床试验受试者的不良事件和合并用药的关联性进行统一判断。例如这些受试者的合并用药中都包括阿司匹林,不良事件中都包括头痛。
参考图2所示,在该合并用药页面200中包括新增按键220。在受试者发生了合并用药的情况下,用户通过点击该新增按键220可以在合并用药页面200中的合并用药记录表230中增加该受试者的合并用药记录。该合并用药记录中包括该受试者所服用的除临床试验药物之外的其他药物的药品名称和开始日期。在图2所示的实施例中,合并用药记录表230中还包括其他的内容,例如:用药原因、给药剂量、给药频率、单位、给药途径和是否持续等。将用户所输入的合并用药记录作为本发明的关联性判断方法中的第一输入。
本发明中的“用户”指临床试验研究的研究人员、数据管理人员以及其他需要使用临床试验研究数据的相关人员。
需要说明,图2不用于限制本步骤中的合并用药页面的具体形式,以及合并用药记录表230中的具体内容。图2所示可以是合并用药页面的一部分而非全部。
在图2所示的实施例中,在该合并用药页面200中已经接收到了两条合并用药记录,药品名称分别是阿司匹林和地塞米松。其中,阿司匹林的用药原因是治疗AE,地塞米松的用药原因是激素联用。
步骤120,呈现不良事件页面,在不良事件页面接收对应于所述临床试验受试者的不良事件信息的第二输入。这里的不良事件信息至少包括不良事件名称和开始日期。
图3是本发明一实施例的关联性判断方法中的不良事件页面的示意图。参考图3所示,该不良事件页面300中包括新增按键310。在受试者发生了不良事件的情况下,用户通过点击新增按键310可以在不良事件页面300中的不良事件记录表320中增加该受试者的不良事件信息。该不良事件信息中至少应包括不良事件名称和开始日期。在图3所示的实施例中,不良事件记录表320中包括不良事件的编号、不良事件名称、开始日期、是否持续、结束日期、转归(是否恢复和解决)、严重程度、对临床试验药物的剂量影响、对受试者采取的措施等。将用户所输入的所有不良事件信息作为本发明的关联性判断方法中的第二输入。
本步骤中所接收的第二输入所对应的临床试验受试者和步骤110中的第一输入所对应的临床试验受试者是相同的。
需要说明,本发明的关联性判断方法对步骤110和120的先后顺序没有限制。
需要说明,图3不用于限制本步骤中的不良事件页面的具体形式,以及不良事件记录表320中的具体内容。图3所示可以是不良事件页面的一部分而非全部。
步骤130,响应于触发操作,在不良事件页面触发对选定的不良事件及其所对应的至少一项合并用药的关联性计算,获得关联性判断结果。
参考图3所示,不良事件记录表320以表格的形式给出,其中该表格的标题行为前文所述的不良事件记录表320中的内容名称,其余的每一行对应于一条不良事件。在编号所在的列中,对应于每一条不良事件信息都具有一触发按键321。当用户点击该触发按键321时,即可触发对该条不良事件及其所对应的至少一项合并用药的关联性计算。
图3所示仅为示例,不用于限制本发明的触发操作的具体形式。
关于不良事件和合并用药的关联性计算可以通过具体的算法在后台进行计算,获得关联性判断结果,该计算过程不在页面中显示。在本发明的优选实施例中,采用语义处理技术来计算不良事件和合并用药的关联性。图4是该优选实施例的关联性计算方法的示例性流程图,参考图4所示,该关联性计算的步骤包括:
步骤410,获取合并用药的药品说明书。
由于在步骤130中选定了某一项不良事件,因此,计算该不良事件和所有相关的合并用药之间的关联性。在步骤410中,获取和该不良事件相关的所有合并用药的药品说明书。该药品说明书可以预先存储在数据库中,可以由本发明的关联性计算算法调用。在一些实施例中,药品说明书是由网络爬虫获得。
步骤420,从药品说明书中提取多个适应症关键词。
通常药品说明书中会包括该药品所适用的适应症的描述。步骤420从药品说明书的文本中提取出多个适应症关键词,该多个适应症关键词都是和选定的不良事件相关。例如,当选定的不良事件为“头痛”时,则从药品说明书中提取的适应症关键词可以包括:头痛、头疼、偏头痛、神经痛、头部等等。
步骤430,从预训练的词向量中提取多个适应症关键词的向量表示。
在一些实施例中,获取预训练的词向量的步骤可以包括:
步骤431,收集医学语料。该医学语料包括药物名称、疾病和症状等。
这里所收集的医学语料应当具有相当大的数量。该医学语料可以来源于现有的药品知识库。该医学语料可以包括句子和词。
步骤432,对医学语料进行分词,获得分词结果。
所谓分词是指将语料中的内容分解为可以用标签来表示的分词结果。在一些实施例中,可以使用隐马尔科夫模型来实现对医学语料的分词。
步骤433,训练所述分词结果获得词向量。
这里的训练过程可以将分词结果转换成可以用于数学运算的词向量。在一些实施例中,可以通过word2vec算法训练分词结果,获得词分量。本发明对于分词和训练的方法不做特别限制,技术人员可以使用语义分析及处理领域常用的方法来实现步骤432和433。
经过步骤431-433可以获得预训练的词向量,该预训练的词向量中包括了大量的适应症相关的词向量,因此,可以通过搜索和匹配从预训练的词向量中提取出步骤420中的多个适应症关键词所对应的向量表示。
步骤440,在药品说明书中统计多个适应症关键词的词频。
通过遍历该药品说明书,可以统计得出每个适应症关键词出现的频率,即词频。
步骤450,根据词频为多个适应症关键词分配权重,将多个适应症关键词结合权重融合生成合并用药向量表示。
根据逆向文件频率(Inverse Document Frequency,IDF)原理,权重与词频成反比关系。因此,词频高的适应症关键词所分配的权重小,词频低的适应症关键词所分配的权重大。将多个适应症关键词与其所对应的权重融合,生成合并用药向量表示。
需要说明,该合并用药向量表示对应于某一种合并用药。
根据本发明的关联性计算方法,可以对选定的不良事件所对应的多个合并用药的药品说明书进行遍历,分别获得各自所对应的合并用药向量表示。
步骤460,计算不良事件的向量表示和合并用药向量表示的相似度。
对于不良事件的向量表示可以采用与步骤430相同的方法,从预训练的词向量中提取出该不良事件的向量表示。
关于向量表示之间的相似度的计算方法可以采用本领域技术人员所熟悉的方法,例如但不限于:曼哈顿距离相似度算法、欧式距离相似度算法、余弦相似度算法或皮尔森相似度算法等。
在本发明的优选实施例中,采用余弦相似度算法计算不良事件的向量表示和各个相关的合并用药向量表示的相似度。
步骤470,将相似度作为关联性判断结果。
通常,相似度的结果表示为一百分数。当相似度为100%时,表示该不良事件和该合并用药完全匹配。在实际应用中,为相似度设置一不到100%的阈值,当计算获得的相似度达到该阈值时,表明该不良事件和该合并用药匹配,AE页面和CM页面的输入正确;当计算获得的相似度未达到该阈值时,表明该不良事件和该合并用药不匹配,AE页面和CM页面的输入可能存在错误,需要重新进行审核。
如前所述,当在图3所示的不良事件页面300通过触发操作触发对选定的不良事件及其所对应的至少一项合并用药的关联性计算时,通过上述的计算过程,即可以获得关联性判断结果。
步骤140,呈现关联性判断结果页面,在关联性判断结果页面显示不良事件及其所对应的至少一项合并用药的关联性判断结果。
图5A和5B本发明一实施例的关联性判断方法中的关联性判断结果页面的示意图。参考图5A所示,在该关联性判断结果页面500中包括不良事件名称区510和关联性判断结果显示区520。在不良事件名称区510中可以同时显示该受试者的所有不良事件。当选定某一不良事件,例如头痛511时,则在关联性判断结果显示区520中显示关于该不良事件和合并用药之间的关联性判断结果。如图5A所示,在关联性判断结果显示区520中同时显示某一种合并用药的药物名称522、开始服药时间523以及关联性判断结果521。该关联性判断结果521以圆环表示,该圆环的闭合程度与其中央所显示的百分数相关。当该百分数为100%时,该圆环闭合。根据图5A所示的实施例,药物“阿司匹林”和不良事件“头痛”之间的关联性判断结果为99%。在关联性判断结果显示区520中还同时显示了另一种合并用药“地塞米松”的关联性判断结果为“36.61%”。
本发明的关联性判断方法还包括,对某一不良事件所对应的多项合并用药的关联性判断结果进行排序,提取关联性判断结果最高的合并用药的关联性判断结果,若该最高的关联性判断结果大于预先设定的阈值,则说明该合并用药和不良事件匹配。
在本发明的一实施例中,在步骤130的触发操作之前还包括按照合并用药记录和不良事件的逻辑关系制定过滤规则,根据过滤规则对合并用药记录进行过滤,在关联性判断结果页面显示未通过过滤的合并用药与选定的不良事件的关联性判断结果为零。在这些实施例中,该过滤规则可以包括:合并用药的开始日期要晚于或等于不良事件的开始日期。可以理解,如果合并用药的开始日期早于不良事件的开始日期,则该合并用药并不是用于治疗该不良事件的,而是受试者出于其他目的服用的,或者是错误的记录,这一类合并用药与不良事件没有关联。因此,利用过滤规则对合并用药记录进行过滤,发现有未满足该过滤规则的合并用药,则将其与选定的不良事件之间的关联性判断结果设为零。
这一过滤步骤可以在本发明的关联性判断方法中的步骤110和120中的任意一步中执行,当发现有未通过过滤的合并用药时,则在步骤130中不用再计算该未通过过滤的合并用药与选定的不良事件之间的关联性判断结果,而直接在图5A所示的关联性判断结果页面500中显示其关联性判断结果为0。
对于有些药品来说,同样一个药物名称可能对应于多个不同的药物剂型。例如,药物名称为“地塞米松”,其药物剂型可能包括复方地塞米松软膏、复方醋酸地塞米松凝胶等等,对于不同的药物剂型,其药品说明书的内容也不同。在本发明的一实施例中,还包括在关联性判断结果页面响应于对至少一项合并用药的剂型的选择,呈现所选择的剂型的药品说明书。如图5B所示,在关联性判断结果页面500中还包括药品说明书显示区530。在该药品说明书显示区530中包括剂型选择框531。用户可以通过剂型选择框531的下拉菜单来选择该受试者的合并用药对应的剂型。当选定了某一剂型之后,药品说明书显示区530中会显示对应于该种剂型的合并用药的药品说明书,并且后台算法根据更新的药品说明书重新计算该合并用药和选定的不良事件之间的相似度,作为关联性判断结果,并且更新关联性判断结果显示区520中的显示结果。
对于这些实施例来说,对合并用药的剂型的选择操作也触发对选定的不良事件及该剂型的合并用药的关联性计算,并且,关联性判断结果页面500中的显示结果随着所选择的不同剂型的合并用药的药品说明书的更新而实时更新。
根据本发明的不良事件和合并用药的关联性判断方法,可以方便高效的获得受试者不良事件和合并用药之间的关联性,并且结果精确、准确性高,从整体上提高了数据管理流程的效率。
本发明还包括一种不良事件和合并用药的关联性判断系统,包括存储器和处理器,其中存储器用于存储可由处理器执行的指令,处理器用于执行该指令以实现本发明前文所述的不良事件和合并用药的关联性判断系统。
本发明还包括一种存储有计算机程序代码的计算机可读介质,该计算机程序代码在由处理器执行时实现如上所述的不良事件和合并用药的关联性判断方法。当该不良事件和合并用药的关联性判断方法实施为计算机程序时,也可以存储在计算机可读存储介质中作为制品。例如,计算机可读存储介质可以包括但不限于磁存储设备(例如,硬盘、软盘、磁条)、光盘(例如,压缩盘(CD)、数字多功能盘(DVD))、智能卡和闪存设备(例如,电可擦除可编程只读存储器(EPROM)、卡、棒、键驱动)。此外,本文描述的各种存储介质能代表用于存储信息的一个或多个设备和/或其它机器可读介质。术语“机器可读介质”可以包括但不限于能存储、包含和/或承载代码和/或指令和/或数据的无线信道和各种其它介质(和/或存储介质)。
应该理解,上文所描述的实施例仅是示意。本文描述的实施例可在硬件、软件、固件、中间件、微码或者其任意组合中实现。对于硬件实现,处理单元可以在一个或者多个特定用途集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、处理器、控制器、微控制器、微处理器和/或设计为执行本文所述功能的其它电子单元或者其结合内实现。
虽然本发明已参照当前的具体实施例来描述,但是本技术领域中的普通技术人员应当认识到,以上的实施例仅是用来说明本发明,在没有脱离本发明精神的情况下还可作出各种等效的变化或替换,因此,只要在本发明的实质精神范围内对上述实施例的变化、变型都将落在本申请的权利要求书的范围内。