CN113901234A - 新药临床试验信息采集分析装置 - Google Patents
新药临床试验信息采集分析装置 Download PDFInfo
- Publication number
- CN113901234A CN113901234A CN202111215217.0A CN202111215217A CN113901234A CN 113901234 A CN113901234 A CN 113901234A CN 202111215217 A CN202111215217 A CN 202111215217A CN 113901234 A CN113901234 A CN 113901234A
- Authority
- CN
- China
- Prior art keywords
- information
- basic
- data
- research
- drug
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/34—Browsing; Visualisation therefor
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H20/00—ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance
- G16H20/10—ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance relating to drugs or medications, e.g. for ensuring correct administration to patients
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Animal Behavior & Ethology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Medicinal Chemistry (AREA)
- Epidemiology (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Primary Health Care (AREA)
- Public Health (AREA)
- Medical Treatment And Welfare Office Work (AREA)
Abstract
本发明属于新药临床试验技术领域,具体涉及一种新药临床试验信息采集分析装置。所述装置包括信息采集端、信息分析端和结果展示端;所述信息采集端用于采集药物基本信息和病例基本信息,所述信息分析端用于汇总上述药物基本信息和病例基本信息,排除冗余信息,保留与药物以及病例有关联的有效信息;所述知识图谱生成模块用于将所述有效信息生成可视化的知识图谱;所述结果展示端用于展示生成的知识图谱。本发明首次以新药疗效评价数据收集为目的,构建了关于新药疗效的知识图谱,并对知识图谱进行解释说明,既实现了临床实验数据与真实世界数据的互联互通,还形象化的展示出了药物研发结果,帮助研发人员理解药物有效性和安全性等信息。
Description
技术领域
本发明属于新药临床试验技术领域,具体涉及一种新药临床试验信息采集分析装置。
背景技术
临床试验是新药上市的必要步骤,其是指在志愿者病人或者志愿者健康人的机体进行的研究试验,涉及对志愿者性别、年龄、既往病史等多个基本信息的采集,也涉及志愿者服用药物后的生命指征变化,通过分析这些复杂繁多的信息,汇总出药物的有效性和副作用等信息,经过多轮的临床试验后,最终确定药物的安全性、有效性和服用剂量等。
由于新药的临床试验涉及的数据种类和数量均非常庞大,因此,数据采集的完整性和准确性直接关系到药物疗效评价和试验效率。最早期,这些庞大复杂的数据是通过人工统计、计算和分析的,需要耗费大量的人力和时间,随着信息技术的发展和人工智能的应用,数据采集的效率和质量均有所提高,使得药物临床试验的有效性也有所提高。
中国专利CN108830034B公开了一种医药临床研发信息处理系统及方法,所述系统包括研发主体端和使用主体端,所述研发主体端包括第一通信模块、第一信息接收分析存储模块、第一信息调用分析处理模块和报告生成模块,所述使用主体端包括用于采集录入、存储、传输的终端,通过将研发主体端和使用主体端进行信息交互,实时向研发人员反馈临床试验结果,便于研发人员及时收集药效试验结果和调整试验方案,提高了药物研发效能。
但是,上述专利的分析结果展示是一个模糊的过程,不够具体化。鉴于新药临床试验数据的繁杂性和数据分析的复杂性,数据的处理需要专业的信息处理人员,而药物研发人员一般只对药物的研发过程具有深刻的理解和认识,对于复杂的信息处理过程较难掌握。那么,新药的临床试验设计和结果分析就需要不同领域的人员配合处理,增加了技术人员之间的交流难度,如果能开发一套可具体化展示数据分析结果的装置,将给非计算机信息专业药物研发技术人员带来极大的便利,也便于非计算机信息专业医务人员对新药的了解。
发明内容
为了解决上述技术问题,本发明提供了一种新药临床试验信息采集分析装置,将大量的新药临床试验数据分析结果通过知识图谱的形式展示出来,直观,易理解,可有效辅助新药的研发。
本发明的目的是提供一种新药临床试验信息采集分析装置,包括:信息采集端、信息分析端和结果展示端;
所述信息采集端包括研发数据采集端和试用者数据采集端;所述研发数据采集端用于录入药物基本信息,所述试用者数据采集端用于录入临床试药人员的病例基本信息;
所述信息分析端包括研发数据归档模块、试用者数据归档模块、信息分析模块、信息排查模块、知识图谱生成模块;
所述研发数据归档模块用于将录入的药物基本信息进行分类,并与药物名称进行对应,并建立多个反应分类信息的研发数据表;
所述试用者数据归档模块用于将录入的病例基本信息进行分类,并与药物名称进行对应,并建立多个反应分类信息的病例数据表;
所述信息分析模块用于对所述研发数据表和所述病例数据表中的数据进行关联对应,确定所述药物基本信息与所述病例基本信息之间的对应关系,并建立多个关联信息数据表来保存所述对应关系;
所述信息排查模块用于排除所述关联信息数据表中的冗余数据,保留与药物以及病例有关联的有效信息;
所述知识图谱生成模块用于将所述有效信息生成可视化的知识图谱;
所述结果展示端用于展示生成的知识图谱。
优选的,上述新药临床试验信息采集分析装置,所述研发数据采集端包括研发数据录入模块和研发数据存储模块;所述研发数据录入模块用于直接录入药物基本信息,所述研发数据存储模块用于存储录入的药物基本信息。
优选的,上述新药临床试验信息采集分析装置,所述药物基本信息是药物的调研、立项、研发过程、理化性质、治病机理的指标。
优选的,上述新药临床试验信息采集分析装置,所述试用者数据采集端包括试用者数据录入模块和试用者数据存储模块,所述试用者数据录入模块用于直接录入病例基本信息,所述试用者数据存储模块用于存储录入的病例基本信息。
优选的,上述新药临床试验信息采集分析装置,所述病例基本信息指试药人员的常规检测指标、临床影像科检测指标和临床体液、血液检验科检测指标在试用药物前后的变化信息。
优选的,上述新药临床试验信息采集分析装置,每个所述关联信息数据表中均包含一组药物基本信息和一组病例基本信息,一组药物基本信息是指药物基本信息中不同指标的具体值的组合,一组病例基本信息是指病例基本信息中不同指标用药前后的具体值的组合,通过关联信息数据表来反应药物基本信息表中不同指标对病例基本信息中不同指标的对应关系。
优选的,上述新药临床试验信息采集分析装置,所述信息排查模块排除所述关联信息数据表中的冗余数据的方法如下:
第一步,选定待分析的药物名称,调用与该药物名称相关的所有关联信息数据表;
第二步,对所有关联信息数据表中的所有指标进行划分,分为基本类别和药效类别,所述基本类别中包含的是对药物适应症无显著影响的非相关指标,所述药效类别中包含的是对药物适应症有显著影响的直接相关指标;
第三步,排除关联信息数据表中所有的非相关指标,得到数据简化表,其作为有效信息,用于制作知识图谱。
优选的,上述新药临床试验信息采集分析装置,所述非相关的指标和所述直接相关的指标根据临床经验划分,或者根据主成分分析法划分。
优选的,上述新药临床试验信息采集分析装置,所述经验法划分的具体过程如下:
研发人员根据动物实验情况对药物基本信息划分出直接相关指标和非相关指标,临床医务人员根据临床经验对病例基本信息划分出直接相关指标和非相关指标,直接相关指标对于药物疗效有显著影响,非相关指标对于药物疗效无显著影响。
优选的,上述新药临床试验信息采集分析装置,所述主成分分析法划分的具体过程如下:
将目的适应症的疗效作为因变量,将病例基本信息和药物基本信息的各指标分别作为自变量,利用SPSS软件进行主成分分析,最终在病例基本信息和药物基本信息中分别筛选出主成分的得分值最高的若干个指标,将其作为直接相关指标,将其余的指标作为非相关指标。
与现有技术相比,本发明具有以下有益效果:
1、本发明首次以新药疗效评价数据收集为目的,构建了关于新药疗效的知识图谱,并对知识图谱进行解释说明,既实现了临床实验数据与真实世界数据的互联互通,还形象化的展示出了药物研发结果,帮助研发人员理解药物有效性和安全性等信息。
2、本发明所构建的知识图谱形象化、具体化,其包含了与药物疗效相关的重要指标信息,比如用量、用法、疗效、适用人群、生理指标等,本发明从众多试验数据中筛选出了与药物、受试人员显著性相关的指标,排除了冗余数据的影响,在不影响药物评价真实性的基础上简化了数据处理和数据表证过程,我们将这些指标按照重要程度排序,最终绘制出表示药物、受试人员、指标间关系的知识图谱,可用性和可信度均较高。
3、本发明以乳腺癌新药研发为例,解释了知识图谱的构建过程,包括如何进行临床试验数据采集、分析、如何与真实世界电子病历之间进行关联等,实现了乳腺癌新药研发临床试验与真实世界病例之间的知识共建、共享和重用,利用知识图谱实现了乳腺癌新药研发临床试验数据与真实世界病例间的互联和互通。
附图说明
图1为本发明新药临床试验信息采集分析装置的原理图;
图2为本发明实施例1制作的知识图谱一;
图3为本发明实施例1制作的知识图谱二。
具体实施方式
为了使本领域技术人员更好地理解本发明的技术方案能予以实施,下面结合具体实施例和附图对本发明作进一步说明。
本发明提供了一种新药临床试验信息采集分析装置,包括信息采集端、信息分析端和结果展示端。装置原理图参见图1。
所述信息采集端包括研发数据采集端和试用者数据采集端,所述研发数据采集端用于录入药物基本信息;所述药物基本信息主要是有关药物的调研、立项、研发过程、理化性质、治病机理等指标,其包括药物外观信息、理化信息、机理信息和其他信息,所述药物外观信息包括药物颜色(白色、黄色、粉色等)、剂型(片剂、针剂、胶囊、颗粒、口服液等)、性状(粉末、液体、半固体等)、制备药物的辅料(淀粉、蔗糖等),所述理化信息包括药物名称、药物中有效物质的化学结构式、熔点、沸点等,所述机理信息包括药物中有效活性物质的来源,药物处理方式、动物实验及细胞实验情况、有效物质的治病活性基团、药物治病机理、本药物与其他药物间的相互作用原理等,所述其他信息是指除上述信息之外的有关药物的信息。
所述研发数据采集端包括研发数据录入模块和研发数据存储模块;所述研发数据录入模块可以是手机、计算机、平板电脑等,这些设备具有人机交互界面,可以手动录入各类药物基本信息;所述研发数据存储模块用于存储录入的药物基本信息,其可采用服务器或者研发数据录入模块自带的存储器存储,便于研发人员实时调用和查看药物基本信息。
所述试用者数据采集端用于录入临床试药人员的病例基本信息;所述病例基本信息主要是有关试药人员的常规检测指标(比如性别、年龄、身高、体重、三围、血压等)、用药情况(比如药物的用法用量、用药时间、其他药物联合治疗方案等)、临床影像科检测指标(比如B超、彩超、CT等)以及临床体液、血液检验科检测指标(比如尿常规、粪便常规、血常规、肝肾功能指标、传染病指标等),尤其是需要录入药物适应症相关指标的变化。可将某一具体检测指标的用药前后变化值作为一个录入指标使用,变化值越大,说明药物对该指标的影响越大,此时需注意录入指标与真实世界的检测指标间的区别,试用者数据采集端采集的是录入指标,而录入指标是用药前后统一检测指标间的差值。病例基本信息必须包括上述各项指标用药前的信息和用药后的信息,便于比较和观察试药人员用药后的生理健康状态。所述其他信息是指除上述信息之外的有关试药者病例的信息。
所述试用者数据采集端与所述研发数据采集端相似,所述试用者数据采集端包括试用者数据录入模块和试用者数据存储模块;所述试用者数据录入模块可以是手机、计算机、平板电脑等,这些设备具有人机交互界面,可以手动录入各类病例基本信息;所述试用者数据存储模块可采用服务器或者试用者数据录入模块自带的存储器存储,用于存储录入的病例基本信息,便于临床医务人员实时调用和查看病例基本信息。
所述信息分析端用于将研发数据采集端采集的药物基本信息和试用者数据采集端采集的病例基本信息汇总,以实现研发数据采集端和试用者数据采集端中数据的互联互通。所述信息分析端包括研发数据归档模块、试用者数据归档模块、信息分析模块、信息排查模块、知识图谱生成模块。
所述研发数据归档模块用于将录入的药物基本信息进行分类,并与药物名称进行对应,并建立多个反应分类信息的研发数据表,便于日后的调用和溯源。比如有一个研发数据表来记录一种药物名称及其基本信息,且该研发数据表对应一个录入信息的人员姓名、录入日期等,通过这个研发数据表将药物名称以及与其对应的其他药物基本信息、录入人员姓名、录入日期等进行关联,并对该研发数据表进行编号;对于不同的药物名称,建立各自对应的研发数据表,一个研发数据表对应一个编号,需要调用研发数据表中的内容时,只需要通过研发数据录入模块输入研发数据表表格编号即可。
所述试用者数据归档模块用于将录入的病例基本信息进行分类,并与药物名称进行对应,并建立多个反应分类信息的病例数据表,便于日后的调用和溯源。比如有一个病例数据表来记录一种病例姓名及其基本信息,且该病例数据表对应一个录入信息的人员姓名、录入日期等,通过这个病例数据表将病例姓名以及与其对应的其他病例基本信息、录入人员姓名、录入日期等进行关联,并对该病例数据表进行编号;对于不同的病例姓名,建立各自对应的病例数据表,如果出现重名,则在姓名后附加标识符,来区分不同的药物试用者病例,一个病例数据表对应一个编号,需要调用病例数据表中的内容时,只需要通过试用者数据录入模块输入表格编号即可。
所述信息分析模块用于对所述研发数据表和所述病例数据表进行关联对应,给出所述药物基本信息与所述病例基本信息之间的对应关系,并建立多个关联信息数据表来保存这些对应关系。每个关联信息数据表中均包含一组药物基本信息和一组病例基本信息,一组药物基本信息是指药物基本信息中不同指标的具体值的组合,对于不同的药物,即使是同一指标,其具体值也可能是不同的,比如对于剂型这个指标,有的是针剂,有的是片剂;一组病例基本信息是指病例基本信息中不同指标用药前后的具体值的组合,比如对于同一个糖尿病病例的同一个血糖指标,其在用药前后的血糖值可能是不同的。通过关联信息数据表来反应药物基本信息中不同指标对病例基本信息中不同指标的对应关系。比如一个药物的药物用量与病例的体重之间有对应关系,随着体重的逐渐增加,药物的用量逐渐提高;再比如一个药物的使用剂型与病例年龄相关,儿童可采用服帖、粉末颗粒,成人可采用口服片剂、胶囊。
所述信息排查模块用于排除所述关联信息数据表中的冗余数据,保留与药物以及病例关联度较高的有效信息,具体如下:
第一步,选定待分析的药物名称,所述信息排查模块调用与该药物名称相关的所有关联信息数据表;
第二步,所述信息排查模块对所有关联信息数据表中的所有指标进行划分,这些指标包括药物基本信息中的指标,也包括病例基本信息中的指标,将这些指标分为基本类别和药效类别;所述基本类别中包含的是对药物适应症无显著影响的非相关指标,所述药效类别中包含的是对药物适应症有显著影响的直接相关指标。
需要说明的是,上述指标中哪些指标与药物直接相关,哪些指标与药物非相关根据临床经验法划分,或者根据主成分分析法划分。
所述经验法划分的具体过程如下:
(1)从研发部门获取,研发人员根据动物实验情况对药物基本信息划分出直接相关指标和非相关指标,比如经过动物实验发现药物剂型对于药物疗效没有显著影响,而药物用量对药物疗效有显著影响,那么药物剂型就作为非相关指标,药物用量就作为相关指标;需要说明的是,上述显著影响或者不显著影响可通过显著性分析进行,比如通过显著性分析出具有P<0.05或P<0.01水平影响的指标,将其作为具有显著影响的指标;那么与该药物相关的其余指标可作为非相关指标;
(2)临床医务人员根据临床经验对病例基本信息划分出直接相关指标和非相关指标,由于每种疾病对应的指标都是具有公认规律的,所以通过临床经验划分的可信度也较高,比如如果临床试验的是治疗高血压的药物,那么,直接相关指标就可选择年龄、血压、高血压病史等,非相关指标就可选择性别等。
所述主成分分析法划分的具体过程如下:
第一步,由于药物研发的目的是开发出具有目的适应症的药物,所以将目的适应症的疗效作为因变量,将病例基本信息和药物基本信息的各指标分别作为自变量,利用SPSS软件进行主成分分析,最终在病例基本信息和药物基本信息中分别筛选出主成分的得分值的绝对值(有些主成分得分值是正数,有些是负数,这是因为影响方向不同,对应到本发明的情况就是正向疗效和反向疗效,正向疗效就是疾病得到改善,反向疗效就是疾病恶化或者副作用大)最高的若干个指标,将其作为直接相关指标,将其余的指标作为非相关指标。
第二步,由于病例基本信息和药物基本信息中的每个指标都可能在不同程度上反应药物疗效,即使是同一种适应症和同一种药物,其各种药物基本信息指标内容和病例基本信息指标内容也是不同的,我们将这些内容不同但是却属于同一指标的信息作为自变量,所以,为了排除经验划分的人为因素干扰,采用主成分分析法可对每个对药物疗效有潜在影响的数据进行分析,提高结果可信度。
第三步,排除关联信息数据表中所有的非相关指标,得到数据简化表,其作为有效信息,利用记载了直接相关指标的数据简化表制作知识图谱;
优选的,对于上述主成分分析法划分出的直接相关指标和非相关指标,排除关联信息数据表中所有的非相关指标之前先进行校验,具体如下:
随机调用一个非相关指标,其与将筛选出的直接相关指标均作为自变量,将目的适应症的疗效作为因变量,然后重复上述“第二步”的主成分分析法操作一次,对所有的自变量进行得分排序,如果发现随机调用的指标排序为末位,就说明直接相关指标的选择是正确的。
重复校验至少3次,且随机调用的是不同于前几次的指标,如果每次都是随机调用的指标排序为末位,就说明信息排查过程无误,将选择出的直接相关指标用于绘制知识图谱。
所述知识图谱生成模块用于将所述有效信息生成一个可视化的知识图谱,所述知识图谱二维图谱或者三维图谱形式,所述二维图谱为包括多个峰谱图的统计图,或者包含多个像素点的统计图。
所述结果展示端用于将生成的知识图谱展示出来,其可以选择显示器或者打印机来实现该项功能。研发人员通过比较不同药物的知识图谱可得出它们应用于人体后的安全性和有效性,特别是当知识图谱中显示的主成分中包含对人体有害的药物副作用指标,那么即使其具有很高的治疗效果,可能也不会作为临床用药的首选。
下面以乳腺癌药物的临床试验为例,说明本发明的工作原理。
实施例1
一种新药临床试验信息采集分析装置,包括信息采集端、信息分析端和结果展示端。
所述信息采集端包括研发数据采集端和试用者数据采集端,所述研发数据采集端用于录入药物基本信息;所述药物基本信息其包括药物外观信息、理化信息和机理信息,所述药物外观信息包括药物颜色(白色)、剂型(片剂)、制备药物的辅料(淀粉),所述理化信息包括药物名称(抗乳腺癌药A),所述机理信息包括药物处理方式(口服),作用对象(乳腺癌细胞株MCF-7)。药物基本信息中共计6个指标。
所述研发数据采集端包括研发数据录入模块和研发数据存储模块;所述研发数据录入模块是计算机;所述研发数据存储模块用于存储录入的药物基本信息,其采用云端服务器。
所述试用者数据采集端用于录入临床试药人员的病例基本信息;所述病例基本信息包括常规检测指标(性别、年龄、身高、体重、血压)、药物用量(一日三次,一次2g,连续使用半个月)、临床影像科检测指标(比如乳腺彩超)以及尿液、血液检验科检测指标(血常规、肝功能、肾功能,为了简单直观的说明本发明的原理,将血液检测指标的血常规、肝功能、肾功能分别归纳为一个指标),上述各项指标除性别、年龄、身高外,其余指标均需要录入用药前的信息和用药后的信息差值。病例基本信息中共计11个指标。
所述试用者数据采集端包括试用者数据录入模块和试用者数据存储模块;所述试用者数据录入模块是计算机;所述试用者数据存储模块采用与研发数据存储模块相同的云端服务器。
所述信息分析端包括研发数据归档模块、试用者数据归档模块、信息分析模块、信息排查模块、知识图谱生成模块。
所述研发数据归档模块用于将录入的药物基本信息进行分类和对应,并建立多个反应分类信息和对应关系的研发数据表,本实施例将药物基本信息的6个指标、录入人员姓名、录入日期、等进行关联,一个指标为一类,药物基本信息录入人员姓名、录入日期为一组对应关系数据。
所述试用者数据归档模块用于将录入的病例基本信息进行分类和对应,并建立多个反应分类信息和对应关系的病例数据表,本实施例将病例基本信息的11个指标、录入人员姓名、录入日期等进行关联,一个指标为一类,药物基本信息录入人员姓名、录入日期为一组对应关系数据。
所述信息分析模块用于对所述研发数据表和所述病例数据表进行关联对应,给出所述药物基本信息与所述病例基本信息之间的对应关系,并建立多个关联信息数据表来保存这些对应关系。
本实施例将药物基本信息的6个指标作为纵列标题,病例基本信息的11个指标作为横列标题,将乳腺癌肿瘤块尺寸大小(表示药物疗效)作为指标具体值,制作excel表格,作为关联信息数据表,对于不同的病例或者药物,乳腺癌肿瘤块尺寸大小是不同的,那么表示的疗效也就是不同的。
所述信息排查模块用于排除所述关联信息数据表中的冗余数据,保留与药物以及病例关联度较高的有效信息,具体如下:
第一步,选定待分析的药物名称,所述信息排查模块调用与该药物名称相关的所有关联信息数据表;
第二步,所述信息排查模块对所有关联信息数据表中的所有指标进行划分,这些指标包括药物基本信息中的指标,也包括病例基本信息中的指标,将这些指标分为基本类别和药效类别;所述基本类别中包含的是对药物适应症无显著影响的非相关指标,所述药效类别中包含的是对药物适应症有显著影响的直接相关指标。排除关联信息数据表中所有的非相关指标,得到数据简化表,其作为有效信息,利用记载了直接相关指标的数据简化表制作知识图谱。
本实施例采用主成分分析法划分,最终筛选出的直接相关指标有处理方式、药物用量、作用对象、乳腺彩超、血常规、体重、肝功能、肾功能,其余指标为非相关指标。
所述知识图谱生成模块用于将所述有效信息生成一个可视化的表格形式的二维知识图谱,所述结果展示端用于将生成的知识图谱展示出来,参见图2。图2中将直接相关指标的重要性按照从大到小的顺序依次横向或纵向排列,横向表示病例基本信息的指标,纵向表示药物基本信息的指标,可看出这些指标对肿瘤疗效的影响趋势。
或者,我们利用知识图谱生成模块生成一个可视化的放射形式的二维知识图谱,参见图3,将药品名称与各个直接相关指标按照象限和重要性大小分布,比如图3所示右上象限为显著影响因素,涉及到药物与药物用量及其处理方式与作用对象(表示适应症)、乳腺彩超(表示药效)等信息之间的相互关系,左上象限为一般影响因素,涉及到药物用量及其处理方式与血常规指标间的相互关系,左下象限为副作用影响因素,涉及了药物用量及其处理方式与肝功能、肾功能之间的相互作用关系,右下象限为基本无影响因素,涉及了药物用量及其处理方式与体重之间的相互作用关系。在图3中,药物名称与指标名称之间的指引线越长表示影响力越大。
需要说明的是,本实施例只是为了解释本发明的工作原理,故将血常规视为一个指标,实际上血常规应当包含多项检测指标。另外,本实施例最终得出的非相关指标和直接相关指标也是模拟数据,不应将其直接作为某种乳腺癌药物的知识图谱。
需要说明的是,对于某种特定的疾病,其存在多个用药术语和疗效术语,用药术语的标准化可以促进数据的规范化采集,利于数据的统计分析,要想实现药物临床试验数据管理系统与真实世界数据的共享和交换,遵循相应的标准和规范是基础。为了本发明的装置正确理解数据,必须采取准确一致的形式表达数据的含义。医学术语和本体是业内公认的将数据形式化(编码)的标准,目的是避免计算机对数据产生误解或歧义。CDISC是目前FDA和包括中国在内的其他国家在药物临床试验过程中普遍采用的标准,SNOMED CT、LOINC是目前电子病历中应用比较广泛的概念表达标准。因此本发明构建的知识图谱可与CDISC、SNOMED CT和LOINC标准对照协同,包括乳腺癌药物治疗疗效实体、实体属性、实例编码等概念。旨在确保数据的一致性表达。
需要说明的是,本发明中涉及数值范围时,应理解为每个数值范围的两个端点以及两个端点之间任何一个数值均可选用,由于采用的步骤方法与实施例相同,为了防止赘述,本发明描述了优选的实施例。尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。
Claims (10)
1.新药临床试验信息采集分析装置,其特征在于,包括:信息采集端、信息分析端和结果展示端;
所述信息采集端包括研发数据采集端和试用者数据采集端;所述研发数据采集端用于录入药物基本信息,所述试用者数据采集端用于录入临床试药人员的病例基本信息;
所述信息分析端包括研发数据归档模块、试用者数据归档模块、信息分析模块、信息排查模块、知识图谱生成模块;
所述研发数据归档模块用于将录入的药物基本信息进行分类,并与药物名称进行对应,并建立多个反应分类信息的研发数据表;
所述试用者数据归档模块用于将录入的病例基本信息进行分类,并与药物名称进行对应,并建立多个反应分类信息的病例数据表;
所述信息分析模块用于对所述研发数据表和所述病例数据表中的数据进行关联对应,确定所述药物基本信息与所述病例基本信息之间的对应关系,并建立多个关联信息数据表来保存所述对应关系;
所述信息排查模块用于排除所述关联信息数据表中的冗余数据,保留与药物以及病例有关联的有效信息;
所述知识图谱生成模块用于将所述有效信息生成可视化的知识图谱;
所述结果展示端用于展示生成的知识图谱。
2.根据权利要求1所述的新药临床试验信息采集分析装置,其特征在于,所述研发数据采集端包括研发数据录入模块和研发数据存储模块;所述研发数据录入模块用于直接录入药物基本信息,所述研发数据存储模块用于存储录入的药物基本信息。
3.根据权利要求2所述的新药临床试验信息采集分析装置,其特征在于,所述药物基本信息是药物的调研、立项、研发过程、理化性质、治病机理的指标。
4.根据权利要求1所述的新药临床试验信息采集分析装置,其特征在于,所述试用者数据采集端包括试用者数据录入模块和试用者数据存储模块,所述试用者数据录入模块用于直接录入病例基本信息,所述试用者数据存储模块用于存储录入的病例基本信息。
5.根据权利要求4所述的新药临床试验信息采集分析装置,其特征在于,所述病例基本信息指试药人员的常规检测指标、临床影像科检测指标和临床体液、血液检验科检测指标在试用药物前后的变化信息。
6.根据权利要求1所述的新药临床试验信息采集分析装置,其特征在于,每个所述关联信息数据表中均包含一组药物基本信息和一组病例基本信息,一组药物基本信息是指药物基本信息中不同指标的具体值的组合,一组病例基本信息是指病例基本信息中不同指标用药前后的具体值的组合,通过关联信息数据表来反应药物基本信息表中不同指标对病例基本信息中不同指标的对应关系。
7.根据权利要求6所述的新药临床试验信息采集分析装置,其特征在于,所述信息排查模块排除所述关联信息数据表中的冗余数据的方法如下:
第一步,选定待分析的药物名称,调用与该药物名称相关的所有关联信息数据表;
第二步,对所有关联信息数据表中的所有指标进行划分,分为基本类别和药效类别,所述基本类别中包含的是对药物适应症无显著影响的非相关指标,所述药效类别中包含的是对药物适应症有显著影响的直接相关指标;
第三步,排除关联信息数据表中所有的非相关指标,得到数据简化表,其作为有效信息,用于制作知识图谱。
8.根据权利要求7所述的新药临床试验信息采集分析装置,其特征在于,所述非相关的指标和所述直接相关的指标根据临床经验划分,或者根据主成分分析法划分。
9.根据权利要求8所述的新药临床试验信息采集分析装置,其特征在于,所述经验法划分的具体过程如下:
研发人员根据动物实验情况对药物基本信息划分出直接相关指标和非相关指标,临床医务人员根据临床经验对病例基本信息划分出直接相关指标和非相关指标,直接相关指标对于药物疗效有显著影响,非相关指标对于药物疗效无显著影响。
10.根据权利要求8所述的新药临床试验信息采集分析装置,其特征在于,所述主成分分析法划分的具体过程如下:
将目的适应症的疗效作为因变量,将病例基本信息和药物基本信息的各指标分别作为自变量,利用SPSS软件进行主成分分析,最终在病例基本信息和药物基本信息中分别筛选出主成分的得分值最高的若干个指标,将其作为直接相关指标,将其余的指标作为非相关指标。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111215217.0A CN113901234A (zh) | 2021-10-19 | 2021-10-19 | 新药临床试验信息采集分析装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111215217.0A CN113901234A (zh) | 2021-10-19 | 2021-10-19 | 新药临床试验信息采集分析装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113901234A true CN113901234A (zh) | 2022-01-07 |
Family
ID=79192716
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111215217.0A Pending CN113901234A (zh) | 2021-10-19 | 2021-10-19 | 新药临床试验信息采集分析装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113901234A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116758062A (zh) * | 2023-08-11 | 2023-09-15 | 之江实验室 | 一种药物有效性评价方法及装置 |
-
2021
- 2021-10-19 CN CN202111215217.0A patent/CN113901234A/zh active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116758062A (zh) * | 2023-08-11 | 2023-09-15 | 之江实验室 | 一种药物有效性评价方法及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Savović et al. | Influence of reported study design characteristics on intervention effect estimates from randomised controlled trials: combined analysis of meta-epidemiological studies | |
Fennelly et al. | Use of standardized terminologies in clinical practice: A scoping review | |
CN109346145B (zh) | 一种药物不良反应的主动监测方法和系统 | |
WO2018010105A1 (zh) | 处方用药信息合理性数据特征分析系统 | |
CN107180157A (zh) | 医用信息处理方法 | |
CN106383993B (zh) | 医用信息的处理方法 | |
CN111274400B (zh) | 一种医学术语系统的构建方法、装置、设备及存储介质 | |
CN107480433A (zh) | 具有统计分析功能的输血闭环信息管理系统 | |
CN106339599A (zh) | 用药合理性检测关联信息处理方法 | |
CN111755110A (zh) | 三高共管三级协同慢病管理平台 | |
CN111180027B (zh) | 一种基于医疗大数据的患者画像相关性规则筛选方法及装置 | |
CN114048343A (zh) | 一种涵盖患者全病程医学影像信息的分类平台 | |
CN113901234A (zh) | 新药临床试验信息采集分析装置 | |
CN107680690B (zh) | 一种基于元数据的临床信息系统 | |
Shiima et al. | Classification scheme for incident reports of medication errors | |
CN106530164A (zh) | 一种两癌普查数据采集报送管理系统 | |
Zeng et al. | Providing multiple views to meet physician information needs | |
Allain et al. | Use of an electronic medical record to monitor efficacy of diabetes care in out-patients in a central hospital in Malawi: Patterns of glycaemic control and lessons learned | |
Morton et al. | Interventions to aid employment for people on dialysis and their families | |
CN111128330A (zh) | 电子病例报告表自动录入方法、装置以及相关设备 | |
Scott et al. | Using bar-code technology to capture clinical intervention data in a hospital with a stand-alone pharmacy computer system | |
CN110911014A (zh) | 一种门诊重复用药查询分析方法及系统 | |
CN111028946A (zh) | 一种智能健康管理器、智能健康管理系统及其使用方法 | |
CN111180028B (zh) | 一种基于医疗大数据的患者画像特异性规则筛选方法及装置 | |
France et al. | Perspectives of Information Processing in Medical Applications: Strategic Issues, Requirements and Options for the European Community |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |