CN114168544B - 临床试验数据处理方法、装置、计算机设备和存储介质 - Google Patents

临床试验数据处理方法、装置、计算机设备和存储介质 Download PDF

Info

Publication number
CN114168544B
CN114168544B CN202111363315.9A CN202111363315A CN114168544B CN 114168544 B CN114168544 B CN 114168544B CN 202111363315 A CN202111363315 A CN 202111363315A CN 114168544 B CN114168544 B CN 114168544B
Authority
CN
China
Prior art keywords
data
file
original
clinical
clinical trial
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202111363315.9A
Other languages
English (en)
Other versions
CN114168544A (zh
Inventor
张亚军
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Taimei Digital Technology Co ltd
Original Assignee
Shanghai Taimei Digital Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Taimei Digital Technology Co ltd filed Critical Shanghai Taimei Digital Technology Co ltd
Priority to CN202111363315.9A priority Critical patent/CN114168544B/zh
Publication of CN114168544A publication Critical patent/CN114168544A/zh
Application granted granted Critical
Publication of CN114168544B publication Critical patent/CN114168544B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/16File or folder operations, e.g. details of user interfaces specifically adapted to file systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/25Integrating or interfacing systems involving database management systems
    • G06F16/258Data format conversion from or to a database
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/20ICT specially adapted for the handling or processing of patient-related medical or healthcare data for electronic clinical trials or questionnaires
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H70/00ICT specially adapted for the handling or processing of medical references
    • G16H70/40ICT specially adapted for the handling or processing of medical references relating to drugs, e.g. their side effects or intended usage

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Epidemiology (AREA)
  • Public Health (AREA)
  • General Engineering & Computer Science (AREA)
  • Primary Health Care (AREA)
  • Human Computer Interaction (AREA)
  • Chemical & Material Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Medicinal Chemistry (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Toxicology (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本说明书实施方式提供一种临床试验数据处理方法、装置、计算机设备、存储介质及计算机程序产品。由于第一文件类型的原始数据文件与第二文件类型的目标数据文件属于不同的文件类型,且第二软件程序不能从原始数据文件读取到临床试验数据,因此依照原始数据文件中临床试验数据的存储结构,从原始数据文件中读取临床试验数据,将临床试验数据写入目标数据文件,第二软件程序可以从第二文件类型的目标数据文件中读取临床试验数据,从而基于第二软件程序对临床试验数据进行变换处理,针对每次临床试验产生的临床试验数据,不再需要专职的程序管理员编写数据转换脚本,从而减少传统技术中编写数据转换脚本所花费的人力成本和时间成本。

Description

临床试验数据处理方法、装置、计算机设备和存储介质
技术领域
本说明书涉及临床试验技术领域,具体涉及一种临床试验数据处理方法、装置、计算机设备、存储介质及计算机程序产品。
背景技术
在医药新产品的临床试验过程,临床研究人员需要收集不同来源的临床试验数据(包括新产品的安全性数据、功效数据等),且这些临床试验数据必须提交至药政监管部门。由于临床试验数据的真实完整性是对试验药物有效性和安全性进行科学和公正评价的基础,以及临床试验过程中不同的角色执行不同的工作流程,以及部分数据点的逻辑关系判断等特定工作场景的需求,临床医疗行业需要专门的软件对临床试验数据进行变换处理,以得到符合药政监管部门格式要求的递交数据。
传统技术中,从EDC(Electronic Data Capture System,电子数据捕获系统)获取的临床试验数据仅仅只能被特定的临床医疗软件程序编辑,且在编辑之前,需要专职的程序管理员花费大量时间编写数据转换脚本,通过数据转换脚本将临床试验数据转换为符合SDTM(Study Data Tabulation Mode,研究数据表格格式)格式要求的数据。
发明内容
有鉴于此,本说明书实施方式致力于提供一种临床试验数据处理方法、装置、计算机设备、存储介质及计算机程序产品,以解决传统技术中编写数据转换脚本所花费的巨大人力成本和时间成本的问题。
本说明书实施方式提供了一种临床试验数据处理方法,所述方法包括:获取包括临床试验数据的原始数据文件;其中,所述原始数据文件属于第一文件类型;其中,所述第一文件类型适配于第一软件程序;依照所述原始数据文件中所述临床试验数据的存储结构,从所述原始数据文件中读取所述临床试验数据;将所述临床试验数据写入第二文件类型的目标数据文件;其中,所述目标数据文件适配于第二软件程序;其中,所述第一文件类型与所述第二文件类型不同;所述第一文件类型不适配于所述第二软件程序。
本说明书实施方式提供了一种临床试验数据处理装置,所述装置包括原始文件获取模块、试验数据读取模块和试验数据写入模块。
原始文件获取模块,用于获取包括临床试验数据的原始数据文件;其中,所述原始数据文件属于第一文件类型;其中,所述第一文件类型适配于第一软件程序。
试验数据读取模块,用于依照所述原始数据文件中所述临床试验数据的存储结构,从所述原始数据文件中读取所述临床试验数据。
试验数据写入模块,用于将所述临床试验数据写入第二文件类型的目标数据文件;其中,所述目标数据文件适配于第二软件程序;其中,所述第一文件类型与所述第二文件类型不同;所述第一文件类型不适配于所述第二软件程序。
本说明书实施方式提供一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述实施方式中的方法步骤。
本说明书实施方式提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述实施方式中的方法步骤。
本说明书实施方式提供一种计算机程序产品,所述计算机程序产品中包括指令,所述指令被计算机设备的处理器执行时,使得所述计算机设备能够执行上述实施方式中的方法步骤。
本说明书实施方式,由于第一文件类型的原始数据文件与第二文件类型的目标数据文件属于不同的文件类型,且第二软件程序不能从原始数据文件读取到临床试验数据,因此依照原始数据文件中临床试验数据的存储结构,从原始数据文件中读取临床试验数据,将临床试验数据写入目标数据文件,第二软件程序可以从第二文件类型的目标数据文件中读取临床试验数据,从而基于第二软件程序对临床试验数据进行变换处理,针对每次临床试验产生的临床试验数据,在对其进行表格结构处理、拼接、拆分等数据转换操作之前,不再需要专职的程序管理员编写数据转换脚本,从而减少传统技术中编写数据转换脚本所花费的人力成本和时间成本。
附图说明
图1a所示为一实施方式提供的场景示例中临床试验数据转换方法的交互示意图;
图1b所示为一实施方式提供的源数据上传页面的示意图;
图1c所示为一实施方式提供的执行人分配控件和数据处理控件的示意图;
图1d所示为一实施方式提供的域配置页面的示意图;
图1e所示为一实施方式提供的临床试验数据处理方法的应用环境图;
图2所示为一实施方式提供的临床试验数据处理方法的流程示意图;
图3所示为一实施方式提供的临床试验数据处理方法的流程示意图;
图4为一实施方式提供的临床试验数据处理装置的结构框图;
图5为一实施方式提供的计算机设备的内部结构图。
具体实施方式
下面将结合说明书实施方式中的附图,对本说明书实施方式中的技术方案进行清楚、完整地描述,显然,所描述的实施方式仅是本说明书一部分实施方式,而不是全部的实施方式。基于本说明书中的实施方式,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施方式,都属于本说明书的范围。
以下对本说明书中涉及的部分名词进行解释,源数据(或者说数据源)可以是临床试验过程中产生的临床试验数据。源数据可以是来自EDC(Electronic Data CaptureSystem,电子数据捕获系统)的病例表单数据(比如人口学属性数据、不良事件表单、合并/既往用药表单、PK样本采集表单、既往病史数据、献血史、过敏史、给药记录表单、凝血功能表单、尿常规、血常规等);也可以是来自ECG(心电信息管理系统)的医疗数据;还可以是来自其他数据系统的医疗数据。药政监管部门可以是中国的国家药品监督管理局(NationalMedical Products Administration,NMPA),也可以是美国的食品药品监督管理局(Foodand Drug Administration,FDA)。
SDTM(Study Data Tabulation Model,临床研究数据列表模型)格式规定了递交数据所需要的标准域(DOMAIN)、标准域中所包括的标准变量(Variable Name或者VariableLabel)。相应地,有些时候源数据中的数据源表单也被称为源数据域。数据源表单可以是按照临床试验方案所制定设定的一种文件,用于记录每一名受试者在试验过程中的临床试验数据。数据源表单可以是病例报告表(Case Report Form,CRF)。数据源表单也可以是临床试验过程中生成的其他表单。变换处理可以理解为将源数据转换为满足SDTM标准的处理操作。
药物的临床试验指的是在人体进行的药物系统性研究,以确定药物的疗效和安全性。药物临床试验阶段分为I期、II期、III期临床试验、IV期临床试验。I期主要是涉及初步的临床药理学及人体安全性评价试验。II期可以理解为治疗作用初步评价阶段,主要涉及初步评价药物对目标适应症患者的治疗作用和安全性,也包括为III期临床试验研究设计和给药剂量方案的确定提供依据。III期可以理解为治疗作用确证阶段,主要进一步验证药物对目标适应症患者的治疗作用和安全性,评价利益与风险关系,最终为药物注册申请的审查提供充分的依据。IV期主要是药物上市后的临床试验,在药物上市后,可以继续追踪在广泛使用条件下的药物的疗效和不良反应,以评价在普通或者特殊人群中使用的利益与风险关系以及改进给药剂量等。
请参阅图1a。在一个具体的场景示例中,终端可以从EDC系统中获取源数据压缩包(ZIP包)。源数据压缩包中所包括的原始数据文件适配于第一软件程序,比如SAS软件(Statistical Analysis System,统计分析软件)。平台服务器部署于第二软件程序,通过终端访问平台服务器提供的网页。终端的操作界面上提供有源数据上传按钮,用户点击源数据上传按钮,终端监控到源数据上传按钮被触发之后,终端展示源数据上传页面102(如图1b所示),源数据上传页面102具有数据导入控件104,通过数据导入控件104可以采用指定源数据存储路径或者拖拽源数据的方式上传ZIP包至平台服务器。平台服务器获取ZIP包,平台服务器对ZIP包解压,得到若干个sas7bdat文件类型的原始数据文件。原始数据文件包括临床试验数据,临床试验数据属于目标临床项目在临床试验过程中所产生的数据。目标临床项目具有项目标识。sas7bdat文件类型可以被传统技术中的临床医疗软件比如SAS软件进行编辑。
平台服务器根据目标临床项目的项目标识,生成项目存储路径。在项目存储路径中生成原始数据库(比如Source.DB),并在项目存储路径中自动生成两个执行任务存储路径。平台服务器依照原始数据文件中临床试验数据的存储结构,从原始数据文件中读取临床试验数据。平台服务器将读取到的临床试验数据写入CSV格式的目标数据文件。进一步地,从目标数据文件中读取临床医疗数据,并写入原始数据库中的数据表。
请参阅图1c。终端操作界面中显示有任务一和任务二。终端操作界面中提供有执行人分配控件106,终端对执行人分配控件106进行监控,在监控到执行人分配控件106第一次被触发的情况下,终端发送第一执行人分配指令至平台服务器。平台服务器获取到第一执行人分配指令,第一执行人分配指令携带有第一执行人标识、任务标识和项目标识。服务器根据执行人标识、任务标识、项目标识以及任务标识所对应的任务存储路径生成对应关系并保存。
请继续参阅图1c。终端操作界面中还提供有数据处理控件108。请参阅图1d。在数据处理控件108被触发的情况下,终端显示展示域配置页面110。域配置页面可以理解为提供对临床试验数据进行映射配置的入口页面。请继续参阅图1d。域配置页面110中具有标准域112。域配置页面中具有标准域的标准变量114。不同的标准域对应有各自的标准标量。示例性地,标准域DE对应的标准变量STUDYID(Study Identifier,研究标识符)、USUBJID(Unique Subject Identifier,受试者唯一标识符)等。标准域AE对应的标准变量STUDYID(Study Identifier,研究标识符)、USUBJID(Unique Subject Identifier,受试者唯一标识符)、AESEQ(Sequence Number,序号)等。标准域CE对应的标准变量CESPID(Sponsor-Defined Identifier自定义标识符)、CETERM(Reported Term for the ClinicalEvent,临床事件报告名称)、CEDECOD(Dictionary-Derived Term、标准化名称)等。
请继续参阅图1d。在域配置页面110中提供有与各标准变量对应的变量执行控件116。在变量执行控件116被触发的情况下,终端向服务器发送变量执行指令。变量执行指令包括标准变量的变量标识、标准变量所属的标准域的域标识。服务器根据标准变量的变量标识、标准变量所属的标准域的域标识,在执行任务存储路径中生成工作数据库。其中,标准域对应有配置文件,配置文件中存储有标准域所包括标准变量与递生成函数的对应关系,即标准变量对应有生成函数。进一步地,生成函数具有输入参数。从原始数据库读取与输入参数对应的字段数据;将字段数据写入工作数据库;基于生成函数对工作数据库中的字段数据进行变换处理,得到与标准变量对应的递交数据。将递交数据写入工作数据库的预设字段名称下。
请继续参阅图1d。在域配置页面110中还提供有与目标临床项目对应的项目执行控件118,在项目执行控件118被触发的情况下,终端向服务器发送项目执行指令,项目执行指令包括项目标识和任务标识,服务器根据项目标识和任务标识进入执行任务存储路径,在执行任务存储路径中生成递交数据库;汇总各工作数据库中的递交数据至递交数据库中。
请参阅图1e,本说明书实施方式提供一种临床试验数据处理系统。该临床试验数据处理系统可以运行于由终端120和服务器122形成的硬件环境,终端120通过网络与服务器122进行通信。具体的,终端120上传源数据至服务器122,服务器122对源数据进行解压,得到若干个包括临床试验数据的原始数据文件;其中,原始数据文件属于第一文件类型;其中,第一文件类型适配于第一软件程序。服务器122依照原始数据文件中临床试验数据的存储结构,从原始数据文件中读取临床试验数据;并将临床试验数据写入第二文件类型的目标数据文件;其中,目标数据文件适配于第二软件程序;其中,第一文件类型与第二文件类型不同;第一文件类型不适配于第二软件程序。其中,终端120可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备,服务器122可以用独立的服务器或者是多个服务器组成的服务器集群来实现。随着科学技术的发展,可能会出现一些新型计算设备,比如量子计算服务器,这些新型计算设备也可以应用于本说明书的实施方式中。
请参阅图2。本说明书一个实施方式提供了一种临床试验数据处理方法。该临床试验数据处理方法可以应用于图1e中的服务器。临床试验数据处理方法可以包括以下步骤。
S210、获取包括临床试验数据的原始数据文件。
其中,临床试验数据可以是临床试验过程对受试者的观测记录信息。原始数据文件中存储有临床试验数据,原始数据文件中的临床试验数据是不符合数据接收方所要求的递交标准的数据。数据接收方可以是药政监管部门。临床试验数据包括比如人口学属性数据、不良事件数据、合并/既往用药数据、既往病史数据、献血史、过敏史、给药记录、尿常规、血常规等。原始数据文件属于第一文件类型。第一文件类型适配于第一软件程序。第一软件程序可以是传统技术的临床医疗软件程序(比如SAS软件)。若利用临床医疗软件程序对原始数据文件所包括的临床试验数据进行变换处理,需要专职程序员花费大量的时间和精力编写数据转换脚本。第一软件程序可以识别原始数据文件,并通过数据转换脚本对原始数据文件内的临床试验数据进行读取、变换处理。
具体的,在一些实施方式中,终端可以从EDC系统中获取源数据压缩包(ZIP包),源数据压缩包中包括若干个原始数据文件。终端可以上传源数据压缩包至服务器,服务器对源数据压缩包进行解压,得到包括临床试验数据的原始数据文件。在一些实施方式中,服务器本地存储有原始数据文件,可以按照原始数据文件的存储地址从服务器本地获取原始数据文件。在一些实施方式中,原始数据文件可以存储在与服务器通信连接的计算机设备,从计算机设备中指定的存储地址获取原始数据文件。
S220、依照原始数据文件中临床试验数据的存储结构,从原始数据文件中读取临床试验数据。
S230、将临床试验数据写入第二文件类型的目标数据文件。
其中,临床试验数据在原始数据文件中的存储结构是第一软件程序所能解析的。临床试验数据在原始数据文件中的存储结构是第二软件程序所不能解析的。第一文件类型可以表示临床试验数据在计算机中的逻辑结构。
具体的,原始数据文件可以是在传统技术中临床试验数据的存储文件。通过分析原始数据文件,可以获取原始数据文件中临床试验数据的存储结构。在得知临床试验数据在原始数据文件中的存储结构的前提下,依照原始数据文件中临床试验数据的存储结构,从原始数据文件的各存储单元中读取临床试验数据。将读取的临床试验数据写入第二文件类型的目标数据文件。
在一些实施方式中,可以将原始数据文件中的临床试验数据直接写入数据库中的数据表。目标数据文件可以是数据库中的数据表。从原始数据文件中读取临床试验数据,并将读取的临床试验数据直接写入数据库中的数据表。在一些实施方式中,可以将原始数据文件中的临床试验数据间接写入数据库中的数据表。目标数据文件可以是CSV文件。从原始数据文件中读取临床试验数据,并将读取的临床试验数据写入CSV文件,然后再从CSV文件中读取临床试验数据,将读取的临床试验数据写入数据库中的数据表。
在一些实施方式中,目标数据文件适配于第二软件程序。第一文件类型与第二文件类型不同。第一文件类型不适配于第二软件程序。第二软件程序不同于传统技术的临床医疗软件程序,第二软件程序不能直接对原始数据文件进行变换处理。需要对原始数据文件进行格式转换,将第一文件类型转换为第二文件类型,即基于第一文件类型的原始数据文件得到第二文件类型的目标数据文件。且目标数据文件中包括之前存储在原始数据文件中的临床试验数据。第二文件类型是第二软件程序所能解析的,从而可以基于此对格式转换后的目标数据文件进行数据转换。
上述临床试验数据处理方法中,由于第一文件类型的原始数据文件与第二文件类型的目标数据文件属于不同的文件类型,且第二软件程序不能从原始数据文件读取到临床试验数据,因此依照原始数据文件中临床试验数据的存储结构,从原始数据文件中读取临床试验数据,将临床试验数据写入目标数据文件,第二软件程序可以从第二文件类型的目标数据文件中读取临床试验数据,从而基于第二软件程序对临床试验数据进行变换处理,针对每次临床试验产生的临床试验数据,在对其进行表格结构处理、拼接、拆分等数据转换操作之前,不再需要专职的程序管理员编写数据转换脚本,从而减少传统技术中编写数据转换脚本所花费的人力成本和时间成本。
在一些实施方式中,第一文件类型包括sas7bdat格式,第二文件类型包括CSV格式、EXCEL格式中的至少一个。
具体的,第一文件类型的原始数据文件可以是sas7bdat格式的文件。第二文件类型的目标数据文件可以是CSV格式的文件。第二文件类型的目标数据文件可以是EXCEL格式的文件。在一些实施方式中,可以将sas7bdat格式的临床试验数据间接写入CSV文件。具体的,从sas7bdat格式的原始数据文件中读取临床试验数据,并将读取的临床试验数据写入CSV文件,在一些实施方式中,可以将sas7bdat格式的临床试验数据间接写入EXCEL文件。具体的,从sas7bdat格式的原始数据文件中读取临床试验数据,并将读取的临床试验数据写入EXCEL文件。本实施方式中,通过将sas7bdat格式的数据转换为CSV格式、EXCEL格式,使得第二软件程序可以将从CSV文件或者EXCEL文件中读取到临床试验数据。
在一些实施方式中,目标数据文件是数据库中的数据表。将临床试验数据写入第二文件类型的目标数据文件,包括:将临床试验数据写入原始数据库中的数据表。
具体的,建立原始数据库,原始数据库包括若干个数据表。原始数据库用于存储原始数据文件中的临床试验数据。将从原始数据文件中读取的临床试验数据对应地写入原始数据库中的数据表。在一些实施方式中,原始数据库中的数据是不可修改的。当需要利用第二软件程序对临床试验数据进行变换处理时,第二软件程序可以从原始数据库中读取临床试验数据,并写入工作数据库(比如work.DB)中,进而对临床试验数据进行变换处理,并将变换处理结果写入工作数据库中。
在一些实施方式中,临床试验数据属于目标临床项目在临床试验过程中所产生的数据。该方法还可以包括:根据目标临床项目的项目标识,生成项目存储路径;在项目存储路径中生成原始数据库。
其中,目标临床项目可以是针对某个医药新产品所进行的药物系统性研究。比如,目标临床项目可以是某个新药的临床试验项目。目标临床项目也可以是某个医疗器械产品的临床试验项目。目标临床项目具有项目标识,项目标识用于唯一性地表示该目标临床项目。项目标识可以是项目编号。项目标识也可以是项目序列号。项目标识也可以是项目ID。项目存储路径(或者称为项目保存路径)可以理解为存储目标临床项目在临床试验过程中所产生的数据的文件夹。项目存储路径可以是在硬盘中某个分区的文件夹,比如D盘/项目ID。项目存储路径可以是在第二软件程序安装路径中的文件夹,第二软件程序的名称为XXYY,则项目存储路径可以D盘/XXYY/项目ID。
具体的,在终端侧创建目标临床项目,服务器接收到目标临床项目的创建指令,为目标临床项目分配项目标识。服务器可以根据目标临床项目的项目标识,生成项目存储路径。由于项目存储路径用于存储目标临床项目在临床试验过程中所产生的数据,因此需要在项目存储路径中创建一个数据库,该数据库用于存储从原始数据文件中提取的临床医疗数据,因此,在项目存储路径中自动生成原始数据库。
在一些实施方式中,该临床试验数据处理方法还可以包括:在项目存储路径中生成预设数量的执行任务存储路径。
其中,预设数量大于1,其中,预设数量可以是2。在临床试验过程中得到临床试验数据,该临床试验数据的格式并不符合药政监管部门所要求的标准。执行任务可以理解是为了得到符合标准的递交数据针对临床试验数据所进行的变换处理工作。执行任务存储路径可以是项目存储路径内的文件夹,文件夹的名称为执行任务名称。执行任务名称可以是任务1,也可以是任务2。若项目存储路径为D盘/项目ID,则执行任务存储路径为D盘/项目ID/任务1。若项目存储路径为D盘/XXYY/项目ID,则执行任务存储路径为D盘/XXYY/项目ID/任务1。执行任务存储路径用于存储在执行变换处理工作的过程所生成的递交数据。
在一些实施方式中,为了确保递交数据的准确性,将变换处理工作分为两个并行的任务,两个任务的执行人互不相同。在一些实施方式中,每个任务可以由多个任务执行人。两个任务可以记为任务一和任务二。执行任务一的多个任务执行人与执行任务二的多个任务执行人不存在交集。两个任务之间的数据以及变换处理操作是完全独立和相互隔离的。为了提升处理效率,同一任务下的各任务执行人所产生的数据或者变换处理操作是可以实时互见。
具体的,在服务器接收到终端上传的源数据之后,可以自动在项目存储路径中生成预设数量的执行任务存储路径。在一些实施方式中,服务器可以接收到终端的生成任务的操作指令,响应于生成任务的操作指令,服务器在在项目存储路径中生成预设数量的执行任务存储路径。在一些实施方式中,服务器在自动生成两个任务时,可以为各任务分配任务标识。针对任一个任务,可以在项目存储路径中生成以该任务的任务标识为文件名的文件夹,作为执行任务存储路径。
本实施方式中,通过在项目存储路径中生成预设数量的执行任务存储路径,实现各个任务之间的数据隔离以及数据转换操作的完全独立。
在一些实施方式中,请参阅图3,该临床试验数据处理方法还可以包括以下步骤。
S310、根据标准变量的变量标识、标准变量所属的标准域的域标识,在执行任务存储路径中生成工作数据库。
其中,标准变量对应有生成函数,生成函数具有输入参数。生成函数可以理解为预先定义的用于对临床试验数据进行计算以得到递交数据的规则或者方法。生成函数可以用于对临床试验数据的格式进行转换操作,生成函数可以用于基于至少一项临床试验数据生成递交数据的处理函数。具体的,终端在域配置页面中提供有与各标准变量对应的变量执行控件。终端对变量执行控件进行监控,在变量执行控件被触发的情况下,终端向服务器发送变量执行指令。变量执行指令包括标准变量的变量标识、标准变量所属的标准域的域标识。服务器根据标准变量的变量标识、标准变量所属的标准域的域标识,在执行任务存储路径中生成工作数据库。工作数据库用于存储变换处理任务所产生的数据。对变量标识与域标识进行拼接,得到拼接标识,工作数据库的名称可以采用拼接标识,用于唯一性地表示标准变量的递交数据的存储位置,实现标准变量之间的数据隔离。
在一些实施方式中,工作数据库可以是临时数据库表,根据预先设定的周期对工作数据库进行清理以释放对应的资源。
S320、从原始数据库读取与输入参数对应的字段数据。
S330、基于生成函数对字段数据进行变换处理,得到与标准变量对应的递交数据。
S340、将递交数据写入工作数据库的数据表的预设字段名称下。
具体的,可以利用输入参数在原始数据库中进行查到,得到与输入参数对应的字段数据,从原始数据库读取与输入参数对应的字段数据。利用生成函数对获取到的字段数据进行变换处理,得到与标准变量对应的递交数据。预设字段名称可以是预先根据标准变量的变量名称所设置的。比如预设字段名称包括标准变量的变量名称,或者预设字段名称采用标准变量的变量名称。工作数据库中包括若干数据表,将与标准变量对应的递交数据写入工作数据库的数据表的预设字段名称下。
在一些实施方式中,变换处理可以理解为将源数据转换为满足SDTM标准的处理操作。变换处理可以由直接调用与标准变量对应的生成函数实现,生成函数可以包括拼接函数、计算时间差函数、计算最早时间函数、计算最晚时间函数等。变换处理可以包括:比如拼接获取到的字段数据、在获取到的字段数据中计算时间差、在获取到的字段数据中计算最早/开始时间、在获取到的字段数据中计算最晚/最后时间、或者对获取到的字段数据进行格式转换(比如时间格式转换)。
在一些实施方式中,原始数据库包括若干数据表,数据表具有表单名称。数据表中包括若干字段,字段具有字段名称。生成函数的输入参数可以采用数据表中的字段名称进行表示。标准变量所属的标准域可以映射到原始数据库中的数据表。利用输入参数在映射到的数据表中进行查找,得到与输入参数对应的字段数据。
在一些实施方式中,标准变量所属的标准域可以映射到原始数据库中的数据表。可以将映射到的数据表复制至工作数据库,利用输入参数在工作数据库的数据表中进行查找,得到与输入参数对应的字段数据。基于生成函数对工作数据库中的字段数据进行变换处理,得到与标准变量对应的递交数据。
本实施方式中,调用与标准变量对应的生成函数对原始数据库中的临床试验数据进行变换处理,无需专职程序员花费大量的时间和精力编写数据转换脚本,减少数据转换任务的执行难度,提升数据转换效率。
在一些实施方式中,该临床试验数据处理方法还可以包括:在接收到项目执行指令的情况下,在执行任务存储路径中生成递交数据库;汇总各工作数据库中的递交数据至递交数据库中。
具体的,终端提供有与目标临床项目对应的项目执行控件,终端对项目执行控件进行监控,在监控到项目执行控件被触发的情况下,终端向服务器发送项目执行指令,项目执行指令包括项目标识和任务标识。服务器预先存储有项目标识和任务标识与执行任务存储路径的对应关系,则服务器可以根据项目标识和任务标识进入执行任务存储路径,在执行任务存储路径中生成递交数据库。递交数据库用于存储执行该任务标识对应的任务时产生的递交数据。在项目执行指令的触发作用下,服务器可以依次针对各标准变量执行数据转换工作,将与标准变量对应的递交数据存储至该标准变量所对应的工作数据库中,从各工作数据库中读取与标准变量的递交数据,并对应的写入递交数据库中,以汇总各工作数据库中的递交数据至递交数据库中。
在一些实施方式中,提供一种临床试验数据处理方法可以包括以下步骤。
S402、获取包括临床试验数据的原始数据文件。
其中,所述原始数据文件属于第一文件类型;其中,所述第一文件类型适配于第一软件程序;
S404、依照所述原始数据文件中所述临床试验数据的存储结构,从所述原始数据文件中读取所述临床试验数据。
S406、将所述临床试验数据写入第二文件类型的目标数据文件。
其中,所述目标数据文件适配于第二软件程序;其中,所述第一文件类型与所述第二文件类型不同;所述第一文件类型不适配于所述第二软件程序。所述第一文件类型可以包括sas7bdat格式,所述第二文件类型可以包括CSV格式、EXCEL格式中的至少一个。所述临床试验数据属于目标临床项目在临床试验过程中所产生的数据。
S408、从目标数据文件中读取临床试验数据。
S410、将读取的所述临床试验数据写入原始数据库中的数据表。
S412、根据所述目标临床项目的项目标识,生成项目存储路径。
S414、在所述项目存储路径中生成所述原始数据库。
S416、在所述项目存储路径中生成预设数量的执行任务存储路径。
S418、根据标准变量的变量标识、所述标准变量所属的标准域的域标识,在所述执行任务存储路径中生成工作数据库。
其中,所述标准变量对应有生成函数,所述生成函数具有输入参数。
S420、从所述原始数据库读取与所述输入参数对应的字段数据。
S422、将所述字段数据写入所述工作数据库。
S424、基于所述生成函数对所述工作数据库中的字段数据进行变换处理,得到与所述标准变量对应的递交数据。
S426、将所述递交数据写入所述工作数据库的预设字段名称下。
S428、在接收到项目执行指令的情况下,在所述执行任务存储路径中生成递交数据库。
S430、汇总各所述工作数据库中的递交数据至所述递交数据库中。
应该理解的是,虽然上述流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,上述流程图中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
在一些实施方式中,如图4所示,提供了一种临床试验数据处理装置400,该装置包括原始文件获取模块402、试验数据读取模块404和试验数据写入模块406。
原始文件获取模块402,用于获取包括临床试验数据的原始数据文件;其中,所述原始数据文件属于第一文件类型;其中,所述第一文件类型适配于第一软件程序;
试验数据读取模块404,用于依照所述原始数据文件中所述临床试验数据的存储结构,从所述原始数据文件中读取所述临床试验数据;
试验数据写入模块406,用于将所述临床试验数据写入第二文件类型的目标数据文件;其中,所述目标数据文件适配于第二软件程序;其中,所述第一文件类型与所述第二文件类型不同;所述第一文件类型不适配于所述第二软件程序。
关于临床试验数据处理装置的具体限定可以参见上文中对于临床试验数据处理方法的限定,在此不再赘述。上述临床试验数据处理装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一些实施方式中,提供了一种计算机设备,该计算机设备可以是终端,其内部结构图可以如图5所示。该计算机设备包括通过系统总线连接的处理器、存储器、通信接口、显示屏和输入装置。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的通信接口用于与外部的终端进行有线或无线方式的通信,无线方式可通过WIFI、运营商网络、NFC(近场通信)或其他技术实现。该计算机程序被处理器执行时以实现一种临床试验数据处理方法。该计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏,该计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。
本领域技术人员可以理解,图5中示出的结构,仅仅是与本说明书方案相关的部分结构的框图,并不构成对本说明书方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一些实施方式中,提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现上述实施方式中的方法步骤。
在一些实施方式中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述实施方式中的方法步骤。
在一些实施方式中,还提供一种计算机程序产品,所述计算机程序产品中包括指令,上述指令可由计算机设备的处理器执行时实现上述实施方式中的方法步骤。
本领域普通技术人员可以理解实现上述实施方式方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施方式的流程。其中,本申请所提供的各实施方式中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-Only Memory,ROM)、磁带、软盘、闪存或光存储器等。易失性存储器可包括随机存取存储器(Random Access Memory,RAM)或外部高速缓冲存储器。作为说明而非局限,RAM可以是多种形式,比如静态随机存取存储器(Static Random Access Memory,SRAM)或动态随机存取存储器(Dynamic Random Access Memory,DRAM)等。
以上实施方式的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施方式中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述仅为本说明书中的部分实施方式而已,并不用以限制本说明书,凡在本说明书的精神和原则之内,所作的任何修改、等同替换等,均应包含在本说明书的公开范围之内。

Claims (6)

1.一种临床试验数据处理方法,其特征在于,所述临床试验数据属于目标临床项目在临床试验过程中所产生的数据;所述方法包括:
获取包括临床试验数据的原始数据文件;其中,所述原始数据文件属于第一文件类型;其中,所述第一文件类型适配于第一软件程序;
依照所述原始数据文件中所述临床试验数据的存储结构,从所述原始数据文件中读取所述临床试验数据;
将所述临床试验数据写入第二文件类型的原始数据库中的数据表;其中,所述原始数据库中的数据表适配于第二软件程序;其中,所述第一文件类型与所述第二文件类型不同;所述第一文件类型不适配于所述第二软件程序;
根据所述目标临床项目的项目标识,生成项目存储路径;
在所述项目存储路径中生成所述原始数据库;
在所述项目存储路径中生成预设数量的执行任务存储路径;
根据标准变量的变量标识、所述标准变量所属的标准域的域标识,在所述执行任务存储路径中生成工作数据库;其中,所述标准变量对应有生成函数,所述生成函数具有输入参数;
从所述原始数据库读取与所述输入参数对应的字段数据;
基于所述生成函数对所述字段数据进行变换处理,得到与所述标准变量对应的递交数据;
将所述递交数据写入所述工作数据库的数据表的预设字段名称下。
2.根据权利要求1所述的方法,其特征在于,所述第一文件类型包括sas7bdat格式,所述第二文件类型包括CSV格式、EXCEL格式中的至少一个。
3.根据权利要求1所述的方法,其特征在于,所述方法还包括:
在接收到项目执行指令的情况下,在所述执行任务存储路径中生成递交数据库;
汇总各所述工作数据库中的递交数据至所述递交数据库中。
4.一种临床试验数据处理装置,其特征在于,所述临床试验数据属于目标临床项目在临床试验过程中所产生的数据;所述装置包括:
原始文件获取模块,用于获取包括临床试验数据的原始数据文件;其中,所述原始数据文件属于第一文件类型;其中,所述第一文件类型适配于第一软件程序;
试验数据读取模块,用于依照所述原始数据文件中所述临床试验数据的存储结构,从所述原始数据文件中读取所述临床试验数据;
试验数据写入模块,用于将所述临床试验数据写入第二文件类型的原始数据库中的数据表;其中,所述原始数据库中的数据表适配于第二软件程序;其中,所述第一文件类型与所述第二文件类型不同;所述第一文件类型不适配于所述第二软件程序;
所述装置还执行以下步骤:
根据所述目标临床项目的项目标识,生成项目存储路径;
在所述项目存储路径中生成所述原始数据库;
在所述项目存储路径中生成预设数量的执行任务存储路径;
根据标准变量的变量标识、所述标准变量所属的标准域的域标识,在所述执行任务存储路径中生成工作数据库;其中,所述标准变量对应有生成函数,所述生成函数具有输入参数;
从所述原始数据库读取与所述输入参数对应的字段数据;
基于所述生成函数对所述字段数据进行变换处理,得到与所述标准变量对应的递交数据;
将所述递交数据写入所述工作数据库的数据表的预设字段名称下。
5.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至3中任一项所述的方法的步骤。
6.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至3中任一项所述的方法的步骤。
CN202111363315.9A 2021-11-17 2021-11-17 临床试验数据处理方法、装置、计算机设备和存储介质 Active CN114168544B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111363315.9A CN114168544B (zh) 2021-11-17 2021-11-17 临床试验数据处理方法、装置、计算机设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111363315.9A CN114168544B (zh) 2021-11-17 2021-11-17 临床试验数据处理方法、装置、计算机设备和存储介质

Publications (2)

Publication Number Publication Date
CN114168544A CN114168544A (zh) 2022-03-11
CN114168544B true CN114168544B (zh) 2023-10-27

Family

ID=80479849

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111363315.9A Active CN114168544B (zh) 2021-11-17 2021-11-17 临床试验数据处理方法、装置、计算机设备和存储介质

Country Status (1)

Country Link
CN (1) CN114168544B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114327377B (zh) * 2022-03-14 2022-08-16 浙江太美医疗科技股份有限公司 需求跟踪矩阵生成方法、装置、计算机设备及存储介质

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101504662A (zh) * 2009-03-13 2009-08-12 北大方正集团有限公司 一种转换数据的方法及装置
CN102063445A (zh) * 2009-11-13 2011-05-18 新奥特(北京)视频技术有限公司 一种股市数据的解码转换方法及一种本地设备端的数据库系统
CN105786912A (zh) * 2014-12-25 2016-07-20 远光软件股份有限公司 数据采集转换方法及装置
CN109885532A (zh) * 2019-02-11 2019-06-14 中国银行股份有限公司 一种交易数据标准化方法和装置
CN110019032A (zh) * 2017-09-20 2019-07-16 北京国双科技有限公司 一种数据处理方法及其相关装置
CN110633075A (zh) * 2018-06-01 2019-12-31 珠海横琴盛达兆业科技投资有限公司 一种基于js-xlsx实现数据分类导入bootstrapTable的方法
CN111026757A (zh) * 2019-12-10 2020-04-17 首都医科大学附属北京友谊医院 标准统计格式数据的生成方法、装置、设备和存储介质
CN111081329A (zh) * 2019-12-20 2020-04-28 天津开心生活科技有限公司 临床数据自动录入方法及装置、电子设备、存储介质
CN111367975A (zh) * 2018-12-25 2020-07-03 中国移动通信集团浙江有限公司 一种多协议数据转换处理方法及装置

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050216495A1 (en) * 2004-03-23 2005-09-29 Sayling Wen Conversion method for multi-language multi-code databases
US20120303642A1 (en) * 2011-05-23 2012-11-29 Gbs Corp. Automated file-conversion system and process for a media-generation system
US10642854B2 (en) * 2016-10-07 2020-05-05 Sudeep Pattnaik Clinical data aggregation architecture and platform

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101504662A (zh) * 2009-03-13 2009-08-12 北大方正集团有限公司 一种转换数据的方法及装置
CN102063445A (zh) * 2009-11-13 2011-05-18 新奥特(北京)视频技术有限公司 一种股市数据的解码转换方法及一种本地设备端的数据库系统
CN105786912A (zh) * 2014-12-25 2016-07-20 远光软件股份有限公司 数据采集转换方法及装置
CN110019032A (zh) * 2017-09-20 2019-07-16 北京国双科技有限公司 一种数据处理方法及其相关装置
CN110633075A (zh) * 2018-06-01 2019-12-31 珠海横琴盛达兆业科技投资有限公司 一种基于js-xlsx实现数据分类导入bootstrapTable的方法
CN111367975A (zh) * 2018-12-25 2020-07-03 中国移动通信集团浙江有限公司 一种多协议数据转换处理方法及装置
CN109885532A (zh) * 2019-02-11 2019-06-14 中国银行股份有限公司 一种交易数据标准化方法和装置
CN111026757A (zh) * 2019-12-10 2020-04-17 首都医科大学附属北京友谊医院 标准统计格式数据的生成方法、装置、设备和存储介质
CN111081329A (zh) * 2019-12-20 2020-04-28 天津开心生活科技有限公司 临床数据自动录入方法及装置、电子设备、存储介质

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
基于CDISC标准的病例报告表注释流程及方法;王宏伟;邓亚中;刘川;;药学学报(第11期);全文 *
数据录入软件EpiData;陈钢;李平;;中国医院统计(第01期);全文 *
电子政务系统中异构系统数据整合方法;程传慧;程学先;;计算机与现代化(第03期);全文 *

Also Published As

Publication number Publication date
CN114168544A (zh) 2022-03-11

Similar Documents

Publication Publication Date Title
US11663375B2 (en) Configuration of a digital twin for a building or other facility via BIM data extraction and asset register mapping
US10291704B2 (en) Networked solutions integration using a cloud business object broker
WO2018120721A1 (zh) 用户界面的测试方法、系统、电子装置及计算机可读存储介质
CN110597946B (zh) 一种案例存储方法、装置、设备及存储介质
CN101739390A (zh) 基于技术设计文档的数据转换
US10586611B2 (en) Systems and methods employing merge technology for the clinical domain
WO2018032976A1 (zh) 一种医疗数据管理方法、装置及医疗数据系统
CN114168544B (zh) 临床试验数据处理方法、装置、计算机设备和存储介质
CN113688288A (zh) 数据关联分析方法、装置、计算机设备和存储介质
CN115964292A (zh) 临床试验数据核查方法和装置、电子设备和存储介质
CN113010208B (zh) 一种版本信息的生成方法、装置、设备及存储介质
CN114005498A (zh) 临床试验数据逻辑核查方法和装置、设备、存储介质
CN114360671A (zh) 电子病历的生成方法和装置、存储介质和电子装置
CN111949845A (zh) 处理测绘信息的方法、装置、计算机设备和存储介质
CN111048165A (zh) 试验样本的确定方法及装置、计算机介质和电子设备
CN114005505A (zh) 病例报告表生成方法、装置、计算机设备和存储介质
CN115910265A (zh) 一种医院无纸化病案生成方法及系统
CN114694813A (zh) 临床试验数据处理方法、装置、设备及介质
CN113971993A (zh) 临床试验数据转换方法、装置、计算机设备和存储介质
CN114155924A (zh) 临床试验数据处理方法、装置、计算机设备及存储介质
CN111933228B (zh) 用于临床研究中的项目分发与管理系统的实现方法和装置
CN113986343B (zh) 程序模块获取方法、装置、计算机设备和存储介质
US9275358B1 (en) System, method, and computer program for automatically creating and submitting defect information associated with defects identified during a software development lifecycle to a defect tracking system
JP5583306B1 (ja) 情報システムおよびその更新方法
CN113987016B (zh) 临床递交数据对比方法、装置、计算机设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20220725

Address after: 201703 room 1288, Zone C, 12 / F, block B, No. 1-72, Lane 2855, Huqingping highway, Zhaoxiang Town, Qingpu District, Shanghai

Applicant after: Shanghai Taimei Digital Technology Co.,Ltd.

Address before: 3 / F, building 9, smart industry innovation park, 36 Changsheng South Road, Jiaxing City, Zhejiang Province, 314001

Applicant before: Zhejiang Taimei Medical Technology Co.,Ltd.

TA01 Transfer of patent application right
GR01 Patent grant
GR01 Patent grant