CN112883033A

CN112883033A - Edc系统中自动编码和历史编码自动匹配方法

Info

Publication number: CN112883033A
Application number: CN202110214114.6A
Authority: CN
Inventors: 许海斌; 管卫华
Original assignee: Jiaxing Yidixi Computer Technology Co ltd
Current assignee: Jiaxing Yidixi Computer Technology Co ltd
Priority date: 2021-02-25
Filing date: 2021-02-25
Publication date: 2021-06-01

Abstract

本发明提供了一种EDC系统中自动编码和历史编码自动匹配方法，包括以下步骤：S1.当用户进入编码页面时，筛选出所有未编码字段值；S2.将所有未编码字段值与编码字典中的编码值进行匹配，若匹配成功，则对相应字段值进行自动编码，否则执行S3；S3.查找是否存在相应字段值的历史编码记录，若是，则使用历史编码记录匹配相应的字段值，否则，提示用户进行人工编码，并将人工编码结果存储为历史编码记录。本发明无需人工逐条编码，避免人为编码错误，能够帮助用户快速、高效且准确地完成编码工作；自动记录历史编码，避免重复劳动力，进一步提高编码效率。

Description

EDC系统中自动编码和历史编码自动匹配方法

技术领域

本发明属于临床试验数据管理技术领域，尤其是涉及一种EDC系统中自动编码和历史编码自动匹配方法。

背景技术

编码管理是临床试验EDC系统的基本功能。目前对于受试者的录入数据进行编码方式较为常见的是人工逐条手工编码，然后对每条录入的数据和相应字典里的术语进行匹配，保证录入的数据点有一个通用及准确的数值描述。但是这样的方式存在较大的缺陷，如：

1、需要系统使用人员对字典中的内容相当熟悉；

2、需要花费非常多的时间对每个未编码的数据点进行单条编码；

3、人工编码的过程中容易出现人为的误操作，如选择了错误的编码值等。

发明内容

本发明的目的是针对上述问题，提供一种EDC系统中自动编码和历史编码自动匹配方法。

为达到上述目的，本发明采用了下列技术方案：

一种EDC系统中自动编码和历史编码自动匹配方法，包括以下步骤：

S1.当用户进入编码页面时，筛选出所有未编码字段值；

S2.将所有未编码字段值与编码字典中的编码值进行匹配，若匹配成功，则对相应字段值进行自动编码，否则执行S3；

S3.查找是否存在相应字段值的历史编码记录，若是，则使用历史编码记录匹配相应的字段值，否则，提示用户进行人工编码，并将人工编码结果存储为历史编码记录。

在上述的EDC系统中自动编码和历史编码自动匹配方法中，步骤S1中，在编码页面提供编码字典表以供用户选择其中的一种或多种编码字典，并根据用户所选的编码字典执行步骤S2。

在上述的EDC系统中自动编码和历史编码自动匹配方法中，步骤S1之前，将每种编码字典划分为多个适用于不同eCRF版本号的分类字典，并在S1中根据当前eCRF版本号在用户所选的编码字典中选取相应的分类字典。

在上述的EDC系统中自动编码和历史编码自动匹配方法中，系统中具有variable表，且该variable表用于记录eCRF版本号与分类字典之间关联关系，在S1中，从variable表中匹配当前eCRF版本号以获得相应的分类字典并用于步骤S2。

在上述的EDC系统中自动编码和历史编码自动匹配方法中，系统中具有用于记录受试者信息的Subject表，所述的受试者信息包括受试者ID、试验中心ID和eCRF版本号，且在S1中根据用户所选的受试者确定当前eCRF版本号。

在上述的EDC系统中自动编码和历史编码自动匹配方法中，步骤S1具体包括：

S11.获取用户录入的数据中所有字段值的字段ID；

S12.将所有编码状态位处于否的字段ID进行提取以筛选出所有未编码的字段ID；

S13.根据未编码的字段ID获取所述的未编码字段值。

在上述的EDC系统中自动编码和历史编码自动匹配方法中，系统中具有Data_point表，Data_point表中记录有字段ID和字段ID的编码状态位，且在步骤S12中，根据Data_point获取各字段ID的编码状态位。

在上述的EDC系统中自动编码和历史编码自动匹配方法中，系统中具有Field表，所述的Field表记录有字段名和字段ID，所述的录入数据由用户分别填入相应的字段名下以获得各字段名下的字段值，并根据Field表获得字段ID与字段值的对应关系并存储在Data_point表中；

在步骤S11中，通过Data_point表根据字段值获取字段ID；

在步骤S13中，通过Data_point表根据未编码的字段ID获取相应的未编码字段值。

在上述的EDC系统中自动编码和历史编码自动匹配方法中，步骤S2中，自动编码方式为：

S21.从encode_column表中获取编码字典中的最低级编码层；

S22.在encode_entry表中获取最低级编码层下的编码值，使用未编码字段值与所获取的编码值进行匹配，若匹配成功则对相应字段值进行当前层级的编码；

通过自动编码、人工编码或历史编码记录编码得到编码后，执行以下步骤：

根据编码结果，通过encode_map表获取上一层级相应的编码，并重复使用encode_map表直到遍历所有层级；

所述的encode_column表中记录有编码字典的所有层级，所述的encode_entry表中记录有所有层级的编码和编码值；所述的encode_map表中记录有不同层级的关联关系。

在上述的EDC系统中自动编码和历史编码自动匹配方法中，在步骤S3中，人工编码结果包括字段值和人工编码所选的编码值；

在步骤S1中，从Field表中获取所有绑定了所用分类字典的字段ID并在Data_point表中对相应字段ID的编码状态位标注为‘是’，同时将未绑定此分类字典的字段ID筛选出来并在Data_point表中对相应字段ID的编码状态位标注为‘否’。

本发明的优点在于：无需人工逐条编码，避免人为编码错误，能够帮助用户快速、高效且准确地完成编码工作；自动记录历史编码，避免重复劳动力，进一步提高编码效率。

附图说明

图1为本发明EDC系统中自动编码和历史编码自动匹配方法的方法流程图；

图2为本发明获取未编码字段值的方法流程图。

具体实施方式

下面结合附图和具体实施方式对本发明做进一步详细的说明。

本实施例公开了一种EDC系统中自动编码和历史编码自动匹配方法，包括以下步骤：

S1.当用户进入编码页面时，筛选出所有未编码字段值；

S3.查找是否存在相应字段值的历史编码记录，若是，则使用历史编码记录匹配相应的字段值，否则，提示用户进行人工编码，并将人工编码结果存储为历史编码记录。进行人工编码时，用户可以人工寻找/填写最接近的术语编码值进行人工匹配，并将相应字段值和用户人工编码所选的编码值存入编码历史数据库中，下次具有同样的字段值时，就能够根据历史记录进行自动编码。

进一步地，步骤S1中，在编码页面提供编码字典表以供用户选择其中的一种或多种编码字典，并根据用户所选的编码字典执行步骤S2。

优选地，步骤S1之前，将每种编码字典划分为多个适用于不同eCRF版本号的分类字典，并在S1中根据当前eCRF版本号在用户所选的编码字典中选取相应的分类字典。若用户所选的编码字典中没有相应的分类字典则提示用户更换字典种类。能够适应不同eCRF版本号的不良事件录入，并且将各种eCRF版本单独对应相应的分类字典，能够大大降低匹配错误的概率，提高自动匹配的精度。

进一步地，系统中具有variable表，且该variable表用于记录eCRF版本号与分类字典之间关联关系，在S1中，从variable表中匹配当前eCRF版本号以获得相应的分类字典并用于步骤S2。

相应地，系统中具有用于记录受试者信息的Subject表，所述的受试者信息包括受试者ID、试验中心ID和eCRF版本号，且在S1中根据用户所选的受试者确定当前eCRF版本号。

具体地，步骤S1具体包括：

S11.获取用户录入的数据中所有字段值的字段ID；

S13.根据未编码的字段ID获取所述的未编码字段值。

进一步地，系统中具有Data_point表，Data_point表中记录有字段ID和字段ID的编码状态位，且在步骤S12中，根据Data_point获取各字段ID的编码状态位。

进一步地，系统中具有Field表，所述的Field表记录有字段名每个字段名的字段ID，所述的录入数据由用户分别填入相应的字段名下以获得各字段名下的字段值，并根据Field表获得字段ID与字段值的对应关系并存储在Data_point表中；

所以，在步骤S11中，通过Data_point表根据字段值获取字段ID；同样地，在步骤S13中，通过Data_point表根据未编码的字段ID获取相应的未编码字段值。

进一步地，步骤S2中，自动编码方式为：

S21.从encode_column表中获取编码字典中的最低级编码层；

S22.在encode_entry表中获取最低级编码层下的编码值，使用未编码字段值与所获取的编码值进行匹配，若匹配成功则对相应字段值进行当前层级的编码；匹配成功是指与其中一个编码值完全匹配，且只有这一条编码值匹配，当对应多条编码值或没有完全匹配时均为未匹配成功。

进一步地，在步骤S1中，从Field表中获取所有绑定了所用分类字典的字段ID并在Data_point表中对相应字段ID的编码状态位标注为‘是’，同时将未绑定此分类字典的字段ID筛选出来并在Data_point表中对相应字段ID的编码状态位标注为‘否’。

本文中所描述的具体实施例仅仅是对本发明精神作举例说明。本发明所属技术领域的技术人员可以对所描述的具体实施例做各种各样的修改或补充或采用类似的方式替代，但并不会偏离本发明的精神或者超越所附权利要求书所定义的范围。

尽管本文较多地使用了subject表、field表和Data_point表、Variable表、encode_entry表、encode_map表等术语，但并不排除使用其它术语的可能性。使用这些术语仅仅是为了更方便地描述和解释本发明的本质；把它们解释成任何一种附加的限制都是与本发明精神相违背的。

Claims

1.一种EDC系统中自动编码和历史编码自动匹配方法，其特征在于，包括以下步骤：

S1.当用户进入编码页面时，筛选出所有未编码字段值；

2.根据权利要求1所述的EDC系统中自动编码和历史编码自动匹配方法，其特征在于，步骤S1中，在编码页面提供编码字典表以供用户选择其中的一种或多种编码字典，并根据用户所选的编码字典执行步骤S2。

3.根据权利要求2所述的EDC系统中自动编码和历史编码自动匹配方法，其特征在于，步骤S1之前，将每种编码字典划分为多个适用于不同eCRF版本号的分类字典，并在S1中根据当前eCRF版本号在用户所选的编码字典中选取相应的分类字典。

4.根据权利要求3所述的EDC系统中自动编码和历史编码自动匹配方法，其特征在于，系统中具有variable表，且该variable表用于记录eCRF版本号与分类字典之间关联关系，在S1中，从variable表中匹配当前eCRF版本号以获得相应的分类字典并用于步骤S2。

5.根据权利要求4所述的EDC系统中自动编码和历史编码自动匹配方法，其特征在于，系统中具有用于记录受试者信息的Subject表，所述的受试者信息包括受试者ID、试验中心ID和eCRF版本号，且在S1中根据用户所选的受试者确定当前eCRF版本号。

6.根据权利要求5所述的EDC系统中自动编码和历史编码自动匹配方法，其特征在于，步骤S1具体包括：

S11.获取用户录入的数据中所有字段值的字段ID；

S12.将所有编码状态位处于‘否’的字段ID进行提取以筛选出所有未编码的字段ID；

S13.根据未编码的字段ID获取所述的未编码字段值。

7.根据权利要求6所述的EDC系统中自动编码和历史编码自动匹配方法，其特征在于，系统中具有Data_point表，Data_point表中记录有字段ID和字段ID的编码状态位，且在步骤S12中，根据Data_point获取各字段ID的编码状态位。

8.根据权利要求7所述的EDC系统中自动编码和历史编码自动匹配方法，其特征在于，系统中具有Field表，所述的Field表记录有字段名和字段ID，所述的录入数据由用户分别填入相应的字段名下以获得各字段名下的字段值，并根据Field表获得字段ID与字段值的对应关系并存储在Data_point表中；

在步骤S11中，通过Data_point表根据字段值获取字段ID；

9.根据权利要求8所述的EDC系统中自动编码和历史编码自动匹配方法，其特征在于，步骤S2中，自动编码方式为：

S21.从encode_column表中获取编码字典中的最低级编码层；

通过自动编码、人工编码或历史编码记录进行编码后，执行以下步骤：

10.根据权利要求9所述的EDC系统中自动编码和历史编码自动匹配方法，其特征在于，在步骤S3中，人工编码结果包括字段值和人工编码所选的编码；