CN112883033A - Edc系统中自动编码和历史编码自动匹配方法 - Google Patents
Edc系统中自动编码和历史编码自动匹配方法 Download PDFInfo
- Publication number
- CN112883033A CN112883033A CN202110214114.6A CN202110214114A CN112883033A CN 112883033 A CN112883033 A CN 112883033A CN 202110214114 A CN202110214114 A CN 202110214114A CN 112883033 A CN112883033 A CN 112883033A
- Authority
- CN
- China
- Prior art keywords
- encoding
- field
- coding
- automatic
- matching
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 34
- 238000012216 screening Methods 0.000 claims abstract description 4
- 238000007792 addition Methods 0.000 description 1
- 230000002411 adverse Effects 0.000 description 1
- 238000013523 data management Methods 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/22—Indexing; Data structures therefor; Storage structures
- G06F16/2282—Tablespace storage structures; Management thereof
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/21—Design, administration or maintenance of databases
- G06F16/219—Managing data history or versioning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2455—Query execution
- G06F16/24553—Query execution of query operations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/374—Thesaurus
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Software Systems (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
本发明提供了一种EDC系统中自动编码和历史编码自动匹配方法,包括以下步骤:S1.当用户进入编码页面时,筛选出所有未编码字段值;S2.将所有未编码字段值与编码字典中的编码值进行匹配,若匹配成功,则对相应字段值进行自动编码,否则执行S3;S3.查找是否存在相应字段值的历史编码记录,若是,则使用历史编码记录匹配相应的字段值,否则,提示用户进行人工编码,并将人工编码结果存储为历史编码记录。本发明无需人工逐条编码,避免人为编码错误,能够帮助用户快速、高效且准确地完成编码工作;自动记录历史编码,避免重复劳动力,进一步提高编码效率。
Description
技术领域
本发明属于临床试验数据管理技术领域,尤其是涉及一种EDC系统中自动编码和历史编码自动匹配方法。
背景技术
编码管理是临床试验EDC系统的基本功能。目前对于受试者的录入数据进行编码方式较为常见的是人工逐条手工编码,然后对每条录入的数据和相应字典里的术语进行匹配,保证录入的数据点有一个通用及准确的数值描述。但是这样的方式存在较大的缺陷,如:
1、需要系统使用人员对字典中的内容相当熟悉;
2、需要花费非常多的时间对每个未编码的数据点进行单条编码;
3、人工编码的过程中容易出现人为的误操作,如选择了错误的编码值等。
发明内容
本发明的目的是针对上述问题,提供一种EDC系统中自动编码和历史编码自动匹配方法。
为达到上述目的,本发明采用了下列技术方案:
一种EDC系统中自动编码和历史编码自动匹配方法,包括以下步骤:
S1.当用户进入编码页面时,筛选出所有未编码字段值;
S2.将所有未编码字段值与编码字典中的编码值进行匹配,若匹配成功,则对相应字段值进行自动编码,否则执行S3;
S3.查找是否存在相应字段值的历史编码记录,若是,则使用历史编码记录匹配相应的字段值,否则,提示用户进行人工编码,并将人工编码结果存储为历史编码记录。
在上述的EDC系统中自动编码和历史编码自动匹配方法中,步骤S1中,在编码页面提供编码字典表以供用户选择其中的一种或多种编码字典,并根据用户所选的编码字典执行步骤S2。
在上述的EDC系统中自动编码和历史编码自动匹配方法中,步骤S1之前,将每种编码字典划分为多个适用于不同eCRF版本号的分类字典,并在S1中根据当前eCRF版本号在用户所选的编码字典中选取相应的分类字典。
在上述的EDC系统中自动编码和历史编码自动匹配方法中,系统中具有variable表,且该variable表用于记录eCRF版本号与分类字典之间关联关系,在S1中,从variable表中匹配当前eCRF版本号以获得相应的分类字典并用于步骤S2。
在上述的EDC系统中自动编码和历史编码自动匹配方法中,系统中具有用于记录受试者信息的Subject表,所述的受试者信息包括受试者ID、试验中心ID和eCRF版本号,且在S1中根据用户所选的受试者确定当前eCRF版本号。
在上述的EDC系统中自动编码和历史编码自动匹配方法中,步骤S1具体包括:
S11.获取用户录入的数据中所有字段值的字段ID;
S12.将所有编码状态位处于否的字段ID进行提取以筛选出所有未编码的字段ID;
S13.根据未编码的字段ID获取所述的未编码字段值。
在上述的EDC系统中自动编码和历史编码自动匹配方法中,系统中具有Data_point表,Data_point表中记录有字段ID和字段ID的编码状态位,且在步骤S12中,根据Data_point获取各字段ID的编码状态位。
在上述的EDC系统中自动编码和历史编码自动匹配方法中,系统中具有Field表,所述的Field表记录有字段名和字段ID,所述的录入数据由用户分别填入相应的字段名下以获得各字段名下的字段值,并根据Field表获得字段ID与字段值的对应关系并存储在Data_point表中;
在步骤S11中,通过Data_point表根据字段值获取字段ID;
在步骤S13中,通过Data_point表根据未编码的字段ID获取相应的未编码字段值。
在上述的EDC系统中自动编码和历史编码自动匹配方法中,步骤S2中,自动编码方式为:
S21.从encode_column表中获取编码字典中的最低级编码层;
S22.在encode_entry表中获取最低级编码层下的编码值,使用未编码字段值与所获取的编码值进行匹配,若匹配成功则对相应字段值进行当前层级的编码;
通过自动编码、人工编码或历史编码记录编码得到编码后,执行以下步骤:
根据编码结果,通过encode_map表获取上一层级相应的编码,并重复使用encode_map表直到遍历所有层级;
所述的encode_column表中记录有编码字典的所有层级,所述的encode_entry表中记录有所有层级的编码和编码值;所述的encode_map表中记录有不同层级的关联关系。
在上述的EDC系统中自动编码和历史编码自动匹配方法中,在步骤S3中,人工编码结果包括字段值和人工编码所选的编码值;
在步骤S1中,从Field表中获取所有绑定了所用分类字典的字段ID并在Data_point表中对相应字段ID的编码状态位标注为‘是’,同时将未绑定此分类字典的字段ID筛选出来并在Data_point表中对相应字段ID的编码状态位标注为‘否’。
本发明的优点在于:无需人工逐条编码,避免人为编码错误,能够帮助用户快速、高效且准确地完成编码工作;自动记录历史编码,避免重复劳动力,进一步提高编码效率。
附图说明
图1为本发明EDC系统中自动编码和历史编码自动匹配方法的方法流程图;
图2为本发明获取未编码字段值的方法流程图。
具体实施方式
下面结合附图和具体实施方式对本发明做进一步详细的说明。
本实施例公开了一种EDC系统中自动编码和历史编码自动匹配方法,包括以下步骤:
S1.当用户进入编码页面时,筛选出所有未编码字段值;
S2.将所有未编码字段值与编码字典中的编码值进行匹配,若匹配成功,则对相应字段值进行自动编码,否则执行S3;
S3.查找是否存在相应字段值的历史编码记录,若是,则使用历史编码记录匹配相应的字段值,否则,提示用户进行人工编码,并将人工编码结果存储为历史编码记录。进行人工编码时,用户可以人工寻找/填写最接近的术语编码值进行人工匹配,并将相应字段值和用户人工编码所选的编码值存入编码历史数据库中,下次具有同样的字段值时,就能够根据历史记录进行自动编码。
进一步地,步骤S1中,在编码页面提供编码字典表以供用户选择其中的一种或多种编码字典,并根据用户所选的编码字典执行步骤S2。
优选地,步骤S1之前,将每种编码字典划分为多个适用于不同eCRF版本号的分类字典,并在S1中根据当前eCRF版本号在用户所选的编码字典中选取相应的分类字典。若用户所选的编码字典中没有相应的分类字典则提示用户更换字典种类。能够适应不同eCRF版本号的不良事件录入,并且将各种eCRF版本单独对应相应的分类字典,能够大大降低匹配错误的概率,提高自动匹配的精度。
进一步地,系统中具有variable表,且该variable表用于记录eCRF版本号与分类字典之间关联关系,在S1中,从variable表中匹配当前eCRF版本号以获得相应的分类字典并用于步骤S2。
相应地,系统中具有用于记录受试者信息的Subject表,所述的受试者信息包括受试者ID、试验中心ID和eCRF版本号,且在S1中根据用户所选的受试者确定当前eCRF版本号。
具体地,步骤S1具体包括:
S11.获取用户录入的数据中所有字段值的字段ID;
S12.将所有编码状态位处于否的字段ID进行提取以筛选出所有未编码的字段ID;
S13.根据未编码的字段ID获取所述的未编码字段值。
进一步地,系统中具有Data_point表,Data_point表中记录有字段ID和字段ID的编码状态位,且在步骤S12中,根据Data_point获取各字段ID的编码状态位。
进一步地,系统中具有Field表,所述的Field表记录有字段名每个字段名的字段ID,所述的录入数据由用户分别填入相应的字段名下以获得各字段名下的字段值,并根据Field表获得字段ID与字段值的对应关系并存储在Data_point表中;
所以,在步骤S11中,通过Data_point表根据字段值获取字段ID;同样地,在步骤S13中,通过Data_point表根据未编码的字段ID获取相应的未编码字段值。
进一步地,步骤S2中,自动编码方式为:
S21.从encode_column表中获取编码字典中的最低级编码层;
S22.在encode_entry表中获取最低级编码层下的编码值,使用未编码字段值与所获取的编码值进行匹配,若匹配成功则对相应字段值进行当前层级的编码;匹配成功是指与其中一个编码值完全匹配,且只有这一条编码值匹配,当对应多条编码值或没有完全匹配时均为未匹配成功。
通过自动编码、人工编码或历史编码记录编码得到编码后,执行以下步骤:
根据编码结果,通过encode_map表获取上一层级相应的编码,并重复使用encode_map表直到遍历所有层级;
所述的encode_column表中记录有编码字典的所有层级,所述的encode_entry表中记录有所有层级的编码和编码值;所述的encode_map表中记录有不同层级的关联关系。
进一步地,在步骤S1中,从Field表中获取所有绑定了所用分类字典的字段ID并在Data_point表中对相应字段ID的编码状态位标注为‘是’,同时将未绑定此分类字典的字段ID筛选出来并在Data_point表中对相应字段ID的编码状态位标注为‘否’。
本文中所描述的具体实施例仅仅是对本发明精神作举例说明。本发明所属技术领域的技术人员可以对所描述的具体实施例做各种各样的修改或补充或采用类似的方式替代,但并不会偏离本发明的精神或者超越所附权利要求书所定义的范围。
尽管本文较多地使用了subject表、field表和Data_point表、Variable表、encode_entry表、encode_map表等术语,但并不排除使用其它术语的可能性。使用这些术语仅仅是为了更方便地描述和解释本发明的本质;把它们解释成任何一种附加的限制都是与本发明精神相违背的。
Claims (10)
1.一种EDC系统中自动编码和历史编码自动匹配方法,其特征在于,包括以下步骤:
S1.当用户进入编码页面时,筛选出所有未编码字段值;
S2.将所有未编码字段值与编码字典中的编码值进行匹配,若匹配成功,则对相应字段值进行自动编码,否则执行S3;
S3.查找是否存在相应字段值的历史编码记录,若是,则使用历史编码记录匹配相应的字段值,否则,提示用户进行人工编码,并将人工编码结果存储为历史编码记录。
2.根据权利要求1所述的EDC系统中自动编码和历史编码自动匹配方法,其特征在于,步骤S1中,在编码页面提供编码字典表以供用户选择其中的一种或多种编码字典,并根据用户所选的编码字典执行步骤S2。
3.根据权利要求2所述的EDC系统中自动编码和历史编码自动匹配方法,其特征在于,步骤S1之前,将每种编码字典划分为多个适用于不同eCRF版本号的分类字典,并在S1中根据当前eCRF版本号在用户所选的编码字典中选取相应的分类字典。
4.根据权利要求3所述的EDC系统中自动编码和历史编码自动匹配方法,其特征在于,系统中具有variable表,且该variable表用于记录eCRF版本号与分类字典之间关联关系,在S1中,从variable表中匹配当前eCRF版本号以获得相应的分类字典并用于步骤S2。
5.根据权利要求4所述的EDC系统中自动编码和历史编码自动匹配方法,其特征在于,系统中具有用于记录受试者信息的Subject表,所述的受试者信息包括受试者ID、试验中心ID和eCRF版本号,且在S1中根据用户所选的受试者确定当前eCRF版本号。
6.根据权利要求5所述的EDC系统中自动编码和历史编码自动匹配方法,其特征在于,步骤S1具体包括:
S11.获取用户录入的数据中所有字段值的字段ID;
S12.将所有编码状态位处于‘否’的字段ID进行提取以筛选出所有未编码的字段ID;
S13.根据未编码的字段ID获取所述的未编码字段值。
7.根据权利要求6所述的EDC系统中自动编码和历史编码自动匹配方法,其特征在于,系统中具有Data_point表,Data_point表中记录有字段ID和字段ID的编码状态位,且在步骤S12中,根据Data_point获取各字段ID的编码状态位。
8.根据权利要求7所述的EDC系统中自动编码和历史编码自动匹配方法,其特征在于,系统中具有Field表,所述的Field表记录有字段名和字段ID,所述的录入数据由用户分别填入相应的字段名下以获得各字段名下的字段值,并根据Field表获得字段ID与字段值的对应关系并存储在Data_point表中;
在步骤S11中,通过Data_point表根据字段值获取字段ID;
在步骤S13中,通过Data_point表根据未编码的字段ID获取相应的未编码字段值。
9.根据权利要求8所述的EDC系统中自动编码和历史编码自动匹配方法,其特征在于,步骤S2中,自动编码方式为:
S21.从encode_column表中获取编码字典中的最低级编码层;
S22.在encode_entry表中获取最低级编码层下的编码值,使用未编码字段值与所获取的编码值进行匹配,若匹配成功则对相应字段值进行当前层级的编码;
通过自动编码、人工编码或历史编码记录进行编码后,执行以下步骤:
根据编码结果,通过encode_map表获取上一层级相应的编码,并重复使用encode_map表直到遍历所有层级;
所述的encode_column表中记录有编码字典的所有层级,所述的encode_entry表中记录有所有层级的编码和编码值;所述的encode_map表中记录有不同层级的关联关系。
10.根据权利要求9所述的EDC系统中自动编码和历史编码自动匹配方法,其特征在于,在步骤S3中,人工编码结果包括字段值和人工编码所选的编码;
在步骤S1中,从Field表中获取所有绑定了所用分类字典的字段ID并在Data_point表中对相应字段ID的编码状态位标注为‘是’,同时将未绑定此分类字典的字段ID筛选出来并在Data_point表中对相应字段ID的编码状态位标注为‘否’。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110214114.6A CN112883033A (zh) | 2021-02-25 | 2021-02-25 | Edc系统中自动编码和历史编码自动匹配方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110214114.6A CN112883033A (zh) | 2021-02-25 | 2021-02-25 | Edc系统中自动编码和历史编码自动匹配方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112883033A true CN112883033A (zh) | 2021-06-01 |
Family
ID=76054565
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110214114.6A Pending CN112883033A (zh) | 2021-02-25 | 2021-02-25 | Edc系统中自动编码和历史编码自动匹配方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112883033A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116303369A (zh) * | 2023-05-12 | 2023-06-23 | 菲特(天津)检测技术有限公司 | 一种基于数据库的自动编码方法、装置、电子设备及介质 |
WO2024007810A1 (zh) * | 2022-07-05 | 2024-01-11 | 上海妙一生物科技有限公司 | 一种基于医学疾病和药品的编码方法和编码装置 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20020138463A1 (en) * | 2001-03-22 | 2002-09-26 | International Business Machines Corporation | Using dynamically encoded values to reduce storage requirements for low cardinality fields in a database |
CN107784611A (zh) * | 2017-04-11 | 2018-03-09 | 平安医疗健康管理股份有限公司 | 药品编码方法及装置 |
CN109256182A (zh) * | 2018-11-09 | 2019-01-22 | 医渡云(北京)技术有限公司 | 一种电子病例表生成方法和装置 |
CN110335647A (zh) * | 2019-06-21 | 2019-10-15 | 上海市精神卫生中心(上海市心理咨询培训中心) | 一种临床数据标准化系统及标准化数据采集方法 |
CN112164469A (zh) * | 2020-10-14 | 2021-01-01 | 杭州卓健信息科技有限公司 | 一种临床科研数据采集管理系统 |
CN112269785A (zh) * | 2020-10-29 | 2021-01-26 | 嘉兴易迪希计算机技术有限公司 | Edc系统中受试者状态明细动态填充字段方法和系统 |
-
2021
- 2021-02-25 CN CN202110214114.6A patent/CN112883033A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20020138463A1 (en) * | 2001-03-22 | 2002-09-26 | International Business Machines Corporation | Using dynamically encoded values to reduce storage requirements for low cardinality fields in a database |
CN107784611A (zh) * | 2017-04-11 | 2018-03-09 | 平安医疗健康管理股份有限公司 | 药品编码方法及装置 |
CN109256182A (zh) * | 2018-11-09 | 2019-01-22 | 医渡云(北京)技术有限公司 | 一种电子病例表生成方法和装置 |
CN110335647A (zh) * | 2019-06-21 | 2019-10-15 | 上海市精神卫生中心(上海市心理咨询培训中心) | 一种临床数据标准化系统及标准化数据采集方法 |
CN112164469A (zh) * | 2020-10-14 | 2021-01-01 | 杭州卓健信息科技有限公司 | 一种临床科研数据采集管理系统 |
CN112269785A (zh) * | 2020-10-29 | 2021-01-26 | 嘉兴易迪希计算机技术有限公司 | Edc系统中受试者状态明细动态填充字段方法和系统 |
Non-Patent Citations (2)
Title |
---|
李庆娜等: "基于电子数据获取的临床研究数据管理计划的制定及其关键因素探讨", 《中西医结合学报》 * |
杨华等: "ICD-10智能辅助编码方法的探讨", 《中国病案》 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2024007810A1 (zh) * | 2022-07-05 | 2024-01-11 | 上海妙一生物科技有限公司 | 一种基于医学疾病和药品的编码方法和编码装置 |
CN116303369A (zh) * | 2023-05-12 | 2023-06-23 | 菲特(天津)检测技术有限公司 | 一种基于数据库的自动编码方法、装置、电子设备及介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112883033A (zh) | Edc系统中自动编码和历史编码自动匹配方法 | |
EP0601569A1 (en) | Method for compressing full text indexes | |
CN101855636A (zh) | 数据处理设备及数据处理方法 | |
CN101855620A (zh) | 数据处理设备和数据处理方法 | |
KR20030011220A (ko) | 데이터 소트 방법, 데이터 소트 장치 및 데이터 소트프로그램 | |
CN105224527B (zh) | 适用于多种目的表更新方式的通用etl方法 | |
EP1504376B1 (en) | Data archive recovery | |
CN114385587B (zh) | 一种面向关系型数据库版本快照的构建方法及查询方法 | |
CN112084246B (zh) | 财务软件信息的采集方法 | |
CN104636471A (zh) | 一种程序代码的查找方法及装置 | |
CN114676229B (zh) | 一种技改大修工程档案管理系统及管理方法 | |
US7620640B2 (en) | Cascading index method and apparatus | |
CN108090034B (zh) | 基于集群的单证代码统一编码生成方法和系统 | |
CN112765136B (zh) | 医学编码词典的存储方法、升级方法和装置 | |
CN114385624A (zh) | 编码方法、编码查找方法、装置、电子设备及存储介质 | |
CN114490599A (zh) | 一种证件号处理和检索的方法 | |
CN110909256A (zh) | 计算机用的人工智能信息过滤系统 | |
US6970868B2 (en) | Method for ascertaining valid address codes | |
CN112286874B (zh) | 一种基于时间的文件管理方法 | |
CN113378362B (zh) | 白车身数据分包系统及方法 | |
US20120259898A1 (en) | Automatically Optimizing Business Process Platforms | |
CN116401678B (zh) | 一种汽车信息安全测试用例的构建和提取方法 | |
CN114974564B (zh) | 一种规则驱动的肿瘤医疗辅助决策系统的数据智能存储方法 | |
CN111507066B (zh) | 一种上传加载文件并解析入库方法及系统 | |
CN112232032B (zh) | docx文档的内容样式自动转换方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20210601 |
|
RJ01 | Rejection of invention patent application after publication |