CN105701221A - 分级映射各种同义但不同标准的术语的方法 - Google Patents

分级映射各种同义但不同标准的术语的方法 Download PDF

Info

Publication number
CN105701221A
CN105701221A CN201610024723.4A CN201610024723A CN105701221A CN 105701221 A CN105701221 A CN 105701221A CN 201610024723 A CN201610024723 A CN 201610024723A CN 105701221 A CN105701221 A CN 105701221A
Authority
CN
China
Prior art keywords
mapping
different
term
various
split
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201610024723.4A
Other languages
English (en)
Inventor
陈杰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to CN201610024723.4A priority Critical patent/CN105701221A/zh
Publication of CN105701221A publication Critical patent/CN105701221A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • G06F16/353Clustering; Classification into predefined classes

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Medical Treatment And Welfare Office Work (AREA)

Abstract

本发明一种分级映射各种同义但不同标准的术语的方法,包括将需要映射的临床术语进行拆分,命名为不同的类别;基于拆分的不同类别,分析各种可能的映射结果,将不同的结果进行分类,按智能系统精确或模糊的映射程度,设置为不同的映射等级;根据不同的映射级别,有选择有针对性的进行人工介入处理,将较低映射等级的数据进行审核提升工作。

Description

分级映射各种同义但不同标准的术语的方法
技术领域
本发明一种分级映射各种同义但不同标准的术语的方法可以分级处理医疗信息化中不同标准的临床术语(如药品、诊疗项目、材料等),从而进行不同级别的应用。
背景技术
随着医疗信息化领域的快速发展,各类信息系统的应用极大的方便了医疗卫生机构的日常工作和管理,从而也对信息化建设提出了更高的要求——如何利用这些有价值的数据更好的为医疗领域服务。
侧重数据处理的临床信息系统通常需要对各类临床数据进行统计分析,尤其需要将客户端的数据与自己产品的标准表数据进行映射处理。但是临床数据数量繁多、复杂,比如临床常用诊断名称“心梗”与标准诊断名称“心肌梗死”,药品名称“阿斯咪唑”与“苄苯哌咪唑”,医嘱项目“宫颈TCT”与“液基薄层细胞制片术”等都是名称不同但是含义相同的临床术语。以上问题甚至是书写格式如“注射用重组人干扰素a-2b”与“注射用重组人干扰素α2b”导致的名称差异等,都会影响映射工作的质量。特别是对于标准不统一的数据,简单的通过名称或编码的比对,完全映射成功的比例极低,而且导致剩余的数据都无法利用或全部需要人工处理。
发明内容
针对上述问题,本发明提供一种通用的映射逻辑,极大的方便了经过简单名称匹配后映射失败数据的处理工作,并提升了数据利用率的分级映射各种同义但不同标准的术语的方法。
为达到上述发明目的,本发明分级映射各种同义但不同标准的术语的方法,包括
将需要映射的临床术语进行拆分,命名为不同的类别;
基于拆分的不同类别,分析各种可能的映射结果,将不同的结果进行分类,按智能系统精确或模糊的映射程度,设置为不同的映射等级;
根据不同的映射级别,有选择有针对性的进行人工介入处理,将较低映射等级的数据进行审核提升工作。
进一步地,所述方法具体包括:
分析术语运行特点;
根据自身各种属性特点将术语进行拆分;
根据拆分的不同类型,分析各种可能的映射结果,将不同的结果进行组合,归置为不同的映射等级;
程序根据设定的映射等级逻辑自动处理映射数据,将数据映射到不同的等级;
根据不同的映射等级有针对性的进行人工介入处理;
审核判断可否提升映射等级,
若是,将相应低映射等级的术语进行升级处理;
否,术语映射完成。
附图说明
图1是本发明实施例临床术语映射流程图;
图2是本发明实施例药品映射实例分级图。
具体实施方式
下面结合说明书附图对本发明做进一步的描述。
按照图1映射流程所示,第一步先将药品名称进行拆分:药品名称包含了药品的主要成分名称和剂型名称,如药品名称“阿米卡星滴眼液”,可以拆分为阿米卡星和滴眼液。这样可以将原有的标准药品名称“阿米卡星滴眼液”作为为产品名,将“阿米卡星”作为为通用名,将“滴眼液”作为剂型。但是由于药品的剂型还有不同的分类标准,如大概念上的注射剂包含了注射液、冻干粉针、无菌粉末等,大概念上的乳膏剂也包含了软膏剂等,口服常释剂包含了片剂和胶囊剂,因此我们可以将大概念上的剂型类别作为标注剂型,将小概念的剂型类别作为实际剂型。这样整个药品术语就被拆分成了[产品名称]、[通用名称]、[标注剂型]、[实际剂型],对应到具体药品阿米卡星滴眼液分别为“阿米卡星滴眼液”、“阿米卡星”、“滴眼剂”、“滴眼液”。
部分药品名称进行分类后的实例如下表所示:
完成药品术语的拆分后就可以根据拆分的不同类别,分析各种可能的映射结果组合,将不同的结果进行分类,归置为不同的映射等级,如图2所示,将不同标准的药品术语的映射结果分为七个等级。
程序根据设定的七个不同等级的映射逻辑进行数据映射识别后,不同标准的药品数据会被分配到不同的级别:
映射到一级的可以唯一确定为同种药品;
映射到二级的可以确定为同通用名(即药品成分相同),且剂型为同类剂型的药品;
映射到三级的可以确定为同通用名的药品,但是剂型并不确定(可能为注射剂型也可能为口服剂型);
映射到一级模糊的为药品名称疑似为同一通用名,可能由于书写格式、药品别名等各种情况导致的名称并不完全一致,只是可以模糊匹配上,但是剂型为相同剂型的药品;
映射到二级模糊的为药品名称疑似为同一通用名,剂型为同一类剂型的药品;
映射到三级模糊的为药品名称疑似为同一通用名,剂型并不确定的药品;
映射到无映射的为药品名称完全匹配不上的药品。
根据不同映射等级的逻辑特点,可以有针对性的进行人工介入处理,如一级模糊等级的药品或许可以提升或批量提升到一级,二级模糊等级的药品或许可以提升或批量提升到二级等。这样将大批量的不同标准的数据进行程序自动分级映射后,再人工介入审核处理,最终得到不同级别的映射结果。
针对不同级别的映射结果可以进行不同的应用,这样能提高数据的利用率。如对于映射到一级的药品,它可以唯一定义确定一种药品,那么相应的药理学、药品说明书等知识都是通用的;映射到二级的药品,通用名相同但是剂型并不完全一样,这样相应的用法用量就会有差异。
对本发明应当理解的是,以上所述的实施例,对本发明的目的、技术方案和有益效果进行了进一步详细的说明,以上仅为本发明的实施例而已,并不用于限定本发明,凡是在本发明的精神原则之内,所作出的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内,本发明的保护范围应该以权利要求所界定的保护范围为准。

Claims (2)

1.一种分级映射各种同义但不同标准的术语的方法,其特征在于:包括
将需要映射的临床术语按程序识别所需的各种属性进行拆分,命名为不同的类别;并由程序根据拆分好的类别自动映射成不同的等级;
基于拆分出的不同类别,即每种术语(如药品),均被拆分成几个类别,根据每个类别识别的程度的不同,形成各种可能的组合,从中分析各种可能的映射结果,将不同的结果按类别组合的不同进行分类,按智能系统精确或模糊的映射程度,将各种分类归置为不同的映射等级;
根据不同的映射级别,有选择有针对性的进行人工介入处理。最高等级映射(即一级映射)为100%准确识别,不需要人工处理,低于一级的所有映射等级数据,均有必要进行审核提升工作,以弥补程序自动识别的局限性。
2.根据权利要求1所述的分级映射各种同义但不同标准的术语的方法,其特征在于:所述方法具体包括:
分析术语自身各种属性特点:术语的各种命名习惯、固有的内涵、统一编码习惯、单位、价格等等,根据这些属性特点将术语进行拆分;
根据拆分的不同类别,分析各种可能的映射结果,将不同的结果进行组合,归置为不同的映射等级;
程序根据设定的映射等级逻辑自动处理映射数据,将数据映射到不同的等级;
根据不同的映射等级有针对性的进行人工介入处理;
审核判断可否提升映射等级,
若是,将相应低映射等级的术语进行升级处理;
否,术语映射完成。
CN201610024723.4A 2016-01-15 2016-01-15 分级映射各种同义但不同标准的术语的方法 Pending CN105701221A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610024723.4A CN105701221A (zh) 2016-01-15 2016-01-15 分级映射各种同义但不同标准的术语的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610024723.4A CN105701221A (zh) 2016-01-15 2016-01-15 分级映射各种同义但不同标准的术语的方法

Publications (1)

Publication Number Publication Date
CN105701221A true CN105701221A (zh) 2016-06-22

Family

ID=56226341

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610024723.4A Pending CN105701221A (zh) 2016-01-15 2016-01-15 分级映射各种同义但不同标准的术语的方法

Country Status (1)

Country Link
CN (1) CN105701221A (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080091690A1 (en) * 2006-10-13 2008-04-17 International Business Machines Corporation Deriving a Data Model From a Hierarchy Of Related Terms, And Deriving a Hierarchy Of Related Terms From a Data Model
US8091119B2 (en) * 2007-08-22 2012-01-03 Novell, Inc. Identity based network mapping
CN103455608A (zh) * 2013-09-05 2013-12-18 广东医药价格协会 一种基于药品编码的管理及查询系统
CN104699828A (zh) * 2015-03-31 2015-06-10 佛山市金蓝领教育科技有限公司 一种原子词知识管理的方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080091690A1 (en) * 2006-10-13 2008-04-17 International Business Machines Corporation Deriving a Data Model From a Hierarchy Of Related Terms, And Deriving a Hierarchy Of Related Terms From a Data Model
US8091119B2 (en) * 2007-08-22 2012-01-03 Novell, Inc. Identity based network mapping
CN103455608A (zh) * 2013-09-05 2013-12-18 广东医药价格协会 一种基于药品编码的管理及查询系统
CN104699828A (zh) * 2015-03-31 2015-06-10 佛山市金蓝领教育科技有限公司 一种原子词知识管理的方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
甘辰希: "中文临床医学术语结构化编码和快速映射方法研究与实现", 《中国优秀硕士学位论文全文数据库 医药卫生科技辑》 *

Similar Documents

Publication Publication Date Title
KR102035888B1 (ko) 의학적 결정을 지원하는 의학적 제안의 스코어 계산방법
CN111489821A (zh) 诊断组管理系统
CN109670971A (zh) 异常就诊费用的判断方法、装置、设备及计算机存储介质
US20170109502A1 (en) System and method for clinical trial candidate matching
CN112489812B (zh) 药物开发分析方法、装置、电子设备和存储介质
US20090083218A1 (en) Retrieving Collected Data Mapped to a Base Dictionary
CN106022004A (zh) 检测混合用药冲突的方法及系统
McBride et al. Using Australian medicines terminology (AMT) and SNOMED CT-AU to better support clinical research.
CN109817289B (zh) 一种医嘱数据拆分的方法
CN106372201B (zh) 规则信息的分类处理方法
CN105701221A (zh) 分级映射各种同义但不同标准的术语的方法
Tjuka et al. Universal and cultural factors shape body part vocabularies
CN109817300B (zh) 一种基于人工智能的用药规则生成方法
JP6386956B2 (ja) データ作成支援システム、データ作成支援方法及びプログラム
Pattison-Gordon et al. Requirements of a sharable guideline representation for computer applications
CN115762758A (zh) 基于特征聚类与精准预测的肿瘤决策支持资源库系统
Guo et al. Comparison of the cohort selection performance of Australian Medicines Terminology to Anatomical Therapeutic Chemical mappings
Kwak et al. Clinical characteristics of behavioral and psychological symptoms in patients with drug-naïve Alzheimer's disease
Eggerth et al. Natural language processing for detecting medication-related notes in heart failure telehealth patients
Varghese et al. Standardized quality assurance forms for organ transplantations with multilingual support, open access and UMLS coding.
Rivera et al. Utilization of the Cancer Medications Enquiry Database (CanMED)-National Drug Codes (NDC): Assessment of systemic breast cancer treatment patterns
Barati et al. Using a digital implant catalog improves data quality and reduces administrative burden in the Dutch breast implant registry
Moyers et al. Trans-Atlantic data harmonization in the classification of medicines and dietary supplements: A challenge for epidemiologic study and clinical research
Lin et al. CTO: a community-based clinical trial ontology and its applications in PubChemRDF and SCAIView
Beukenhorst et al. Guideline-related barriers to optimal prescription of oral anticoagulants in primary care

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20160622

RJ01 Rejection of invention patent application after publication