CN112349430A - 药物检索方法及装置 - Google Patents
药物检索方法及装置 Download PDFInfo
- Publication number
- CN112349430A CN112349430A CN202011135169.XA CN202011135169A CN112349430A CN 112349430 A CN112349430 A CN 112349430A CN 202011135169 A CN202011135169 A CN 202011135169A CN 112349430 A CN112349430 A CN 112349430A
- Authority
- CN
- China
- Prior art keywords
- drug
- medicine
- information
- name
- retrieved
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 239000003814 drug Substances 0.000 title claims abstract description 467
- 229940079593 drug Drugs 0.000 title claims abstract description 244
- 238000000034 method Methods 0.000 title claims abstract description 48
- 230000011218 segmentation Effects 0.000 claims description 73
- 238000007781 pre-processing Methods 0.000 claims description 17
- 238000012545 processing Methods 0.000 claims description 15
- 239000000126 substance Substances 0.000 claims description 8
- 230000008569 process Effects 0.000 claims description 5
- CIWBSHSKHKDKBQ-JLAZNSOCSA-N Ascorbic acid Chemical group OC[C@H](O)[C@H]1OC(=O)C(O)=C1O CIWBSHSKHKDKBQ-JLAZNSOCSA-N 0.000 description 10
- 239000008186 active pharmaceutical agent Substances 0.000 description 6
- 229940088679 drug related substance Drugs 0.000 description 6
- 239000000243 solution Substances 0.000 description 6
- ZZZCUOFIHGPKAK-UHFFFAOYSA-N D-erythro-ascorbic acid Natural products OCC1OC(=O)C(O)=C1O ZZZCUOFIHGPKAK-UHFFFAOYSA-N 0.000 description 5
- 229930003268 Vitamin C Natural products 0.000 description 5
- 229940023488 pill Drugs 0.000 description 5
- 239000006187 pill Substances 0.000 description 5
- 238000006467 substitution reaction Methods 0.000 description 5
- 235000019154 vitamin C Nutrition 0.000 description 5
- 239000011718 vitamin C Substances 0.000 description 5
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 4
- 239000007910 chewable tablet Substances 0.000 description 4
- 239000002775 capsule Substances 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 239000008187 granular material Substances 0.000 description 3
- 238000002347 injection Methods 0.000 description 3
- 239000007924 injection Substances 0.000 description 3
- 239000007788 liquid Substances 0.000 description 3
- 239000006072 paste Substances 0.000 description 3
- 239000000843 powder Substances 0.000 description 3
- 239000003826 tablet Substances 0.000 description 3
- OYPRJOBELJOOCE-UHFFFAOYSA-N Calcium Chemical compound [Ca] OYPRJOBELJOOCE-UHFFFAOYSA-N 0.000 description 2
- 229930012538 Paclitaxel Natural products 0.000 description 2
- WHMDKBIGKVEYHS-IYEMJOQQSA-L Zinc gluconate Chemical compound [Zn+2].OC[C@@H](O)[C@@H](O)[C@H](O)[C@@H](O)C([O-])=O.OC[C@@H](O)[C@@H](O)[C@H](O)[C@@H](O)C([O-])=O WHMDKBIGKVEYHS-IYEMJOQQSA-L 0.000 description 2
- 239000011575 calcium Substances 0.000 description 2
- 229910052791 calcium Inorganic materials 0.000 description 2
- 238000012217 deletion Methods 0.000 description 2
- 230000037430 deletion Effects 0.000 description 2
- 239000003292 glue Substances 0.000 description 2
- 230000036541 health Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 229960001592 paclitaxel Drugs 0.000 description 2
- -1 preparation Substances 0.000 description 2
- 238000002360 preparation method Methods 0.000 description 2
- 239000011780 sodium chloride Substances 0.000 description 2
- RCINICONZNJXQF-MZXODVADSA-N taxol Chemical compound O([C@@H]1[C@@]2(C[C@@H](C(C)=C(C2(C)C)[C@H](C([C@]2(C)[C@@H](O)C[C@H]3OC[C@]3([C@H]21)OC(C)=O)=O)OC(=O)C)OC(=O)[C@H](O)[C@@H](NC(=O)C=1C=CC=CC=1)C=1C=CC=CC=1)O)C(=O)C1=CC=CC=C1 RCINICONZNJXQF-MZXODVADSA-N 0.000 description 2
- 238000013519 translation Methods 0.000 description 2
- 239000011670 zinc gluconate Substances 0.000 description 2
- 229960000306 zinc gluconate Drugs 0.000 description 2
- 235000011478 zinc gluconate Nutrition 0.000 description 2
- 229930003779 Vitamin B12 Natural products 0.000 description 1
- 229940068682 chewable tablet Drugs 0.000 description 1
- FDJOLVPMNUYSCM-WZHZPDAFSA-L cobalt(3+);[(2r,3s,4r,5s)-5-(5,6-dimethylbenzimidazol-1-yl)-4-hydroxy-2-(hydroxymethyl)oxolan-3-yl] [(2r)-1-[3-[(1r,2r,3r,4z,7s,9z,12s,13s,14z,17s,18s,19r)-2,13,18-tris(2-amino-2-oxoethyl)-7,12,17-tris(3-amino-3-oxopropyl)-3,5,8,8,13,15,18,19-octamethyl-2 Chemical compound [Co+3].N#[C-].N([C@@H]([C@]1(C)[N-]\C([C@H]([C@@]1(CC(N)=O)C)CCC(N)=O)=C(\C)/C1=N/C([C@H]([C@@]1(CC(N)=O)C)CCC(N)=O)=C\C1=N\C([C@H](C1(C)C)CCC(N)=O)=C/1C)[C@@H]2CC(N)=O)=C\1[C@]2(C)CCC(=O)NC[C@@H](C)OP([O-])(=O)O[C@H]1[C@@H](O)[C@@H](N2C3=CC(C)=C(C)C=C3N=C2)O[C@@H]1CO FDJOLVPMNUYSCM-WZHZPDAFSA-L 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000013479 data entry Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- 239000006196 drop Substances 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000009472 formulation Methods 0.000 description 1
- 239000000499 gel Substances 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000014759 maintenance of location Effects 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 229960000402 palivizumab Drugs 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 235000019163 vitamin B12 Nutrition 0.000 description 1
- 239000011715 vitamin B12 Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H70/00—ICT specially adapted for the handling or processing of medical references
- G16H70/40—ICT specially adapted for the handling or processing of medical references relating to drugs, e.g. their side effects or intended usage
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3322—Query formulation using system suggestions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/237—Lexical tools
- G06F40/247—Thesauruses; Synonyms
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Mathematical Physics (AREA)
- Chemical & Material Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Medicinal Chemistry (AREA)
- Pharmacology & Pharmacy (AREA)
- Toxicology (AREA)
- Epidemiology (AREA)
- Medical Informatics (AREA)
- Primary Health Care (AREA)
- Public Health (AREA)
- Medical Treatment And Welfare Office Work (AREA)
Abstract
本申请公开了一种药物检索方法及装置。该药物检索方法包括获取待检索药物信息,其中,待检索药物信息是用于检索药物名称的信息;将待检索药物信息输入药物检索引擎,与药物检索引擎中的检索药物知识库表中的药物名称进行比对;根据待检索药物信息与检索药物知识库表中的药物名称的相似度,输出待检索药物信息的归一化检索结果。本申请解决了无法根据药物的关键字归一化成同一种药物的技术问题。
Description
技术领域
本申请涉及医疗信息管理领域,具体而言,涉及一种药物检索方法及装置。
背景技术
近年来,医疗病历数据的结构化越来越受到重视、如真实世界研究(Real WorldEvidence,以下简称为RWE),RWE是药物有效性和安全性评价证据链的重要组成部分,而真实世界数据(Real World Data,以下简称为RWD)则是产生RWE的基础,RWD是指来源于日常所收集的各种与患者健康状况和/或诊疗及保健有关的数据。
在RWD数据结构化的过程中,药物的结构化尤其重要,但现实情况是全国各家医院的药物标准不统一,同一种药物存在多种叫法,有通用名、商品名、成分名、缩写、简称、变体、中文翻译等,另外在数据录入过程中可能出现人为错误如错别字等,最终造成结构化后无法准确识别为同一种药物。
针对相关技术中无法根据药物的关键字归一化成同一种药物的问题,目前尚未提出有效的解决方案。
发明内容
本申请的主要目的在于提供一种药物检索方法,以解决无法根据药物的关键字归一化成同一种药物的问题。
为了实现上述目的,本申请提供了一种药物检索方法及装置。
第一方面,本申请提供了一种药物检索方法。
根据本申请的药物检索方法包括:
获取待检索药物信息,其中,所述待检索药物信息是用于检索药物名称的信息;
将所述待检索药物信息输入药物检索引擎,与药物检索引擎中的检索药物知识库表中的药物名称进行比对;
根据所述待检索药物信息与检索药物知识库表中的药物名称的相似度,输出所述待检索药物信息的归一化检索结果。
进一步的,在将所述待检索药物信息输入药物检索引擎,与药物检索引擎中的检索药物知识库表中的药物名称进行比对之前,所述方法还包括:
根据原始药物知识库表以及分词工具生成检索药物知识库表。
进一步的,所述根据原始药物知识库表以及分词工具生成检索药物知识库表,包括:
获取原始药物知识库表中的药物名称,其中,所述药物名称至少包括通用名、成分名、商品名;
对所述药物名称包含的每种名称分别利用分词工具进行分词处理,得到所述每种名称的分词结果;
对所述药物名称包含的通用名、成分名以及商品名名称进行组合处理,得到所述药物名称的组合名称;
根据所述药物名称、所述药物名称的分词结果和所述药物名称的组合结果,生成检索药物知识库表。
进一步的,所述对所述药物名称包含的每种名称分别利用分词工具进行分词处理,得到所述每种名称的分词结果,包括:
将所述药物名称中的中文药物名称进行拼音分词,得到中文分词结果;和/或
将所述药物名称中的外文药物名称进行外文分词,得到外文分词结果。
进一步的,所述对所述药物名称包含的通用名、成分名以及商品名名称进行组合处理,得到所述药物名称的组合名称,包括:
将所述药物名称中的通用名、成分名和商品名进行组合,生成组合后的全名名称;和/或
将所述药物名称中的通用名、成分名和商品名进行两两组合,生成组合后的多个组合名称。
进一步的,所述获取待检索药物信息,其中,所述待检索药物信息是用于检索药物名称的信息,包括:
对所述待检索药物信息进行预处理,得到预处理后的待检索药物信息。
进一步的,所述对所述待检索药物信息进行预处理,得到预处理后的待检索药物信息,包括:
对所述待检索药物信息进行同义词替换,得到预处理后的待检索药物信息;和/或
对所述待检索药物信息进行辅助词处理,得到预处理后的待检索药物信息。
进一步的,所述对所述待检索药物信息进行辅助词处理,得到预处理后的待检索药物信息,包括以下任意一项或其组合:
若所述待检索药物信息中包含无用停顿词,则删除所述待检索药物信息中的无用停顿词;
若所述待检索药物信息中包含不收集药物名称,则删除所述待检索药物信息中的不收集药物名称;
若所述待检索药物信息中包含药物物质形态名称,则保留所述待检索药物信息中的药物物质形态名称;
若所述待检索药物信息中包含患者说明词,则保留所述待检索药物信息中的患者说明词。
第二方面,本申请提供了一种药物检索装置。
根据本申请的药物检索装置包括:
获取模块,用于获取待检索药物信息,其中,所述待检索药物信息是用于检索药物名称的信息;
比对模块,用于将所述待检索药物信息输入药物检索引擎,与药物检索引擎中的检索药物知识库表中的药物名称进行比对;
结果输出模块,用于根据所述待检索药物信息与检索药物知识库表中的药物名称的相似度,输出所述待检索药物信息的归一化检索结果。
进一步的,所述药物检索装置还包括:
知识库表生成模块,用于根据原始药物知识库表以及分词工具生成检索药物知识库表。
进一步的,所述知识库表生成模块还包括:
获取单元,用于获取原始药物知识库表中的药物名称,其中,所述药物名称至少包括通用名、成分名、商品名;
分词单元,用于对所述药物名称包含的每种名称分别利用分词工具进行分词处理,得到所述每种名称的分词结果;
组合单元,用于对所述药物名称包含的通用名、成分名以及商品名名称进行组合处理,得到所述药物名称的组合名称;
生成单元,用于根据所述药物名称、所述药物名称的分词结果和所述药物名称的组合结果,生成检索药物知识库表。
进一步的,所述分词单元还包括:
用于将所述药物名称中的中文药物名称进行拼音分词,得到中文分词结果;和/或将所述药物名称中的外文药物名称进行外文分词,得到外文分词结果。
进一步的,所述组合单元还包括:
用于将所述药物名称中的通用名、成分名和商品名进行组合,生成组合后的全名名称;和/或将所述药物名称中的通用名、成分名和商品名进行两两组合,生成组合后的多个组合名称。
进一步的,所述获取模块包括:
检索预处理单元,用于对所述待检索药物信息进行预处理,得到预处理后的待检索药物信息。
进一步的,所述检索预处理单元还包括:
用于对所述待检索药物信息进行同义词替换,得到预处理后的待检索药物信息;和/或对所述待检索药物信息进行辅助词处理,得到预处理后的待检索药物信息。
进一步的,所述检索预处理单元还包括以下任意一项或其组合:
用于若所述待检索药物信息中包含无用停顿词,则删除所述待检索药物信息中的无用停顿词;
用于若所述待检索药物信息中包含不收集药物名称,则删除所述待检索药物信息中的不收集药物名称;
用于若所述待检索药物信息中包含药物物质形态名称,则保留所述待检索药物信息中的药物物质形态名称;
用于若所述待检索药物信息中包含患者说明词,则保留所述待检索药物信息中的患者说明词。
第三方面,本申请提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现第一方面提供的药物检索方法的步骤。
在本申请实施例中,通过获取待检索药物信息进行检索,并将待检索药物信息与药物检索引擎中的检索药物知识库表中的药物名称进行比对,达到了根据获取待检索药物信息与检索药物知识库表中的相似度,得到待检索药物信息的检索结果的目的,从而实现了根据药物的关键字归一化成同一种药物的技术效果,进而解决了无法根据药物的关键字归一化成同一种药物的技术问题。
附图说明
构成本申请的一部分的附图用来提供对本申请的进一步理解,使得本申请的其它特征、目的和优点变得更明显。本申请的示意性实施例附图及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1是根据本申请实施例的药物检索方法的流程示意图;
图2是根据本申请另一实施例的药物检索方法的流程示意图;
图3是根据本申请实施例的药物检索装置的结构框图。
具体实施方式
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
根据本申请实施例,提供了一种药物检索方法,如图1所示,该方法包括如下的步骤S1至步骤S3:
S1:获取待检索药物信息,其中,待检索药物信息是用于检索药物名称的信息。
在该步骤中,待检索药物信息可以通过用户的文字输入信息直接获取,也可以是通过用户的图片输入信息进行文字提取后进行获取,也可以是通过扫描用户输入的条形码或二维码后获取的文字信息,用户输入的文字信息可以是中文或是外文,在此不进行限制。
进一步的,上述步骤S1中“获取待检索药物信息,其中,待检索药物信息是用于检索药物名称的信息”还包括:
对待检索药物信息进行预处理,得到预处理后的待检索药物信息。
在获取待检测药物名称后,由于获取的待检索药物信息中可能会存在干扰文字,如“服用VC和维生素B12”中的“服用”和“VC”,影响检测结果,需要对干扰文字进行删除或替换,即需要对待检测药物名称进行预处理。
具体的,对待检索药物信息进行预处理,得到预处理后的待检索药物信息,包括:
对待检索药物信息进行同义词替换,得到预处理后的待检索药物信息;和/或对待检索药物信息进行辅助词处理,得到预处理后的待检索药物信息。
需要说明的是,在对待检索药物信息进行同义词替换时,需要首先判断待检索药物信息中是否存在同义词替换,并判断同义词类型。同义词替换可以通过网络检索是否存在待检索药物信息的同义词并进行同义词替换,也可以通过系统预存的药物缩写表中的信息进行检索并进行同义词替换,在此不进行限制。具体的,判断待检索药物信息中是否存在缩写替换,若存在则进行替换(例如,TAX/PTX/TAXOL替换成紫杉醇;又例,VC替换成维生素C);判断待检索药物信息中是否存在数字代号替换,若存在则替换(例如,3922替换成劳拉替尼);判断待检索药物信息中是否存在变体替换,若存在则进行替换(例如,坎利珠单抗/艾立妥替换成卡瑞利珠单抗;又例,布加替尼替换成布吉他滨);判断药物信息是否存在翻译同义词,若存在则替换(例如,维他命C替换成维生素C)。进一步的,对上述同义词判断步骤可以按照用户的需求进行排序,也可以按照用户的需求选择上述任意一项或其组合,在此不进行限制。
进一步的,对待检索药物信息进行辅助词处理,得到预处理后的待检索药物信息,包括以下任意一项或其组合:
若待检索药物信息中包含无用停顿词,则删除待检索药物信息中的无用停顿词;
若待检索药物信息中包含不收集药物名称,则删除待检索药物信息中的不收集药物名称;
若待检索药物信息中包含药物物质形态名称,则保留待检索药物信息中的药物物质形态名称;
若待检索药物信息中包含患者说明词,则保留待检索药物信息中的患者说明词。
需要说明的是,在对待检索药物信息进行辅助词处理时,需要首先待检索药物信息中是否存在辅助词,并判断辅助词的类型。具体的,判断待检索药物信息中是否存在无用停顿词,若存在则删除(例如,“使用卡瑞利珠单抗”,删除谓语“使用”);判断待检索药物信息中是否存在不收集药物名称,若存在则删除(例如,“氯化钠”,删除或过滤“氯化钠”);判断待检索药物信息中是否存在药物物质形态名称,若存在则保留(例如,存在“溶液、粉、颗粒、片、剂、注射、胶囊、液、胶、膏、滴丸、丸、针”,保留或获取“溶液、粉、颗粒、片、剂、注射、胶囊、液、胶、膏、滴丸、丸、针”);判断待检索药物信息中是否存在患者说明词,若存在则保留(例如,存在“儿童、中老年、孕妇”,保留或获取“儿童、中老年、孕妇”),进一步的,对上述辅助词判断步骤可以按照用户的需求进行排序,也可以按照用户的需求选择上述任意一项或其组合,在此不进行限制。
示例的,当获取的待检索药物信息为“服用VC咀嚼片”,对待检索药物信息进行同义词替换,即将缩写“VC”替换成“维生素C”。并且,对待检索药物进行辅助词处理,即将无用停顿词“服用”删除,将药物物质形态名称“咀嚼片”保留。即,待检索药物信息“服用VC咀嚼片”进行预处理,得到预处理后的待检索药物信息为“维生素C咀嚼片”。当获取的待检索药物信息为“葡萄糖酸钙锌”,待检索药物信息不存在同义词替换或辅助词处理,则预处理后的待检索药物信息为未处理的原始待检索药物信息“葡萄糖酸钙锌”。
S2:将待检索药物信息输入药物检索引擎,与药物检索引擎中的检索药物知识库表中的药物名称进行比对。
将上述步骤S1中的待检索药物信息输入药物检索引擎,可选的,将上述步骤S1中预处理后的待检索药物信息输入药物检索引擎,并将待检索药物信息与检索药物知识库表中的每一个药物名称进行比对。
具体的,在执行上述步骤S2“将待检索药物信息输入药物检索引擎,与药物检索引擎中的药物知识库表中的药物名称进行比对”之前,该方法还包括:
根据原始药物知识库表以及分词工具生成检索药物知识库表。
在对上述步骤S1获取的待检索药物信息进行检索之前,需要对原始药物知识库表进行处理,得到检索药物知识库表。具体的,利用分词工具对原始药物知识库表进行分词处理,并对原始药物知识库表中的数据进行处理。
进一步的,根据原始药物知识库表以及分词工具生成检索药物知识库表,包括:
获取原始药物知识库表中的药物名称,其中,药物名称至少包括通用名、成分名、商品名;
对药物名称包含的每种名称分别利用分词工具进行分词处理,得到每种名称的分词结果;
对药物名称包含的通用名、成分名以及商品名名称进行组合处理,得到药物名称的组合名称;
根据药物名称、药物名称的分词结果和药物名称的组合结果,生成检索药物知识库表。
需要说明的是,原始药物知识库表中包括多种药物名称,需要对每种药物名称进行处理。得到处理后的药物名称,具体的,对每种药物名称进行分词和组合处理,根据每种药物名称的原始名称、分词名称以及组合名称,生成检索药物知识库表。
具体的,对药物名称包含的每种名称分别利用分词工具进行分词处理,得到每种名称的分词结果,包括:
将药物名称中的中文药物名称进行拼音分词,得到中文分词结果;和/或将药物名称中的外文药物名称进行外文分词,得到外文分词结果。
药物名称包括中文名称和外文名称,可选的,外文名称为英文名称为外文名称,并且将药物名称中的通用名、成分名以及商品名的名称全部进行分词。可选的,在药物名称进行分词时,若分词结果中出现药物物质形态名称(例如“溶液、粉、颗粒、片、剂、注射、胶囊、液、胶、膏、滴丸、丸、针”),则将该药物名称中的药物物质形态名称单独生成类型为“关键词”的数据。例如,将如表1所示的药物名称进行分词,得到如表2所示的药物名称的分词结果。
表1:药物名称
表2:药物名称的分词结果
具体的,对药物名称包含的通用名、成分名以及商品名名称进行组合处理,得到药物名称的组合名称,包括:
将药物名称中的通用名、成分名和商品名进行组合,生成组合后的全名名称;和/或将药物名称中的通用名、成分名和商品名进行两两组合,生成组合后的多个组合名称。
获取药物名称中的通用名、成分名和商品名,并将通用名、成分名和商品名的三种名称全部进行组合,得到全名名称,组合顺序可以按照用户自定义进行组合,也可以按照系统预设的组合顺序进行组合(例如,按照成分名+通用名+商品名的顺序进行组合);组合的药物名称中的语言可以按照按照用户自定义进行组合,也可以按照系统预设的语言系统中的语言类型进行组合(例如,按照中文成分名+英文成分名+拉丁文商品名进行组合;又例,按照系统预设的中文语言系统的中文成分名+中文通用名+中文商品名进行组合),在此不进行限制。并且,将药物中的通用名、成分名和商品名中的任意两种名称进行组合,得到包括通用名和成分名、通用名和商品名、成分名和商品名的组合名称,同样的,组合顺序可以按照用户自定义进行组合,也可以按照系统预设的组合顺序进行组合。
示例的,将如表1所示的药物名称进行组合,得到如表3所示的药物名称的多个组合名称。
表3:药物名称的组合名称
通过获取原始药物知识库表中不同的药物名称,并且重复上述步骤,可以生成检索药物知识库表。
示例的,可以根据如表4所示的原始药物知识库表以及分词工具生成如表5所示的检索药物知识库表。
表4:原始药物知识库表为:
表5:检索药物知识库表为:
S3:根据待检索药物信息与检索药物知识库表中的药物名称的相似度,输出待检索药物信息的归一化检索结果。
将上述步骤S1中获取的待检索药物信息与上述步骤S2中的检索药物知识库表中的每一个数据进行比对,得到检索药物知识库表中对于待检索药物信息的相似度,并根据相似度的高低进行排序,根据相似度的高低输出检索结果。可选的,可以根据相似度的高低输出多个检索结果;也可以根据相似度的高低,输出相似度最高的结果。输出的检索结果可以是包含通用名、成分名、商品名的数据,也可以是根据用户需求对检索药物知识库表中的数据进行自由组合的数据。可选的,在该实施例中,输出的检索结果为包含通用名、成分名、商品名的数据,即归一化检索结果。
本申请的另一实施例的药物检索方法的流程如图2所示,包括:
获取原始收集药物名称,并依次进行缩写替换、数字代号替换、别名替换、删除停顿词、删除药物辅助词的预处理,得到预处理后的药物名称,将预处理后的药物名称封闭成JSON查询结构,并输入到Elasticsearch(简称为ES)搜索引擎中进行搜索,通过与ES引擎中的药物知识库表进行比对,得到多组搜索结果,获取多组搜索结果中比对相似度得分最高的结果作为搜索结果进行输出,得到归一化的搜索结果。
从以上的描述中,可以看出,本申请实现了如下技术效果:
通过获取待检索药物信息,并对待检索药物信息进行预处理,将原始药物知识库表进行分词和组合,生成检索药物知识库表,并将预处理后的待检索药物信息输入检索药物知识库表进行检索,根据相似度的高低进行排序,并输出检索结果,达到了根据待检索药物信息进行检索,根据相似度高低得到检索结果的目的,从而实现了根据药物的关键字归一化成同一种药物的技术效果。
需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
根据本申请实施例,还提供了一种用于实施上述药物检索方法的装置,如图3所示,该药物检索装置10包括:
获取模块11,用于获取待检索药物信息;
比对模块12,用于将待检索药物信息输入药物检索引擎,与药物检索引擎中的检索药物知识库表中的药物名称进行比对;
结果输出模块13,用于根据待检索药物信息与检索药物知识库表中的药物名称的相似度,输出待检索药物信息的归一化检索结果。
进一步的,获取模块11包括:
检索预处理单元,用于对待检索药物信息进行预处理,得到预处理后的待检索药物信息。
进一步的,检索预处理单元还包括:
用于对待检索药物信息进行同义词替换,得到预处理后的待检索药物信息;和/或对待检索药物信息进行辅助词处理,得到预处理后的待检索药物信息。
进一步的,检索预处理单元还包括以下任意一项或其组合:
用于若待检索药物信息中包含无用停顿词,则删除待检索药物信息中的无用停顿词;
用于若待检索药物信息中包含不收集药物名称,则删除待检索药物信息中的不收集药物名称;
用于若待检索药物信息中包含药物物质形态名称,则保留待检索药物信息中的药物物质形态名称;
用于若待检索药物信息中包含患者说明词,则保留待检索药物信息中的患者说明词。
进一步的,药物检索装置还包括:
知识库表生成模块,用于根据原始药物知识库表以及分词工具生成检索药物知识库表。
进一步的,知识库表生成模块还包括:
获取单元,用于获取原始药物知识库表中的药物名称,其中,药物名称至少包括通用名、成分名、商品名;
分词单元,用于对药物名称包含的每种名称分别利用分词工具进行分词处理,得到每种名称的分词结果;
组合单元,用于对药物名称包含的通用名、成分名以及商品名名称进行组合处理,得到药物名称的组合名称;
生成单元,用于根据药物名称、药物名称的分词结果和药物名称的组合结果,生成检索药物知识库表。
进一步的,分词单元还包括:
用于将药物名称中的中文药物名称进行拼音分词,得到中文分词结果;和/或将药物名称中的外文药物名称进行外文分词,得到外文分词结果。
进一步的,组合单元还包括:
用于将药物名称中的通用名、成分名和商品名进行组合,生成组合后的全名名称;和/或将药物名称中的通用名、成分名和商品名进行两两组合,生成组合后的多个组合名称。
具体的,本实施例中个模块的实现可以参考方法实施例中的相关实现,不再赘述。
从以上的描述中,可以看出,本申请实现了如下技术效果:
通过获取待检索药物信息,并对待检索药物信息进行预处理,将原始药物知识库表进行分词和组合,生成检索药物知识库表,并将预处理后的待检索药物信息输入检索药物知识库表进行检索,根据相似度的高低进行排序,并输出检索结果,达到了根据待检索药物信息进行检索,根据相似度高低得到检索结果的目的,从而实现了根据药物的关键字归一化成同一种药物的技术效果。
显然,本领域的技术人员应该明白,上述的本申请的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本申请不限制于任何特定的硬件和软件结合。
以上所述仅为本申请的优选实施例而已,并不用于限制本申请,对于本领域的技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。
Claims (10)
1.一种药物检索方法,其特征在于,包括:
获取待检索药物信息,其中,所述待检索药物信息是用于检索药物名称的信息;
将所述待检索药物信息输入药物检索引擎,并与药物检索引擎中的检索药物知识库表中的药物名称进行比对;
根据所述待检索药物信息与检索药物知识库表中的药物名称的相似度,输出所述待检索药物信息的归一化检索结果。
2.根据权利要求1所述的药物检索方法,其特征在于,在将所述待检索药物信息输入药物检索引擎,与药物检索引擎中的检索药物知识库表中的药物名称进行比对之前,所述方法还包括:
根据原始药物知识库表以及分词工具生成检索药物知识库表。
3.根据权利要求2所述的药物检索方法,其特征在于,所述根据原始药物知识库表以及分词工具生成检索药物知识库表,包括:
获取原始药物知识库表中的药物名称,其中,所述药物名称至少包括通用名、成分名、商品名;
对所述药物名称包含的每种名称分别利用分词工具进行分词处理,得到所述每种名称的分词结果;
对所述药物名称包含的通用名、成分名以及商品名名称进行组合处理,得到所述药物名称的组合名称;
根据所述药物名称、所述药物名称的分词结果和所述药物名称的组合结果,生成检索药物知识库表。
4.根据权利要求3所述的药物检索方法,其特征在于,所述对所述药物名称包含的每种名称分别利用分词工具进行分词处理,得到所述每种名称的分词结果,包括:
将所述药物名称中的中文药物名称进行拼音分词,得到中文分词结果;和/或
将所述药物名称中的外文药物名称进行外文分词,得到外文分词结果。
5.根据权利要求3所述的药物检索方法,其特征在于,所述对所述药物名称包含的通用名、成分名以及商品名名称进行组合处理,得到所述药物名称的组合名称,包括:
将所述药物名称中的通用名、成分名和商品名进行组合,生成组合后的全名名称;和/或
将所述药物名称中的通用名、成分名和商品名进行两两组合,生成组合后的多个组合名称。
6.根据权利要求1所述的药物检索方法,其特征在于,所述获取待检索药物信息,其中,所述待检索药物信息是用于检索药物名称的信息,包括:
对所述待检索药物信息进行预处理,得到预处理后的待检索药物信息。
7.根据权利要求6所述的药物检索方法,其特征在于,所述对所述待检索药物信息进行预处理,得到预处理后的待检索药物信息,包括:
对所述待检索药物信息进行同义词替换,得到预处理后的待检索药物信息;和/或
对所述待检索药物信息进行辅助词处理,得到预处理后的待检索药物信息。
8.根据权利要求7所述的药物检索方法,其特征在于,所述对所述待检索药物信息进行辅助词处理,得到预处理后的待检索药物信息,包括以下任意一项或其组合:
若所述待检索药物信息中包含无用停顿词,则删除所述待检索药物信息中的无用停顿词;
若所述待检索药物信息中包含不收集药物名称,则删除所述待检索药物信息中的不收集药物名称;
若所述待检索药物信息中包含药物物质形态名称,则保留所述待检索药物信息中的药物物质形态名称;
若所述待检索药物信息中包含患者说明词,则保留所述待检索药物信息中的患者说明词。
9.一种药物检索装置,其特征在于,包括:
获取模块,用于获取待检索药物信息,其中,所述待检索药物信息是用于检索药物名称的信息;
比对模块,用于将所述待检索药物信息输入药物检索引擎,与药物检索引擎中的检索药物知识库表中的药物名称进行比对;
结果输出模块,用于根据所述待检索药物信息与检索药物知识库表中的药物名称的相似度,输出所述待检索药物信息的归一化检索结果。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使所述计算机执行权利要求1-8任一项所述的药物检索方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011135169.XA CN112349430A (zh) | 2020-10-21 | 2020-10-21 | 药物检索方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011135169.XA CN112349430A (zh) | 2020-10-21 | 2020-10-21 | 药物检索方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112349430A true CN112349430A (zh) | 2021-02-09 |
Family
ID=74359593
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011135169.XA Pending CN112349430A (zh) | 2020-10-21 | 2020-10-21 | 药物检索方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112349430A (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107993724A (zh) * | 2017-11-09 | 2018-05-04 | 易保互联医疗信息科技(北京)有限公司 | 一种医学智能问答数据处理的方法及装置 |
CN108287843A (zh) * | 2017-01-09 | 2018-07-17 | 北京四维图新科技股份有限公司 | 一种兴趣点信息检索的方法和装置、及导航设备 |
JP6652675B1 (ja) * | 2019-07-11 | 2020-02-26 | 聡子 鈴木 | 医薬品名称特定システム、医薬品名称特定方法、処理装置、及びコンピュータプログラム |
WO2020073528A1 (zh) * | 2018-10-12 | 2020-04-16 | 平安科技(深圳)有限公司 | 基于会话的信息推送方法、装置、计算机设备及存储介质 |
CN111198887A (zh) * | 2019-12-31 | 2020-05-26 | 北京左医健康技术有限公司 | 药品索引方法、药品检索方法及系统 |
-
2020
- 2020-10-21 CN CN202011135169.XA patent/CN112349430A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108287843A (zh) * | 2017-01-09 | 2018-07-17 | 北京四维图新科技股份有限公司 | 一种兴趣点信息检索的方法和装置、及导航设备 |
CN107993724A (zh) * | 2017-11-09 | 2018-05-04 | 易保互联医疗信息科技(北京)有限公司 | 一种医学智能问答数据处理的方法及装置 |
WO2020073528A1 (zh) * | 2018-10-12 | 2020-04-16 | 平安科技(深圳)有限公司 | 基于会话的信息推送方法、装置、计算机设备及存储介质 |
JP6652675B1 (ja) * | 2019-07-11 | 2020-02-26 | 聡子 鈴木 | 医薬品名称特定システム、医薬品名称特定方法、処理装置、及びコンピュータプログラム |
CN111198887A (zh) * | 2019-12-31 | 2020-05-26 | 北京左医健康技术有限公司 | 药品索引方法、药品检索方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11468975B2 (en) | Medication reconciliation system and method | |
CN107783950B (zh) | 药品说明书处理方法及装置 | |
Liu et al. | AZDrugMiner: an information extraction system for mining patient-reported adverse drug events in online patient forums | |
Doan et al. | Global health monitor: A web-based system for detecting and mapping infectious diseases | |
Oronoz et al. | Automatic annotation of medical records in Spanish with disease, drug and substance names | |
CN109036508B (zh) | 一种中医医疗信息处理方法、装置、计算机设备和存储介质 | |
US20200075135A1 (en) | Trial planning support apparatus, trial planning support method, and storage medium | |
CN113707303A (zh) | 基于知识图谱的医疗问题解答方法、装置、设备及介质 | |
CN106777996A (zh) | 一种基于Solr的体检数据搜索系统 | |
WO2023226262A1 (zh) | 基于智能联想的疾病内容推送方法、装置、设备及介质 | |
US20240071630A1 (en) | Method and apparatus for determining drug code, electronic device, and computer medium | |
CN114328968A (zh) | 医学知识图谱的构建方法、装置、电子设备和介质 | |
Gupta et al. | Algorithms for rapid digitalization of prescriptions | |
CN113724830A (zh) | 基于人工智能的用药风险检测方法及相关设备 | |
CN109616165A (zh) | 医疗信息展示方法及装置 | |
CN113157864A (zh) | 关键信息提取方法、装置、电子设备及介质 | |
CN102360390A (zh) | 一种基于医学关键词的知识云数据库检索方法和系统 | |
CN112349430A (zh) | 药物检索方法及装置 | |
CN109522331B (zh) | 以个人为中心的区域化多维度健康数据处理方法及介质 | |
Padmanabhan et al. | Doctors Handwritten Prescription Recognition System In Multi Language Using Deep Learning | |
KR102405985B1 (ko) | 복약 지도 방법 및 장치 | |
CN103198204A (zh) | 一种救援方舱his系统 | |
Ou et al. | Automatic prescription recognition system | |
KR101491338B1 (ko) | 한의 정보 시스템에서 처방 정보의 모델링 및 표현 방법 | |
Tsumoto et al. | Mining text for disease diagnosis |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |