CN104268137A - 一种药品名称数据匹配方法和装置 - Google Patents

一种药品名称数据匹配方法和装置 Download PDF

Info

Publication number
CN104268137A
CN104268137A CN201310344291.1A CN201310344291A CN104268137A CN 104268137 A CN104268137 A CN 104268137A CN 201310344291 A CN201310344291 A CN 201310344291A CN 104268137 A CN104268137 A CN 104268137A
Authority
CN
China
Prior art keywords
drug
nomenclature
word
data
participle
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201310344291.1A
Other languages
English (en)
Inventor
边旭
贾西贝
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Huaao Data Technology Co Ltd
Original Assignee
Shenzhen Huaao Data Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Huaao Data Technology Co Ltd filed Critical Shenzhen Huaao Data Technology Co Ltd
Priority to CN201310344291.1A priority Critical patent/CN104268137A/zh
Priority to PCT/CN2014/079159 priority patent/WO2015014156A1/zh
Publication of CN104268137A publication Critical patent/CN104268137A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H70/00ICT specially adapted for the handling or processing of medical references
    • G16H70/40ICT specially adapted for the handling or processing of medical references relating to drugs, e.g. their side effects or intended usage
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/242Query formulation
    • G06F16/243Natural language query formulation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/237Lexical tools
    • G06F40/242Dictionaries

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Epidemiology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Public Health (AREA)
  • Mathematical Physics (AREA)
  • Primary Health Care (AREA)
  • Medical Informatics (AREA)
  • Chemical & Material Sciences (AREA)
  • Computational Linguistics (AREA)
  • Medicinal Chemistry (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Toxicology (AREA)
  • Artificial Intelligence (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Medical Treatment And Welfare Office Work (AREA)
  • Machine Translation (AREA)

Abstract

本申请提供了一种药品名称数据匹配方法,包括:获取药品名称数据;根据预置字典对所述药品名称数据进行分词生成药品名称标注数据;所述预置字典至少包括:前缀词字库、成分词字库、药效词字库和剂型词字库;对所述药品名称标注数据通过比较算法生成相同药品名称数据组。本发明实施例还提供了对应的装置,本发明实施例通过预置字典对药品名称数据进行分词,将分词获得的药品名称标注数据进行比较计算,以获取相同名称数据组,提高了相同药品名称数据获取的成功率,减少了计算量。

Description

一种药品名称数据匹配方法和装置
技术领域
本申请涉及数据匹配技术领域,特别是涉及一种药品名称数据匹配方法和装置。
背景技术
在医药行业中,存在大量的医药名称,可能同一类型的药因为剂量、药名等细微的差异会产生大量数据,事实上企业很难确保其所积累数据的质量,其原因是多种多样的,如:录入错误、完整性约束缺失、信息的多种描述方式等。在一些医药批发等类似行业中,需要对药品的名称进行确切识别,以方便用户获知同类型药品。
为了解决上述应用中的问题,现有技术提出一种记录匹配方法,主要包括:首先对药品名称数据进行分词获取名称词;然后将相近名称词的药品名称数据经过比较算法获得相同名称数据组展示给操作员。现有技术中利用开源的分词工具对药品名称进行分词,对于常见的如“小儿复方赖氨酸颗粒”确实可以分为“小儿|复方|赖氨酸|颗粒”,可是对于“注射用阿莫西林钠”这种不常见的药品名称,其分词结果为“注射用|阿莫西林|钠”将原本是一种化学物质(阿莫西林钠)分成了两种化学物质的组合(阿莫西林|钠)。这种情况将导致“阿莫西林”与“阿莫西林钠”这两种化学物质混淆,影响最终的比较结果。
在现有的技术方案中,由于在分词过程中多半采用固定分词方式难以获取针对药品名称数据精确的特征词,以至于无法精确比较,无法完成对药品名称数据的相同类型确定。
发明内容
本申请所要解决的技术问题是提供一种药品名称数据匹配方法和装置,能够针对药品名称更快的提供相同药品名称数据组。
为了解决上述问题,本申请公开了一种药品名称数据匹配方法,包括:
获取药品名称数据;
根据预置字典对所述药品名称数据进行分词生成药品名称标注数据;所述预置字典至少包括:前缀词字库、成分词字库、药效词字库和剂型词字库;
对所述药品名称标注数据通过比较算法生成相同药品名称数据组。
进一步,所述根据预置字典对所述药品名称数据进行分词生成药品名称标注数据包括:
根据预置字典中包含的前缀词字库、成分词字库、药效词字库和剂型词字库对药品名称数据进行分词,形成的药品名称标注数据包括前缀词、成分词、药效词和剂型词。
进一步,所述对药品名称标注数据通过比较算法生成相同药品名称数据组包括:
根据预置固定比较算法对所述药品名称标注数据中的前缀词、成分词、药效词和剂型词计算相似度,当所述相似度超过阈值的药品名称标注数据对应的药品名称数据判定为相同名称数据组。
进一步,所述根据预置固定比较算法对所述药品名称标注数据中的前缀词、成分词、药效词和剂型词进行比较计算包括:
计算两个药品名称标注数据的前缀词、剂型词和其他后缀词相似度,当所述相似度达到或超过预定阈值,且判断其中一个药品标注数据中的其他识别词与另一个药品名称中的成分词或药效词或其他识别词通过拼音模糊匹配合格,则判定所述两个药品名称标注数据是模糊相同。
进一步,所述根据预置固定比较算法对所述药品名称标注数据中的前缀词、成分词、药效词和剂型词进行比较计算包括:
计算两个药品名称标注数据的成分词和药效词相似度,当所述相似度为完全相同时,判定所述两个药瓶名称标注数据对应的药品名称数据为相同名称数据组。
本申请还提供了一种药品名称数据匹配装置,包括:
获取模块,用于获取药品名称数据;
分词模块,用于根据预置字典对所述药品名称数据进行分词生成药品名称标注数据;所述预置字典至少包括:前缀词字库、成分词字库、药效词字库和剂型词字库;
比较模块,用于对所述药品名称标注数据通过比较算法生成相同药品名称数据组。
进一步,所述分词模块用于:
根据预置字典中包含的前缀词字库、成分词字库、药效词字库和剂型词字库对药品名称数据进行分词,所述药品名称标注数据至少包括前缀词、成分词、药效词和剂型词。
进一步,所述比较模块用于:
根据预置固定比较算法对所述药品名称标注数据中的前缀词、成分词、药效词和剂型词计算相似度,当所述相似度超过阈值的药品名称标注数据对应的药品名称数据判定为相同名称数据组。
进一步,所述比较模块用于:
计算两个药品名称标注数据的前缀词、剂型词和其他后缀词相似度,当所述相似度达到或超过预定阈值,且判断其中一个药品标注数据中的其他识别词与另一个药品名称中的成分词或药效词或其他识别词通过拼音模糊匹配合格,则判定所述两个药品名称标注数据是模糊相同。
进一步,所比较模块用于:
计算两个药品名称标注数据的成分词和药效词相似度,当所述相似度为完全相同时,判定所述两个药瓶名称标注数据对应的药品名称数据为相同名称数据组。
与现有技术相比,本申请包括以下优点:通过预置字典对药品名称数据进行分词,将分词获得的药品名称标注数据进行比较计算,以获取相同名称数据组,提高了相同药品名称数据获取的成功率,减少了计算量。
附图说明
图1是本发明一种药品名称数据匹配方法一实施例的流程图;
图2是本发明一种药品名称数据匹配方法一实施例中字典完善流程;
图3是本发明一种药品名称数据匹配方法一实施例中分词示意图;
图4是本发明一种药品名称数据匹配装置一实施例的结构示意图。
具体实施方式
为使本申请的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本申请作进一步详细的说明。
参照图1,示出了本申请一种药品名称数据匹配方法。
现有的药品名称数据的匹配方法中,针对分词步骤主要利用开源的分词工具对药品名称数据进行分词,由于药品名称数据的特殊性和开源的分词工具并不具备完整字典(相对于药品名称来说),因此通过常见开源的分词工具进行分词获取的药品名称标注数据并不精确,因此,一个相对于药品名称来说完整的字典对于药品名称的识别是至关重要的。在本发明实施例中将公开一种药品名称数据匹配方法。包括:
步骤S101、获取药品名称数据;
本发明实施例可以直接从现有保存药品名称数据的数据库中获取药品名称数据。
步骤S102、根据预置字典对所述药品名称数据进行分词生成药品名称标注数据;所述预置字典至少包括:前缀词字库、成分词字库、药效词字库和剂型词字库。
在本发明实施例中预置的字典中针对药品名称数据提供了至少四个字库,包括前缀词字库、成分词字库、药效词字库和剂型词字库;四个字库中分别保存了尽量多的同类型的词,其中对四个类型的词区别如下:
前缀词:在药品名称数据中存在特殊的前缀信息,如“复方甘草片”这个药品名称中的“复方”就是体现规格的前缀、“小儿清热宁颗粒”中的“小儿”就是体现适用对象的前缀,这些前缀词在药品名称中确实担任重要作用,但在识别不同药品名称的时候容易造成混淆,如“小儿复方赖氨酸颗粒”、“小儿复方金银花颗粒”两个名称相同的前缀词与剂型词很容易造成机器识别时候的混淆,因此在本发明实施例中将类似的前缀信息词提取出来做特殊处理。
成分词:在药品名称数据中,存在标识药品的成分词,这些词往往具有较强的辨识度,如“小儿复方赖氨酸颗粒”、“小儿复方金银花颗粒”两个名称中虽然相同的字很多,可是真正具有标识药品作用的成分词“赖氨酸”、“金银花”却是不同的,因此使用成分词是为了更好的识别药品名称,通用化的记录匹配算法并不具备这种能力。
药效词:有的药品名称命名时并不是使用药品的成分,而是利用药品的功效来命名的,如“感冒清热颗粒”中的“感冒清热”就是用来表征该药物的药效,而且药物名称数据中的药效词具有较强的辨识度(如同成分词),可以用来识别药品名称。
剂型词:在药品名称数据中存在体现剂型特征的词,称之为剂型词,这些词具有特殊的识别作用:1.利用该词可以获知药品的剂型信息;2.能够辅助识别药品名称中的成分,如“阿莫西林胶囊”中“胶囊”是药品名称的剂型词,前面的“阿莫西林”则是药品名称中的成分词。
参照图2,利用字典对药品名称数据进行分词时,可以将字典导入到分词工具中获得所有不存在于字典中的字串(连续未识别字的片段),产生未识别词的文档,将该文档提交给操作员对未识别词进行分词标注;其标注信息包括:剂型词、其他后缀词、前缀词、药效词、成分词、其他识别词。可以在处理一定量的数据(建议初识时为200后续迭代逐步增多)后,将新标注的词加入到字典中,利用新的字典重新对药品名称数据进行分词,重复该过程即可得到最终的字典。
由于药品名称词中往往存在错误的拼写(即使药监局的数据中同样存在),因此有必要将常见的错误拼写组成别名表如:药监局网站上可以同时查到“呋噻米片”和“呋塞米片”,即在业务系统中同时使用“呋噻米”和“呋塞米”指代同一种化学物质。该别名表可以随着对未识别词人工分词标注的过程相应获得,不再详细描述该过程。
步骤S103、对所述药品名称标注数据通过比较算法生成相同药品名称数据组。
进一步,所述根据预置字典对所述药品名称数据进行分词生成药品名称标注数据包括:
根据预置字典中包含的前缀词字库、成分词字库、药效词字库和剂型词字库对药品名称数据进行分词,形成的药品名称标注数据包括前缀词、成分词、药效词和剂型词。
进一步,所述对药品名称标注数据通过比较算法生成相同药品名称数据组包括:
根据预置固定比较算法对所述药品名称标注数据中的前缀词、成分词、药效词和剂型词计算相似度,当所述相似度超过阈值的药品名称标注数据对应的药品名称数据判定为相同名称数据组。
将待比较的两个药品名称数据利用上述字典对其分词,参照图3,获得药品名称的药品名称标注数据,所述药品名称标注数据可以标注“前缀词”、“成分词”、“药效词”、“其他识别词”、“剂型词”、“其他后缀词”这样的信息,然后将两个药品名称标注数据分别在对应标注信息上进行比较,只有在各标注信息上都达成一致才能算作是名称相同,若两个药品名称的相似度为0-1的相似。在“前缀词”对应的两组词上,完全相同则一致,否则不一致。在“成分词”对应的两组词上,要利用别名表作为参照,如果完全相同或属于别名关系则成分词一致,否则不一致。在“剂型词”上判断一致的方式与成分词类似,需要参考剂型词与剂型信息的对应关系。“药效词”、“其他识别词”、“其他后缀词”的内容识别方式与“前缀词”识别方式一致。
进一步,所述根据预置固定比较算法对所述药品名称标注数据中的前缀词、成分词、药效词和剂型词进行比较计算可以采用如下方法:
A、计算两个药品名称标注数据的前缀词、剂型词和其他后缀词相似度,当所述相似度达到或超过预定阈值,且判断其中一个药品标注数据中的其他识别词与另一个药品名称中的成分词或药效词或其他识别词通过拼音模糊匹配合格,则判定所述两个药品名称标注数据是模糊相同。
B、计算两个药品名称标注数据的成分词和药效词相似度,当所述相似度为完全相同时,判定所述两个药瓶名称标注数据对应的药品名称数据为相同名称数据组。
C、药品名称标注数据比较若同时比较计算成分词、药效词、剂型词,则可以忽略前缀词、其他后缀词。
值得注意的是在B和C的比较过程中都可以利用A中的模糊比较方法。
本发明实施例中通过预置字典对药品名称数据进行分词,将分词获得的药品名称标注数据进行比较计算,以获取相同名称数据组,提高了相同药品名称数据获取的成功率,减少了计算量。
对于装置实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
如图4所述为本发明提供的一种药品名称数据匹配装置,包括:
获取模块41,用于获取药品名称数据;
分词模块42,用于根据预置字典对所述药品名称数据进行分词生成药品名称标注数据;所述预置字典至少包括:前缀词字库、成分词字库、药效词字库和剂型词字库;
比较模块43,用于对所述药品名称标注数据通过比较算法生成相同药品名称数据组。
进一步,所述分词模块42用于:
根据预置字典中包含的前缀词字库、成分词字库、药效词字库和剂型词字库对药品名称数据进行分词,所述药品名称标注数据至少包括前缀词、成分词、药效词和剂型词。
所述分词模块42将待比较的两个药品名称数据利用上述字典对其分词,获得药品名称的药品名称标注数据,所述药品名称标注数据可以标注“前缀词”、“成分词”、“药效词”、“其他识别词”、“剂型词”、“其他后缀词”这样的信息,然后比较模块43将两个药品名称标注数据分别在对应标注信息上进行比较,只有在各标注信息上都达成一致才能算作是名称相同,若两个药品名称的相似度为0-1的相似。在“前缀词”对应的两组词上,完全相同则一致,否则不一致。在“成分词”对应的两组词上,要利用别名表作为参照,如果完全相同或属于别名关系则成分词一致,否则不一致。在“剂型词”上判断一致的方式与成分词类似,需要参考剂型词与剂型信息的对应关系。“药效词”、“其他识别词”、“其他后缀词”的内容识别方式与“前缀词”识别方式一致。
进一步,所述比较模块43还用于:
根据预置固定比较算法对所述药品名称标注数据中的前缀词、成分词、药效词和剂型词计算相似度,当所述相似度超过阈值的药品名称标注数据对应的药品名称数据判定为相同名称数据组。
进一步,所述比较模块43还用于:
计算两个药品名称标注数据的前缀词、剂型词和其他后缀词相似度,当所述相似度达到或超过预定阈值,且判断其中一个药品标注数据中的其他识别词与另一个药品名称中的成分词或药效词或其他识别词通过拼音模糊匹配合格,则判定所述两个药品名称标注数据是模糊相同。
进一步,所比较模块43还用于:
计算两个药品名称标注数据的成分词和药效词相似度,当所述相似度为完全相同时,判定所述两个药瓶名称标注数据对应的药品名称数据为相同名称数据组。
比较模块43在进行药品名称标注数据比较计算时,若同时比较计算成分词、药效词、剂型词,则可以忽略前缀词、其他后缀词。
本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。
以上对本申请所提供的一种药品名称数据匹配方法和装置,进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。

Claims (10)

1.一种药品名称数据匹配方法,其特征在于,包括:
获取药品名称数据;
根据预置字典对所述药品名称数据进行分词生成药品名称标注数据;所述预置字典至少包括:前缀词字库、成分词字库、药效词字库和剂型词字库;
对所述药品名称标注数据通过比较算法生成相同药品名称数据组。
2.根据权利要求1所述的方法,其特征在于,所述根据预置字典对所述药品名称数据进行分词生成药品名称标注数据包括:
根据预置字典中包含的前缀词字库、成分词字库、药效词字库和剂型词字库对药品名称数据进行分词,形成的药品名称标注数据包括前缀词、成分词、药效词和剂型词。
3.根据权利要求2所述的方法,其特征在于,所述对药品名称标注数据通过比较算法生成相同药品名称数据组包括:
根据预置固定比较算法对所述药品名称标注数据中的前缀词、成分词、药效词和剂型词计算相似度,当所述相似度超过阈值的药品名称标注数据对应的药品名称数据判定为相同名称数据组。
4.根据权利要求3所述的方法,其特征在于,所述根据预置固定比较算法对所述药品名称标注数据中的前缀词、成分词、药效词和剂型词进行比较计算包括:
计算两个药品名称标注数据的前缀词、剂型词和其他后缀词相似度,当所述相似度达到或超过预定阈值,且判断其中一个药品标注数据中的其他识别词与另一个药品名称中的成分词或药效词或其他识别词通过拼音模糊匹配合格,则判定所述两个药品名称标注数据是模糊相同。
5.根据权利要求3所述的方法,其特征在于,所述根据预置固定比较算法对所述药品名称标注数据中的前缀词、成分词、药效词和剂型词进行比较计算包括:
计算两个药品名称标注数据的成分词和药效词相似度,当所述相似度为完全相同时,判定所述两个药瓶名称标注数据对应的药品名称数据为相同名称数据组。
6.一种药品名称数据匹配装置,其特征在于,包括:
获取模块,用于获取药品名称数据;
分词模块42,用于根据预置字典对所述药品名称数据进行分词生成药品名称标注数据;所述预置字典至少包括:前缀词字库、成分词字库、药效词字库和剂型词字库;
比较模块,用于对所述药品名称标注数据通过比较算法生成相同药品名称数据组。
7.根据权利要求6所述的装置,其特征在于,所述分词模块42用于:
根据预置字典中包含的前缀词字库、成分词字库、药效词字库和剂型词字库对药品名称数据进行分词,所述药品名称标注数据至少包括前缀词、成分词、药效词和剂型词。
8.根据权利要求7所述的装置,其特征在于,所述比较模块用于:
根据预置固定比较算法对所述药品名称标注数据中的前缀词、成分词、药效词和剂型词计算相似度,当所述相似度超过阈值的药品名称标注数据对应的药品名称数据判定为相同名称数据组。
9.根据权利要求8所述的装置,其特征在于,所述比较模块用于:
计算两个药品名称标注数据的前缀词、剂型词和其他后缀词相似度,当所述相似度达到或超过预定阈值,且判断其中一个药品标注数据中的其他识别词与另一个药品名称中的成分词或药效词或其他识别词通过拼音模糊匹配合格,则判定所述两个药品名称标注数据是模糊相同。
10.根据权利要求8所述的装置,其特征在于,所比较模块用于:
计算两个药品名称标注数据的成分词和药效词相似度,当所述相似度为完全相同时,判定所述两个药瓶名称标注数据对应的药品名称数据为相同名称数据组。
CN201310344291.1A 2013-07-31 2013-07-31 一种药品名称数据匹配方法和装置 Pending CN104268137A (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201310344291.1A CN104268137A (zh) 2013-07-31 2013-07-31 一种药品名称数据匹配方法和装置
PCT/CN2014/079159 WO2015014156A1 (zh) 2013-07-31 2014-06-04 一种药品名称数据匹配方法和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310344291.1A CN104268137A (zh) 2013-07-31 2013-07-31 一种药品名称数据匹配方法和装置

Publications (1)

Publication Number Publication Date
CN104268137A true CN104268137A (zh) 2015-01-07

Family

ID=52159659

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310344291.1A Pending CN104268137A (zh) 2013-07-31 2013-07-31 一种药品名称数据匹配方法和装置

Country Status (2)

Country Link
CN (1) CN104268137A (zh)
WO (1) WO2015014156A1 (zh)

Cited By (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104978400A (zh) * 2015-06-04 2015-10-14 无锡天脉聚源传媒科技有限公司 一种视频专辑名称的生成方法及装置
CN104978403A (zh) * 2015-06-04 2015-10-14 无锡天脉聚源传媒科技有限公司 一种视频专辑名称的生成方法及装置
CN105068994A (zh) * 2015-08-13 2015-11-18 易保互联医疗信息科技(北京)有限公司 一种药品信息的自然语言处理方法及系统
CN105184052A (zh) * 2015-08-13 2015-12-23 易保互联医疗信息科技(北京)有限公司 一种药品信息的自动编码方法及系统
CN106294378A (zh) * 2015-05-18 2017-01-04 腾讯科技(深圳)有限公司 应用识别方法和装置
CN106777962A (zh) * 2016-12-13 2017-05-31 天津迈沃医药技术股份有限公司 一种医疗信息平台信息分析利用方法及系统
CN107590146A (zh) * 2016-07-06 2018-01-16 北京搜狗科技发展有限公司 一种药方匹配方法和装置、一种用于药方匹配的装置
CN107766395A (zh) * 2017-03-03 2018-03-06 平安医疗健康管理股份有限公司 数据匹配方法和装置
CN107818124A (zh) * 2017-03-03 2018-03-20 平安医疗健康管理股份有限公司 数据匹配方法及装置
CN108875062A (zh) * 2018-06-26 2018-11-23 北京奇艺世纪科技有限公司 一种重复视频的确定方法及装置
CN109165326A (zh) * 2018-08-16 2019-01-08 蜜小蜂智慧(北京)科技有限公司 一种字符串匹配方法及装置
CN109841268A (zh) * 2019-01-18 2019-06-04 杭州逸曜信息技术有限公司 一种过敏信息的处理方法
CN110289058A (zh) * 2019-06-06 2019-09-27 北京市天元网络技术股份有限公司 一种电子病历规范化匹配方法以及装置
CN111198887A (zh) * 2019-12-31 2020-05-26 北京左医健康技术有限公司 药品索引方法、药品检索方法及系统
CN112463895A (zh) * 2020-12-01 2021-03-09 零氪科技(北京)有限公司 基于药物名称挖掘自动发现药物成分的方法和装置
WO2021184729A1 (zh) * 2020-03-17 2021-09-23 平安科技(深圳)有限公司 一种药品分类方法、装置、存储介质和智能设备
JP7436213B2 (ja) 2019-07-11 2024-02-21 聡子 鈴木 医薬品名称特定システム、医薬品名称特定方法、処理装置、及びコンピュータプログラム

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030149554A1 (en) * 2000-08-14 2003-08-07 Lambert Christophe Gerard Fast computer data segmenting techniques
CN101118562A (zh) * 2006-08-21 2008-02-06 凌强 中医临床参考系统

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101221632A (zh) * 2007-01-12 2008-07-16 科达制药股份有限公司 药品调剂检核系统及其方法
CN100476800C (zh) * 2007-06-22 2009-04-08 腾讯科技(深圳)有限公司 一种切分索引分词的方法及系统
CN101388023B (zh) * 2008-09-12 2010-09-15 北京搜狗科技发展有限公司 电子地图兴趣点数据冗余检测方法和系统
CN103177087B (zh) * 2013-03-08 2016-05-18 浙江大学 一种基于概率主题模型的相似中药检索方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030149554A1 (en) * 2000-08-14 2003-08-07 Lambert Christophe Gerard Fast computer data segmenting techniques
CN101118562A (zh) * 2006-08-21 2008-02-06 凌强 中医临床参考系统

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
卢育红: "半结构化药物数据智能分类技术研究与系统实现", 《中国优秀硕士学位论文全文数据库信息科技辑》 *
张翔 等: "半结构化数据领域本体构建算法及实现", 《计算机与信息技术》 *

Cited By (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106294378A (zh) * 2015-05-18 2017-01-04 腾讯科技(深圳)有限公司 应用识别方法和装置
CN104978403A (zh) * 2015-06-04 2015-10-14 无锡天脉聚源传媒科技有限公司 一种视频专辑名称的生成方法及装置
CN104978400A (zh) * 2015-06-04 2015-10-14 无锡天脉聚源传媒科技有限公司 一种视频专辑名称的生成方法及装置
CN105068994B (zh) * 2015-08-13 2018-04-17 易保互联医疗信息科技(北京)有限公司 一种药品信息的自然语言处理方法及系统
CN105068994A (zh) * 2015-08-13 2015-11-18 易保互联医疗信息科技(北京)有限公司 一种药品信息的自然语言处理方法及系统
CN105184052A (zh) * 2015-08-13 2015-12-23 易保互联医疗信息科技(北京)有限公司 一种药品信息的自动编码方法及系统
CN105184052B (zh) * 2015-08-13 2018-02-16 易保互联医疗信息科技(北京)有限公司 一种药品信息的自动编码方法及系统
CN107590146A (zh) * 2016-07-06 2018-01-16 北京搜狗科技发展有限公司 一种药方匹配方法和装置、一种用于药方匹配的装置
CN106777962A (zh) * 2016-12-13 2017-05-31 天津迈沃医药技术股份有限公司 一种医疗信息平台信息分析利用方法及系统
CN107818124A (zh) * 2017-03-03 2018-03-20 平安医疗健康管理股份有限公司 数据匹配方法及装置
CN107766395A (zh) * 2017-03-03 2018-03-06 平安医疗健康管理股份有限公司 数据匹配方法和装置
CN107766395B (zh) * 2017-03-03 2020-12-25 平安医疗健康管理股份有限公司 数据匹配方法和装置
CN108875062A (zh) * 2018-06-26 2018-11-23 北京奇艺世纪科技有限公司 一种重复视频的确定方法及装置
CN109165326A (zh) * 2018-08-16 2019-01-08 蜜小蜂智慧(北京)科技有限公司 一种字符串匹配方法及装置
CN109841268A (zh) * 2019-01-18 2019-06-04 杭州逸曜信息技术有限公司 一种过敏信息的处理方法
CN110289058A (zh) * 2019-06-06 2019-09-27 北京市天元网络技术股份有限公司 一种电子病历规范化匹配方法以及装置
JP7436213B2 (ja) 2019-07-11 2024-02-21 聡子 鈴木 医薬品名称特定システム、医薬品名称特定方法、処理装置、及びコンピュータプログラム
CN111198887A (zh) * 2019-12-31 2020-05-26 北京左医健康技术有限公司 药品索引方法、药品检索方法及系统
WO2021184729A1 (zh) * 2020-03-17 2021-09-23 平安科技(深圳)有限公司 一种药品分类方法、装置、存储介质和智能设备
CN112463895A (zh) * 2020-12-01 2021-03-09 零氪科技(北京)有限公司 基于药物名称挖掘自动发现药物成分的方法和装置

Also Published As

Publication number Publication date
WO2015014156A1 (zh) 2015-02-05

Similar Documents

Publication Publication Date Title
CN104268137A (zh) 一种药品名称数据匹配方法和装置
US10650192B2 (en) Method and device for recognizing domain named entity
Bast et al. A benchmark and evaluation for text extraction from PDF
CN110874531A (zh) 一种话题分析方法、装置和存储介质
US20150169511A1 (en) System and method for identifying floor of main body of webpage
WO2021159733A1 (zh) 医学属性知识图谱构建方法、装置、设备及介质
CN106682209A (zh) 一种跨语言科技文献检索方法及系统
US20120246175A1 (en) Annotating schema elements based on associating data instances with knowledge base entities
CN111160030A (zh) 一种信息抽取方法、装置、及存储介质
CN102750339A (zh) 一种基于视频重构的重复片段定位方法
CN104714950A (zh) 用于对数据库中的信息进行修正及补充的方法及系统
CN106610931A (zh) 话题名称的提取方法及装置
CN106991090A (zh) 舆情事件实体的分析方法及装置
CN107766036B (zh) 一种模块的构建方法、构建装置及终端设备
Tissot et al. Combining string and phonetic similarity matching to identify misspelt names of drugs in medical records written in Portuguese
CN104111942B (zh) 维吾尔医药古籍资源网络检索平台
US20090182759A1 (en) Extracting entities from a web page
Xu et al. An improved blind recognition algorithm of frame parameters based on self-correlation
Li et al. DIR: A Large-Scale Dialogue Rewrite Dataset for Cross-Domain Conversational Text-to-SQL
CN111325007B (zh) 一种pptx文件的批注解析方法及终端
Liu et al. Information extraction of medical materials: an overview of the track of medical materials MedOCR
US11734522B2 (en) Machine learning enabled text analysis with support for unstructured data
Wang et al. MKBQA: Question Answering over Knowledge Graph Based on Semantic Analysis and Priority Marking Method
CN105279172B (zh) 视频匹配方法和装置
CN109815312B (zh) 一种文档查询的方法、装置、计算设备及计算机存储介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20150107

RJ01 Rejection of invention patent application after publication