CN110909121A - 用于医疗行业数据标准化的方法及系统 - Google Patents

用于医疗行业数据标准化的方法及系统 Download PDF

Info

Publication number
CN110909121A
CN110909121A CN201910960134.0A CN201910960134A CN110909121A CN 110909121 A CN110909121 A CN 110909121A CN 201910960134 A CN201910960134 A CN 201910960134A CN 110909121 A CN110909121 A CN 110909121A
Authority
CN
China
Prior art keywords
data
normalized
standard data
standard
similarity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910960134.0A
Other languages
English (en)
Inventor
黄俊杰
齐昱
张聃
邵河山
王雨功
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Neusoft Wang Hai Technology Co Ltd
Original Assignee
Beijing Neusoft Wang Hai Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Neusoft Wang Hai Technology Co Ltd filed Critical Beijing Neusoft Wang Hai Technology Co Ltd
Priority to CN201910960134.0A priority Critical patent/CN110909121A/zh
Publication of CN110909121A publication Critical patent/CN110909121A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/3332Query translation
    • G06F16/3334Selection or weighting of terms from queries, including natural language queries
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H40/00ICT specially adapted for the management or administration of healthcare resources or facilities; ICT specially adapted for the management or operation of medical equipment or devices
    • G16H40/20ICT specially adapted for the management or administration of healthcare resources or facilities; ICT specially adapted for the management or operation of medical equipment or devices for the management or administration of healthcare resources or facilities, e.g. managing hospital staff or surgery rooms

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Business, Economics & Management (AREA)
  • General Business, Economics & Management (AREA)
  • Artificial Intelligence (AREA)
  • Biomedical Technology (AREA)
  • Epidemiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Primary Health Care (AREA)
  • Public Health (AREA)
  • Medical Treatment And Welfare Office Work (AREA)

Abstract

本申请公开了用于医疗行业数据标准化的方法及系统,其中所述方法包括:基于医疗行业语料库对待标化数据进行自然语言处理;确定处理后的待标化数据与标准数据是否存在唯一匹配关系;响应于处理后的待标化数据与标准数据不存在唯一匹配关系,分别计算一处理后的待标化数据与每一条标准数据的相似值;响应于确定一个或多个相似值高于第一阈值,将相应的一个或多个标准数据作为与待标化数据匹配的待定标准数据;及响应于确定一个或多个相似值低于第二阈值,确定没有与待标化数据匹配的标准数据。本发明使能提高医疗行业数据标准化准确率并降低人工干预比例,提高标准化效率。

Description

用于医疗行业数据标准化的方法及系统
技术领域
本申请涉及电数字数据处理领域,尤其涉及用于医疗行业数据标准化的方法及系统。
背景技术
医疗行业的大数据即将成为未来医院发展的必经之路,有助于推动医院的运营管理模式从“粗放式”走向“精细化”,从而提升医疗服务水平和核心竞争力。目前在运用大数据技术时面临诸多困难,其中包括医疗数据的来源多样化、标准不一致的困难。要实现医疗数据的标准化,目前一般存在以下两种方案。一种方案是人工对不同来源、标准不一的医疗数据进行标准化,这种方案准确率高但需要耗费巨大的人力成本与时间成本,并且可能需要依赖专业知识(例如药品、耗材的标准化情形)。另一种方案是将自然语言处理(NaturalLanguage Processing,NLP)引入医疗数据标准化,通过分词、命名实体识别计算相似度,这种方案准确率很低,大量数据仍然需要人工比对。
发明内容
为了克服现有技术中存在的不足,本发明要解决的技术问题是提供一种用于医疗行业数据标准化的方法及系统,其使能提高医疗行业数据标准化的准确率,降低人工干预的比例。
为解决上述技术问题,根据本发明的第一方面,提供用于医疗行业数据标准化的方法,该方法包括:
基于医疗行业语料库对待标化数据进行自然语言处理;
确定处理后的待标化数据与标准数据是否存在唯一匹配关系;
响应于处理后的待标化数据与标准数据不存在唯一匹配关系,分别计算一处理后的待标化数据与每一条标准数据的相似值;
响应于确定一个或多个相似值高于第一阈值,将相应的一个或多个标准数据作为与待标化数据匹配的待定标准数据;及
响应于确定一个或多个相似值低于第二阈值,确定没有与待标化数据匹配的标准数据。
作为本发明所述方法的改进,所述方法还包括:响应于所述待定标准数据仅包含一个标准数据,将所述待定标准数据作为与待标化数据对应的标准数据并输出标准化结果;及响应于所述待定标准数据包含两个以上标准数据,接收人工确认,及将人工确认的标准数据作为与待标化数据对应的标准数据并输出标准化结果。
作为本发明所述方法的另一种改进,所述方法还包括:响应于确定一个或多个相似值落在第二阈值与第一阈值形成的区间内,将相应的一个或多个标准数据作为与待标化数据疑似的疑似标准数据;接收基于所述疑似标准数据的人工标准化结果及将其作为与待标化数据对应的标准数据并输出标准化结果。
作为本发明所述方法的又一种改进,所述方法还包括:在进行自然语言处理之前对待标化数据进行预处理,其中所述预处理包括去空处理、日期格式化处理、拼接和/或拆分处理。
作为本发明所述方法的再一种改进,所述计算一处理后的待标化数据与每一条标准数据的相似值包括通过下式计算所述相似值:
Figure BDA0002228631140000021
其中,S指相似值,f为待标化数据经自然语言处理之后得到的每个词与一条标准数据中的对应标准词之间的相似度,w为每个词所属属性的预设权重,i为属性序号,n为属性数量。
作为本发明所述方法的另一种改进,所述方法还包括:基于人工确认的标准数据与待标化数据的匹配关系丰富所述医疗行业语料库。
为解决上述技术问题,根据本发明的第二方面,提供用于医疗行业数据标准化的系统,该系统包括:
自然语言处理模块,用于基于医疗行业语料库对待标化数据进行自然语言处理;
匹配确定模块,用于确定处理后的待标化数据与标准数据是否存在唯一匹配关系;
计算模块,用于响应于处理后的待标化数据与标准数据不存在唯一匹配关系,分别计算一处理后的待标化数据与每一条标准数据的相似值;
判定模块,用于响应于确定一个或多个相似值高于第一阈值,将相应的一个或多个标准数据作为与待标化数据匹配的待定标准数据;及
确定模块,用于响应于确定一个或多个相似值低于第二阈值,确定没有与待标化数据匹配的标准数据。
为解决上述技术问题,本发明的有形计算机可读介质,包括用于执行本发明的用于医疗行业数据标准化的方法的计算机程序代码。
为解决上述技术问题,本发明提供一种装置,包括至少一个处理器;及至少一个存储器,含有计算机程序代码,所述至少一个存储器和所述计算机程序代码被配置为利用所述至少一个处理器使得所述装置执行本发明的用于医疗行业数据标准化的方法的至少部分步骤。
按照本发明,首先基于医疗行业语料库对待标化数据进行自然语言处理,提高了文本尤其是中文文本数据的识别率。然后,自动运用相似值计算算法计算得出相似度最高的一个或多个标准数据,进而自动或人工将计算出来的标准数据确认为标准化结果。如果存在少量的疑难数据可能需要专家介入。这样可保证大部分数据(例如70%以上)是由系统进行自动标准化的,而且准确率很高,仅一小部分数据是由人工干预的,从而可提高标准化过程的效率。
结合附图阅读本发明实施方式的详细描述后,本发明的其它特点和优点将变得更加清楚。
附图说明
图1为根据本发明方法的一实施例的流程图。
图2为根据本发明系统的一实施例的结构示意图。
为清晰起见,这些附图均为示意性及简化的图,它们只给出了对于理解本发明所必要的细节,而省略其他细节。
具体实施方式
下面参照附图对本发明的实施方式和实施例进行详细说明。
通过下面给出的详细描述,本发明的适用范围将显而易见。然而,应当理解,在详细描述和具体例子表明本发明优选实施例的同时,它们仅为说明目的给出。
在本说明书中,术语“标化”与“标准化”可互换地使用。
图1示出了根据本发明的用于医疗行业数据标准化的方法的一优选实施例的流程图。
在步骤S102,对待标化数据进行去空处理、日期格式化处理、拼接和/或拆分处理等预处理。去空处理是指将待标化数据字符串两边的空格去除。日期格式化处理是指按预设日期格式对日期进行格式化。拼接和/或拆分处理是指对待标化数据进行数据清洗、规范化。
在步骤S104,基于医疗行业语料库对预处理后的待标化数据进行自然语言处理,即对长串文本的分词处理(取词/名词识别)。医疗行业语料库是一个不断完善丰富的语料库,包括但不限于“医院科室”、“收入类型”、“医用耗材”、“生产企业”、“经营企业”、“医疗服务项目”、“药品”、“疾病”、“医院会计科目”等语料库。自然语言处理在本领域已知,在此不再赘述。
在步骤S106,通过查找历史数据已有的匹配关系,确定自然语言处理后的待标化数据与标准数据是否存在唯一匹配关系。如果确定存在唯一匹配关系,则处理进行到步骤S150,将唯一匹配的标准数据作为待标化数据的标准化结果。如果确定自然语言处理后的待标化数据与标准数据不存在唯一匹配关系,则处理进行到步骤S108。例如,待标化数据“血一病房”已经唯一匹配到标准数据“心血管内科病房”(之前可能是通过相似度算法,也可能是人工确认后),如果再出现待标化数据“血一病房”需要标化,则可直接确定存在唯一匹配关系。
在步骤S108,计算自然语言处理后的待标化数据与每一条标准数据的相似值。经自然语言处理之后,每一待标化数据可被分为多个词,每个词根据其属性对应一个预设权重。例如,对于医疗耗材的标准化,其属性例如包括生产厂家、名称、规格型号等,每一属性的预设权重例如为生产厂家10%、名称80%、规格型号10%。对于其它种类如药品的标准化,根据其包含的属性可具有另外一套预设权重。每个词与一条标准数据中的对应标准词之间的相似度f可通过文本相似度算法如余弦算法比较确定两个文本的相似度。待标化数据与一条标准数据的相似值S通过下式计算:
Figure BDA0002228631140000051
其中,w为每个词所属属性的预设权重,i为属性序号,n为属性数量。
具体地,同样以耗材为例,例如“手术钳,I型,山东医疗器械厂”,自然语言处理分词的结果为“手术钳”、“I型”和“山东医疗器械厂”,分别对应名称、型号和厂家的属性,因而分别具有80%、10%和10%的权重。通过文本相似度算法计算出“手术钳”、“I型”和“山东医疗器械厂”与某一条标准数据的相应标准词的相似度分别为100%、100%和0%。则待标化数据与标准数据之间的相似值S为:100%*80%+100%*10%+0%*10%=0.9。依此类推,分别计算待标化数据与所有标准数据之中的每一标准数据的相似值S。
在步骤S110,确定待标化数据与所有标准数据之间的所有相似值S中是否有大于预设阈值区间[m,n]上限的S值。如果有,则处理进行到步骤S112;否则,处理进行到步骤S140。
在步骤S112,如果确定仅有一个S值大于n,则处理进行到步骤S150,将S值大于n的标准数据作为待标化数据的标准化结果。如果有两个以上S值大于n,则处理进行到步骤S140。如果没有S值大于n但存在落在区间[m,n]的S值,则认为存在疑似标准数据,处理进行到步骤S140。如果所有S值均小于m,则认为没有与待标化数据匹配的标准数据,处理也进行到步骤S140。
在步骤S140,接收对两个以上S值大于n的标准数据的人工确认,将其中之一确认为待标化数据的标准化结果;或者接收人工标化结果,人工标化时可参考疑似标准数据。然后进行到步骤S150,将人工确认或人工标化的标准数据作为待标化数据的标准化结果输出。
在其它实施例中,还可基于人工确认或人工标化的标准数据与待标化数据的匹配关系丰富医疗行业语料库。语料库都是人工添加的。例如,待标化数据“综治办”是“综合治理办公室”的简称、“ICU”是“重症监护室”的英文简写。通过不断完善丰富的语料库,可以让计算机知道“综治办”实际上就是“综合治理办公室”,“ICU”实际上就是“重症监护室”。
图2示出了根据本发明的用于医疗行业数据标准化的系统的一实施例的框图,该系统包括:
自然语言处理模块202,用于基于医疗行业语料库对待标化数据进行自然语言处理;
匹配确定模块204,用于确定处理后的待标化数据与标准数据是否存在唯一匹配关系;
计算模块206,用于响应于处理后的待标化数据与标准数据不存在唯一匹配关系,计算一处理后的待标化数据与每一条标准数据的相似值;在实施例中,计算模块包括通过下式计算所述相似值:
Figure BDA0002228631140000061
其中,S指相似值,f为待标化数据经自然语言处理之后得到的每个词与一条标准数据中的对应标准词之间的相似度,w为每个词所属属性的预设权重,i为属性序号,n为属性数量;
判定模块208,用于响应于确定一个或多个相似值高于第一阈值,将相应的一个或多个标准数据作为与待标化数据匹配的待定标准数据;及
确定模块210,用于响应于确定一个或多个相似值低于第二阈值,确定没有与待标化数据匹配的标准数据。
在其它实施例中,本发明系统还可包括:第一输出模块,用于响应于所述待定标准数据仅包含一个标准数据,将所述待定标准数据作为与待标化数据对应的标准数据并输出标准化结果;及第二输出模块,用于响应于所述待定标准数据包含两个以上标准数据,接收人工确认,及将人工确认的标准数据作为与待标化数据对应的标准数据并输出标准化结果。
在此所述的多个不同实施例或者其特定特征、结构或特性可在本发明的一个或多个实施方式中适当组合。另外,在某些情形下,只要适当,流程图中和/或流水处理描述的步骤顺序可修改,并不必须精确按照所描述的顺序执行。另外,本发明的多个不同方面可使用软件、硬件、固件或者其组合和/或执行所述功能的其它计算机实施的模块或装置进行实施。本发明的软件实施可包括保存在计算机可读介质中并由一个或多个处理器执行的可执行代码。计算机可读介质可包括计算机硬盘驱动器、ROM、RAM、闪存、便携计算机存储介质如CD-ROM、DVD-ROM、闪盘驱动器和/或例如具有通用串行总线(USB)接口的其它装置,和/或任何其它适当的有形或非短暂计算机可读介质或可执行代码可保存于其上并由处理器执行的计算机存储器。本发明可结合任何适当的操作系统使用。
除非明确指出,在此所用的单数形式“一”、“该”均包括复数含义(即具有“至少一”的意思)。应当进一步理解,说明书中使用的术语“具有”、“包括”和/或“包含”表明存在所述的特征、步骤、操作、元件和/或部件,但不排除存在或增加一个或多个其他特征、步骤、操作、元件、部件和/或其组合。如在此所用的术语“和/或”包括一个或多个列举的相关项目的任何及所有组合。
前面说明了本发明的一些优选实施例,但是应当强调的是,本发明不局限于这些实施例,而是可以本发明主题范围内的其它方式实现。本领域技术人员可以在本发明技术构思的启发和不脱离本发明内容的基础上对本发明做出各种变型和修改,这些变型或修改仍落入本发明的保护范围之内。

Claims (10)

1.用于医疗行业数据标准化的方法,其特征在于,所述方法包括:
基于医疗行业语料库对待标化数据进行自然语言处理;
确定处理后的待标化数据与标准数据是否存在唯一匹配关系;
响应于处理后的待标化数据与标准数据不存在唯一匹配关系,分别计算一处理后的待标化数据与每一条标准数据的相似值;
响应于确定一个或多个相似值高于第一阈值,将相应的一个或多个标准数据作为与待标化数据匹配的待定标准数据;及
响应于确定一个或多个相似值低于第二阈值,确定没有与待标化数据匹配的标准数据。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
响应于所述待定标准数据仅包含一个标准数据,将所述待定标准数据作为与待标化数据对应的标准数据并输出标准化结果;及
响应于所述待定标准数据包含两个以上标准数据,接收人工确认,及将人工确认的标准数据作为与待标化数据对应的标准数据并输出标准化结果。
3.根据权利要求1所述的方法,其特征在于,所述方法还包括:
响应于确定一个或多个相似值落在第二阈值与第一阈值形成的区间内,将相应的一个或多个标准数据作为与待标化数据疑似的疑似标准数据;
接收基于所述疑似标准数据的人工标准化结果及将其作为与待标化数据对应的标准数据并输出标准化结果。
4.根据权利要求1所述的方法,其特征在于,所述方法还包括:
在进行自然语言处理之前对待标化数据进行预处理,其中所述预处理包括去空处理、日期格式化处理、拼接和/或拆分处理。
5.根据权利要求1所述的方法,其特征在于,所述计算一处理后的待标化数据与每一条标准数据的相似值包括通过下式计算所述相似值:
Figure FDA0002228631130000011
其中,S指相似值,f为待标化数据经自然语言处理之后得到的每个词与一条标准数据中的对应标准词之间的相似度,w为每个词所属属性的预设权重,i为属性序号,n为属性数量。
6.根据权利要求5所述的方法,其特征在于,所述相似度使用文本相似度算法进行计算。
7.根据权利要求2所述的方法,其特征在于,所述方法还包括:
基于人工确认的标准数据与待标化数据的匹配关系丰富所述医疗行业语料库。
8.用于医疗行业数据标准化的系统,其特征在于,所述系统包括:
自然语言处理模块,用于基于医疗行业语料库对待标化数据进行自然语言处理;
匹配确定模块,用于确定处理后的待标化数据与标准数据是否存在唯一匹配关系;
计算模块,用于响应于处理后的待标化数据与标准数据不存在唯一匹配关系,分别计算一处理后的待标化数据与每一条标准数据的相似值;
判定模块,用于响应于确定一个或多个相似值高于第一阈值,将相应的一个或多个标准数据作为与待标化数据匹配的待定标准数据;及
确定模块,用于响应于确定一个或多个相似值低于第二阈值,确定没有与待标化数据匹配的标准数据。
9.根据权利要求8所述的系统,其特征在于,所述系统还包括:
第一输出模块,用于响应于所述待定标准数据仅包含一个标准数据,将所述待定标准数据作为与待标化数据对应的标准数据并输出标准化结果;及
第二输出模块,用于响应于所述待定标准数据包含两个以上标准数据,接收人工确认,及将人工确认的标准数据作为与待标化数据对应的标准数据并输出标准化结果。
10.根据权利要求8所述的系统,其特征在于,所述计算模块包括通过下式计算所述相似值:
Figure FDA0002228631130000031
其中,S指相似值,f为待标化数据经自然语言处理之后得到的每个词与一条标准数据中的对应标准词之间的相似度,w为每个词所属属性的预设权重,i为属性序号,n为属性数量。
CN201910960134.0A 2019-10-10 2019-10-10 用于医疗行业数据标准化的方法及系统 Pending CN110909121A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910960134.0A CN110909121A (zh) 2019-10-10 2019-10-10 用于医疗行业数据标准化的方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910960134.0A CN110909121A (zh) 2019-10-10 2019-10-10 用于医疗行业数据标准化的方法及系统

Publications (1)

Publication Number Publication Date
CN110909121A true CN110909121A (zh) 2020-03-24

Family

ID=69815405

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910960134.0A Pending CN110909121A (zh) 2019-10-10 2019-10-10 用于医疗行业数据标准化的方法及系统

Country Status (1)

Country Link
CN (1) CN110909121A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112035451A (zh) * 2020-08-25 2020-12-04 上海灵长软件科技有限公司 数据校验优化的处理方法、装置、电子设备与存储介质
CN112307763A (zh) * 2020-12-30 2021-02-02 望海康信(北京)科技股份公司 术语标准化方法、系统及相应设备和存储介质
CN113468236A (zh) * 2021-06-03 2021-10-01 太平洋医疗健康管理有限公司 一种匹配标准化医保目录的控制方法及装置

Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1839404A (zh) * 2003-07-14 2006-09-27 理智医疗情报技术株式会社 将医疗信息计算机化和标准化的方法
CN104156415A (zh) * 2014-07-31 2014-11-19 沈阳锐易特软件技术有限公司 解决医疗数据标准编码对照问题的映射处理系统及方法
US20150348218A1 (en) * 2014-06-02 2015-12-03 MDX Medical, Inc. System and Method for Tabling Medical Service Provider Data Provided in a Variety of Forms
CN106791517A (zh) * 2016-11-21 2017-05-31 广州爱九游信息技术有限公司 直播视频检测方法、装置及服务端
CN106845058A (zh) * 2015-12-04 2017-06-13 北大医疗信息技术有限公司 疾病数据的标准化方法及标准化装置
CN106998444A (zh) * 2017-02-14 2017-08-01 北京中科天云科技有限公司 一种大数据人脸监控系统及装置
CN107766395A (zh) * 2017-03-03 2018-03-06 平安医疗健康管理股份有限公司 数据匹配方法和装置
CN107958007A (zh) * 2016-10-18 2018-04-24 浙江格林蓝德信息技术有限公司 病例信息检索方法及装置
CN109522552A (zh) * 2018-11-09 2019-03-26 天津开心生活科技有限公司 一种医疗信息的归一化方法、装置、介质及电子设备
CN109582955A (zh) * 2018-11-14 2019-04-05 金色熊猫有限公司 医疗术语的标准化方法、装置及介质
CN109858371A (zh) * 2018-12-29 2019-06-07 深圳云天励飞技术有限公司 人脸识别的方法及装置
CN110121169A (zh) * 2019-03-27 2019-08-13 安徽继远软件有限公司 一种三重身份安全防护方法及终端

Patent Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1839404A (zh) * 2003-07-14 2006-09-27 理智医疗情报技术株式会社 将医疗信息计算机化和标准化的方法
US20150348218A1 (en) * 2014-06-02 2015-12-03 MDX Medical, Inc. System and Method for Tabling Medical Service Provider Data Provided in a Variety of Forms
CN104156415A (zh) * 2014-07-31 2014-11-19 沈阳锐易特软件技术有限公司 解决医疗数据标准编码对照问题的映射处理系统及方法
CN106845058A (zh) * 2015-12-04 2017-06-13 北大医疗信息技术有限公司 疾病数据的标准化方法及标准化装置
CN107958007A (zh) * 2016-10-18 2018-04-24 浙江格林蓝德信息技术有限公司 病例信息检索方法及装置
CN106791517A (zh) * 2016-11-21 2017-05-31 广州爱九游信息技术有限公司 直播视频检测方法、装置及服务端
CN106998444A (zh) * 2017-02-14 2017-08-01 北京中科天云科技有限公司 一种大数据人脸监控系统及装置
CN107766395A (zh) * 2017-03-03 2018-03-06 平安医疗健康管理股份有限公司 数据匹配方法和装置
CN109522552A (zh) * 2018-11-09 2019-03-26 天津开心生活科技有限公司 一种医疗信息的归一化方法、装置、介质及电子设备
CN109582955A (zh) * 2018-11-14 2019-04-05 金色熊猫有限公司 医疗术语的标准化方法、装置及介质
CN109858371A (zh) * 2018-12-29 2019-06-07 深圳云天励飞技术有限公司 人脸识别的方法及装置
CN110121169A (zh) * 2019-03-27 2019-08-13 安徽继远软件有限公司 一种三重身份安全防护方法及终端

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
《资讯管理研究文集》编委会: "《资讯管理研究文集 汉、英》", 30 November 2015 *
姜利雪 等: ""专利中基于语义角色的术语相似度计算方法"", 《中文信息学报》 *
曾建勋, 科学技术文献出版社 *
栗蒙光: ""基于改进的文本相似度算法的中文文本分类"", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *
黄梦龙: ""基于分词的天地图福建多源POI重复检测方法"", 《地理空间信息》 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112035451A (zh) * 2020-08-25 2020-12-04 上海灵长软件科技有限公司 数据校验优化的处理方法、装置、电子设备与存储介质
CN112307763A (zh) * 2020-12-30 2021-02-02 望海康信(北京)科技股份公司 术语标准化方法、系统及相应设备和存储介质
CN113468236A (zh) * 2021-06-03 2021-10-01 太平洋医疗健康管理有限公司 一种匹配标准化医保目录的控制方法及装置

Similar Documents

Publication Publication Date Title
CN110427618B (zh) 对抗样本生成方法、介质、装置和计算设备
CN110909121A (zh) 用于医疗行业数据标准化的方法及系统
WO2018040899A1 (zh) 搜索词纠错方法及装置
CN109522552B (zh) 一种医疗信息的归一化方法、装置、介质及电子设备
US20130346074A1 (en) Verification of Extracted Data
CN112883157B (zh) 一种多源异构医疗数据的标准化方法及装置
CN108038108B (zh) 分词模型训练方法和装置、及存储介质
CN108427702B (zh) 目标文档获取方法及应用服务器
CN110895961A (zh) 医疗数据中的文本匹配方法及装置
CN111292814A (zh) 一种医疗数据标准化的方法及装置
CN109189907A (zh) 一种基于语义匹配的检索方法及装置
CN109871544B (zh) 基于中文病历的实体识别方法、装置、设备及存储介质
CN112307763B (zh) 术语标准化方法、系统及相应设备和存储介质
CN113658720A (zh) 匹配诊断名称和icd编码的方法、装置、电子设备和存储介质
CN111950267B (zh) 文本三元组的抽取方法及装置、电子设备及存储介质
CN109960707B (zh) 一种基于人工智能的高校招生数据采集方法及系统
CN114595661B (zh) 用于评审投标文件的方法、设备和介质
CN115759040A (zh) 一种电子病历解析方法、装置、设备和存储介质
CN111062208A (zh) 一种文件审核的方法、装置、设备及存储介质
CN114944231A (zh) 一种基于语义理解处理病历质控的方法
CN112733517B (zh) 需求模板符合性检查的方法、电子设备及存储介质
CN114625889A (zh) 一种语义消歧方法、装置、电子设备及存储介质
CN113535938A (zh) 基于内容识别的标准数据构建方法、系统、设备及介质
CN112686033A (zh) 一种词语词向量的生成方法以及相似词的确定方法
Hoang Improving statistical machine translation with linguistic information

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
CB02 Change of applicant information
CB02 Change of applicant information

Address after: 801-2, floor 8, building 3, No. 22, Ronghua Middle Road, Beijing Economic and Technological Development Zone, Daxing District, Beijing

Applicant after: Wanghai Kangxin (Beijing) Technology Co.,Ltd.

Address before: 100060 room 07, block 2, building B, No. 12, Hongda North Road, Beijing Economic and Technological Development Zone, Daxing District, Beijing

Applicant before: BEIJING NEUSOFT VIEWHIGH TECHNOLOGY Co.,Ltd.

SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20200324