CN102314478A - 一种患者身份识别与匹配的方法 - Google Patents
一种患者身份识别与匹配的方法 Download PDFInfo
- Publication number
- CN102314478A CN102314478A CN201110186618A CN201110186618A CN102314478A CN 102314478 A CN102314478 A CN 102314478A CN 201110186618 A CN201110186618 A CN 201110186618A CN 201110186618 A CN201110186618 A CN 201110186618A CN 102314478 A CN102314478 A CN 102314478A
- Authority
- CN
- China
- Prior art keywords
- information
- item
- address
- identity information
- identity
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Medical Treatment And Welfare Office Work (AREA)
Abstract
本发明提供了一种患者身份识别与匹配的方法,其特征在于,步骤为:首先定义用来作为患者身份识别和匹配的信息项,根据信息项的重要程度为每个信息项分配一个权重;随后计算两个待匹配的身份信息与基准信息之间的相似度,通过得到的值判断是否将两条信息进行匹配。本发明提供的一种方法不用完全取代原系统中患者身份库,因此对原有系统冲击较小,不易造成单点故障。
Description
技术领域
本发明涉及一种医疗数据库中患者身份信息的识别和匹配的方法。
背景技术
随着互联网技术的不断发展、信息技术的逐渐成熟以及病患就医记录的不断增加,使得各家医疗机构需要对原有的患者信息进行整合,在整合过程中需要将同一患者的不同医疗信息进行合并。目前,医疗健康领域开展患者身份信息整合时,一般都是采用ETL手段建立一个集中的患者身份库,然后取代原系统中患者身份库。ELT是Extraction-Transformation-Loading的缩写,中文名称为数据提取、转换和加载,ETL负责将分布的、异构数据源中的数据如关系数据、平面数据文件等抽取到临时中间层后进行清洗、转换、集成,最后加载到数据仓库或数据集市中。这样做的弊端是:对原有系统冲击较大,也容易造成单点故障。
发明内容
本发明的目的是提供一种对原有系统冲击较小的整合患者数据的方法。
为了达到上述目的,本发明的技术方案是提供了一种患者身份识别与匹配的方法,其特征在于,步骤为:
步骤1、定义用来作为患者身份识别和匹配的信息项,根据信息项的重要程度为每个信息项分配一个权重,所有信息项的权重的和必须等于1;
步骤2、从待匹配的身份信息库中取出第 条待匹配的身份信息,并从基准库中取出第条基准信息,若身份信息或基准信息中的某些信息项缺失,则判断缺失的信息项的权重是否较重,若较重则直接判定为不相似,否则将该信息项的权重按比例分配到其他未缺失的信息项上后进入步骤3;
步骤3、计算待匹配的身份信息库中的第条待匹配的身份信息与基准库中的第条基准信息之间的相似度,,其中,为信息项的总数,为第个信息项所对应的权重,指第条待匹配的身份信息与基准库中的第条基准信息的第个信息项之间的相似度,该相似度事先通过人工设定;
本发明提供的一种方法不用完全取代原系统中患者身份库,因此对原有系统冲击较小,不易造成单点故障。
具体实施方式
以下结合实施例来具体说明本发明。
实施例
本发明提供了一种患者身份识别与匹配的方法,步骤为:
步骤1、定义用来作为患者身份识别和匹配的信息项,根据信息项的重要程度为每个信息项分配一个权重,所有信息项的权重的和必须等于1,其中,所述的信息项包括姓名、姓名拼音、性别、出生日期、身份证号、居住地址、电话号码及手机号码,居住地址采用多级停用词进行划分,其步骤为:
步骤1.1、定义地址信息框架,地址信息框架由地址信息项组成,地址信息项包括:省、市、区/县、镇/乡/街道、村/路/街/巷、弄/队、户/号/幢及室;
步骤1.2、将医院采集的患者地址信息通过至少一级停用词划分为不同的地址信息段,停用词是指在需要分割的文本中经常出现,可作为词语之间的间隔标识的词;
步骤1.3、根据地址信息段的停用词和地址信息框架各个地址信息项的对应关系,将地址信息段中的非停用词部分填入相应的地址信息项中;
步骤2、对待匹配的身份信息库及基准库中的身份信息采用关键信息项排序的方法进行分组,其步骤为:若相似的身份信息所包含的某个信息项ItemA一定是相等的,则按信息项ItemA对身份信息进行排序,排序完成后具有相同信息项ItemA的身份信息聚集成若干个组,然后在各个组内再进行身份信息的两两比对即可;
步骤3、从待匹配的身份信息库中取出第条待匹配的身份信息,并从基准库中取出第条基准信息,若身份信息或基准信息中的某些信息项缺失,则判断缺失的信息项的权重是否较重,若较重(例如权重超过0.5)则直接判定为不相似,否则将该信息项的权重按比例分配到其他未缺失的信息项上后进入步骤4;
步骤4、计算待匹配的身份信息库中的第条待匹配的身份信息与基准库中的第条基准信息之间的相似度,,其中,为信息项的总数,为第个信息项所对应的权重,指第条待匹配的身份信息与基准库中的第条基准信息的第个信息项之间的相似度,该相似度事先通过人工设定;
以下对上述步骤做出进一步的详细说明。
患者身份唯一识别的方法是待识别的患者身份信息与基准患者身份库中的信息进行匹配,计算它们之间的相似度(Similarity),这里的相似度是不小于0且不大于1的标量,也就是说它的值域是[0,1]。当Similarity=0时,表明待识别的患者信息和基准信息之间没有任何关联。当Similarity=1,表明二者完全匹配,可以直接进行合并。
一、定义身份信息项及其优先级:
首先,需要明确赖以进行身份识别的身份信息项,实际可以用来进行身份识别和匹配的身份信息项有姓名、性别、出生日期、年龄、婚姻状况、职业等。但其中有些信息项可能不够稳定,容易发生变化,例如职业等。经分析,相对稳定且可以用来作为患者身份识别和匹配的信息项有:身份信息包括:姓名、姓名拼音、性别、出生日期、身份证号、居住地址、电话号码、手机号码等。
各个信息项的相似程度定义如下,对于性别:相同为1,否则为0;对于姓名:完全相同为1,读音不同为0,读音相同时为(0,1)之间的实数;对于除地址外的其他信息:完全相同为1,有两位数字不同为0,由一位数字不同时为(0,1)之间的实数。
地址信息往往比较复杂,而各种来源的地址信息大多没有对地址进行切分,一般来说都是一个较长的字符串,里面包含了各级行政区直至最小单位的门牌号等全部地址信息。但这样的信息很难充分利用,尤其是不便于进行比较、检索等操作。为此,需要定义一个专门的地址信息框架。地址信息框架的关键字包括:省、市、区/县、镇/乡/街道、村/路/街/巷、弄/队、户/号/幢、室等。我们可以根据这些地址关键字将地址进一步划分为多个更小单位的地址信息项,参与匹配的两条信息的各项对应地址信息项的相似度的加权和即为地址信息的相似度。
如果某些信息项缺失,则该信息项的权值按比例分配到其它信息项上;如果权重较重的信息项缺失较多,则无需进行计算相似度,直接判定为不相似。
二、采用多级停用词划分地址信息项:
由于医院采集的患者地址信息一般是连写的,必须先经过地址项划分才可填入上文所描述的地址信息框架。通过“多级停用词划分”的方式来处理连写中文地址记录的规格化问题。停用词是指在需要分割的文本中经常出现,可作为词语之间的间隔标识的词。根据经验,归纳了常用的地址信息分割停用词。共分二级停用词,第一级停用词包括:空格、“/”、“一”、“省”、“市”、“区”、“县”、“镇”、“乡”、“街道”、“村”、“路”、“街”、“巷”、“弄”、“队”、“户”、“号”、“幢”、“室”等;第二级停用词由三部分组成:国内各省、自治区、直辖市的名称;一些大城市及上海周边城市的名称;上海各区县的名称。分割地址信息时,先按第一级停用词进行分割,如果仍存在具有一定长度的地址信息段,则需要按第二级停用词再次进行分割。其意义在于,既可以通过第一级停用词分割来处理占总数80%左右的某一地区本地患者的地址信息;又可以通过第二级停用词分割来兼顾非该地区患者的地址信息分割的要求。分割完成后,按地址信息段的停用词和地址信息框架各个地址信息项的对应关系,将地址信息段中的非停用词部分填入相应的地址信息项中。在分割过程中要遵循一个顺序的原则,包括:根据第一级停用词的分割必须按上述排列的顺序进行,只有当排列靠前的停用词未出现时,才能考虑采用靠后的停用词分割;当不能确定地址信息段应对应哪个地址信息项时,需利用一些经验性的规则,例如地址信息为: “XX路011 8/3/301”,则后面三个数字分别对应“弄”、“号”、“室”。
同时,采用“关键信息项排序”的方法来进行匹配,其主要思路是,如果有一个身份信息项ItemA满足:相似的身份信息所包含的ItemA一定是相等的,则可以先按ItemA对身份信息进行排序,排序完成后具有相同ItemA的身份信息聚集成若干个组,然后在各个组内再进行身份信息的两两比对即可。根据上述条件的逆否命题可知,当ItemA不相等时,包含它们的身份信息一定不相似,因此不必再到组外去搜索相似的记录。我们将这样的ItemA称为“关键身份信息项”。根据经验,只要将现有的“姓名”信息项稍作调整,就可以生成这样的关键身份信息项。在忽略平翘舌音和一些前后鼻音的条件下,姓名的汉语拼音就可以作为“关键信息项”,其直观地解释是,如果若干条身份信息同属于一个患者,那它们包含的“姓名”信息至少应该读起来是大致相同的。忽略平翘舌音和一些前后鼻音的方式是,将所有姓名拼音中的ch、sh、zh转换成C、S、Z:将eng、ing转换为en、in即可。
三、计算整体相似度
计算待匹配的身份信息库中的第条待匹配的身份信息与基准库中的第条基准信息之间的相似度,,其中,为信息项的总数,为第个信息项所对应的权重,指第条待匹配的身份信息与基准库中的第条基准信息的第个信息项之间的相似度,地址信息需要根据多级停用词进行划分,分割成更小单位的信息项,然后为子信息项分配权重,各子信息项的加权和即为地址信息项的相似度。
四、身份信息合并
根据上一步骤中计算得到整体相似度,对相似度达到标准的身份信息进行合并。一般的原则是,对于相似度等于1的信息,直接进行合并,相似度大于0.5而小于1的信息进行人工参与下的合并。
Claims (4)
1.一种患者身份识别与匹配的方法,其特征在于,步骤为:
步骤1、定义用来作为患者身份识别和匹配的信息项,根据信息项的重要程度为每个信息项分配一个权重,所有信息项的权重的和必须等于1;
步骤2、从待匹配的身份信息库中取出第 条待匹配的身份信息,并从基准库中取出第条基准信息,若身份信息或基准信息中的某些信息项缺失,则判断缺失的信息项的权重是否较重,若较重则直接判定为不相似,否则将该信息项的权重按比例分配到其他未缺失的信息项上后进入步骤3;
步骤3、计算待匹配的身份信息库中的第条待匹配的身份信息与基准库中的第条基准信息之间的相似度,,其中,为信息项的总数,为第个信息项所对应的权重,指第条待匹配的身份信息与基准库中的第条基准信息的第个信息项之间的相似度,该相似度事先通过人工设定;
2.如权利要求1所述的一种患者身份识别与匹配的方法,其特征在于:步骤1中所述的信息项包括姓名、姓名拼音、性别、出生日期、身份证号、居住地址、电话号码及手机号码。
3.如权利要求2所述的一种患者身份识别与匹配的方法,其特征在于:所述居住地址采用多级停用词进行划分,其步骤为:
步骤1.1、定义地址信息框架,地址信息框架由地址信息项组成,地址信息项包括:省、市、区/县、镇/乡/街道、村/路/街/巷、弄/队、户/号/幢及室;
步骤1.2、将医院采集的患者地址信息通过至少一级停用词划分为不同的地址信息段,停用词是指在需要分割的文本中经常出现,可作为词语之间的间隔标识的词;
步骤1.3、根据地址信息段的停用词和地址信息框架各个地址信息项的对应关系,将地址信息段中的非停用词部分填入相应的地址信息项中。
4.如权利要求1所述的一种患者身份识别与匹配的方法,其特征在于:在步骤2之前,还需要对待匹配的身份信息库及基准库中的身份信息采用关键信息项排序的方法进行分组,其步骤为:若相似的身份信息所包含的某个信息项ItemA一定是相等的,则按信息项ItemA对身份信息进行排序,排序完成后具有相同信息项ItemA的身份信息聚集成若干个组,然后在各个组内再进行身份信息的两两比对即可。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201110186618A CN102314478A (zh) | 2011-07-05 | 2011-07-05 | 一种患者身份识别与匹配的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201110186618A CN102314478A (zh) | 2011-07-05 | 2011-07-05 | 一种患者身份识别与匹配的方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN102314478A true CN102314478A (zh) | 2012-01-11 |
Family
ID=45427647
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201110186618A Pending CN102314478A (zh) | 2011-07-05 | 2011-07-05 | 一种患者身份识别与匹配的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN102314478A (zh) |
Cited By (22)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102622337A (zh) * | 2012-02-24 | 2012-08-01 | 浙江和仁科技有限公司 | 基于ihe pix规范的中文自然语言信息匹配方法 |
CN103488783A (zh) * | 2013-09-29 | 2014-01-01 | 方正国际软件有限公司 | 患者信息匹配系统和患者信息匹配方法 |
CN103761341A (zh) * | 2014-02-21 | 2014-04-30 | 北京嘉和美康信息技术有限公司 | 一种信息匹配方法及装置 |
CN103870668A (zh) * | 2012-12-17 | 2014-06-18 | 上海联影医疗科技有限公司 | 一种面向区域医疗的病人主索引建立方法和装置 |
US8805900B2 (en) | 2012-03-30 | 2014-08-12 | Mckesson Financial Holdings | Methods, apparatuses and computer program products for facilitating location and retrieval of health information in a healthcare system |
CN106164976A (zh) * | 2014-03-31 | 2016-11-23 | 富士胶片株式会社 | 诊疗支持装置、方法及程序以及诊疗信息保存装置、方法及程序 |
CN106295182A (zh) * | 2016-08-10 | 2017-01-04 | 依据数据(湖南)科技有限公司 | 一种基于患者生物信息的身份识别方法 |
CN106650259A (zh) * | 2016-12-22 | 2017-05-10 | 深圳中兴网信科技有限公司 | 患者信息的管理方法及管理系统 |
CN107209780A (zh) * | 2015-01-16 | 2017-09-26 | 普华永道会计事务所 | 医疗数据交换系统和方法 |
CN107807996A (zh) * | 2017-11-08 | 2018-03-16 | 江苏国泰新点软件有限公司 | 多数据源多维度数据匹配的方法、装置、设备和存储介质 |
CN108491460A (zh) * | 2018-03-05 | 2018-09-04 | 北京市肿瘤防治研究所 | 个人身份信息匹配方法、装置、存储介质及计算机设备 |
CN108604318A (zh) * | 2015-10-12 | 2018-09-28 | 口袋医生公司 | 用于动态自主事务性身份管理的系统和方法 |
CN110176282A (zh) * | 2019-05-22 | 2019-08-27 | 浙江大学 | 一种基于最大期望算法的患者身份匹配方法 |
CN110197214A (zh) * | 2019-05-22 | 2019-09-03 | 浙江大学 | 一种基于多字段相似度计算的患者身份匹配方法 |
WO2019205287A1 (zh) * | 2018-04-26 | 2019-10-31 | 新瑞阳光粒子医疗装备(无锡)有限公司 | 信息匹配装置及方法、终端及存储介质 |
US10510440B1 (en) | 2013-08-15 | 2019-12-17 | Change Healthcare Holdings, Llc | Method and apparatus for identifying matching record candidates |
CN111859956A (zh) * | 2020-07-09 | 2020-10-30 | 睿智合创(北京)科技有限公司 | 一种用于金融行业的地址分词方法 |
CN112863672A (zh) * | 2021-03-09 | 2021-05-28 | 中电健康云科技有限公司 | 一种基于pso算法优化的患者身份匹配方法 |
CN112927813A (zh) * | 2021-04-01 | 2021-06-08 | 上海京知信息科技有限公司 | 基于区块链的区域医疗信息通信方法、系统、设备及介质 |
US11114185B1 (en) | 2013-08-20 | 2021-09-07 | Change Healthcare Holdings, Llc | Method and apparatus for defining a level of assurance in a link between patient records |
TWI788688B (zh) * | 2020-07-23 | 2023-01-01 | 臺灣銀行股份有限公司 | 姓名編碼比對裝置及其方法 |
CN117352187A (zh) * | 2023-12-04 | 2024-01-05 | 四川互慧软件有限公司 | 一种患者身份证号码匹配方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1894698A (zh) * | 2003-12-19 | 2007-01-10 | 西门子医疗健康服务公司 | 管理包括染色体组信息和其它的患者特有信息的医疗保健数据的系统 |
CN101098232A (zh) * | 2007-07-12 | 2008-01-02 | 兰州大学 | 一种动态口令与多生物特征结合的身份认证方法 |
CN101727535A (zh) * | 2008-10-30 | 2010-06-09 | 北大方正集团有限公司 | 一种跨系统患者交叉索引方法及其系统 |
-
2011
- 2011-07-05 CN CN201110186618A patent/CN102314478A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1894698A (zh) * | 2003-12-19 | 2007-01-10 | 西门子医疗健康服务公司 | 管理包括染色体组信息和其它的患者特有信息的医疗保健数据的系统 |
CN101098232A (zh) * | 2007-07-12 | 2008-01-02 | 兰州大学 | 一种动态口令与多生物特征结合的身份认证方法 |
CN101727535A (zh) * | 2008-10-30 | 2010-06-09 | 北大方正集团有限公司 | 一种跨系统患者交叉索引方法及其系统 |
Cited By (28)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102622337A (zh) * | 2012-02-24 | 2012-08-01 | 浙江和仁科技有限公司 | 基于ihe pix规范的中文自然语言信息匹配方法 |
US8805900B2 (en) | 2012-03-30 | 2014-08-12 | Mckesson Financial Holdings | Methods, apparatuses and computer program products for facilitating location and retrieval of health information in a healthcare system |
US9268906B2 (en) | 2012-03-30 | 2016-02-23 | Mckesson Financial Holdings | Methods, apparatuses and computer program products for facilitating location and retrieval of health information in a healthcare system |
CN103870668A (zh) * | 2012-12-17 | 2014-06-18 | 上海联影医疗科技有限公司 | 一种面向区域医疗的病人主索引建立方法和装置 |
US10510440B1 (en) | 2013-08-15 | 2019-12-17 | Change Healthcare Holdings, Llc | Method and apparatus for identifying matching record candidates |
US11114185B1 (en) | 2013-08-20 | 2021-09-07 | Change Healthcare Holdings, Llc | Method and apparatus for defining a level of assurance in a link between patient records |
CN103488783A (zh) * | 2013-09-29 | 2014-01-01 | 方正国际软件有限公司 | 患者信息匹配系统和患者信息匹配方法 |
CN103761341A (zh) * | 2014-02-21 | 2014-04-30 | 北京嘉和美康信息技术有限公司 | 一种信息匹配方法及装置 |
CN103761341B (zh) * | 2014-02-21 | 2017-02-22 | 北京嘉和美康信息技术有限公司 | 一种信息匹配方法及装置 |
CN106164976A (zh) * | 2014-03-31 | 2016-11-23 | 富士胶片株式会社 | 诊疗支持装置、方法及程序以及诊疗信息保存装置、方法及程序 |
CN107209780A (zh) * | 2015-01-16 | 2017-09-26 | 普华永道会计事务所 | 医疗数据交换系统和方法 |
CN108604318A (zh) * | 2015-10-12 | 2018-09-28 | 口袋医生公司 | 用于动态自主事务性身份管理的系统和方法 |
CN106295182B (zh) * | 2016-08-10 | 2019-03-08 | 依据数据(湖南)科技有限公司 | 一种基于患者生物信息的身份识别方法 |
CN106295182A (zh) * | 2016-08-10 | 2017-01-04 | 依据数据(湖南)科技有限公司 | 一种基于患者生物信息的身份识别方法 |
CN106650259B (zh) * | 2016-12-22 | 2020-06-19 | 深圳中兴网信科技有限公司 | 患者信息的管理方法及管理系统 |
CN106650259A (zh) * | 2016-12-22 | 2017-05-10 | 深圳中兴网信科技有限公司 | 患者信息的管理方法及管理系统 |
CN107807996A (zh) * | 2017-11-08 | 2018-03-16 | 江苏国泰新点软件有限公司 | 多数据源多维度数据匹配的方法、装置、设备和存储介质 |
CN108491460A (zh) * | 2018-03-05 | 2018-09-04 | 北京市肿瘤防治研究所 | 个人身份信息匹配方法、装置、存储介质及计算机设备 |
WO2019205287A1 (zh) * | 2018-04-26 | 2019-10-31 | 新瑞阳光粒子医疗装备(无锡)有限公司 | 信息匹配装置及方法、终端及存储介质 |
CN110197214A (zh) * | 2019-05-22 | 2019-09-03 | 浙江大学 | 一种基于多字段相似度计算的患者身份匹配方法 |
CN110176282A (zh) * | 2019-05-22 | 2019-08-27 | 浙江大学 | 一种基于最大期望算法的患者身份匹配方法 |
CN111859956A (zh) * | 2020-07-09 | 2020-10-30 | 睿智合创(北京)科技有限公司 | 一种用于金融行业的地址分词方法 |
CN111859956B (zh) * | 2020-07-09 | 2021-08-27 | 睿智合创(北京)科技有限公司 | 一种用于金融行业的地址分词方法 |
TWI788688B (zh) * | 2020-07-23 | 2023-01-01 | 臺灣銀行股份有限公司 | 姓名編碼比對裝置及其方法 |
CN112863672A (zh) * | 2021-03-09 | 2021-05-28 | 中电健康云科技有限公司 | 一种基于pso算法优化的患者身份匹配方法 |
CN112927813A (zh) * | 2021-04-01 | 2021-06-08 | 上海京知信息科技有限公司 | 基于区块链的区域医疗信息通信方法、系统、设备及介质 |
CN117352187A (zh) * | 2023-12-04 | 2024-01-05 | 四川互慧软件有限公司 | 一种患者身份证号码匹配方法 |
CN117352187B (zh) * | 2023-12-04 | 2024-01-30 | 四川互慧软件有限公司 | 一种患者身份证号码匹配方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102314478A (zh) | 一种患者身份识别与匹配的方法 | |
CN108197163B (zh) | 一种基于裁判文书的结构化处理方法 | |
CN104699730B (zh) | 用于识别候选答案之间的关系的方法和系统 | |
CN108509425B (zh) | 一种基于新颖度的中文新词发现方法 | |
US10102191B2 (en) | Propagation of changes in master content to variant content | |
CN105138670B (zh) | 音频文件标签生成方法和系统 | |
CN107862070B (zh) | 基于文本聚类的线上课堂讨论短文本即时分组方法及系统 | |
CN104199855B (zh) | 一种针对中医药学信息的检索系统和方法 | |
CN105938495A (zh) | 实体关系识别方法及装置 | |
WO2019041520A1 (zh) | 基于社交数据的金融产品推荐方法、电子装置及介质 | |
NZ578672A (en) | Information-retrieval systems, methods, and software with concept-based searching and ranking | |
WO2022160454A1 (zh) | 医疗文献的检索方法、装置、电子设备及存储介质 | |
CN101952824A (zh) | 计算机执行的对数据库中的文献进行索引和检索的方法以及信息检索系统 | |
CN104298714B (zh) | 一种基于异常处理的海量文本自动标注方法 | |
CN110032728A (zh) | 疾病名称标准化的转换方法和装置 | |
CN110209892A (zh) | 敏感信息识别方法、装置、电子设备及存储介质 | |
CN111291177A (zh) | 一种信息处理方法、装置和计算机存储介质 | |
Ahmed et al. | Revised n-gram based automatic spelling correction tool to improve retrieval effectiveness | |
CN105205163B (zh) | 一种科技新闻的增量学习多层次二分类方法 | |
Alam et al. | A knowledge-poor approach to chemical-disease relation extraction | |
CN114387061A (zh) | 产品推送方法、装置、电子设备及可读存储介质 | |
CN108319584A (zh) | 一种基于改进FP-Growth算法的微博类短文本的新词发现方法 | |
CN109255048A (zh) | 一种基于大数据的音乐存储与提取系统 | |
CN107273405B (zh) | 基于MeSH表的电子病历档案的智能检索系统 | |
TW201239645A (en) | Recommendation method and recommender system using dynamic language model |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C12 | Rejection of a patent application after its publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20120111 |