CN112349423A - 一种基于BiMPM方法的口干信息匹配系统 - Google Patents
一种基于BiMPM方法的口干信息匹配系统 Download PDFInfo
- Publication number
- CN112349423A CN112349423A CN202011219117.0A CN202011219117A CN112349423A CN 112349423 A CN112349423 A CN 112349423A CN 202011219117 A CN202011219117 A CN 202011219117A CN 112349423 A CN112349423 A CN 112349423A
- Authority
- CN
- China
- Prior art keywords
- stem
- information
- vector set
- mouth
- matched
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 97
- 201000010099 disease Diseases 0.000 claims abstract description 59
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 claims abstract description 59
- 238000003064 k means clustering Methods 0.000 claims abstract description 29
- 208000024891 symptom Diseases 0.000 claims description 19
- 238000012795 verification Methods 0.000 claims description 12
- 238000004364 calculation method Methods 0.000 claims description 6
- 230000010365 information processing Effects 0.000 claims description 5
- 238000007781 pre-processing Methods 0.000 claims description 5
- 206010013781 dry mouth Diseases 0.000 abstract description 21
- 210000000214 mouth Anatomy 0.000 description 65
- 238000010586 diagram Methods 0.000 description 11
- 208000005946 Xerostomia Diseases 0.000 description 6
- 208000011580 syndromic disease Diseases 0.000 description 5
- 210000003296 saliva Anatomy 0.000 description 4
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 4
- 239000008280 blood Substances 0.000 description 3
- 210000004369 blood Anatomy 0.000 description 3
- 239000003651 drinking water Substances 0.000 description 3
- 235000020188 drinking water Nutrition 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 230000028327 secretion Effects 0.000 description 3
- 206010062717 Increased upper airway secretion Diseases 0.000 description 2
- 208000025157 Oral disease Diseases 0.000 description 2
- 208000004880 Polyuria Diseases 0.000 description 2
- 208000021386 Sjogren Syndrome Diseases 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 230000001055 chewing effect Effects 0.000 description 2
- 239000011248 coating agent Substances 0.000 description 2
- 238000000576 coating method Methods 0.000 description 2
- 230000035619 diuresis Effects 0.000 description 2
- 238000001035 drying Methods 0.000 description 2
- 208000030194 mouth disease Diseases 0.000 description 2
- 208000026435 phlegm Diseases 0.000 description 2
- 210000003079 salivary gland Anatomy 0.000 description 2
- MCSXGCZMEPXKIW-UHFFFAOYSA-N 3-hydroxy-4-[(4-methyl-2-nitrophenyl)diazenyl]-N-(3-nitrophenyl)naphthalene-2-carboxamide Chemical compound Cc1ccc(N=Nc2c(O)c(cc3ccccc23)C(=O)Nc2cccc(c2)[N+]([O-])=O)c(c1)[N+]([O-])=O MCSXGCZMEPXKIW-UHFFFAOYSA-N 0.000 description 1
- 206010063659 Aversion Diseases 0.000 description 1
- 206010006458 Bronchitis chronic Diseases 0.000 description 1
- 206010007134 Candida infections Diseases 0.000 description 1
- 208000003556 Dry Eye Syndromes Diseases 0.000 description 1
- 206010013774 Dry eye Diseases 0.000 description 1
- 208000015220 Febrile disease Diseases 0.000 description 1
- 206010019194 Head discomfort Diseases 0.000 description 1
- 208000006083 Hypokinesia Diseases 0.000 description 1
- 206010061245 Internal injury Diseases 0.000 description 1
- 206010022998 Irritability Diseases 0.000 description 1
- 206010068319 Oropharyngeal pain Diseases 0.000 description 1
- 206010035664 Pneumonia Diseases 0.000 description 1
- 206010037660 Pyrexia Diseases 0.000 description 1
- 206010040844 Skin exfoliation Diseases 0.000 description 1
- 208000031971 Yin Deficiency Diseases 0.000 description 1
- 230000002411 adverse Effects 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- QVGXLLKOCUKJST-UHFFFAOYSA-N atomic oxygen Chemical compound [O] QVGXLLKOCUKJST-UHFFFAOYSA-N 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 210000001124 body fluid Anatomy 0.000 description 1
- 239000010839 body fluid Substances 0.000 description 1
- 206010006451 bronchitis Diseases 0.000 description 1
- 208000023819 chronic asthma Diseases 0.000 description 1
- 208000007451 chronic bronchitis Diseases 0.000 description 1
- 235000020965 cold beverage Nutrition 0.000 description 1
- 230000006378 damage Effects 0.000 description 1
- -1 decayed teeth Diseases 0.000 description 1
- 230000035618 desquamation Effects 0.000 description 1
- 206010012601 diabetes mellitus Diseases 0.000 description 1
- 230000035622 drinking Effects 0.000 description 1
- 230000008451 emotion Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 239000012530 fluid Substances 0.000 description 1
- 239000006260 foam Substances 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 235000012171 hot beverage Nutrition 0.000 description 1
- 208000015181 infectious disease Diseases 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 210000004400 mucous membrane Anatomy 0.000 description 1
- 210000003205 muscle Anatomy 0.000 description 1
- 206010029410 night sweats Diseases 0.000 description 1
- 230000036565 night sweats Effects 0.000 description 1
- 230000003204 osmotic effect Effects 0.000 description 1
- 229910052760 oxygen Inorganic materials 0.000 description 1
- 239000001301 oxygen Substances 0.000 description 1
- 238000005192 partition Methods 0.000 description 1
- 208000028169 periodontal disease Diseases 0.000 description 1
- 206010036067 polydipsia Diseases 0.000 description 1
- 230000008439 repair process Effects 0.000 description 1
- 208000023504 respiratory system disease Diseases 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 230000035807 sensation Effects 0.000 description 1
- 238000011524 similarity measure Methods 0.000 description 1
- 230000000638 stimulation Effects 0.000 description 1
- 210000002784 stomach Anatomy 0.000 description 1
- 230000009747 swallowing Effects 0.000 description 1
- 230000035922 thirst Effects 0.000 description 1
- 210000002700 urine Anatomy 0.000 description 1
- 210000001835 viscera Anatomy 0.000 description 1
- 208000016261 weight loss Diseases 0.000 description 1
- 230000004580 weight loss Effects 0.000 description 1
- 239000010056 xuefu Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/70—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/20—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
Abstract
本发明提出了一种基于BiMPM方法的口干信息匹配系统。包括:集建立模块,获取口干描述文本信息以及对应的疾病信息,根据该口干描述文本信息建立口干信息向量集,将疾病信息信息存入口干信息向量集中;聚类模块,建立k‑means聚类方法,对口干信息向量集进行聚类,并建立口干特征向量集;处理模块,获取待匹配口干文本信息,并建立待匹配口干特征向量集;信息匹配模块,建立BiMPM方法,通过BiMPM方法计算口干特征向量集与待匹配口干特征向量集之间的相似度,根据该相似度对待匹配口干文本信息进行匹配。本发明通过BiMPM方法计算口干特征向量集与待匹配口干特征向量集之间的相似度,能够实现口干描述文本信息的快速匹配,同时提高匹配精确度。
Description
技术领域
本发明涉及人工智能领域,尤其涉及一种基于BiMPM方法的口干信息匹配系统。
背景技术
口干症是指因唾液分泌减少或成分变化引起的口腔干燥状态或感觉,是常见的由多种因素引起的口腔自觉症状,并非一种独立性疾病,可涉及五脏六腑、实热、湿热、痰饮、瘀血、外感、六淫、内伤、七情。
现有的技术方案在处理口干症时,都是通过信息匹配的方法将口干信息与对应的疾病信息进行匹配,以此生成用户或者医生想要了解的信息,但是这种匹配方法能够匹配的信息有限不说,为了保证精确度,还需要对匹配词语进行限定,浪费时间不说,还需要大量资源进行运算,所以,亟需一种基于BiMPM方法的口干信息匹配系统。
上述内容仅用于辅助理解本发明的技术方案,并不代表承认上述内容是现有技术。
发明内容
有鉴于此,本发明提出了一种基于BiMPM方法的口干信息匹配系统,旨在解决现有技术无法实现通过BiMPM方法实现口干信息快速精确匹配疾病信息的技术问题。
本发明的技术方案是这样实现的:
一方面,本发明提供了一种基于BiMPM方法的口干信息匹配系统,所述基于BiMPM方法的口干信息匹配系统包括:
集建立模块,用于获取口干描述文本信息以及对应的疾病信息,根据该口干描述文本信息建立口干信息向量集,将疾病信息信息存入口干信息向量集中;
聚类模块,用于建立k-means聚类方法,通过k-means聚类方法对口干信息向量集进行聚类,根据聚类结果建立口干特征向量集;
处理模块,用于获取待匹配口干文本信息,并对该待匹配口干文本信息进行预处理,根据预处理后的待匹配口干文本信息建立待匹配口干特征向量集;
信息匹配模块,用于建立BiMPM方法,通过BiMPM方法计算口干特征向量集与待匹配口干特征向量集之间的相似度,根据该相似度对待匹配口干文本信息进行匹配。
在以上技术方案的基础上,优选的,集建立模块包括信息处理模块,用于获取口干描述文本信息以及对应的疾病信息,所述口干描述文本信息包括:口干描述文本数据以及对应的症状文本数据,所述疾病信息包括:疾病描述文本数据以及对应的疾病症状文本数据,对口干描述文本信息以及对应的疾病信息的完整性进行验证,当验证通过时,保留口干描述文本信息以及对应的疾病信息;当验证未通过时,删除口干描述文本信息以及对应的疾病信息。
在以上技术方案的基础上,优选的,集建立模块包括向量集建立模块,用于根据口干描述文本数据建立不同口干信息向量集,将口干描述文本数据对应的症状文本数据、疾病描述文本数据以及对应的疾病症状文本数据存入不同口干信息向量集中。
在以上技术方案的基础上,优选的,聚类模块包括聚类计算模块,用于建立k-means聚类方法,将口干描述文本数据作为质心,通过k-means聚类方法计算该口干描述文本数据向量中所有数据到质心的距离,根据该距离对口干信息向量集进行更新,将更新后的口干信息向量集作为口干特征向量集。
在以上技术方案的基础上,优选的,处理模块包括待匹配信息处理模块,用于获取待匹配口干文本信息,所述待匹配口干文本信息包括:待匹配口干描述文本数据以及对应的待匹配症状文本数据,根据待匹配口干文本信息建立待匹配口干向量集,通过k-means聚类方法将待匹配口干向量集更新为待匹配口干特征向量集。
在以上技术方案的基础上,优选的,信息匹配模块包括计算模块,用于建立BiMPM方法,利用BiMPM方法计算口干特征向量集中每个特征语句与待匹配口干特征向量集中每个特征语句之间的相似度。
在以上技术方案的基础上,优选的,信息匹配模块包括匹配模块,用于设定相似度阈值,将相似度与相似度阈值进行比较,当相似度满足相似度阈值时,将待匹配口干特征向量集与口干特征向量集中对应的疾病信息进行匹配。
更进一步优选的,所述基于BiMPM方法的口干信息匹配设备包括:
集建立单元,用于获取口干描述文本信息以及对应的疾病信息,根据该口干描述文本信息建立口干信息向量集,将疾病信息信息存入口干信息向量集中;
聚类单元,用于建立k-means聚类方法,通过k-means聚类方法对口干信息向量集进行聚类,根据聚类结果建立口干特征向量集;
处理单元,用于获取待匹配口干文本信息,并对该待匹配口干文本信息进行预处理,根据预处理后的待匹配口干文本信息建立待匹配口干特征向量集;
信息匹配单元,用于建立BiMPM方法,通过BiMPM方法计算口干特征向量集与待匹配口干特征向量集之间的相似度,根据该相似度对待匹配口干文本信息进行匹配。
本发明的一种基于BiMPM方法的口干信息匹配系统相对于现有技术具有以下有益效果:
(1)通过利用k-means聚类方法,能够在保证精确度的同时实现口干信息的聚类,通过聚类能够更加方便后续实现口干信息的匹配;
(2)通过利用BiMPM方法,能够使信息之间的匹配更加精确,同时提高了匹配速度,提升了用户体验。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明基于BiMPM方法的口干信息匹配系统第一实施例的结构框图;
图2为本发明基于BiMPM方法的口干信息匹配系统的第二实施例结构框图;
图3为本发明基于BiMPM方法的口干信息匹配系统的第三实施例结构框图;
图4为本发明基于BiMPM方法的口干信息匹配系统的第四实施例结构框图;
图5为本发明基于BiMPM方法的口干信息匹配系统的第五实施例结构框图;
图6为本发明基于BiMPM方法的口干信息匹配设备结构框图。
具体实施方式
下面将结合本发明实施方式,对本发明实施方式中的技术方案进行清楚、完整地描述,显然,所描述的实施方式仅仅是本发明一部分实施方式,而不是全部的实施方式。基于本发明中的实施方式,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施方式,都属于本发明保护的范围。
如图1所示,图1为本发明基于BiMPM方法的口干信息匹配系统第一实施例的结构框图。其中,所述基于BiMPM方法的口干信息匹配系统包括:集建立模块10、聚类模块20、处理模块30和信息匹配模块40。
集建立模块10,用于获取口干描述文本信息以及对应的疾病信息,根据该口干描述文本信息建立口干信息向量集,将疾病信息信息存入口干信息向量集中;
聚类模块20,用于建立k-means聚类方法,通过k-means聚类方法对口干信息向量集进行聚类,根据聚类结果建立口干特征向量集;
处理模块30,用于获取待匹配口干文本信息,并对该待匹配口干文本信息进行预处理,根据预处理后的待匹配口干文本信息建立待匹配口干特征向量集;
信息匹配模块40,用于建立BiMPM方法,通过BiMPM方法计算口干特征向量集与待匹配口干特征向量集之间的相似度,根据该相似度对待匹配口干文本信息进行匹配。
进一步地,如图2所示,基于上述各实施例提出本发明基于BiMPM方法的口干信息匹配系统的第二实施例结构框图,在本实施例中,集建立模块10还包括:
信息处理模块101,用于获取口干描述文本信息以及对应的疾病信息,所述口干描述文本信息包括:口干描述文本数据以及对应的症状文本数据,所述疾病信息包括:疾病描述文本数据以及对应的疾病症状文本数据,对口干描述文本信息以及对应的疾病信息的完整性进行验证,当验证通过时,保留口干描述文本信息以及对应的疾病信息;当验证未通过时,删除口干描述文本信息以及对应的疾病信息。
向量集建立模块102,用于根据口干描述文本数据建立不同口干信息向量集,将口干描述文本数据对应的症状文本数据、疾病描述文本数据以及对应的疾病症状文本数据存入不同口干信息向量集中。
应当理解的是,本实施中系统会获取口干描述文本信息以及对应的疾病信息,所述口干描述文本信息包括:口干描述文本数据以及对应的症状文本数据,所述疾病信息包括:疾病描述文本数据以及对应的疾病症状文本数据,同时为了保证后续计算的精确度,不影响后续计算及数据匹配的过程,系统还会对口干描述文本信息以及对应的疾病信息的完整性进行验证,当验证通过时,保留口干描述文本信息以及对应的疾病信息;当验证未通过时,删除口干描述文本信息以及对应的疾病信息,这里的完整性验证只是对文本的完整性进行验证,以保证现在处理的文本是一个完整的文本,系统能够从中提取相对应的描述词。
应当理解的是,本实施例中系统提取的口干文本描述信息以及伴随症状的特征信息为下列表现方式,外感风热证候:口干而饮水稍多,伴发了热恶风,脉浮,多见于外感温热病的初期,津液损伤较轻;胃火炽盛证候是口干而喜冷饮,伴烦躁易怒,大便干燥,小便发黄,面红舌红,脉实有力;阴虚的症候是口干而不多饮,伴全红盗汗、舌红少津、脉细数若;湿热的症候,口干而不多,头身困重,苔黄腻,脉滑数;痰饮内停的症候是口干不喜饮,或喜热饮但饮水不多,甚至口干欲饮水,水入即吐,舌苔润滑,脉象无力或沉迟或沉缓或沉弱;瘀血内停的症候是,口干但不喜水、水润口而不下咽,主方是血府逐瘀汤加减等。
应当理解的是,同时,本实施例中系统提取的疾病描述文本数据以及对应的疾病症状文本数据为下列表现方式,常见的口腔疾病,如缺牙、龋齿、牙周病和义齿修复不合适等都是老年人常见的口腔疾病,这些不利因素可造成咀嚼功能下降,对唾液腺及咀嚼肌的刺激减少引起唾液分泌减少,导致老年人的口干症。口腔的白色念珠菌感染也可能引起口干;糖尿病患者的口干是由于血糖升高引起血浆渗透压增高,多尿而出现口干及口渴。同时可以伴有多尿、体重下降、乏力等症状;呼吸系统疾病,如慢性支气管炎、哮喘和肺炎等疾病也是老年人常发的疾病。这些患者发病时常有缺氧的感觉,因此,长期张口呼吸以求得较大的氧摄入量,致使口腔内唾液散发过多,常导致口干舌燥;干燥综合征,主要是眼干和口干两大症状,口干为其主要临床表现,唾液分泌减少,有时呈白色泡沫或少量粘性分泌物,重者几乎见不到唾液。口腔黏膜随唾液减少程度而加重成潮红色,如羊皮纸状干涩,舌红绛,光滑,或有沟裂。口唇干燥脱屑。患者常常是大小涎腺均受损,使全口腔和咽部干燥,致使患者不能咀嚼一般食物及吞咽有障碍。进食时需同时饮水,不能多讲话,易使咽喉干痛及舌运动受阻。老年人群中干燥综合征的患病率为3%~4%,多见于中老年妇女等。
进一步地,如图3所示,基于上述各实施例提出本发明基于BiMPM方法的口干信息匹配系统的第三实施例结构框图,在本实施例中,聚类模块20还包括:
聚类计算模块201,用于建立k-means聚类方法,将口干描述文本数据作为质心,通过k-means聚类方法计算该口干描述文本数据向量中所有数据到质心的距离,根据该距离对口干信息向量集进行更新,将更新后的口干信息向量集作为口干特征向量集。
应当理解的是,本实例为了更好对文本数据信息进行聚类,使用的方法为k-means聚类方法,k-means算法是k均值聚类算法(k-means clustering algorithm)是一种迭代求解的聚类分析算法,其步骤是,预将数据分为K组,则随机选取K个对象作为初始的聚类中心,然后计算每个对象与各个种子聚类中心之间的距离,把每个对象分配给距离它最近的聚类中心。聚类中心以及分配给它们的对象就代表一个聚类。每分配一个样本,聚类的聚类中心会根据聚类中现有的对象被重新计算。这个过程将不断重复直到满足某个终止条件。终止条件可以是没有(或最小数目)对象被重新分配给不同的聚类,没有(或最小数目)聚类中心再发生变化,误差平方和局部最小,k-means算法是一种基于划分的聚类算法,以距离作为数据对象间相似性度量的标准,即数据对象间的距离越小,则它们的相似性越高,则它们越有可能在同一个类簇。
应当理解的是,通过k-means算法,系统可以更加快速且精确将不同的文本数据划分为不同的特征向量集,不仅方便了后续存储,同时也利于后续对信息匹配进行计算,能够提高信息匹配的速度。
进一步地,如图4所示,基于上述各实施例提出本发明基于BiMPM方法的口干信息匹配系统的第四实施例结构框图,在本实施例中,处理模块30包括:
待匹配信息处理模块301,用于获取待匹配口干文本信息,所述待匹配口干文本信息包括:待匹配口干描述文本数据以及对应的待匹配症状文本数据,根据待匹配口干文本信息建立待匹配口干向量集,通过k-means聚类方法将待匹配口干向量集更新为待匹配口干特征向量集。
应当理解的是,在处理好模板数据之后,系统会获取待匹配口干文本信息,所述待匹配口干文本信息包括:待匹配口干描述文本数据以及对应的待匹配症状文本数据,同时也会对待匹配口干文本信息进行完整性验证,验证方式跟上述验证方式相同,然后根据待匹配口干文本信息建立待匹配口干向量集,通过k-means聚类方法将待匹配口干向量集更新为待匹配口干特征向量集。
应当理解的是,通过这样的方式,将需要进行匹配的文本信息转化为特征向量集进行匹配,不仅提高了匹配的精确度,同时也提高了整个系统的运行速度。
进一步地,如图5所示,基于上述各实施例提出本发明基于BiMPM方法的口干信息匹配系统的第五实施例结构框图,在本实施例中,信息匹配模块40包括:
计算模块401,用于建立BiMPM方法,利用BiMPM方法计算口干特征向量集中每个特征语句与待匹配口干特征向量集中每个特征语句之间的相似度。
匹配模块402,用于设定相似度阈值,将相似度与相似度阈值进行比较,当相似度满足相似度阈值时,将待匹配口干特征向量集与口干特征向量集中对应的疾病信息进行匹配。
应当理解的是,本实施例中系统会建立BiMPM方法,BiMPM方法是一种现有方法,本实施例中不仅描述,然后利用BiMPM方法计算口干特征向量集中每个特征语句与待匹配口干特征向量集中每个特征语句之间的相似度,通过这样的方式将文本与文本的匹配转化为数值匹配,提高了整个过程的精确度。
应当理解的是,最后系统会设定相似度阈值,这个相似度阈值可以是管理人员进行设定,同时也可以是系统根据当前数据情况自行设定,将相似度与相似度阈值进行比较,当相似度满足相似度阈值时,将待匹配口干特征向量集与口干特征向量集中对应的疾病信息进行匹配。
需要说明的是,以上仅为举例说明,并不对本申请的技术方案构成任何限定。
通过上述描述不难发现,本实施例提出了一种基于BiMPM方法的口干信息匹配系统,包括:集建立模块,用于获取口干描述文本信息以及对应的疾病信息,根据该口干描述文本信息建立口干信息向量集,将疾病信息信息存入口干信息向量集中;聚类模块,用于建立k-means聚类方法,通过k-means聚类方法对口干信息向量集进行聚类,根据聚类结果建立口干特征向量集;处理模块,用于获取待匹配口干文本信息,并对该待匹配口干文本信息进行预处理,根据预处理后的待匹配口干文本信息建立待匹配口干特征向量集;信息匹配模块,用于建立BiMPM方法,通过BiMPM方法计算口干特征向量集与待匹配口干特征向量集之间的相似度,根据该相似度对待匹配口干文本信息进行匹配。本实施例通过BiMPM方法计算口干特征向量集与待匹配口干特征向量集之间的相似度,能够实现口干描述文本信息的快速匹配,同时提高匹配精确度。
此外,本发明实施例还提出一种基于BiMPM方法的口干信息匹配设备。如图6所示,该基于BiMPM方法的口干信息匹配设备包括:集建立单元10、聚类单元20、处理单元30以及信息匹配单元40。
集建立单元10,用于获取口干描述文本信息以及对应的疾病信息,根据该口干描述文本信息建立口干信息向量集,将疾病信息信息存入口干信息向量集中;
聚类单元20,用于建立k-means聚类方法,通过k-means聚类方法对口干信息向量集进行聚类,根据聚类结果建立口干特征向量集;
处理单元30,用于获取待匹配口干文本信息,并对该待匹配口干文本信息进行预处理,根据预处理后的待匹配口干文本信息建立待匹配口干特征向量集;
信息匹配单元40,用于建立BiMPM方法,通过BiMPM方法计算口干特征向量集与待匹配口干特征向量集之间的相似度,根据该相似度对待匹配口干文本信息进行匹配。
此外,需要说明的是,以上所描述的装置实施例仅仅是示意性的,并不对本发明的保护范围构成限定,在实际应用中,本领域的技术人员可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的,此处不做限制。
另外,未在本实施例中详尽描述的技术细节,可参见本发明任意实施例所提供的基于BiMPM方法的口干信息匹配系统,此处不再赘述。
以上所述仅为本发明的较佳实施方式而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (8)
1.一种基于BiMPM方法的口干信息匹配系统,其特征在于,所述基于BiMPM方法的口干信息匹配系统包括:
集建立模块,用于获取口干描述文本信息以及对应的疾病信息,根据该口干描述文本信息建立口干信息向量集,将疾病信息信息存入口干信息向量集中;
聚类模块,用于建立k-means聚类方法,通过k-means聚类方法对口干信息向量集进行聚类,根据聚类结果建立口干特征向量集;
处理模块,用于获取待匹配口干文本信息,并对该待匹配口干文本信息进行预处理,根据预处理后的待匹配口干文本信息建立待匹配口干特征向量集;
信息匹配模块,用于建立BiMPM方法,通过BiMPM方法计算口干特征向量集与待匹配口干特征向量集之间的相似度,根据该相似度对待匹配口干文本信息进行匹配。
2.如权利要求1所述的基于BiMPM方法的口干信息匹配系统,其特征在于:集建立模块包括信息处理模块,用于获取口干描述文本信息以及对应的疾病信息,所述口干描述文本信息包括:口干描述文本数据以及对应的症状文本数据,所述疾病信息包括:疾病描述文本数据以及对应的疾病症状文本数据,对口干描述文本信息以及对应的疾病信息的完整性进行验证,当验证通过时,保留口干描述文本信息以及对应的疾病信息;当验证未通过时,删除口干描述文本信息以及对应的疾病信息。
3.如权利要求2所述的基于BiMPM方法的口干信息匹配系统,其特征在于:集建立模块包括向量集建立模块,用于根据口干描述文本数据建立不同口干信息向量集,将口干描述文本数据对应的症状文本数据、疾病描述文本数据以及对应的疾病症状文本数据存入不同口干信息向量集中。
4.如权利要求3所述的基于BiMPM方法的口干信息匹配系统,其特征在于:聚类模块包括聚类计算模块,用于建立k-means聚类方法,将口干描述文本数据作为质心,通过k-means聚类方法计算该口干描述文本数据向量中所有数据到质心的距离,根据该距离对口干信息向量集进行更新,将更新后的口干信息向量集作为口干特征向量集。
5.如权利要求4所述的基于BiMPM方法的口干信息匹配系统,其特征在于:处理模块包括待匹配信息处理模块,用于获取待匹配口干文本信息,所述待匹配口干文本信息包括:待匹配口干描述文本数据以及对应的待匹配症状文本数据,根据待匹配口干文本信息建立待匹配口干向量集,通过k-means聚类方法将待匹配口干向量集更新为待匹配口干特征向量集。
6.如权利要求5所述的基于BiMPM方法的口干信息匹配系统,其特征在于:信息匹配模块包括计算模块,用于建立BiMPM方法,利用BiMPM方法计算口干特征向量集中每个特征语句与待匹配口干特征向量集中每个特征语句之间的相似度。
7.如权利要求6所述的基于BiMPM方法的口干信息匹配系统,其特征在于:信息匹配模块包括匹配模块,用于设定相似度阈值,将相似度与相似度阈值进行比较,当相似度满足相似度阈值时,将待匹配口干特征向量集与口干特征向量集中对应的疾病信息进行匹配。
8.一种基于BiMPM方法的口干信息匹配设备,其特征在于,所述基于BiMPM方法的口干信息匹配设备包括:
集建立单元,用于获取口干描述文本信息以及对应的疾病信息,根据该口干描述文本信息建立口干信息向量集,将疾病信息信息存入口干信息向量集中;
聚类单元,用于建立k-means聚类方法,通过k-means聚类方法对口干信息向量集进行聚类,根据聚类结果建立口干特征向量集;
处理单元,用于获取待匹配口干文本信息,并对该待匹配口干文本信息进行预处理,根据预处理后的待匹配口干文本信息建立待匹配口干特征向量集;
信息匹配单元,用于建立BiMPM方法,通过BiMPM方法计算口干特征向量集与待匹配口干特征向量集之间的相似度,根据该相似度对待匹配口干文本信息进行匹配。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011219117.0A CN112349423A (zh) | 2020-11-04 | 2020-11-04 | 一种基于BiMPM方法的口干信息匹配系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011219117.0A CN112349423A (zh) | 2020-11-04 | 2020-11-04 | 一种基于BiMPM方法的口干信息匹配系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112349423A true CN112349423A (zh) | 2021-02-09 |
Family
ID=74429236
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011219117.0A Pending CN112349423A (zh) | 2020-11-04 | 2020-11-04 | 一种基于BiMPM方法的口干信息匹配系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112349423A (zh) |
Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20120124051A1 (en) * | 2009-07-29 | 2012-05-17 | Wilfred Wan Kei Lin | Ontological information retrieval system |
CN104915561A (zh) * | 2015-06-11 | 2015-09-16 | 万达信息股份有限公司 | 疾病特征智能匹配方法 |
CN107862070A (zh) * | 2017-11-22 | 2018-03-30 | 华南理工大学 | 基于文本聚类的线上课堂讨论短文本即时分组方法及系统 |
US20180137250A1 (en) * | 2016-11-15 | 2018-05-17 | Hefei University Of Technology | Mobile health intelligent medical guide system and method thereof |
KR101875306B1 (ko) * | 2017-01-11 | 2018-07-05 | 전북대학교산학협력단 | 의료용어 클러스터를 이용한 질병정보제공시스템 |
CN108614885A (zh) * | 2018-05-03 | 2018-10-02 | 杭州认识科技有限公司 | 基于医学信息的知识图谱分析方法及装置 |
CN108647203A (zh) * | 2018-04-20 | 2018-10-12 | 浙江大学 | 一种中医病情文本相似度的计算方法 |
US20190130073A1 (en) * | 2017-10-27 | 2019-05-02 | Nuance Communications, Inc. | Computer assisted coding systems and methods |
CN111028828A (zh) * | 2019-12-20 | 2020-04-17 | 京东方科技集团股份有限公司 | 一种基于画屏的语音交互方法、画屏及存储介质 |
CN111613311A (zh) * | 2020-06-09 | 2020-09-01 | 广东珠江智联信息科技股份有限公司 | 一种智能ai导诊实现技术 |
CN111653359A (zh) * | 2020-05-30 | 2020-09-11 | 吾征智能技术(北京)有限公司 | 一种出血性疾病的智能预测模型构建方法和预测系统 |
CN111710409A (zh) * | 2020-05-29 | 2020-09-25 | 吾征智能技术(北京)有限公司 | 基于人体汗液异常变化的智能筛查系统 |
CN111710383A (zh) * | 2020-06-16 | 2020-09-25 | 平安科技(深圳)有限公司 | 病历质控方法、装置、计算机设备和存储介质 |
-
2020
- 2020-11-04 CN CN202011219117.0A patent/CN112349423A/zh active Pending
Patent Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20120124051A1 (en) * | 2009-07-29 | 2012-05-17 | Wilfred Wan Kei Lin | Ontological information retrieval system |
CN104915561A (zh) * | 2015-06-11 | 2015-09-16 | 万达信息股份有限公司 | 疾病特征智能匹配方法 |
US20180137250A1 (en) * | 2016-11-15 | 2018-05-17 | Hefei University Of Technology | Mobile health intelligent medical guide system and method thereof |
KR101875306B1 (ko) * | 2017-01-11 | 2018-07-05 | 전북대학교산학협력단 | 의료용어 클러스터를 이용한 질병정보제공시스템 |
US20190130073A1 (en) * | 2017-10-27 | 2019-05-02 | Nuance Communications, Inc. | Computer assisted coding systems and methods |
CN107862070A (zh) * | 2017-11-22 | 2018-03-30 | 华南理工大学 | 基于文本聚类的线上课堂讨论短文本即时分组方法及系统 |
CN108647203A (zh) * | 2018-04-20 | 2018-10-12 | 浙江大学 | 一种中医病情文本相似度的计算方法 |
CN108614885A (zh) * | 2018-05-03 | 2018-10-02 | 杭州认识科技有限公司 | 基于医学信息的知识图谱分析方法及装置 |
CN111028828A (zh) * | 2019-12-20 | 2020-04-17 | 京东方科技集团股份有限公司 | 一种基于画屏的语音交互方法、画屏及存储介质 |
CN111710409A (zh) * | 2020-05-29 | 2020-09-25 | 吾征智能技术(北京)有限公司 | 基于人体汗液异常变化的智能筛查系统 |
CN111653359A (zh) * | 2020-05-30 | 2020-09-11 | 吾征智能技术(北京)有限公司 | 一种出血性疾病的智能预测模型构建方法和预测系统 |
CN111613311A (zh) * | 2020-06-09 | 2020-09-01 | 广东珠江智联信息科技股份有限公司 | 一种智能ai导诊实现技术 |
CN111710383A (zh) * | 2020-06-16 | 2020-09-25 | 平安科技(深圳)有限公司 | 病历质控方法、装置、计算机设备和存储介质 |
Non-Patent Citations (4)
Title |
---|
INDRANI BHATTACHARYA,等: "Spatial Distribution Based Provisional Disease Diagnosis in Remote Healthcare", 《PATTERN RECOGNITION AND MACHINE INTELLIGENCE, PREMI 2017》, vol. 10597, 1 November 2017 (2017-11-01), pages 601 - 607, XP047455166, DOI: 10.1007/978-3-319-69900-4_76 * |
NAMWON KIM,等: "FAMOUS: Fake News Detection Model Based on Unified Key Sentence Information", 《IEEE XPLORE》, 10 March 2019 (2019-03-10), pages 617 - 620 * |
周阳: "基于机器学习的医疗文本分析挖掘技术研究", 《中国博士学位论文全文数据库 信息科技辑》, no. 01, 15 January 2020 (2020-01-15), pages 138 - 171 * |
张扬扬: "自动问答技术在中草药系统中的研究及应用", 《中国优秀硕士学位论文全文数据库 信息科技辑》, no. 12, 15 December 2018 (2018-12-15), pages 138 - 2034 * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Närhi et al. | Xerostomia and hyposalivation: causes, consequences and treatment in the elderly | |
Choi et al. | Prediction tree for severely head-injured patients | |
Russell | The periodontal index | |
Donner et al. | Analysis of site-specific data in dental studies | |
CN112289441B (zh) | 一种基于多模态的医学生物特征信息匹配系统 | |
CN112349423A (zh) | 一种基于BiMPM方法的口干信息匹配系统 | |
CN112002419B (zh) | 一种基于聚类的疾病辅助诊断系统、设备、存储介质 | |
Anifah | Decision Support System Erythemato-Squamous Diseases Classification Diagnosis Using Linear Vector Quantization Based Clinical Atributes | |
Crawford et al. | In vivo oxygen transport in the normal rabbit femoral arterial wall. | |
CN112386245A (zh) | 从舌头分析身体状况的方法 | |
US20040133121A1 (en) | Method and apparatus for analyzing organism reaction waveform information, and diagnosing apparatus | |
CN116246779A (zh) | 基于用户影像数据的牙科诊疗方案生成方法及系统 | |
CN103399098A (zh) | 一种心气虚证大鼠模型的评价方法 | |
CN112086200B (zh) | 一种基于口苦预测疾病的系统、设备、存储介质 | |
CN111637610B (zh) | 基于机器视觉的室内环境健康度调节方法与系统 | |
Kukharev Georgy et al. | Application of digital facial anthropometry | |
Sullivan et al. | A contribution to Samoan somatology | |
Syafaah et al. | Self-Monitoring and Detection of Diabetes with Smart Toilet based on Image Processing and K-Means Technique | |
Sutherland et al. | Charity Hospital experience with long-term survival and prognostic factors in patients with breast cancer with localized or regional disease. | |
Matthews-Brzozowska et al. | Minimally invasive treatments revitalizing facial skin-a case study | |
CN112017774B (zh) | 一种基于口臭伴随症状的疾病预测模型的构建方法及系统 | |
Diroll et al. | Inverse relationship between blood volume and blood pressure | |
CN113240799B (zh) | 一种基于医疗大数据的牙齿三维模型构建系统 | |
Etikan et al. | Prediction methods for babies’ birth weight using linear and nonlinear regression analysis | |
CN116058810A (zh) | 一种基于大数据的智能心电数据识别系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |