CN111973155B - 一种基于人体口味异常变化的疾病认知自学习系统 - Google Patents

一种基于人体口味异常变化的疾病认知自学习系统 Download PDF

Info

Publication number
CN111973155B
CN111973155B CN202010853269.XA CN202010853269A CN111973155B CN 111973155 B CN111973155 B CN 111973155B CN 202010853269 A CN202010853269 A CN 202010853269A CN 111973155 B CN111973155 B CN 111973155B
Authority
CN
China
Prior art keywords
data set
information
human taste
module
disease
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010853269.XA
Other languages
English (en)
Other versions
CN111973155A (zh
Inventor
杜登斌
杜小军
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wuzheng Intelligent Technology Beijing Co ltd
Original Assignee
Wuzheng Intelligent Technology Beijing Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wuzheng Intelligent Technology Beijing Co ltd filed Critical Wuzheng Intelligent Technology Beijing Co ltd
Priority to CN202010853269.XA priority Critical patent/CN111973155B/zh
Publication of CN111973155A publication Critical patent/CN111973155A/zh
Application granted granted Critical
Publication of CN111973155B publication Critical patent/CN111973155B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/40Detecting, measuring or recording for evaluating the nervous system
    • A61B5/4005Detecting, measuring or recording for evaluating the nervous system for evaluating the sensory system
    • A61B5/4017Evaluating sense of taste
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Heart & Thoracic Surgery (AREA)
  • Medical Informatics (AREA)
  • Physiology (AREA)
  • Surgery (AREA)
  • Animal Behavior & Ethology (AREA)
  • Pathology (AREA)
  • Public Health (AREA)
  • Veterinary Medicine (AREA)
  • Computational Linguistics (AREA)
  • Neurosurgery (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Neurology (AREA)
  • Measuring And Recording Apparatus For Diagnosis (AREA)
  • Medical Treatment And Welfare Office Work (AREA)

Abstract

本发明提出了一种基于人体口味异常变化的疾病认知自学习系统。包括:数据获取模块,用于获取人体口味变化信息以及对应疾病信息,作为原始数据集;自学习模块,用于通过类别不平衡分类方法对原始数据集进行训练,根据该训练结果对原始数据集进行扩充,获取扩充后的原始数据集作为第一数据集;匹配模块,用于建立向量空间模型,获取待诊断人体口味变化信息,通过向量空间模型计算待诊断人体口味变化信息与第一数据集的相似度;预测模块,用于对待诊断人体口味变化信息进行预测。本发明通过利用类别不平衡分类方法以及向量空间模型能够自学习对系统数据库进行更新,同时能够快速与人体口味变化进行诊断预测,提高了速度与精确度。

Description

一种基于人体口味异常变化的疾病认知自学习系统
技术领域
本发明涉及计算机技术领域,尤其涉及一种基于人体口味异常变化的疾病认知自学习系统。
背景技术
一般每个人都有自己的口舌爱好。比如有的人喜欢吃甜的,有的人喜欢吃酸的,如果有一天吃什么东西都味同嚼蜡,那生活也就失去了意义。相反,如果短期内口味突然变了,嘴里经常感觉有异味,比如泛酸、口苦、发甜等,那就要警惕了,因为这常常是患有某种疾病或者健康状况出来问题的信号。
目前,传统的人体口味认知疾病的方法还是依靠中医的“望闻问切”,也就是先通过医生的询问,初步判断情况,然后通过仪器的检查来得到最终的检查结果,但是这样不仅检查过程繁琐,而且耗费时间,极大影响用户体验,所以亟需一种基于人体口味异常变化的疾病认知自学习系统,能够快速实现人体口味认知疾病。
上述内容仅用于辅助理解本发明的技术方案,并不代表承认上述内容是现有技术。
发明内容
有鉴于此,本发明提出了一种基于人体口味异常变化的疾病认知自学习系统,旨在解决现有技术无法实现通过建立空间向量模型来提高口味和对应疾病之间的信息检索速度的技术问题。
本发明的技术方案是这样实现的:
一方面,本发明提供了一种基于人体口味异常变化的疾病认知自学习系统,所述基于人体口味异常变化的疾病认知自学习系统包括:
数据获取模块,用于获取人体口味变化信息以及对应疾病信息,并将该人体口味变化信息以及对应疾病信息进行分类存储,并作为原始数据集;
自学习模块,用于通过类别不平衡分类方法对原始数据集进行训练,获取训练结果,根据该训练结果对原始数据集进行扩充,获取扩充后的原始数据集作为第一数据集;
匹配模块,用于建立向量空间模型,获取待诊断人体口味变化信息,通过向量空间模型计算待诊断人体口味变化信息与第一数据集中人体口味变化信息的相似度;
预测模块,用于根据相似度从第一数据集查找出对应疾病信息,并对待诊断人体口味变化信息进行预测。
在以上技术方案的基础上,优选的,数据获取模块包括数据信息记录模块,用于获取人体口味变化信息以及对应疾病信息,所述人体口味变化信息包括:人体口味信息以及症状特征信息,所述人体口味信息包括:口酸、口甜、口苦以及口干,所述症状特征信息包括:舌燥、头疼、乏力以及胃疼,所述对应疾病信息包括:疾病知识以及疾病症状特征信息,所述疾病知识包括:单纯性口臭病以及免疫、脏腑功能失调口臭病,所述疾病症状特征信息包括:舌苔厚腻、口苦、气短、胸闷以及肠胃不适。
在以上技术方案的基础上,优选的,数据获取模块包括分类存储模块,用于根据人体口味变化信息建立不同数据集,将对应的症状特征信息以及疾病信息存入数据集中,并将该数据集作为原始数据集。
在以上技术方案的基础上,优选的,自学习模块包括训练模块,用于从原始数据集中随机提取部分数据集作为待筛选数据集,从待筛选数据集中提取少数样本数据,将该少数样本数据作为人工样本添加到原始数据集中,将添加后的原始数据集作为混合数据集,通过分类器对该混合数据集进行分类训练,获取训练后的待判断数据集。
在以上技术方案的基础上,优选的,自学习模块包括扩充模块,用于设定数据集判断标准,通过数据集判断标准对待判断数据集,当待判断数据集满足数据集判断标准时,将该待判断数据集添加入原始数据集中,对原始数据集进行扩充覆盖,将扩充覆盖后的原始数据集作为第一数据集;当待判断数据集不满足数据集判断标准时,重新选择该待判断数据集。
在以上技术方案的基础上,优选的,匹配模块包括匹配计算模块,用于建立向量空间模型,获取待诊断人体口味变化信息,通过向量空间模型计算待诊断人体口味变化信息的权重以及第一数据集中人体口味变化信息的权重之间的相似度。
在以上技术方案的基础上,优选的,预测模块包括诊断预测模块,用于设定相似度阈值,将相似度与相似度阈值进行比较,当相似度大于相似度阈值时,从第一数据集查找出对应疾病信息,并对待诊断人体口味变化信息进行预测;当相似小于相似度阈值时,重选选择待诊断人体口味变化信息。
更进一步优选的,所述基于人体口味异常变化的疾病认知自学习设备包括:
数据获取单元,用于获取人体口味变化信息以及对应疾病信息,并将该人体口味变化信息以及对应疾病信息进行分类存储,并作为原始数据集;
自学习单元,用于通过类别不平衡分类方法对原始数据集进行训练,获取训练结果,根据该训练结果对原始数据集进行扩充,获取扩充后的原始数据集作为第一数据集;
匹配单元,用于建立向量空间模型,获取待诊断人体口味变化信息,通过向量空间模型计算待诊断人体口味变化信息与第一数据集中人体口味变化信息的相似度;
预测单元,用于根据相似度从第一数据集查找出对应疾病信息,并对待诊断人体口味变化信息进行预测。
本发明的一种基于人体口味异常变化的疾病认知自学习系统相对于现有技术具有以下有益效果:
(1)通过利用类别不平衡分类方法对原始数据集进行训练,能够不停对原始数据集进行扩充,实现系统自学习的功能,提高系统诊断的精确度;
(2)通过建立空间向量模型,能够快速对待诊断人体口味变化进行诊断预测,同时用算法的方法,精确度高,用户体验好。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明基于人体口味异常变化的疾病认知自学习系统第一实施例的结构框图;
图2为本发明基于人体口味异常变化的疾病认知自学习系统的第二实施例结构框图;
图3为本发明基于人体口味异常变化的疾病认知自学习系统的第三实施例结构框图;
图4为本发明基于人体口味异常变化的疾病认知自学习系统的第四实施例结构框图;
图5为本发明基于人体口味异常变化的疾病认知自学习系统的第五实施例结构框图;
图6为本发明基于人体口味异常变化的疾病认知自学习设备结构框图。
具体实施方式
下面将结合本发明实施方式,对本发明实施方式中的技术方案进行清楚、完整地描述,显然,所描述的实施方式仅仅是本发明一部分实施方式,而不是全部的实施方式。基于本发明中的实施方式,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施方式,都属于本发明保护的范围。
如图1所示,图1为本发明基于人体口味异常变化的疾病认知自学习系统第一实施例的结构框图。其中,所述基于人体口味异常变化的疾病认知自学习系统包括:数据获取模块10、自学习模块20、匹配模块30和预测模块40。
数据获取模块10,用于获取人体口味变化信息以及对应疾病信息,并将该人体口味变化信息以及对应疾病信息进行分类存储,并作为原始数据集;
自学习模块20,用于通过类别不平衡分类方法对原始数据集进行训练,获取训练结果,根据该训练结果对原始数据集进行扩充,获取扩充后的原始数据集作为第一数据集;
匹配模块30,用于建立向量空间模型,获取待诊断人体口味变化信息,通过向量空间模型计算待诊断人体口味变化信息与第一数据集中人体口味变化信息的相似度;
预测模块40,用于根据相似度从第一数据集查找出对应疾病信息,并对待诊断人体口味变化信息进行预测。
应当理解的是,本实施例还提出另一种基于人体口味异常变化的疾病认知自学习系统:
数据存储模块,用于获取人体口味(例如:口酸、口甜、口苦、口辣、口咸及口臭、口涩、口干等)异常变化的特征信息以及对应的疾病知识和疾病症状的特征信息,并根据这些特征信息进行分类存储;
数据库模块,用于根据存储的人体口味异常变化的特征信息以及对应的疾病知识和疾病症状的特征信息。这里,基于匹配的诊断是在患者病历记录和疾病诊断知识之间进行的匹配,实际上是在构成这两部分知识的医学术语之间的匹配。因此,在进行基于匹配的诊断之前,需要依据疾病诊断术语库查找病人病历数据和疾病诊断知识所使用的医学术语之间的关系;
自学习模块,用于通过基于扩充训练数据集的类别不平衡分类方法对上述数据进行训练和匹配。通过对匹配结果进行人工评定,正确的结果将转换为标签与认知诊断数据成对存储在数据库中;错误的结果通过人工修订,指定正确值后再次成对进行存储,并再次进行自学习。经过多次训练,直到达到最终的匹配效果;
匹配模块,用于基于向量空间模型进行相似度计算。也就是获取待诊断人体口味异常变化的特征信息,利用向量空间模型计算待诊断人体口味异常变化的特征信息与疾病知识和疾病症状的特征信息的相相似性;
预测推理模块,用于对待诊断人体口味异常变化的特征信息进行诊断预测。基本方法为,基于疾病诊断规则的预测推理模块主要负责从疾病诊断知识事实库中取出与本次诊断相关的疾病诊断知识事实,从疾病诊断规则库中取出疾病诊断规则,与数据库数据事实集一起,组织得到疾病诊断推理程序。将组织好的疾病诊断推理程序送入推理机进行推理,得到疾病预测和诊断结果。
进一步地,如图2所示,基于上述各实施例提出本发明基于人体口味异常变化的疾病认知自学习系统的第二实施例结构框图,在本实施例中,数据获取模块10还包括:
数据信息记录模块101,用于获取人体口味变化信息以及对应疾病信息,所述人体口味变化信息包括:人体口味信息以及症状特征信息,所述人体口味信息包括:口酸、口甜、口苦以及口干,所述症状特征信息包括:舌燥、头疼、乏力以及胃疼,所述对应疾病信息包括:疾病知识以及疾病症状特征信息,所述疾病知识包括:单纯性口臭病以及免疫、脏腑功能失调口臭病,所述疾病症状特征信息包括:舌苔厚腻、口苦、气短、胸闷以及肠胃不适。
分类存储模块102,用于根据人体口味变化信息建立不同数据集,将对应的症状特征信息以及疾病信息存入数据集中,并将该数据集作为原始数据集。
应当理解的是,系统获取的人体口味变化信息包括:人体口味信息以及症状特征信息,所述人体口味信息包括:口酸、口甜、口苦、口辣、口咸及口臭、口涩、口干等;所述症状特征信息包括:舌燥、头疼、乏力、咽痛、多饮、心慌、便秘、腹胀、胃疼、小便发黄、舌苔厚腻等,所述疾病知识和疾病症状的特征信息包括:单纯性口臭病:除明显有口臭之外,口腔牙龈肿、痛,局部发热等;免疫、脏腑功能失调口臭病:除口臭这一明显标志之外,还会根据患者的个体差异,分别出现以下单个症状或者以下多个症状表现:舌苔厚腻、口苦、气短、胸闷、肠胃不适、腹账、尿频、便秘、便溏、腰膝酸软、肢体麻痛、容易上火(女性则经期易上火)、手脚心易出汗、身体常发热、易于疲劳、易感冒、烦躁、失眠、精神不振、头昏、头发干枯、耳鸣等症状。
应当理解的是,系统会根据人体口味信息建立不同的数据集,口酸、口甜、口苦、口辣、口咸及口臭、口涩、口干等则是作为数据集的名称,里面存储对应的症状特征信息、疾病知识和疾病症状的特征信息,为了后续方便计算,系统会将这些不同的数据集作为原始数据集。
应当理解的是,系统之后会将分类存储的人体口味异常变化的特征信息与对应的疾病知识和疾病症状的特征信息(即原始数据集)作为系统训练以及自学习和和匹配的依据。比如:口苦为肝胆有热;口酸有腐味为胃肠积滞;口臭为胃火盛;口淡为胃有湿或虚证;口甜为脾有湿热;口咸为肾虚等;再比如:口苦又可以分为:口感苦者,如果经常兼有头痛眩晕、面红眼赤、性急易怒、大便干结、舌质偏红、苔薄黄、脉象弦数等症状,多为肝、胆有热所致;口苦者,如果常兼有寒热往来、心烦喜呕、胸肋苦满、默默不欲食、小便赤黄等症状,多为胆热上蒸所致。
进一步地,如图3所示,基于上述各实施例提出本发明基于人体口味异常变化的疾病认知自学习系统的第三实施例结构框图,在本实施例中,自学习模块20还包括:
训练模块201,用于从原始数据集中随机提取部分数据集作为待筛选数据集,从待筛选数据集中提取少数样本数据,将该少数样本数据作为人工样本添加到原始数据集中,将添加后的原始数据集作为混合数据集,通过分类器对该混合数据集进行分类训练,获取训练后的待判断数据集。
扩充模块202,用于设定数据集判断标准,通过数据集判断标准对待判断数据集,当待判断数据集满足数据集判断标准时,将该待判断数据集添加入原始数据集中,对原始数据集进行扩充覆盖,将扩充覆盖后的原始数据集作为第一数据集;当待判断数据集不满足数据集判断标准时,重新选择该待判断数据集。
应当理解的是,系统会通过基于扩充训练数据集的类别不平衡分类方法对上述数据进行训练和匹配。然后对匹配结果进行人工评定,将匹配正确的结果转换为标签与认知诊断数据成对存储在数据库中;错误的结果通过人工修订,指定正确值后再次成对进行存储,并再次进行自学习。经过多次训练,直到达到最终的匹配效果。
应当理解的是,具体操作为:首先获取分类任务所需的真实数据集;在真实数据集中筛选出少数类样本,并区分出靠近和远离决策边界的样本;将上述样本作为输入,得到与真实数据相似的人工样本;将一定数量的人工样本加入到真实数据集中,得到混合数据集;将混合数据集作为输入,使用分类器进行分类任务,然后设定数据集判断标准,通过数据集判断标准对待判断数据集,当待判断数据集满足数据集判断标准时,将该待判断数据集添加入原始数据集中,对原始数据集进行扩充覆盖,将扩充覆盖后的原始数据集作为第一数据集;当待判断数据集不满足数据集判断标准时,重新选择该待判断数据集。
其中,区分出靠近决策边界的样本和远离决策边界的样本中区分靠近决策边界样本的方法如下:对于某个少数类样本,找出其在全部样本中的K个最近邻,K>2。如果最近邻中属于多数类的样本数量不少于K/2,则标记该少数类样本为靠近决策边界的样本;反之则标记该少数类样本为远离决策边界的样本,重复此步骤直到所有少数类样本都已标记。在原始数据集样本类别不平衡的情况下,针对少数类样本,利用边界信息,获得了额外的人工数据,以此扩充并平衡了原始数据集。通过此方法得到的人工样本由于在分布特征上和原始样本具有相似性,一定程度上可以扩充样本而不会带来过大的分布偏差,因此有效提高了类别不平衡数据的分类准确率。
应当理解的是,在具有两个类的统计分类问题中,决策边界或决策表面是超曲面,其将基础向量空间划分为两个集合,一个集合。分类器将决策边界一侧的所有点分类为属于一个类,而将另一侧的所有点分类为属于另一个类,本实施例中的决策边界由用户预先决定。
应当理解的是,分类是数据挖掘的一种非常重要的方法。分类的概念是在已有数据的基础上学会一个分类函数或构造出一个分类模型(即我们通常所说的分类器(Classifier))。该函数或模型能够把数据库中的数据纪录映射到给定类别中的某一个,从而可以应用于数据预测。总之,分类器是数据挖掘中对样本进行分类的方法的统称,包含决策树、逻辑回归、朴素贝叶斯、神经网络等算法。本实施例使用的分类器是逻辑回归算法。
进一步地,如图4所示,基于上述各实施例提出本发明基于人体口味异常变化的疾病认知自学习系统的第四实施例结构框图,在本实施例中,匹配模块30包括:
匹配计算模块301,用于建立向量空间模型,获取待诊断人体口味变化信息,通过向量空间模型计算待诊断人体口味变化信息的权重以及第一数据集中人体口味变化信息的权重之间的相似度。
应当理解的是,系统之后会基于向量空间模型进行相似度计算。也就是获取待诊断人体口味异常变化的特征信息,利用向量空间模型计算待诊断人体口味异常变化的特征信息与第一数据集的特征信息的相似性。比如,口辣:主要原因是肺热壅盛或胃火上炎。口中有辛辣味或舌体有麻辣感的人多为肺热壅盛或胃火上炎所致,常见于高血压、神经官能症、更年期综合征及长期低热者,大多还伴有咳嗽、咯痰黄稠、舌苔薄黄等症状;口甜:主要原因是脾热酶的分泌异常。一般来说,脾热口甘,因此口甜多为脾胃功能失调所致。因为消化系统功能紊乱可导致各种酶的分泌异常,唾液中淀粉酶含量增加,刺激舌上的味蕾而感觉口甜。另外糖尿病患者血糖升高,唾液内糖分亦升高,也常会出现口舌发甜;口苦:主要原因是湿热肝胆湿热和胃热。口苦的人大多因为湿热引起,多见于肝胆湿热和胃热,一般是由于胆汁反流造成,因此首先应检查胃和胆囊有没有问题;部分喜欢夜宵的人或过食辛辣食物也会出现胆汁反流造成口苦;而老年人因为胃动力差,也容易出现口苦;癌症病人也常常出现口苦症状;再就是一些脑力劳动者,由于精神压力大,再加上生活饮食节律失调,导致肠胃功能呆滞,进食的食物在胃肠停留时间过长,也容易引起口苦;口咸:主要原因是肾阴不足、虚火上浮。口咸与肾有关,大多是肾阴不足、虚火上浮造成的,有的还伴有腰膝酸软、头昏耳鸣、五心烦热、畏寒肢冷、神疲乏力、夜尿频长等症状,多见于慢性肾炎、神经官能症、慢性咽喉炎或口腔溃疡等病症;口酸:主要原因是肝热肝胆之热侵蚀脾。中医认为,肝热则口酸,大多由于肝胆之热侵蚀脾脏后形成,而且很多人还可能出现舌苔薄黄、食后腹胀、恶心,甚至出现胸闷肋痛等症状,这预示着可能患了胃炎或消化道溃疡等疾病,最好马上做进一步的胃部检查。
应当理解的是,向量空间模型简称VSM,是VectorSpace Model的缩写,是近些年使用效果较好、且应用较为广泛的一种信息检索模型。在此模型中,文本被看作是由一系列相互独立的词语组成的,若文档D中包含词语t1,t2,...,tN,则文档表示为D(t1,t2,...,tN)。由于文档中词语对文档的重要程度不同,并且词语的重要程度对文本相似度的计算有很大的影响,因而可对文档中的每个词语赋以一个权值w,以表示该词的权重,其表示如下:D(t1,w1;t2,w2;...;tN,wN),可简记为D(w1,w2,...,wN),此时的wN即为词语tN的权重。这样,就把文本表示成了向量的形式,同时两文本的相似度问题也就可以通过两向量之间的夹角大小(即余弦相似度计算方法)来计算了,夹角越大,两文本的相似度就越低。
应当理解的是,在文本中出现频率较高的词语应该具有较高的权值,因此,在计算词语对文本的权重时,应考虑词语在文本中的出现频率,记为tf。仅考虑这一项是不够的,如果某一词语不仅在一个文本中出现,而是在文本集中的很多个文本中都有出现,例如“的”字在中文文本中的出现频率应该是相当高的,但它对于我们区分各个文本是没有帮助的,也就是说,这样的词语是不具备鉴别能力的。因而,在计算词语权重时还应考虑词语的文档频率(df),即含有该词的文档数量。由于词语的权重与文档频率成反比,又引出与文档频率成反比关系的倒置文档频率(idf),其计算公式为
Figure BDA0002645525880000101
(其中N为文档集中全部文档的数量,n为包含某词语的文档数)。由此得出特征词t在文档D中的权重weight(t.D)=tf(t.D)*idf(t)。用tf*idf公式计算特征项的权重,既注重了词语在文本中的重要性,又注重了词的鉴别能力。因此,有较高的tf*idf值的词在文档中一定是重要的,同时它一定在其它文档中出现很少。因此我们可以通过这种方法来选择把那些词语作为文本向量的特征词。特征词选择出来之后,就能确定文本的向量表示了,有了文本向量,我们就可以通过此向量计算文本的相似度了,相似度的计算方法很多,其中包括:内积法(Inner Product);余弦法(Cosine);Dice系数法(DiceCoefficient);Jaccard系数法(Jaccard Coefficient)等,本实施例中采用的是余弦法。
应当理解的是,大量统计结果表明,文本中出现次数最多的词语往往是反映句子语法结构的虚词以及文本作者想要阐述某个问题时所用的核心词,如果是围绕同一核心问题的文本,其核心词汇应该是类似的,所以这两类词对文本相似度的计算都是没有用的。因此,最高频词和低频词都不适宜做文本的特征词,只有词频介于最高频和低频之间的这部分词汇才适合做特征词。
进一步地,如图5所示,基于上述各实施例提出本发明基于人体口味异常变化的疾病认知自学习系统的第五实施例结构框图,在本实施例中,预测模块40包括:
诊断预测模块401,用于设定相似度阈值,将相似度与相似度阈值进行比较,当相似度大于相似度阈值时,从第一数据集查找出对应疾病信息,并对待诊断人体口味变化信息进行预测;当相似小于相似度阈值时,重选选择待诊断人体口味变化信息。
应当理解的是,系统最后会根据向量空间模型的相似性对待诊断人体口味异常变化的特征信息进行诊断,并结合疾病知识和疾病症状的特征信息对待诊断人体口味异常变化的特征信息进行预测。比如:口苦一般为急性炎症表现,以肝胆急性炎症最多见,与胆汁排泄异常有关;口酸多见于胃炎、胆汁反流性胃炎等;口甜多见于消化功能紊乱患者和糖尿病患者;口淡多见某些消化系统疾病、内分泌疾病、长期发热消耗性疾病,以及营养不良的人,会常常口中淡而无味;口咸多见于慢性咽炎、神经官能症、癌症患者,大量吸烟的人也常有口涩之感;口辣多见于肺炎、支气管炎、高血压、更年期综合症、长期发热患者;口臭多见牙周炎、龋齿、口腔溃疡,以及鼻咽部炎症、胃肠功能紊乱、消化不良者可发生口臭。
需要说明的是,以上仅为举例说明,并不对本申请的技术方案构成任何限定。
通过上述描述不难发现,本实施例提出了一种基于人体口味异常变化的疾病认知自学习系统,包括:数据获取模块,用于获取人体口味变化信息以及对应疾病信息,并将该人体口味变化信息以及对应疾病信息进行分类存储,并作为原始数据集;自学习模块,用于通过类别不平衡分类方法对原始数据集进行训练,获取训练结果,根据该训练结果对原始数据集进行扩充,获取扩充后的原始数据集作为第一数据集;匹配模块,用于建立向量空间模型,获取待诊断人体口味变化信息,通过向量空间模型计算待诊断人体口味变化信息与第一数据集中人体口味变化信息的相似度;预测模块,用于根据相似度从第一数据集查找出对应疾病信息,并对待诊断人体口味变化信息进行预测。本实施例通过利用类别不平衡分类方法以及向量空间模型能够自学习对系统数据库进行更新,同时能够快速与人体口味变化进行诊断预测,提高了速度与精确度。
此外,本发明实施例还提出一种基于人体口味异常变化的疾病认知自学习设备。如图6所示,该基于人体口味异常变化的疾病认知自学习设备包括:数据获取单元10、自学习单元20、匹配单元30以及预测单元40。
数据获取单元10,用于获取人体口味变化信息以及对应疾病信息,并将该人体口味变化信息以及对应疾病信息进行分类存储,并作为原始数据集;
自学习单元20,用于通过类别不平衡分类方法对原始数据集进行训练,获取训练结果,根据该训练结果对原始数据集进行扩充,获取扩充后的原始数据集作为第一数据集;
匹配单元30,用于建立向量空间模型,获取待诊断人体口味变化信息,通过向量空间模型计算待诊断人体口味变化信息与第一数据集中人体口味变化信息的相似度;
预测单元40,用于根据相似度从第一数据集查找出对应疾病信息,并对待诊断人体口味变化信息进行预测。
此外,需要说明的是,以上所描述的装置实施例仅仅是示意性的,并不对本发明的保护范围构成限定,在实际应用中,本领域的技术人员可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的,此处不做限制。
另外,未在本实施例中详尽描述的技术细节,可参见本发明任意实施例所提供的基于人体口味异常变化的疾病认知自学习系统,此处不再赘述。
以上所述仅为本发明的较佳实施方式而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (2)

1.一种基于人体口味异常变化的疾病认知自学习系统,其特征在于,所述基于人体口味异常变化的疾病认知自学习系统包括:
数据获取模块,用于获取人体口味变化信息以及对应疾病信息,并将该人体口味变化信息以及对应疾病信息进行分类存储,并作为原始数据集;数据获取模块包括数据信息记录模块,用于获取人体口味变化信息以及对应疾病信息,所述人体口味变化信息包括:人体口味信息以及症状特征信息,所述人体口味信息包括:口酸、口甜、口苦以及口干,所述症状特征信息包括:舌燥、头疼、乏力以及胃疼,所述对应疾病信息包括:疾病知识以及疾病症状特征信息,所述疾病知识包括:单纯性口臭病以及免疫、脏腑功能失调口臭病,所述疾病症状特征信息包括:舌苔厚腻、口苦、气短、胸闷以及肠胃不适;数据获取模块包括分类存储模块,用于根据人体口味变化信息建立不同数据集,将对应的症状特征信息以及疾病信息存入数据集中,并将该数据集作为原始数据集;
自学习模块,用于通过类别不平衡分类方法对原始数据集进行训练,获取训练结果,根据该训练结果对原始数据集进行扩充,获取扩充后的原始数据集作为第一数据集;自学习模块包括训练模块,用于从原始数据集中随机提取部分数据集作为待筛选数据集,从待筛选数据集中提取少数样本数据,将该少数样本数据作为人工样本添加到原始数据集中,将添加后的原始数据集作为混合数据集,通过分类器对该混合数据集进行分类训练,获取训练后的待判断数据集;自学习模块包括扩充模块,用于设定数据集判断标准,通过数据集判断标准对待判断数据集,当待判断数据集满足数据集判断标准时,将该待判断数据集添加入原始数据集中,对原始数据集进行扩充覆盖,将扩充覆盖后的原始数据集作为第一数据集;当待判断数据集不满足数据集判断标准时,重新选择该待判断数据集;
匹配模块,用于建立向量空间模型,获取待诊断人体口味变化信息,通过向量空间模型计算待诊断人体口味变化信息与第一数据集中人体口味变化信息的相似度;匹配模块包括匹配计算模块,用于建立向量空间模型,获取待诊断人体口味变化信息,通过向量空间模型计算待诊断人体口味变化信息的权重以及第一数据集中人体口味变化信息的权重之间的相似度;
预测模块,用于根据相似度从第一数据集查找出对应疾病信息,并对待诊断人体口味变化信息进行预测;预测模块包括诊断预测模块,用于设定相似度阈值,将相似度与相似度阈值进行比较,当相似度大于相似度阈值时,从第一数据集查找出对应疾病信息,并对待诊断人体口味变化信息进行预测;当相似小于相似度阈值时,重选选择待诊断人体口味变化信息。
2.一种基于人体口味异常变化的疾病认知自学习设备,其特征在于,所述基于人体口味异常变化的疾病认知自学习设备包括:
数据获取单元,用于获取人体口味变化信息以及对应疾病信息,并将该人体口味变化信息以及对应疾病信息进行分类存储,并作为原始数据集;数据获取模块包括数据信息记录模块,用于获取人体口味变化信息以及对应疾病信息,所述人体口味变化信息包括:人体口味信息以及症状特征信息,所述人体口味信息包括:口酸、口甜、口苦以及口干,所述症状特征信息包括:舌燥、头疼、乏力以及胃疼,所述对应疾病信息包括:疾病知识以及疾病症状特征信息,所述疾病知识包括:单纯性口臭病以及免疫、脏腑功能失调口臭病,所述疾病症状特征信息包括:舌苔厚腻、口苦、气短、胸闷以及肠胃不适;数据获取模块包括分类存储模块,用于根据人体口味变化信息建立不同数据集,将对应的症状特征信息以及疾病信息存入数据集中,并将该数据集作为原始数据集;
自学习单元,用于通过类别不平衡分类方法对原始数据集进行训练,获取训练结果,根据该训练结果对原始数据集进行扩充,获取扩充后的原始数据集作为第一数据集;自学习模块包括训练模块,用于从原始数据集中随机提取部分数据集作为待筛选数据集,从待筛选数据集中提取少数样本数据,将该少数样本数据作为人工样本添加到原始数据集中,将添加后的原始数据集作为混合数据集,通过分类器对该混合数据集进行分类训练,获取训练后的待判断数据集;自学习模块包括扩充模块,用于设定数据集判断标准,通过数据集判断标准对待判断数据集,当待判断数据集满足数据集判断标准时,将该待判断数据集添加入原始数据集中,对原始数据集进行扩充覆盖,将扩充覆盖后的原始数据集作为第一数据集;当待判断数据集不满足数据集判断标准时,重新选择该待判断数据集;
匹配单元,用于建立向量空间模型,获取待诊断人体口味变化信息,通过向量空间模型计算待诊断人体口味变化信息与第一数据集中人体口味变化信息的相似度;匹配模块包括匹配计算模块,用于建立向量空间模型,获取待诊断人体口味变化信息,通过向量空间模型计算待诊断人体口味变化信息的权重以及第一数据集中人体口味变化信息的权重之间的相似度;
预测单元,用于根据相似度从第一数据集查找出对应疾病信息,并对待诊断人体口味变化信息进行预测;预测模块包括诊断预测模块,用于设定相似度阈值,将相似度与相似度阈值进行比较,当相似度大于相似度阈值时,从第一数据集查找出对应疾病信息,并对待诊断人体口味变化信息进行预测;当相似小于相似度阈值时,重选选择待诊断人体口味变化信息。
CN202010853269.XA 2020-08-23 2020-08-23 一种基于人体口味异常变化的疾病认知自学习系统 Active CN111973155B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010853269.XA CN111973155B (zh) 2020-08-23 2020-08-23 一种基于人体口味异常变化的疾病认知自学习系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010853269.XA CN111973155B (zh) 2020-08-23 2020-08-23 一种基于人体口味异常变化的疾病认知自学习系统

Publications (2)

Publication Number Publication Date
CN111973155A CN111973155A (zh) 2020-11-24
CN111973155B true CN111973155B (zh) 2023-06-16

Family

ID=73442473

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010853269.XA Active CN111973155B (zh) 2020-08-23 2020-08-23 一种基于人体口味异常变化的疾病认知自学习系统

Country Status (1)

Country Link
CN (1) CN111973155B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113793662B (zh) * 2021-08-16 2023-07-28 北京百度网讯科技有限公司 相关性识别方法、装置、电子设备和计算机可读存储介质

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2004278425A1 (en) * 2003-10-02 2005-04-14 The Government Of The United States Of America As Represented By The Secretary Of The Department Of Health And Human Services Mammalian T1R3 sweet taste receptors
CN108027365A (zh) * 2015-06-26 2018-05-11 皇家飞利浦有限公司 检测口臭的系统和方法
CN109564229A (zh) * 2016-07-11 2019-04-02 兰维尔健康有限公司 基于味觉识别的诊断相关性的方法
CN109690384A (zh) * 2016-04-08 2019-04-26 维扎瑞尔股份公司 用于基于视觉性能数据获得、分析和生成视觉性能数据和修改媒体的方法和系统
CN110090012A (zh) * 2019-03-15 2019-08-06 上海图灵医疗科技有限公司 一种基于机器学习的人体疾病检测方法及检测产品
WO2019178233A1 (en) * 2018-03-13 2019-09-19 Opertech Bio, Inc. System and method for taste preference testing and assessment and determining likelihood of consumption
CN110867232A (zh) * 2019-11-19 2020-03-06 广州科技贸易职业学院 用于确定中老年痴呆疾病治疗方案的智能设备和系统
CN110956093A (zh) * 2019-11-08 2020-04-03 武汉东湖大数据交易中心股份有限公司 基于大数据的模型识别方法、装置、设备及介质
CN111128394A (zh) * 2020-03-26 2020-05-08 腾讯科技(深圳)有限公司 医疗文本语义识别方法、装置、电子设备及可读存储介质
CN111369501A (zh) * 2020-02-24 2020-07-03 武汉大学 一种基于视觉特征识别口腔鳞状细胞癌的深度学习方法
CN111492437A (zh) * 2017-12-29 2020-08-04 英泰曲尔德直线有限公司 支持医学决策的方法和系统

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6979298B2 (en) * 2001-06-01 2005-12-27 Auburn University Apparatus and method for the measurement of the aerodynamics of olfaction in animals and man

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2004278425A1 (en) * 2003-10-02 2005-04-14 The Government Of The United States Of America As Represented By The Secretary Of The Department Of Health And Human Services Mammalian T1R3 sweet taste receptors
CN108027365A (zh) * 2015-06-26 2018-05-11 皇家飞利浦有限公司 检测口臭的系统和方法
CN109690384A (zh) * 2016-04-08 2019-04-26 维扎瑞尔股份公司 用于基于视觉性能数据获得、分析和生成视觉性能数据和修改媒体的方法和系统
CN109564229A (zh) * 2016-07-11 2019-04-02 兰维尔健康有限公司 基于味觉识别的诊断相关性的方法
CN111492437A (zh) * 2017-12-29 2020-08-04 英泰曲尔德直线有限公司 支持医学决策的方法和系统
WO2019178233A1 (en) * 2018-03-13 2019-09-19 Opertech Bio, Inc. System and method for taste preference testing and assessment and determining likelihood of consumption
CN110090012A (zh) * 2019-03-15 2019-08-06 上海图灵医疗科技有限公司 一种基于机器学习的人体疾病检测方法及检测产品
CN110956093A (zh) * 2019-11-08 2020-04-03 武汉东湖大数据交易中心股份有限公司 基于大数据的模型识别方法、装置、设备及介质
CN110867232A (zh) * 2019-11-19 2020-03-06 广州科技贸易职业学院 用于确定中老年痴呆疾病治疗方案的智能设备和系统
CN111369501A (zh) * 2020-02-24 2020-07-03 武汉大学 一种基于视觉特征识别口腔鳞状细胞癌的深度学习方法
CN111128394A (zh) * 2020-03-26 2020-05-08 腾讯科技(深圳)有限公司 医疗文本语义识别方法、装置、电子设备及可读存储介质

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
3D打印技术专业"三教"改革探索;刘森等;《数码世界》(第4期);第177页 *
湿病证治;裘鹤勇;《浙江中医学院学报》(第1期);第25页 *
烟台市产业发展现状及产业布局分析;杜小军;《经济研究导刊》(第16期);第132-133页 *
蒙医舌诊的源流与发展;王晓华等;《中国民族民间医药》(第1期);第64-65页 *
野菜虽土 处处生金;桔梗;《现代营销(经营版)》(第4期);第4-23页 *

Also Published As

Publication number Publication date
CN111973155A (zh) 2020-11-24

Similar Documents

Publication Publication Date Title
Hooper et al. Clinical symptoms, signs and tests for identification of impending and current water‐loss dehydration in older people
Hegedus et al. Combining orthopedic special tests to improve diagnosis of shoulder pathology
Memish et al. Peer reviewed: obesity and associated factors—Kingdom of Saudi Arabia, 2013
Abel Measuring health lifestyles in a comparative analysis: theoretical issues and empirical findings
CN108648827B (zh) 心脑血管疾病风险预测方法及装置
Fischer et al. Statistical adequacy of the Abel Assessment for Interest in Paraphilias
Cuff The body mass index values of mid-nineteenth-century West Point cadets: A theoretical application of Waaler's curves to a historical population
Son et al. Prevalence and risk factors of irritable bowel syndrome in Korean adolescent girls: a school-based study
Daly et al. Health status, perceptions of coping, and social support immediately after discharge of survivors of acute myocardial infarction
Binder et al. Intent to fail: Significance testing of forced choice test results
SG175057A1 (en) Computer-aided diagnostic systems and methods for determining skin compositions based on traditional chinese medicinal (tcm) principles
CN111973155B (zh) 一种基于人体口味异常变化的疾病认知自学习系统
CN109360658B (zh) 一种基于词向量模型的疾病模式挖掘方法及装置
Reid International studies in epidemiology
Howell et al. Analyzing taste preferences from crowdsourced food entries
Liu et al. Application of multilabel learning using the relevant feature for each label in chronic gastritis syndrome diagnosis
Eslick et al. Empirically derived symptom sub‐groups correspond poorly with diagnostic criteria for functional dyspepsia and irritable bowel syndrome. A factor and cluster analysis of a patient sample
Halligan et al. Automated blood pressure measurement as a predictor of proteinuric pre‐eclampsia
CN112185571B (zh) 一种基于口酸的疾病辅助诊断系统、设备、存储介质
Keya et al. Measuring the heart attack possibility using different types of machine learning algorithms
Heckerling et al. Entering the black box of neural networks
Yost Jr Sydenham's philosophy of science
Green et al. Repeatable battery for the assessment of neuropsychological status (RBANS): preliminary Australian normative data
US11887729B2 (en) Personalized extended digital migraine diary
El Azab et al. Obesity related risk factors among the saudi female students in Jouf University

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant