CN106934223A - 一种基于大数据的血液病智能分类系统及方法 - Google Patents

一种基于大数据的血液病智能分类系统及方法 Download PDF

Info

Publication number
CN106934223A
CN106934223A CN201710113828.1A CN201710113828A CN106934223A CN 106934223 A CN106934223 A CN 106934223A CN 201710113828 A CN201710113828 A CN 201710113828A CN 106934223 A CN106934223 A CN 106934223A
Authority
CN
China
Prior art keywords
blood disease
feature
module
data
training
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710113828.1A
Other languages
English (en)
Inventor
邝璞
高彦回
张洋
刘为
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Si Ji (beijing) Network Technology Co Ltd
Original Assignee
Si Ji (beijing) Network Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Si Ji (beijing) Network Technology Co Ltd filed Critical Si Ji (beijing) Network Technology Co Ltd
Priority to CN201710113828.1A priority Critical patent/CN106934223A/zh
Publication of CN106934223A publication Critical patent/CN106934223A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/70ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Public Health (AREA)
  • Data Mining & Analysis (AREA)
  • Medical Informatics (AREA)
  • Biomedical Technology (AREA)
  • Databases & Information Systems (AREA)
  • Epidemiology (AREA)
  • Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及一种基于大数据的血液病智能分类系统,包括服务器、信息输入装置、显示装置;服务器包括数据采集模块、数据存储模块、数据分割模块、特征病理信息提取模块、数据预处理模块、特征数值生成模块、分类器模型训练模块、分类器模型测试模块、病例分类模块。服务器将采集的血液病病例的电子数据分为训练集和测试集,提取训练集中病例的特征病理信息,预处理并生成特征数值,训练血液病病理分类器,并根据用户输入信息得出血液病分类结果;信息输入装置用于用户输入诊断为血液病的病例历史电子数据和待分类的血液病病例电子数据;显示装置对血液病分类结果进行显示。本发明不依赖医生的主观判断和工作经验,提高了诊断的准确性和及时性。

Description

一种基于大数据的血液病智能分类系统及方法
技术领域
本发明涉及数据处理技术领域,尤其涉及一种基于大数据的血液病智能分类系统及方法。
背景技术
目前,正处于大数据时代,到处都有大规模数据量的数据,现有技术中的简单规则处理难以发挥这些数据的价值。硬件的高速发展给大数据的应用提供了条件。高性能计算使得基于大规模数据的数据学习时间和数据处理代价大大降低了;大规模数据存储,使得能够更快、代价更小地处理大规模数据。由于硬件和算法的发展,使得在使用机器学习解决数据分析的问题后,能获得更加丰厚收益。
现有的机器学习技术主要运用到新闻、电子商务等互联网领域,在传统领域,尤其是医学领域的应用十分匮乏。因此,本发明提供一种将机器学习方法运用到医学领域中,进行血液病病理类型的智能分类方法,以弥补现有技术中,血液病的分类主要依赖医生的主观判断,判断的准确性取决于医生的工作经验,不同的医生对患者病情的判断结果可能会不一致,这容易导致误诊,甚至可能会延误患者病情的问题。
发明内容
鉴于上述的分析,本发明旨在提供一种基于大数据的血液病智能分类系统及方法,用以解决因医生的工作经验导致对患者病情诊断结果准确性不高的问题。
本发明的目的主要是通过以下技术方案实现的:
一种基于大数据的血液病智能分类系统,包括服务器、信息输入装置和显示装置;
所述信息输入装置用于用户输入诊断为血液病的病例历史电子数据和待分类的血液病病例电子数据;
所述服务器包括数据采集模块、数据存储模块、数据分割模块、特征病理信息提取模块、数据预处理模块、特征数值生成模块、分类器模型训练模块、分类器模型测试模块和病例分类模块,用于训练血液病病理分类器,并利用训练好的血液病病理分类器对用户输入的待分类的血液病病例电子数据进行分类,得到血液病分类结果;
所述显示装置用于对血液病分类结果进行显示。
所述数据采集模块用于获取诊断为血液病的病例历史电子数据和待分类的血液病病例电子数据,并存储到数据存储模块;
所述数据分割模块用于将电子数据分割为训练集和测试集;
所述特征病理信息提取模块用于提取训练集和测试集中的每个病例的特征病理信息,将提取的特征病理信息逐个与预先判定的血液病分类结果对应;
所述数据预处理模块用于对训练集和测试集中的特征病理信息进行预处理,生成训练用和测试用特征词集合;
所述特征数值生成模块用于为训练用和测试用特征词集合中的特征词生成对应的特征数值,利用计算得到的特征数值对词条进行特征表示;
所述分类器模型训练模块用于训练血液病分类分析模型,得到血液病病理分类器;
所述病例分类模块用于根据待分类信息的特征数值,利用血液病病理分类器得出根据用户输入信息的血液病分类结果。
所述预处理包括分词、噪声词剔除和同义词处理操作,生成训练用和测试用特征词集合。
使用分词工具对提取的病理信息中的每条信息进行分词,获得文本词集。
对分词结果进行噪声词剔除处理,包括去除没有实际意义的字或词,以及生僻字和特殊符号,还去除与血液病信息无关的词汇。
噪声词剔除处理通过建立噪声词表的方式进行匹配和剔除。
使用预先建立的同义词表对特征词集合中的同义词进行替换,使得所有同义词均用一个词来表示,得到训练用和测试用特征词集合。
对训练用特征词集合中的特征词进行特征选择。
采用Hash算法为训练用和测试用特征词集合中的每一病理的特征词生成对应的特征数值。
一种基于大数据的血液病智能分类方法,包括以下步骤:
步骤S1、数据采集模块获取诊断为血液病的病例历史电子数据,并存储到数据存储模块;
步骤S2、特征病理信息提取模块提取训练集中的每个病例的特征病理信息,将提取的特征病理信息逐个与预先判定的血液病分类结果对应;
步骤S3、对训练集中的特征病理信息进行预处理,生成训练用特征词集合;
步骤S4、为训练用特征词集合中的特征词生成对应的特征数值,利用计算得到的特征数值对词条进行特征表示;
步骤S5、利用步骤S4生成的特征数值训练血液病分类分析模型,得到血液病病理分类器;
步骤S6、将根据测试集生成的测试用特征数值输入到血液病病理分类器中,分类器模型测试模块将所述测试用特征数值与标准结果进行对比,得到测试结果;
步骤S7、接收用户输入的待分类的血液病病例电子数据;
步骤S8、对用户的输入信息进行特征病理信息提取、预处理和生成特征数值的处理,得到待分类信息的特征词集合和对应的特征数值;
步骤S9、血液病病理分类器根据待分类信息的特征数值,得出根据用户输入信息的血液病分类结果。
本发明有益效果如下:
本发明公开了一种基于大数据的血液病智能分类系统及方法,利用本发明得到的血液病病理分类器对病例进行分类,不依赖医生的主观判断和工作经验,针对相对症状的病人可以给出病症的分类,给医生的诊断提供参考,提高了诊断的准确性和及时性。
本发明的其他特征和优点将在随后的说明书中阐述,并且,部分的从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
附图说明
附图仅用于示出具体实施例的目的,而并不认为是对本发明的限制,在整个附图中,相同的参考符号表示相同的部件。
图1为基于大数据的血液病智能分类系统;
图2为基于大数据的血液病智能分类方法流程图。
具体实施方式
下面结合附图来具体描述本发明的优选实施例,其中,附图构成本申请一部分,并与本发明的实施例一起用于阐释本发明的原理。
本发明实施例提供了一种基于大数据的血液病智能分类系统,如图1所示,包括服务器、信息输入装置和显示装置;
所述服务器包括数据采集模块、数据存储模块、数据分割模块、特征病理信息提取模块、数据预处理模块、特征数值生成模块、分类器模型训练模块、分类器模型测试模块和病例分类模块;
所述数据采集模块用于获取用户输入的诊断为血液病的病例历史电子数据和待分类的血液病病例电子数据,并存储到数据存储模块;诊断为血液病的病例历史电子数据来源于过往纸质病历的电子化文本、现有电子病历和医院内部的研究统计文本;
所述数据存储模块用于存储数据采集模块采集的诊断为血液病的病例历史电子数据和待分类的血液病病例电子数据;
所述数据分割模块用于将病例历史电子数据分割为训练集和测试集;
所述特征病理信息提取模块用于提取训练集和测试集中的每个病例的特征病理信息,将提取的特征病理信息逐个与预先判定的血液病分类结果对应;具体提取的特征病理信息包括:病例中血液病的病理名称、病理描述和病理归属分类等;
所述数据预处理模块用于对训练集和测试集中的特征病理信息进行预处理,将提取的特征病理信息解析成词条,其中每一个病例对应多个词条;
进一步地,所述预处理包括分词、噪声词剔除和同义词处理等操作,生成训练用和测试用特征词集合,具体包括以下步骤:
1、使用分词工具对提取的病理信息中的每条信息进行分词,获得文本词集,如果文本是中文,则采用中文分词器;如果是英文,则使用空格进行分词,且在英文分词完成后使用词干提取的方式归一化时态和单复数;
具体地,可以采用ICTCLAS(Institute of Computing Technology,ChineseLexical Analysis System,汉语词法分析系统)和IK Analyzer(IK分词器)等分词工具作为中文分词器。
2、对分词结果进行噪声词剔除处理,包括去除没有实际意义的字或词,如“的、了、不但、而且、虽然、但是”等,以及一些生僻字和特殊符号,还去除与血液病信息无关的词汇。
进一步的,噪声词剔除处理可以通过建立噪声词表的方式进行匹配和剔除。
3、使用预先建立的同义词表对特征词集合中的同义词进行替换,使得所有同义词均用一个词来表示,得到训练用和测试用特征词集合。
所述特征数值生成模块用于为训练用和测试用特征词集合中的特征词生成对应的特征数值,利用计算得到的特征数值对词条进行特征表示;
所述分类器模型训练模块用于训练血液病分类分析模型,得到血液病病理分类器;
所述分类分析是指将物理或抽象对象的集合分组为由类似的对象组成的多个类的分析过程,其目的是在相似的基础上收集数据来分类。本发明中的分类分析算法有以下几种:
1、朴素贝叶斯(Naive Bayes,NB)
如果条件独立假设成立的话,NB将比鉴别模型(如Logistic回归)收敛的更快,所以只需要少量的训练数据。即使条件独立假设不成立,NB在实际中仍然表现很好。如果想做类似半监督学习,或者是既要模型简单又要性能好,可选用NB。
2、Logistic回归(Logistic Regression,LR)
LR有很多方法来对模型正则化。比起NB的条件独立性假设,LR不需要考虑样本是否是相关的。与决策树与支持向量机(SVM)不同,LR有很好的概率解释,且很容易利用新的训练数据来更新模型(使用在线梯度下降法)。如果想要一些概率信息(如,为了更容易的调整分类阈值,得到分类的不确定性,得到置信区间),或者希望将来有更多数据时能方便的更新改进模型,可选用LR。
3、决策树(Decision Tree,DT)
DT容易理解与解释,DT是非参数的,所以不需要担心野点(或离群点)和数据是否线性可分的问题(例如,DT可以轻松的处理这种情况:属于A类的样本的特征x取值往往非常小或者非常大,而属于B类的样本的特征x取值在中间范围)。DT的主要缺点是容易过拟合,这也正是随机森林(Random Forest,RF)(或者Boosted树)等集成学习算法被提出来的原因。
4、支持向量机(Support Vector Machine,SVM)
SVM具有很高的分类正确率,对过拟合有很好的理论保证,选取合适的核函数,面对特征线性不可分的问题也可以表现得很好。SVM在维数通常很高的文本分类中非常的流行。
所述分类器模型测试模块用于将输入到血液病病理分类器中的根据测试集生成的测试用特征数值与标准结果进行对比,得到测试结果,即三级分类的准确率;
所述信息输入装置用于用户输入诊断为血液病的病例历史电子数据和待分类的血液病病例电子数据;
所述病例分类模块用于根据待分类信息的特征数值,利用血液病病理分类器得出根据用户输入信息的血液病分类结果;
所述显示装置用于对血液病分类结果进行显示。
根据本发明的一个优选实施例,提供了一种基于大数据的血液病智能分类方法,流程图如图2所示,包括以下步骤:
步骤S1、数据采集模块获取诊断为血液病的病例历史电子数据,并存储到数据存储模块。
数据分割模块将病例历史电子数据分割为训练集和测试集,训练集占全部病例历史电子数据的比例越高,训练分类的准确度越高,在本实施例中,选取约85%的病例历史电子数据作为训练集,将其余病例历史电子数据作为测试集。
步骤S2、特征病理信息提取模块提取训练集中的每个病例的特征病理信息,将提取的特征病理信息逐个与预先判定的血液病分类结果对应;
优选的,在提取电子数据中的每个病例对应的血液病特征病理信息之后,检查特征病理信息的一致性,去除不符合要求的问题数据,例如空值、明显有问题的数据、重复数据以及不符合逻辑的数据等。
步骤S3、对训练集中的特征病理信息进行预处理,生成训练用特征词集合。
进一步地,所述预处理包括分词、噪声词剔除和同义词处理等操作,具体包括以下步骤:
使用分词工具对提取的病理信息中的每条信息进行分词,获得文本词集,如果文本是中文,则采用中文分词器;如果是英文,则使用空格进行分词,且在英文分词完成后使用词干提取的方式归一化时态和单复数;
对分词结果进行噪声词剔除处理,包括去除没有实际意义的字或词,如“的、了、不但、而且、虽然、但是”等,以及一些生僻字和特殊符号,还去除与血液病信息无关的词汇;
使用预先建立的同义词表对特征词集合中的同义词进行替换,使得所有同义词均用一个词来表示,得到训练用特征词集合。
进一步地,对训练用特征词集合中的特征词进行特征选择,如果特征词提取得过多,会造成特征维度过高,不利于分类器训练。
步骤S4、为训练用特征词集合中的特征词生成对应的特征数值,利用计算得到的特征数值对词条进行特征表示。
优选的,采用Hash算法为训练用特征词集合中的每一病理的特征词生成对应的特征数值。
步骤S5、利用步骤S4生成的特征数值训练血液病分类分析模型,得到血液病病理分类器。
本发明中使用的分类分析模型,可以采用朴素贝叶斯(Naive Bayes,NB)分类模型、Logistic回归(Logistic Regression,LR)模型、决策树(Decision Tree,DT)模型、支持向量机(Support Vector Machine,SVM)等。本实施例将血液病进行三级分类,根据实验结果,优选支持向量机(SVM)算法进行血液病的智能分类。
步骤S6、将根据测试集生成的测试用特征数值输入到血液病病理分类器中,分类器模型测试模块将所述测试用特征数值与标准结果进行对比,得到测试结果,即三级分类的准确率;
具体地,采用步骤S2~S4所述的方法生成测试用特征数值;
如果测试结果与预期偏差太大,则需要考虑是数据源出了问题还是特征选取或是算法出了问题,更改分类分析算法或更改特征选取的数量,以对血液病分类分析模型进行调整,重新获得新的血液病分类分析模型,再进行血液病病理分类器测试,并不断调整血液病分类分析模型,直到实验结果达标;
本实施例的测试结果满足我们的预期,分类的准确率达到93%,将血液病病理分类器进行封装,以供用户使用,并定期维护和升级。
步骤S7、接收用户输入的待分类的血液病病例电子数据。
步骤S8、对用户的输入信息进行特征病理信息提取、预处理和生成特征数值的处理,处理方法同步骤S2~S4,得到待分类信息的特征词集合和对应的特征数值。
步骤S9、血液病病理分类器根据待分类信息的特征数值,得出根据用户输入信息的血液病分类结果。
综上所述,本发明实施例提供了一种基于大数据的血液病智能分类系统及方法,使用人工智能的系统和方法对病例数据进行机器学习,而后对新的病例进行智能分类。利用本发明得到的血液病病理分类器对病例进行分类不依赖医生的主观判断和工作经验,针对相对症状的病人可以给出病症的分类,给医生的诊断提供参考,提高了诊断的准确性和及时性。
本领域技术人员可以理解,实现上述实施例方法的全部或部分流程,可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于计算机可读存储介质中。其中,所述计算机可读存储介质为磁盘、光盘、只读存储记忆体或随机存储记忆体等。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。

Claims (10)

1.一种基于大数据的血液病智能分类系统,其特征在于,包括服务器、信息输入装置和显示装置;
所述信息输入装置用于用户输入诊断为血液病的病例历史电子数据和待分类的血液病病例电子数据;
所述服务器包括数据采集模块、数据存储模块、数据分割模块、特征病理信息提取模块、数据预处理模块、特征数值生成模块、分类器模型训练模块、分类器模型测试模块和病例分类模块,用于训练血液病病理分类器,并利用训练好的血液病病理分类器对用户输入的待分类的血液病病例电子数据进行分类,得到血液病分类结果;
所述显示装置用于对血液病分类结果进行显示。
2.根据权利要求1所述的系统,其特征在于,所述数据采集模块用于获取诊断为血液病的病例历史电子数据和待分类的血液病病例电子数据,并存储到数据存储模块;
所述数据分割模块用于将电子数据分割为训练集和测试集;
所述特征病理信息提取模块用于提取训练集和测试集中的每个病例的特征病理信息,将提取的特征病理信息逐个与预先判定的血液病分类结果对应;
所述数据预处理模块用于对训练集和测试集中的特征病理信息进行预处理,生成训练用和测试用特征词集合;
所述特征数值生成模块用于为训练用和测试用特征词集合中的特征词生成对应的特征数值,利用计算得到的特征数值对词条进行特征表示;
所述分类器模型训练模块用于训练血液病分类分析模型,得到血液病病理分类器;
所述病例分类模块用于根据待分类信息的特征数值,利用血液病病理分类器得出根据用户输入信息的血液病分类结果。
3.根据权利要求1所述的系统,其特征在于,所述预处理包括分词、噪声词剔除和同义词处理操作,生成训练用和测试用特征词集合。
4.根据权利要求3所述的系统,其特征在于,使用分词工具对提取的病理信息中的每条信息进行分词,获得文本词集。
5.根据权利要求3或4所述的系统,其特征在于,对分词结果进行噪声词剔除处理,包括去除没有实际意义的字或词,以及生僻字和特殊符号,还去除与血液病信息无关的词汇。
6.根据权利要求5所述的系统,其特征在于,噪声词剔除处理通过建立噪声词表的方式进行匹配和剔除。
7.根据权利要求5所述的系统,其特征在于,使用预先建立的同义词表对特征词集合中的同义词进行替换,使得所有同义词均用一个词来表示,得到训练用和测试用特征词集合。
8.根据权利要求7所述的系统,其特征在于,对训练用特征词集合中的特征词进行特征选择。
9.根据权利要求1所述的系统,其特征在于,采用Hash算法为训练用和测试用特征词集合中的每一病理的特征词生成对应的特征数值。
10.一种基于大数据的血液病智能分类方法,其特征在于,包括以下步骤:
步骤S1、数据采集模块获取诊断为血液病的病例历史电子数据,并存储到数据存储模块;
步骤S2、特征病理信息提取模块提取训练集中的每个病例的特征病理信息,将提取的特征病理信息逐个与预先判定的血液病分类结果对应;
步骤S3、对训练集中的特征病理信息进行预处理,生成训练用特征词集合;
步骤S4、为训练用特征词集合中的特征词生成对应的特征数值,利用计算得到的特征数值对词条进行特征表示;
步骤S5、利用步骤S4生成的特征数值训练血液病分类分析模型,得到血液病病理分类器;
步骤S6、将根据测试集生成的测试用特征数值输入到血液病病理分类器中,分类器模型测试模块将所述测试用特征数值与标准结果进行对比,得到测试结果;
步骤S7、接收用户输入的待分类的血液病病例电子数据;
步骤S8、对用户的输入信息进行特征病理信息提取、预处理和生成特征数值的处理,得到待分类信息的特征词集合和对应的特征数值;
步骤S9、血液病病理分类器根据待分类信息的特征数值,得出根据用户输入信息的血液病分类结果。
CN201710113828.1A 2017-02-28 2017-02-28 一种基于大数据的血液病智能分类系统及方法 Pending CN106934223A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710113828.1A CN106934223A (zh) 2017-02-28 2017-02-28 一种基于大数据的血液病智能分类系统及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710113828.1A CN106934223A (zh) 2017-02-28 2017-02-28 一种基于大数据的血液病智能分类系统及方法

Publications (1)

Publication Number Publication Date
CN106934223A true CN106934223A (zh) 2017-07-07

Family

ID=59424358

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710113828.1A Pending CN106934223A (zh) 2017-02-28 2017-02-28 一种基于大数据的血液病智能分类系统及方法

Country Status (1)

Country Link
CN (1) CN106934223A (zh)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107945871A (zh) * 2017-12-19 2018-04-20 贵州医科大学附属医院 一种基于大数据的血液病智能分类系统
CN108154928A (zh) * 2017-12-27 2018-06-12 北京嘉和美康信息技术有限公司 一种疾病诊断方法及装置
CN108735295A (zh) * 2018-05-14 2018-11-02 平安科技(深圳)有限公司 基于回归树模型的血液分析方法及终端设备
CN109585015A (zh) * 2019-01-21 2019-04-05 兰州大学 一种淋巴瘤病理类型智能分类系统和方法
CN110008323A (zh) * 2019-03-27 2019-07-12 北京百分点信息科技有限公司 一种半监督学习结合集成学习的问题等价性判别的方法
CN110097965A (zh) * 2018-01-30 2019-08-06 深圳市帝迈生物技术有限公司 基于血液细胞分析仪的结果数据分析方法及装置
CN110245272A (zh) * 2019-06-17 2019-09-17 上海米帝信息技术有限公司 一种血液病病例数据库生成系统
CN111681756A (zh) * 2020-05-29 2020-09-18 吾征智能技术(北京)有限公司 基于痰液性状认知的疾病征兆预测系统
CN111710410A (zh) * 2020-05-29 2020-09-25 吾征智能技术(北京)有限公司 一种基于青筋固定部位征兆的疾病推测系统
CN112133390A (zh) * 2020-09-17 2020-12-25 吾征智能技术(北京)有限公司 一种基于电子病历的肝病认知系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1477581A (zh) * 2003-07-01 2004-02-25 �Ϻ���ͨ��ѧ 一种适用于计算机辅助医疗诊断的预测建模方法
CN104915561A (zh) * 2015-06-11 2015-09-16 万达信息股份有限公司 疾病特征智能匹配方法
CN106095996A (zh) * 2016-06-22 2016-11-09 量子云未来(北京)信息科技有限公司 用于文本分类的方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1477581A (zh) * 2003-07-01 2004-02-25 �Ϻ���ͨ��ѧ 一种适用于计算机辅助医疗诊断的预测建模方法
CN104915561A (zh) * 2015-06-11 2015-09-16 万达信息股份有限公司 疾病特征智能匹配方法
CN106095996A (zh) * 2016-06-22 2016-11-09 量子云未来(北京)信息科技有限公司 用于文本分类的方法

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107945871A (zh) * 2017-12-19 2018-04-20 贵州医科大学附属医院 一种基于大数据的血液病智能分类系统
CN108154928A (zh) * 2017-12-27 2018-06-12 北京嘉和美康信息技术有限公司 一种疾病诊断方法及装置
CN110097965A (zh) * 2018-01-30 2019-08-06 深圳市帝迈生物技术有限公司 基于血液细胞分析仪的结果数据分析方法及装置
CN108735295A (zh) * 2018-05-14 2018-11-02 平安科技(深圳)有限公司 基于回归树模型的血液分析方法及终端设备
WO2019218483A1 (zh) * 2018-05-14 2019-11-21 平安科技(深圳)有限公司 基于回归树模型的血液分析方法、装置、终端设备及可读存储介质
CN108735295B (zh) * 2018-05-14 2024-01-26 平安科技(深圳)有限公司 基于回归树模型的血液分析方法及终端设备
CN109585015A (zh) * 2019-01-21 2019-04-05 兰州大学 一种淋巴瘤病理类型智能分类系统和方法
CN110008323B (zh) * 2019-03-27 2021-04-23 北京百分点科技集团股份有限公司 一种半监督学习结合集成学习的问题等价性判别的方法
CN110008323A (zh) * 2019-03-27 2019-07-12 北京百分点信息科技有限公司 一种半监督学习结合集成学习的问题等价性判别的方法
CN110245272A (zh) * 2019-06-17 2019-09-17 上海米帝信息技术有限公司 一种血液病病例数据库生成系统
CN111710410A (zh) * 2020-05-29 2020-09-25 吾征智能技术(北京)有限公司 一种基于青筋固定部位征兆的疾病推测系统
CN111681756A (zh) * 2020-05-29 2020-09-18 吾征智能技术(北京)有限公司 基于痰液性状认知的疾病征兆预测系统
CN112133390A (zh) * 2020-09-17 2020-12-25 吾征智能技术(北京)有限公司 一种基于电子病历的肝病认知系统
CN112133390B (zh) * 2020-09-17 2024-03-22 吾征智能技术(北京)有限公司 一种基于电子病历的肝病认知系统

Similar Documents

Publication Publication Date Title
CN106934223A (zh) 一种基于大数据的血液病智能分类系统及方法
Ramírez-Cifuentes et al. Detection of suicidal ideation on social media: multimodal, relational, and behavioral analysis
Chiu et al. Multimodal depression detection on instagram considering time interval of posts
Ren et al. Ensemble based adaptive over-sampling method for imbalanced data learning in computer aided detection of microaneurysm
Abir et al. [Retracted] Explainable AI in Diagnosing and Anticipating Leukemia Using Transfer Learning Method
US11675896B2 (en) Using multimodal model consistency to detect adversarial attacks
Carchiolo et al. Medical prescription classification: a NLP-based approach
CN110263169A (zh) 一种基于卷积神经网络和关键词聚类的热点事件检测方法
CN108009135A (zh) 生成文档摘要的方法和装置
Ranjan et al. Document classification using lstm neural network
Al Sulaimani et al. Short text classification using contextual analysis
Johnson et al. Hcpcs2vec: Healthcare procedure embeddings for medicare fraud prediction
CN106951917A (zh) 一种淋巴瘤病理类型的智能分类系统和方法
Ullah et al. Detecting High‐Risk Factors and Early Diagnosis of Diabetes Using Machine Learning Methods
Chen et al. Developing a more responsive radiology resident dashboard
Khan et al. Computational approach for detection of diabetes from ocular scans
Atoum Detecting cyberbullying from tweets through machine learning techniques with sentiment analysis
Dubey et al. Smart Underwriting System: An Intelligent Decision Support System for Insurance Approval & Risk Assessment
Kužina et al. CASSED: context-based approach for structured sensitive data detection
KR102198454B1 (ko) 기계 학습에 기반한 건강 검진 항목 추천 시스템 및 방법
Marerngsit et al. A two-stage text-to-emotion depressive disorder screening assistance based on contents from online community
Gokhale et al. Deploying a co-training algorithm to classify human-rights abuses
Yan et al. An interactive visual analytics system for incremental classification based on semi-supervised topic modeling
Sathish et al. Enhanced sentimental analysis using visual geometry group network-based deep learning approach
Agombar et al. A clustering backed deep learning approach for document layout analysis

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20170707