CN110021439A - 基于机器学习的医疗数据分类方法、装置和计算机设备 - Google Patents

基于机器学习的医疗数据分类方法、装置和计算机设备 Download PDF

Info

Publication number
CN110021439A
CN110021439A CN201910171593.0A CN201910171593A CN110021439A CN 110021439 A CN110021439 A CN 110021439A CN 201910171593 A CN201910171593 A CN 201910171593A CN 110021439 A CN110021439 A CN 110021439A
Authority
CN
China
Prior art keywords
medical
text
record information
data
vector
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910171593.0A
Other languages
English (en)
Other versions
CN110021439B (zh
Inventor
陈娴娴
阮晓雯
徐亮
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Technology Shenzhen Co Ltd
Original Assignee
Ping An Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Technology Shenzhen Co Ltd filed Critical Ping An Technology Shenzhen Co Ltd
Priority to CN201910171593.0A priority Critical patent/CN110021439B/zh
Priority to SG11202008485XA priority patent/SG11202008485XA/en
Priority to PCT/CN2019/090873 priority patent/WO2020177230A1/zh
Priority to JP2021506440A priority patent/JP7162726B2/ja
Publication of CN110021439A publication Critical patent/CN110021439A/zh
Priority to US17/165,665 priority patent/US20210257066A1/en
Application granted granted Critical
Publication of CN110021439B publication Critical patent/CN110021439B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/284Lexical analysis, e.g. tokenisation or collocates
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/20Ensemble learning
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/60ICT specially adapted for the handling or processing of patient-related medical or healthcare data for patient-specific data, e.g. for electronic patient records
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/70ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H70/00ICT specially adapted for the handling or processing of medical references
    • G16H70/20ICT specially adapted for the handling or processing of medical references relating to practices or guidelines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/01Dynamic search techniques; Heuristics; Dynamic trees; Branch-and-bound

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • Public Health (AREA)
  • Data Mining & Analysis (AREA)
  • Primary Health Care (AREA)
  • Epidemiology (AREA)
  • Artificial Intelligence (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Computational Linguistics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Pathology (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • Bioethics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Medical Treatment And Welfare Office Work (AREA)

Abstract

本申请涉及一种基于机器学习的医疗数据分类方法、装置和计算机设备。所述方法包括:接收终端发送的医疗数据分类请求,医疗数据分类请求包括病历信息;对病历信息进行分词处理,得到多个文本向量;对多个文本向量进行特征提取,得到多个文本向量以及对应的特征维度值;获取目标分类器,目标分类器基于对多个医疗数据进行训练得到,通过目标分类器的多个神经网络节点对多个文本向量以及对应的特征维度值进行遍历计算;直到遍历至多个文本向量对应的目标节点,根据目标节点计算多个文本向量对应的类别概率,根据类别概率得到病历信息对应的类别结果;将病历信息对应的类别结果推送至终端。采用本方法能够有效提高医疗数据分类准确率。

Description

基于机器学习的医疗数据分类方法、装置和计算机设备
技术领域
本申请涉及计算机技术领域,特别是涉及一种基于机器学习的医疗数据分类方法、装置和计算机设备。
背景技术
近年来,癌症患病率不断在增加,癌症作为一个重要的健康问题,对于癌症的早期诊断和治疗能够使得癌症病人的存活率显著升高。随着计算机技术和医疗技术的迅速发展,出现了一些对大量医疗数据进行智能分类的方式,例如从医案书籍中提取单片医案中的结构化词表,并建立医案主题模型,并对医案主题进行训练得到相应的类别。或者利用先验知识对输入样本进行训练,进而对癌症类型进行分类,有助于减轻医务人员的劳动强度。
传统的医疗数据分类方式中,分类分析的数据大多是采用已有的固定的数据,数据来源比较有限,无法对用户实际的病历信息进行分类分析,而病历信息多为较繁杂和具体的病历分析、记录文本,由于医学文本的特殊性,病历信息中的词汇的偏差将会导致语义的完全不一致,对文本提取的准确性较低,进而导致对病历信息等医疗数据分类的准确率较低。因此,如何有效提高医疗数据的分类准确率成为目前需要解决的技术问题。
发明内容
基于此,有必要针对上述技术问题,提供一种能够有效提高医疗数据分类准确率基于机器学习的医疗数据分类方法、装置、计算机设备和存储介质。
一种基于机器学习的医疗数据分类方法,所述方法包括:
接收终端发送的医疗数据分类请求,所述医疗数据分类请求包括病历信息;
对所述病历信息进行分词处理,得到多个文本向量;
对所述多个文本向量进行特征提取,得到多个文本向量以及对应的特征维度值;
获取目标分类器,通过所述目标分类器的多个神经网络节点对所述多个文本向量以及对应的特征维度值进行遍历计算;所述目标分类器基于对多个医疗数据进行训练得到;
直到遍历至所述多个文本向量对应的目标节点,根据所述目标节点计算所述多个文本向量对应的类别概率,根据所述类别概率得到所述病历信息对应的类别结果;
将所述病历信息对应的类别结果推送至所述终端。
在其中一个实施例中,所述病历信息中包括多个文本数据,所述对所述病历信息进行分词处理的步骤包括:获取预设的医疗词库,将所述病历信息中的多个文本数据与所述医疗词库进行匹配,提取达到预设匹配度的文本数据;根据匹配后的文本数据对所述病历信息进行分词,得到分词后的多个文本数据;对所述分词后的多个文本数据进行向量化,得到多个文本向量。
在其中一个实施例中,所述对所述多个文本向量进行特征提取,得到多个文本向量以及对应的特征维度值的步骤包括:根据预设算法计算多个文本向量的权重;提取出所述权重达到预设阈值的文本向量;根据预设算法和所述权重计算所述文本向量对应的特征维度值。
在其中一个实施例中,构建所述目标分类器的步骤包括:获取多个医疗数据,根据所述多个医疗数据生成对应的训练集数据和验证集数据;对所述训练集数据中的多个医疗数据进行聚类分析,得到聚类结果;对所述聚类结果进行特征提取,提取出多个特征变量;获取预设的神经网络模型,通过所述神经网络模型对所述训练集数据进行训练,得到多个特征变量对应的特征维度值和权重,根据多个特征变量对应的特征维度值和权重构建初始分类器;利用所述验证集数据对所述分类器进行进一步训练和验证,直到所述验证集数据中满足预设阈值的数量达到预设比值时,则停止训练,得到所需的目标分类器。
在其中一个实施例中,所述文本中包括多个词句,所述多个文本组成文本块,所述通过所述目标分类器的多个神经网络节点对所述多个文本向量以及对应的特征维度值进行遍历计算多个文本向量对应的类别步骤包括:根据所述特征维度值计算所述多个文本向量之间的相关性,根据所述相关性计算所述多个文本向量对应的句向量;提取所述句向量的特征,根据所述多个句向量的特征计算出文本块向量;计算所述文本块向量对应每个类别的概率,提取达到预设概率值的类别,并对所述文本块添加对应的类别标签。
在其中一个实施例中,所述方法还包括:根据预设频率从预设数据库中获取多个历史医疗数据;对多个历史医疗数据进行聚类分析,得到分析结果;根据所述分析结果进行特征选择,得到多个特征变量;根据预设的算法计算多个特征变量的权重;根据多个特征变量和对应的权重对所述目标分类器进行优化调整。
一种基于机器学习的医疗数据分类装置,所述装置包括:
请求接收模块,用于接收终端发送的医疗数据分类请求,所述医疗数据分类请求包括病历信息;
分词处理模块,用于对所述病历信息进行分词处理,得到多个文本向量;
特征提取模块,用于对所述多个文本向量进行特征提取,得到多个文本向量以及对应的特征维度值;
数据分类模块,用于获取目标分类器,通过所述目标分类器的多个神经网络节点对所述多个文本向量以及对应的特征维度值进行遍历计算;所述目标分类器基于对多个医疗数据进行训练得到;直到遍历至所述多个文本向量对应的目标节点,根据所述目标节点计算所述多个文本向量对应的类别概率,根据所述类别概率得到所述病历信息对应的类别结果;
数据推送模块,用于将所述病历信息对应的类别结果推送至所述终端。
在其中一个实施例中,所述分词处理模块还用于获取预设的医疗词库,将所述病历信息中的多个文本数据与所述医疗词库进行匹配,提取达到预设匹配度的文本数据;根据匹配后的文本数据对所述病历信息进行分词,得到分词后的多个文本数据;对所述分词后的多个文本数据进行向量化,得到多个文本向量。
一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现本申请任意一个实施例中提供的基于机器学习的医疗数据分类方法的步骤。
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现本申请任意一个实施例中提供的基于机器学习的医疗数据分类方法的步骤。
上述基于机器学习的医疗数据分类方法、装置、计算机设备和存储介质,服务器接收终端发送的医疗数据分类请求后,对医疗数据分类请求中携带的病历信息进行分词处理,由此能够有效地根据医疗领域进行分词得到多个文本向量,服务器进而对多个文本向量进行特征提取,能够有效地提取出多个文本向量以及对应的特征维度值。服务器则进一步获取目标分类器,目标分类器基于对多个医疗数据进行训练得到,通过目标分类器的多个神经网络节点对得到多个文本向量以及对应的特征维度值进行遍历计算,直到遍历至多个文本向量对应的目标节点,根据目标节点计算多个文本向量对应的类别概率,根据类别概率得到病历信息对应的类别结果,由此能够有效得到病历信息对应的类别结果,通过预先训练构建的分类器对提取的文本数据进行分类,从而有效地提高了病历信息的分类准确率。服务器则将病历信息对应的类别结果推送至对应的终端。由此能够有利于医务人员根据推送的病历信息对应的类别结果进行有效地决策,通过对病历信息进行准确地分类,进而能够有效提高医疗数据的处理效率。
附图说明
图1为一个实施例中基于机器学习的医疗数据分类方法的应用场景图;
图2为一个实施例中基于机器学习的医疗数据分类方法的流程示意图;
图3为一个实施例中对病历信息进行分词处理步骤的流程示意图;
图4为一个实施例中构建目标分类器步骤的流程示意图;
图5为一个实施例中基于机器学习的医疗数据分类装置的结构框图;
图6为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
本申请提供的基于机器学习的医疗数据分类方法,可以应用于如图1所示的应用环境中。其中,终端102通过网络与服务器104通过网络进行通信。医务人员可以利用对应的终端102向服务器104发送医疗数据分类请求,医疗数据分类请求中包括了病历信息。服务器104接收终端102发送的医疗数据分类请求后,对病历信息进行分词处理,得到多个文本向量,服务器104进而对多个文本向量进行特征提取,得到多个文本向量以及对应的特征维度值。服务器104则进一步获取目标分类器,目标分类器基于对多个医疗数据进行训练得到,通过目标分类器的多个神经网络节点对得到多个文本向量以及对应的特征维度值进行分类分析,由此能够有效得到病历信息对应的类别结果,服务器104并将病历信息对应的类别结果推送至对应的终端102。通过对病历信息进行有效地分词和特征提取,并利用预先训练构建的分类器对提取的文本数据进行分类,从而有效地提高了病历信息的分类准确率。其中,终端102可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备,服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
在一个实施例中,如图2所示,提供了一种基于机器学习的医疗数据分类方法,以该方法应用于图1中的服务器为例进行说明,包括以下步骤:
步骤202,接收终端发送的医疗数据分类请求,医疗数据分类请求包括病历信息。
其中,病历信息可以包括就医人员的身份标识、资本资料、病史记录信息和历史诊断信息等。医务人员在对就医人员进行诊断的时候,可以利用对应的终端获取就医人员的病历信息,病历信息可以包括医务人员输入的信息,也可以包括根据就医人员的身份标识从数据库获取的病历信息。终端获取该就医人员的病历信息后,则根据病历信息向服务器发送医疗数据分类请求,医疗数据分类请求中包括了病历信息和身份标识。
进一步地,服务器还可以根据就医人员的身份标识从第三方数据库获取该就医人员的历史病历信息,例如该就医人员在其他地方就医的病历信息,以有效获取该就医人员对应的完整的病历信息。
步骤204,对病历信息进行分词处理,得到多个文本向量。
服务器对病历信息进行分词处理之前,可以获取大量的医疗数据,并对获取的大量的医疗数据进行语义分析,例如可以通过预设的语义分析模型对大量的医疗数据进行语义分析,得到多个类型的医疗词汇。服务器进而利用分析得到的医疗词汇生成医疗领域内多个类型对应的医疗词库。
服务器接收到终端发送的医疗数据分类请求后,则对病历信息进行分词处理。具体地,服务器获取预设的医疗词库,医疗词库中包括了大量的医疗词汇和对应的向量。服务器则将病历信息中的多个文本数据与医疗词库中多个医疗词汇进行匹配,具体地,服务器可以通过预设的距离算法计算病历信息中文本数据和医疗词汇之间的相似度,进而计算出病历信息中的文本数据与医疗词汇的匹配度。服务器进一步提取出达到预设匹配度的文本数据。服务器则根据匹配后的文本数据对病历信息进行分词,得到分词后的多个文本数据。服务器进一步对分词后的多个文本数据进行向量化,将文本数据转换为对应的量化信息,得到多个文本数据对应的多个文本向量。
步骤206,对多个文本向量进行特征提取,得到多个文本向量以及对应的特征维度值。
服务器对病历信息对应的文本向量进行分词,得到多个文本向量后,进一步对文本数据进行特征提取。服务器根据预设算法计算分词后的多个文本向量的权重。例如,服务器可以通过TF-IDF算法计算多个文本向量的TF值和IDF值,TF词频(Term Frequency),表示文本向量在文档中出现的频率。IDF逆向文件频率(Inverse Document Frequency),指词语普遍重要性的度量。并根据多个词的TF值和IDF值计算多个对应的权重,例如通过计算TF值和IDF值的乘积可以得到文本向量对应的权重,服务器进而根据文本向量的权重对文本向量进行特征提取,则提取出达到预设阈值的文本向量。
服务器提取出达到预设阈值的文本向量后,则根据预设算法和文本向量的权重计算出多个文本向量的特征维度值,特征维度值可以表示文本向量所属的特征维度。通过计算出文本向量的权重,由此根据权重对文本向量进行过滤,从而能够有效地对文本向量进行特征提取,并得到文本向量对应的特征维度值。
步骤208,获取目标分类器,通过目标分类器的多个神经网络节点对多个文本向量以及对应的特征维度值进行遍历计算;目标分类器基于对多个医疗数据进行训练得到。
步骤210,直到遍历至多个文本向量对应的目标节点,根据目标节点计算多个文本向量对应的类别概率,根据类别概率得到病历信息对应的类别结果。
其中,服务器在获取目标分类器之前,还可以预先构建和训练得到目标分类器。具体地,服务器可以预先从本地数据库或第三方数据库中获取大量的医疗数据,根据多个医疗数据生成对应的训练集数据和验证集数据。服务器对医疗数据对应的多个字段数据进行向量化,得到多个文本数据对应的特征向量,并将特征向量转换为对应的特征变量。服务器进而采用预设的聚类算法对训练集数据对应的特征变量进行聚类分析,提取出达到预设阈值的特征变量。服务器则获取预设的神经网络模型,通过神经网络模型对训练集数据进行训练,得到多个特征变量对应的特征维度值和权重,根据多个特征变量对应的特征维度值和权重构建初始分类器。利用验证集数据对分类器进行进一步训练和验证,直到验证集数据中满足预设阈值的数量达到预设比值时,则停止训练,得到所需的目标分类器。
服务器对文本数据进行特征提取,得到多个文本数据对应的多维度向量后,则获取已经训练好的目标分类器,将多个文本向量以及对应的维度特征值输入至明白分类器中,其中,目标分类器中包括多个预设的神经网络层节点和对应的节点权重。通过目标分类器中的多个节点预设损失函数对多个文本向量以及对应的维度特征值进行遍历计算,直到得到多个文本词向量对应的目标节点,根据目标节点计算多个文本向量对应的类别概率,根据类别概率得到文本向量对应的类别结果,进而得到病历信息对应的类别结果。
步骤212,将病历信息对应的类别结果推送至终端。
服务器通过目标分类器对病历信息进行分类,得到病历信息对应的类别结果后,则将病历信息对应的类别结果推送至对应的终端。通过对病历信息进行有效地分词和特征提取,并利用预先训练构建的目标分类器对提取的文本信息进行分类,能够有效地提高病历信息的分类准确率,由此能够有利于医务人员根据推送的病历信息对应的类别结果进行有效地诊断,进而有效提高了医务人员的诊断效率。
例如,病历信息中包括了就医人员对应的历史病历记录信息,包括多个历史症状描述、历史处方信息、历史诊断信息等数据。通过对病历信息进行多次筛选和文本提取后,利用预先训练的目标分类器对提取出的文本进行分类分析,当对该就医人员的病历信息中所有数据进行分类分析后,得到该病历信息所对应的类别结果,例如当就医人员患病为癌症时,则可以分类得到具体的癌症类别。
上述基于机器学习的医疗数据分类方法中,服务器接收终端发送的医疗数据分类请求后,对医疗数据分类请求中携带的病历信息进行分词处理,由此能够有效地根据医疗领域进行分词得到多个文本向量,服务器进而对多个文本向量进行特征提取,能够有效地提取出得到多个文本向量以及对应的特征维度值。服务器则进一步获取目标分类器,目标分类器基于对多个医疗数据进行训练得到,通过目标分类器的多个神经网络节点对得到多个文本向量以及对应的特征维度值进行遍历计算,直到遍历至多个文本向量对应的目标节点,根据目标节点计算多个文本向量对应的类别概率,根据类别概率得到病历信息对应的类别结果,由此能够有效得到病历信息对应的类别结果,通过预先训练构建的分类器对提取的文本数据进行分类,从而有效地提高了病历信息的分类准确率。服务器则将病历信息对应的类别结果推送至对应的终端。由此能够有利于医务人员根据推送的病历信息对应的类别结果进行有效地决策,通过对病历信息进行准确地分类,进而能够有效提高医疗数据的处理效率。
在一个实施例中,如图3所示,病历信息中包括了多个文本数据,对病历信息进行分词处理的步骤,具体包括以下内容:
步骤302,获取预设的医疗词库,将病历信息中的多个文本数据与医疗词库进行匹配,提取达到预设匹配度的文本数据。
步骤304,根据匹配后的文本数据对病历信息进行分词,得到分词后的多个文本数据。
步骤306,对分词后的多个文本数据进行向量化,得到对应的多个文本向量。
服务器对医疗数据进行处理之前,可以预先建立医疗词库。具体地,服务器可以获取大量的医疗数据,并对获取的大量的医疗数据进行语义分析,例如可以通过预设的语义分析模型对大量的医疗数据进行语义分析,得到多个类型的医疗词汇。服务器进而利用分析得到的医疗词汇生成医疗领域内多个类型对应的医疗词库。
医务人员可以利用对应的终端向服务器发送医疗数据分类请求,医疗数据分类请求中包括了病历信息。服务器接收终端发送的医疗数据分类请求后,对医疗数据分类请求中的病历信息进行分词处理。具体地,服务器获取预设的医疗词库,医疗词库中包括了大量的医疗词汇和对应的向量。服务器则将病历信息中的多个文本数据与医疗词库中多个医疗词汇进行匹配,具体地,服务器可以通过预设的距离算法计算病历信息中文本数据和医疗词汇之间的相似度,进而计算出病历信息中的文本数据与医疗词汇的匹配度。服务器进一步提取出达到预设匹配度的文本数据。服务器则根据匹配后的文本数据对病历信息进行分词,得到分词后的多个文本数据。
服务器进一步对分词后的多个文本数据进行向量化,将文本数据转换为对应的量化信息,得到多个文本数据对应的多个文本向量。例如,可以通过Doc2Vec与Word2Vec算法对分词后的多个文本数据进行词向量化和段落向量化,进而得到对应的文本向量。其中,文本向量可以包括字向量、词向量和句向量等。
服务器得到多个文本数据对应的文本向量后,根据预设算法计算出文本向量的特征维度值,并对多个文本向量进行特征提取,得到多个文本向量和对应的特征维度值。服务器则进一步获取预设的分类器,通过分类器对多个文本向量以及对应的特征维度值进行分类分析,由此能够有效得到病历信息对应的类别结果,服务器并将病历信息对应的类别结果推送至对应的终端。通过对病历信息进行有效地分词和特征提取,并利用预先训练构建的分类器对提取的文本信息进行分类,能够有效地提高病历信息的分类准确率,由此能够有利于医务人员根据推送的病历信息对应的类别结果进行有效地诊断。
在一个实施例中,对多个文本数据进行特征提取,得到多个文本向量对应的多维度向量的步骤包括:根据预设算法计算多个文本向量的权重;提取出权重达到预设阈值的文本向量;根据预设算法和权重计算文本向量对应的特征维度值。
医务人员可以利用对应的终端向服务器发送医疗数据分类请求,医疗数据分类请求中包括了病历信息。服务器接收终端发送的医疗数据分类请求后,对医疗数据分类请求中的病历信息进行分词处理,得到多个文本向量。
服务器得到病历信息对应的多个文本向量后,根据预设算法计算分词后的多个文本向量的权重。例如,服务器可以通过TF-IDF算法计算多个文本向量的TF值和IDF值,TF词频(Term Frequency),表示文本向量出现的频率。IDF逆向文件频率(Inverse DocumentFrequency),可以表示词语普遍重要性的度量。并根据多个词的TF值和IDF值计算多个对应的权重,例如通过计算TF值和IDF值的乘积可以得到文本数据对应的权重。
例如,可以用如下公式计算多个文本向量的TF值:
计算文本向量的IDF值的公式可以如下:
计算文本向量权重的公式可以如下:
tfidfi,j=tfi,j×idfi,j
如果包含文本向量t的文档越少,也就是n越小,IDF越大,则说明文本向量t具有很好的类别区分能力。如果某一类文档C中包含词条t的文档数为m,而其它类包含t的文档总数为k,显然所有包含t的文档数n=m+k,当m大的时候,n也大,按照IDF公式得到的IDF的值会小,就说明该词条t类别区分能力不强。如果一个词条在一个类的文档中频繁出现,则说明该词条能够很好代表这个类的文本的特征,则该词条具有较高的权重。通过计算TF与IDF的乘积,进而计算出文本向量的权重,服务器进而根据文本向量的权重对文本向量进行特征提取,则提取出达到预设阈值的文本向量。
服务器提取出达到预设阈值的文本向量后,则根据预设算法和文本向量的权重计算出多个文本向量的特征维度值,特征维度值可以表示文本向量所属的特征维度。文本向量可以包括多个特征维度,服务器计算出文本向量的权重后,则可以利用权重对文本向量的特征维度的重要程度进行计算,进而得到文本向量对应的特征维度值。通过计算出文本向量的权重,由此根据权重对文本文本向量进行过滤,从而能够有效地对文本向量进行特征提取,并得到文本向量对应的特征维度值。
在一个实施例中,如图4所示,获取目标分类器之前,还包括构建目标分类器的步骤,该步骤具体包括以下内容:
步骤402,获取多个医疗数据,根据多个医疗数据生成对应的训练集数据和验证集数据。
服务器在获取目标分类器之前,还需要构建和训练出目标分类器。具体地,服务器可以预先从本地数据库或第三方数据库中获取大量的医疗数据,医疗数据可以包括医疗诊断信息、临床数据以及调研数据等。服务器则将大量的医疗数据生成训练集数据和验证集数据,其中,训练集数据可以是经过人工标注后的数据。
步骤404,对训练集数据中的多个医疗数据进行聚类分析,得到聚类结果。
步骤406,对聚类结果进行特征提取,提取出多个特征变量。
步骤408,获取预设的神经网络模型,通过神经网络模型对训练集数据进行训练,得到多个特征变量对应的特征维度值和权重,根据多个特征变量对应的特征维度值和权重构建初始分类器。
步骤410,利用验证集数据对分类器进行进一步训练和验证,直到验证集数据中满足预设阈值的数量达到预设比值时,则停止训练,得到所需的目标分类器。
服务器首先对训练集数据中的医疗数据进行数据清洗和数据预处理,具体地,服务器对医疗数据对应的多个字段数据进行向量化,得到多个文本数据对应的特征向量,并将特征向量转换为对应的特征变量。服务器进一步对特征变量进行衍生处理,得到处理后的多个特征变量。如对特征变量进行缺失值填充、异常值抽取更替等。
服务器进而采用预设的聚类算法对训练集数据对应的特征变量进行聚类分析。例如,预设的聚类算法可以为k-means(k-均值算法)聚类的方法。服务器通过对特征变量进行多次聚类后得到多个聚类结果。服务器并根据预设算法计算多个特征变量之间的相似度,提取出相似度达到预设阈值的特征变量。
例如,服务器可以对多个聚类结果内的特征变量分别进行组合,得到多个组合特征变量。获取目标变量,利用目标变量对多个组合特征变量进行相关性检验。检验通过时,对组合特征变量添加交互标签。利用添加交互标签后的组合特征变量解析对应的特征变量。添加交互标签后的组合特征变量可以为达到预设阈值的特征变量,服务器则提取出达到预设阈值特征变量。通过对特征变量进行特征处理和特征提取,能够有效地提取出有价值的特征变量。
服务器则获取预设的机器学习模型,例如可以是基于决策树的Xgboot机器学习模型。例如,机器学习模型中包括多个神经网络模型,神经网络模型可以包括预设的输入层、多个LSTM层、dropout层和输出层。神经网络模型中包括多个网络节点,其中每一层网络节点的舍弃率可以为0.2。神经网络模型的LSTM层包括激活函数以及损失函数,通过LSTM层输出的完全连接人工神经网络也包括对应的激活函数。神经网络模型中还包括确定误差的计算方式,例如可以采用均方误差算法;还包括确定权重参数的迭代更新方式,例如可以采用RMSprop算法。神经网络模型中还可以包括一层普通的神经网络层,用于输出结果的降维。
服务器获取预设的神经网络模型后,进一步将训练集数据中的医疗数据输入至神经网络模型中进行学习和训练。服务器通过对训练集中的大量医疗数据进行训练后,可以得到得到多个特征变量对应的特征维度值和权重,进而根据多个特征变量对应的特征维度值和权重构建初始分类器。
服务器得到初始分类器后,则获取验证集数据,通过验证集数据中的大量医疗数据对构建的初始分类器进行训练和验证。直到验证集数据中满足预设阈值的数量达到预设比值时,则停止训练,进而得到训练完成的目标分类器。通过对大量的医疗数据进行训练和学习,进而能够有效构建出预测准确率较高的分类器,从而有效提高了医疗数据的分类准确率。
在一个实施例中,文本中包括多个词句,多个文本组成文本块,通过分类器的多个神经网络节点对多个文本向量以及对应的特征维度值进行遍历计算多个文本向量对应的类别的步骤包括:根据特征维度值计算多个文本向量之间的相关性,根据相关性计算多个文本向量对应的句向量;提取句向量的特征,根据多个句向量的特征计算出文本块向量;计算文本块向量对应每个类别的概率,提取达到预设概率值的类别,并对文本块添加对应的类别标签。
医务人员可以利用对应的终端向服务器发送医疗数据分类请求,医疗数据分类请求中包括了病历信息。服务器接收终端发送的医疗数据分类请求后,对医疗数据分类请求中的病历信息进行分词处理,得到多个文本数据对应的文本向量。服务器进一步对文本向量进行特征提取,得到多个文本向量以及对应的特征维度值。
服务器提取出多个文本向量以及对应的特征维度值后,则获取目标分类器,并将多个文本向量以及对应的特征维度值作为目标分类器的输入。其中,目标分类器中包括多个预设的神经网络层节点和对应的节点权重,通过目标分类器中的多个神经网络层节点对多个文本向量以及对应的特征维度值进行遍历计算。具体地,文本中可以包括多个词语和短句,文本向量可以包括词向量和短语向量。服务器可以首先根据文本向量和对应的维度特征值计算出文本中多个文本向量之间的相关性,进而根据相关性计算文本中成句的句子,并计算出对应的句向量。服务器则提取句向量的特征,并根据多个句向量的特征计算出文本块向量。其中,文本块包括多个句子,文本块向量可以由多个句向量组成。服务器根据多个神经网络层节点中的预设损失函数计算文本块向量属于每个类别的概率,并根据类别概率将多个文本块向量输入至下一个神经网络层节点进行计算,直到得到多个文本块向量对应的目标节点,进而根据目标节点计算得到多个文本块向量对应的类别概率,获取出类别概率最高的类别结果,由此得到多个文本块向量所属的类别结果。通过利用大量数据训练得到的目标分类器对病历信息中的文本向量进行分类,从而能够有效及准确地得到病历信息所属的类别,由此能够有效地提高病历信息的分类准确率。
在一个实施例中,该方法还包括:根据预设频率从预设数据库中获取多个历史医疗数据;对多个历史医疗数据进行聚类分析,得到分析结果;根据分析结果进行特征选择,得到多个特征变量;根据预设的算法计算多个特征变量的权重;根据多个特征变量和对应的权重对分类器进行优化调整。
服务器训练得到目标分类器后,还可以根据预设的频率对分类器进行调参优化。具体地,服务器可以根据预设频率从本地数据库或第三方数据库中获取大量的历史医疗数据,例如预设频率可以为一个月、三个月、六个月等,服务器则可以获取过去一个月、三个月、六个月内的历史医疗数据,历史医疗数据可以包括医疗诊断信息、临床数据以及调研数据等。
服务器首先获取的大量历史医疗数据进行数据清洗和数据预处理,具体地,服务器对历史医疗数据对应的多个字段数据进行向量化,得到多个字段数据对应的特征变量,并对特征变量进行衍生处理,得到处理后的多个特征变量。如对特征变量进行缺失值填充、异常值抽取更替等。
服务器进而采用预设的聚类算法对训练集数据对应的特征变量进行聚类分析。例如,预设的聚类算法可以为k-means(k-均值算法)聚类的方法。服务器通过对特征变量进行多次聚类后得到多个聚类结果。服务器并根据预设算法计算多个特征变量之间的相似度,提取出相似度达到预设阈值的特征变量。
例如,服务器可以对多个聚类结果内的特征变量分别进行组合,得到多个组合特征变量。获取目标变量,利用目标变量对多个组合特征变量进行相关性检验。检验通过时,对组合特征变量添加交互标签。利用添加交互标签后的组合特征变量解析对应的特征变量。添加交互标签后的组合特征变量可以为达到预设阈值的特征变量,服务器则提取出达到预设阈值特征变量。通过对特征变量进行特征处理和特征提取,能够有效地提取出有价值的特征变量。
服务器进一步根据预设的算法计算多个特征变量的权重,进而根据多个特征变量和对应的权重对目标分类器进行优化调整。具体地,服务器可以根据多个特征变量和对应的权重对目标分类器中的参数进行调整,由此能够有效地对目标分类器进行调参优化。
应该理解的是,虽然图2-4的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图2-4中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
在一个实施例中,如图5所示,提供了一种基于机器学习的医疗数据分类装置,包括:请求接收模块502、分词处理模块504、特征提取模块506、数据分类模块508和数据推送模块510,其中:
请求接收模块502,用于接收终端发送的医疗数据分类请求,医疗数据分类请求包括病历信息;
分词处理模块504,用于对病历信息进行分词处理,得到多个文本向量;
特征提取模块506,用于对多个文本向量进行特征提取,得到多个文本向量以及对应的特征维度值;
数据分类模块508,用于获取目标分类器,通过目标分类器的多个神经网络节点对多个文本向量以及对应的特征维度值进行遍历计算;目标分类器基于对多个医疗数据进行训练得到;直到遍历至多个文本向量对应的目标节点,根据目标节点计算多个文本向量对应的类别概率,根据类别概率得到病历信息对应的类别结果;
数据推送模块510,用于将病历信息对应的类别结果推送至终端。
在其中一个实施例中,病历信息中包括多个文本数据,分词处理模块504还用于获取预设的医疗词库,将病历信息中的多个文本数据与医疗词库进行匹配,提取达到预设匹配度的文本数据;根据匹配后的文本数据对病历信息进行分词,得到分词后的多个文本数据;对分词后的多个文本数据进行向量化,得到多个文本向量。
在其中一个实施例中,特征提取模块506还用于根据预设算法计算多个文本向量的权重;提取出权重达到预设阈值的文本向量;根据预设算法和权重计算文本向量对应的特征维度值。
在其中一个实施例中,该装置还包括目标分类器构建模块,用于获取多个医疗数据,根据多个医疗数据生成对应的训练集数据和验证集数据;对训练集数据中的多个医疗数据进行聚类分析,得到聚类结果;对聚类结果进行特征提取,提取出多个特征变量;获取预设的神经网络模型,通过神经网络模型对训练集数据进行训练,得到多个特征变量对应的特征维度值和权重,根据多个特征变量对应的特征维度值和权重构建初始分类器;利用验证集数据对分类器进行进一步训练和验证,直到验证集数据中满足预设阈值的数量达到预设比值时,则停止训练,得到所需的目标分类器。
在其中一个实施例中,文本中包括多个词句,多个文本组成文本块,数据分类模块508还用于根据特征维度值计算多个文本向量之间的相关性,根据相关性计算多个文本向量对应的句向量;提取句向量的特征,根据多个句向量的特征计算出文本块向量;计算文本块向量对应每个类别的概率,提取达到预设概率值的类别,并对文本块添加对应的类别标签。
在其中一个实施例中,该装置还包括目标分类器优化模块,用于根据预设频率从预设数据库中获取多个历史医疗数据;对多个历史医疗数据进行聚类分析,得到分析结果;根据分析结果进行特征选择,得到多个特征变量;根据预设的算法计算多个特征变量的权重;根据多个特征变量和对应的权重对目标分类器进行优化调整。
关于基于机器学习的医疗数据分类装置的具体限定可以参见上文中对于基于机器学习的医疗数据分类方法的限定,在此不再赘述。上述基于机器学习的医疗数据分类装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图6所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储医疗数据、病历信息等数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现本申请任意一个实施例中提供的基于机器学习的医疗数据分类方法的步骤。
本领域技术人员可以理解,图6中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现本申请任意一个实施例中提供的基于机器学习的医疗数据分类方法的步骤。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

Claims (10)

1.一种基于机器学习的医疗数据分类方法,所述方法包括:
接收终端发送的医疗数据分类请求,所述医疗数据分类请求包括病历信息;
对所述病历信息进行分词处理,得到多个文本向量;
对所述多个文本向量进行特征提取,得到多个文本向量以及对应的特征维度值;
获取目标分类器,通过所述目标分类器的多个神经网络节点对所述多个文本向量以及对应的特征维度值进行遍历计算;所述目标分类器基于对多个医疗数据进行训练得到;
直到遍历至所述多个文本向量对应的目标节点,根据所述目标节点计算所述多个文本向量对应的类别概率,根据所述类别概率得到所述病历信息对应的类别结果;
将所述病历信息对应的类别结果推送至所述终端。
2.根据权利要求1所述的方法,其特征在于,所述病历信息中包括多个文本数据,所述对所述病历信息进行分词处理的步骤包括:
获取预设的医疗词库,将所述病历信息中的多个文本数据与所述医疗词库进行匹配,提取达到预设匹配度的文本数据;
根据匹配后的文本数据对所述病历信息进行分词,得到分词后的多个文本数据;
对所述分词后的多个文本数据进行向量化,得到多个文本向量。
3.根据权利要求1所述的方法,其特征在于,所述对所述多个文本向量进行特征提取,得到多个文本向量以及对应的特征维度值的步骤包括:
根据预设算法计算多个文本向量的权重;
提取出所述权重达到预设阈值的文本向量;
根据预设算法和所述权重计算所述文本向量对应的特征维度值。
4.根据权利要求1所述的方法,其特征在于,构建所述目标分类器的步骤包括:
获取多个医疗数据,根据所述多个医疗数据生成对应的训练集数据和验证集数据;
对所述训练集数据中的多个医疗数据进行聚类分析,得到聚类结果;
对所述聚类结果进行特征提取,提取出多个特征变量;
获取预设的神经网络模型,通过所述神经网络模型对所述训练集数据进行训练,得到多个特征变量对应的特征维度值和权重,根据多个特征变量对应的特征维度值和权重构建初始分类器;
利用所述验证集数据对所述分类器进行进一步训练和验证,直到所述验证集数据中满足预设阈值的数量达到预设比值时,则停止训练,得到所需的目标分类器。
5.根据权利要求1至4任意一项所述的方法,其特征在于,所述文本中包括多个词句,所述多个文本组成文本块,所述通过所述目标分类器的多个神经网络节点对所述多个文本向量以及对应的特征维度值进行遍历计算多个文本向量对应的类别的步骤包括:
根据所述特征维度值计算所述多个文本向量之间的相关性,根据所述相关性计算所述多个文本向量对应的句向量;
提取所述句向量的特征,根据所述多个句向量的特征计算出文本块向量;
计算所述文本块向量对应每个类别的概率,提取达到预设概率值的类别,并对所述文本块添加对应的类别标签。
6.根据权利要求1所述的方法,其特征在于,所述方法还包括:
根据预设频率从预设数据库中获取多个历史医疗数据;
对多个历史医疗数据进行聚类分析,得到分析结果;
根据所述分析结果进行特征选择,得到多个特征变量;
根据预设的算法计算多个特征变量的权重;
根据多个特征变量和对应的权重对所述目标分类器进行优化调整。
7.一种基于机器学习的医疗数据分类装置,所述装置包括:
请求接收模块,用于接收终端发送的医疗数据分类请求,所述医疗数据分类请求包括病历信息;
分词处理模块,用于对所述病历信息进行分词处理,得到多个文本向量;
特征提取模块,用于对所述多个文本向量进行特征提取,得到多个文本向量以及对应的特征维度值;
数据分类模块,用于获取目标分类器,通过所述目标分类器的多个神经网络节点对所述多个文本向量以及对应的特征维度值进行遍历计算;所述目标分类器基于对多个医疗数据进行训练得到;直到遍历至所述多个文本向量对应的目标节点,根据所述目标节点计算所述多个文本向量对应的类别概率,根据所述类别概率得到所述病历信息对应的类别结果;
数据推送模块,用于将所述病历信息对应的类别结果推送至所述终端。
8.根据权利要求7所述的装置,其特征在于,所述分词处理模块还用于获取预设的医疗词库,将所述病历信息中的多个文本数据与所述医疗词库进行匹配,提取达到预设匹配度的文本数据;根据匹配后的文本数据对所述病历信息进行分词,得到分词后的多个文本数据;对所述分词后的多个文本数据进行向量化,得到多个文本向量。
9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至6中任一项所述方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至6中任一项所述的方法的步骤。
CN201910171593.0A 2019-03-07 2019-03-07 基于机器学习的医疗数据分类方法、装置和计算机设备 Active CN110021439B (zh)

Priority Applications (5)

Application Number Priority Date Filing Date Title
CN201910171593.0A CN110021439B (zh) 2019-03-07 2019-03-07 基于机器学习的医疗数据分类方法、装置和计算机设备
SG11202008485XA SG11202008485XA (en) 2019-03-07 2019-06-12 Method and apparatus for classifying medical data based on machine learning, computer device, and storage medium
PCT/CN2019/090873 WO2020177230A1 (zh) 2019-03-07 2019-06-12 基于机器学习的医疗数据分类方法、装置、计算机设备及存储介质
JP2021506440A JP7162726B2 (ja) 2019-03-07 2019-06-12 機械学習に基づく医療データ分類方法、装置、コンピュータデバイス及び記憶媒体
US17/165,665 US20210257066A1 (en) 2019-03-07 2021-02-02 Machine learning based medical data classification method, computer device, and non-transitory computer-readable storage medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910171593.0A CN110021439B (zh) 2019-03-07 2019-03-07 基于机器学习的医疗数据分类方法、装置和计算机设备

Publications (2)

Publication Number Publication Date
CN110021439A true CN110021439A (zh) 2019-07-16
CN110021439B CN110021439B (zh) 2023-01-24

Family

ID=67189351

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910171593.0A Active CN110021439B (zh) 2019-03-07 2019-03-07 基于机器学习的医疗数据分类方法、装置和计算机设备

Country Status (5)

Country Link
US (1) US20210257066A1 (zh)
JP (1) JP7162726B2 (zh)
CN (1) CN110021439B (zh)
SG (1) SG11202008485XA (zh)
WO (1) WO2020177230A1 (zh)

Cited By (37)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110427486A (zh) * 2019-07-25 2019-11-08 北京百度网讯科技有限公司 身体病况文本的分类方法、装置及设备
CN110472049A (zh) * 2019-07-19 2019-11-19 上海联影智能医疗科技有限公司 疾病筛查文本分类方法、计算机设备和可读存储介质
CN110767318A (zh) * 2019-10-11 2020-02-07 平安医疗健康管理股份有限公司 医疗数据异常检测方法、装置、计算机设备和存储介质
CN110765265A (zh) * 2019-09-06 2020-02-07 平安科技(深圳)有限公司 信息分类抽取方法、装置、计算机设备和存储介质
CN110781298A (zh) * 2019-09-18 2020-02-11 平安科技(深圳)有限公司 药品分类方法、装置、计算机设备及存储介质
CN110797101A (zh) * 2019-10-28 2020-02-14 腾讯医疗健康(深圳)有限公司 医学数据处理方法、装置、可读存储介质和计算机设备
CN110875093A (zh) * 2019-11-19 2020-03-10 泰康保险集团股份有限公司 治疗方案的处理方法、装置、设备及存储介质
CN111081370A (zh) * 2019-10-25 2020-04-28 中国科学院自动化研究所 一种用户分类方法及装置
CN111128391A (zh) * 2019-12-24 2020-05-08 北京推想科技有限公司 一种信息处理设备、方法和存储介质
CN111177375A (zh) * 2019-12-16 2020-05-19 医渡云(北京)技术有限公司 一种电子文档分类方法及装置
CN111178064A (zh) * 2019-12-13 2020-05-19 平安医疗健康管理股份有限公司 基于字段分词处理的信息推送方法、装置和计算机设备
CN111178070A (zh) * 2019-12-25 2020-05-19 平安医疗健康管理股份有限公司 基于分词的单词序列获取方法、装置和计算机设备
CN111403028A (zh) * 2020-03-19 2020-07-10 医渡云(北京)技术有限公司 医疗文本分类方法及装置、存储介质、电子设备
CN111415751A (zh) * 2020-03-19 2020-07-14 北京嘉和海森健康科技有限公司 电子病历数据的主题切分方法、装置及系统
CN111477320A (zh) * 2020-03-11 2020-07-31 北京大学第三医院(北京大学第三临床医学院) 治疗效果预测模型的构建系统、治疗效果预测系统及终端
CN111522795A (zh) * 2020-04-23 2020-08-11 北京互金新融科技有限公司 处理数据的方法和装置
CN111696663A (zh) * 2020-05-26 2020-09-22 平安科技(深圳)有限公司 疾病风险的分析方法、装置、电子设备及计算机存储介质
CN111755118A (zh) * 2020-03-16 2020-10-09 腾讯科技(深圳)有限公司 医疗信息处理方法、装置、电子设备及存储介质
CN111949795A (zh) * 2020-08-14 2020-11-17 中国工商银行股份有限公司 工单自动分类方法及装置
CN111951976A (zh) * 2020-08-21 2020-11-17 上海交通大学医学院附属第九人民医院 基于医学资料余量的价值判断方法、系统、终端以及介质
CN112347776A (zh) * 2019-08-09 2021-02-09 金色熊猫有限公司 医疗数据处理方法及装置、存储介质、电子设备
CN112632222A (zh) * 2020-12-25 2021-04-09 海信视像科技股份有限公司 一种终端设备和确定数据所属领域的方法
CN112836492A (zh) * 2021-01-30 2021-05-25 云知声智能科技股份有限公司 一种医疗项目名称对齐方法
CN113380414A (zh) * 2021-05-20 2021-09-10 心医国际数字医疗系统(大连)有限公司 基于大数据的数据采集方法及系统
CN113421632A (zh) * 2021-07-09 2021-09-21 中国人民大学 一种基于时间序列的心理疾病类型诊断系统
CN113421653A (zh) * 2021-06-23 2021-09-21 平安科技(深圳)有限公司 医疗信息的推送方法及装置、存储介质、计算机设备
CN113591458A (zh) * 2021-07-29 2021-11-02 平安科技(深圳)有限公司 基于神经网络的医学术语处理方法、装置、设备及存储介质
CN113744851A (zh) * 2020-05-27 2021-12-03 阿里巴巴集团控股有限公司 一种就医分组方法、设备及存储介质
CN113779275A (zh) * 2021-09-18 2021-12-10 中国平安人寿保险股份有限公司 基于医疗数据的特征提取方法、装置、设备及存储介质
CN114005522A (zh) * 2021-10-28 2022-02-01 平安国际智慧城市科技股份有限公司 数据处理方法、装置、设备及存储介质
CN114003791A (zh) * 2021-12-30 2022-02-01 之江实验室 基于深度图匹配的医疗数据元自动化分类方法及系统
CN114582494A (zh) * 2022-03-03 2022-06-03 数坤(北京)网络科技股份有限公司 诊断结果分析方法、装置、存储介质及电子设备
CN114613495A (zh) * 2022-03-23 2022-06-10 康键信息技术(深圳)有限公司 数据处理方法、装置、设备及存储介质
CN115146712A (zh) * 2022-06-15 2022-10-04 北京天融信网络安全技术有限公司 物联网资产识别方法、装置、设备及存储介质
CN116092672A (zh) * 2023-03-21 2023-05-09 四川大学华西医院 谵妄识别装置
CN116842330A (zh) * 2023-08-31 2023-10-03 庆云县人民医院 一种可对比历史记录的保健信息处理方法及装置
CN118132753A (zh) * 2024-05-08 2024-06-04 奇点数联(北京)科技有限公司 一种病历文本对应标签的获取系统

Families Citing this family (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110491519B (zh) * 2019-07-17 2024-01-02 上海明品医学数据科技有限公司 一种医学数据的检验方法
CN112749277B (zh) * 2020-12-30 2023-08-04 杭州依图医疗技术有限公司 医学数据的处理方法、装置及存储介质
CN112579916B (zh) * 2021-03-01 2021-05-25 广州汇图计算机信息技术有限公司 一种基于多渠道用户信息的数据处理系统
CN113377911B (zh) * 2021-06-09 2022-10-14 广东电网有限责任公司广州供电局 一种文本信息提取方法、装置、电子设备及存储介质
CN113270181B (zh) * 2021-06-22 2024-06-07 中国平安人寿保险股份有限公司 指标数据的区分方法、装置、设备及存储介质
CN113569996B (zh) * 2021-08-30 2024-05-07 平安医疗健康管理股份有限公司 病案信息的分类方法、装置、设备以及存储介质
CN113657109A (zh) * 2021-08-31 2021-11-16 平安医疗健康管理股份有限公司 基于模型的临床术语的标准化方法、装置和计算机设备
CN113822365B (zh) * 2021-09-28 2023-09-05 北京恒生芸泰网络科技有限公司 基于区块链技术的医疗数据存储及大数据挖掘方法及系统
CN113821641B (zh) * 2021-09-29 2024-04-05 深圳平安医疗健康科技服务有限公司 基于权重分配的药品分类的方法、装置、设备及存储介质
CN113806492B (zh) * 2021-09-30 2024-02-06 中国平安人寿保险股份有限公司 基于语义识别的记录生成方法、装置、设备及存储介质
CN113641799B (zh) * 2021-10-13 2022-02-11 腾讯科技(深圳)有限公司 文本处理方法、装置、计算机设备及存储介质
CN114004228A (zh) * 2021-10-28 2022-02-01 泰康保险集团股份有限公司 医疗文本数据的标准化处理方法及装置
CN114913953B (zh) * 2022-07-19 2022-10-04 北京惠每云科技有限公司 医学实体关系的识别方法、装置、电子设备及存储介质
CN115269838B (zh) * 2022-07-20 2023-06-23 北京新纽科技有限公司 一种电子病历的分类方法
CN115314550B (zh) * 2022-08-17 2023-08-25 常州市儿童医院(常州市第六人民医院) 基于数字化的智慧医疗信息推送方法及系统
CN115391494B (zh) * 2022-10-27 2023-02-17 北京元知创智科技有限公司 中医症候智能识别方法及装置
CN116049693B (zh) * 2023-03-17 2023-06-06 济南市计量检定测试院 一种基于医疗设备的计量检定数据管理方法
CN117112729B (zh) * 2023-08-21 2024-05-31 北京科文思数据管理有限公司 基于人工智能的医疗资源对接方法及系统
CN117312963B (zh) * 2023-11-29 2024-03-12 山东企联信息技术股份有限公司 一种采集信息数据智能分类方法、系统及存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130297827A1 (en) * 2010-12-06 2013-11-07 Tencent Technology (Shenzhen) Company Limited Method and server for intelligent categorization of bookmarks
CN104750833A (zh) * 2015-04-03 2015-07-01 浪潮集团有限公司 一种文本分类方法及装置
CN107808011A (zh) * 2017-11-20 2018-03-16 北京大学深圳研究院 信息的分类抽取方法、装置、计算机设备和存储介质
CN107863147A (zh) * 2017-10-24 2018-03-30 清华大学 基于深度卷积神经网络的医疗诊断的方法
WO2018157330A1 (zh) * 2017-03-01 2018-09-07 深圳市博信诺达经贸咨询有限公司 大数据的划分方法及系统
CN109215754A (zh) * 2018-09-10 2019-01-15 平安科技(深圳)有限公司 病历数据处理方法、装置、计算机设备和存储介质

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150286783A1 (en) * 2014-04-02 2015-10-08 Palo Alto Research Center Incorporated Peer group discovery for anomaly detection
US20170228500A1 (en) * 2016-02-09 2017-08-10 Justin Massengale Process of generating medical records
CN107680689A (zh) * 2017-05-05 2018-02-09 平安科技(深圳)有限公司 医疗文本的潜在疾病推断方法、系统及可读存储介质
CN107785075A (zh) * 2017-11-01 2018-03-09 杭州依图医疗技术有限公司 基于文本病历的小儿发热疾病深度学习辅助诊断系统
CN108447534A (zh) * 2018-05-18 2018-08-24 灵玖中科软件(北京)有限公司 一种基于nlp的电子病历数据质量管理方法
AU2019392537A1 (en) * 2018-12-03 2021-07-01 Tempus Ai, Inc. Clinical concept identification, extraction, and prediction system and related methods

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130297827A1 (en) * 2010-12-06 2013-11-07 Tencent Technology (Shenzhen) Company Limited Method and server for intelligent categorization of bookmarks
CN104750833A (zh) * 2015-04-03 2015-07-01 浪潮集团有限公司 一种文本分类方法及装置
WO2018157330A1 (zh) * 2017-03-01 2018-09-07 深圳市博信诺达经贸咨询有限公司 大数据的划分方法及系统
CN107863147A (zh) * 2017-10-24 2018-03-30 清华大学 基于深度卷积神经网络的医疗诊断的方法
CN107808011A (zh) * 2017-11-20 2018-03-16 北京大学深圳研究院 信息的分类抽取方法、装置、计算机设备和存储介质
CN109215754A (zh) * 2018-09-10 2019-01-15 平安科技(深圳)有限公司 病历数据处理方法、装置、计算机设备和存储介质

Cited By (64)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110472049A (zh) * 2019-07-19 2019-11-19 上海联影智能医疗科技有限公司 疾病筛查文本分类方法、计算机设备和可读存储介质
CN110472049B (zh) * 2019-07-19 2023-01-24 上海联影智能医疗科技有限公司 疾病筛查文本分类方法、计算机设备和可读存储介质
CN110427486A (zh) * 2019-07-25 2019-11-08 北京百度网讯科技有限公司 身体病况文本的分类方法、装置及设备
CN110427486B (zh) * 2019-07-25 2022-03-01 北京百度网讯科技有限公司 身体病况文本的分类方法、装置及设备
CN112347776A (zh) * 2019-08-09 2021-02-09 金色熊猫有限公司 医疗数据处理方法及装置、存储介质、电子设备
CN112347776B (zh) * 2019-08-09 2024-05-24 金色熊猫有限公司 医疗数据处理方法及装置、存储介质、电子设备
CN110765265A (zh) * 2019-09-06 2020-02-07 平安科技(深圳)有限公司 信息分类抽取方法、装置、计算机设备和存储介质
CN110765265B (zh) * 2019-09-06 2023-04-11 平安科技(深圳)有限公司 信息分类抽取方法、装置、计算机设备和存储介质
CN110781298A (zh) * 2019-09-18 2020-02-11 平安科技(深圳)有限公司 药品分类方法、装置、计算机设备及存储介质
CN110781298B (zh) * 2019-09-18 2023-06-20 平安科技(深圳)有限公司 药品分类方法、装置、计算机设备及存储介质
CN110767318A (zh) * 2019-10-11 2020-02-07 平安医疗健康管理股份有限公司 医疗数据异常检测方法、装置、计算机设备和存储介质
CN111081370A (zh) * 2019-10-25 2020-04-28 中国科学院自动化研究所 一种用户分类方法及装置
CN111081370B (zh) * 2019-10-25 2023-11-03 中国科学院自动化研究所 一种用户分类方法及装置
CN110797101A (zh) * 2019-10-28 2020-02-14 腾讯医疗健康(深圳)有限公司 医学数据处理方法、装置、可读存储介质和计算机设备
CN110797101B (zh) * 2019-10-28 2023-11-03 腾讯医疗健康(深圳)有限公司 医学数据处理方法、装置、可读存储介质和计算机设备
CN110875093A (zh) * 2019-11-19 2020-03-10 泰康保险集团股份有限公司 治疗方案的处理方法、装置、设备及存储介质
CN111178064B (zh) * 2019-12-13 2022-11-29 深圳平安医疗健康科技服务有限公司 基于字段分词处理的信息推送方法、装置和计算机设备
CN111178064A (zh) * 2019-12-13 2020-05-19 平安医疗健康管理股份有限公司 基于字段分词处理的信息推送方法、装置和计算机设备
CN111177375A (zh) * 2019-12-16 2020-05-19 医渡云(北京)技术有限公司 一种电子文档分类方法及装置
CN111128391B (zh) * 2019-12-24 2021-01-12 推想医疗科技股份有限公司 一种信息处理设备、方法和存储介质
CN111128391A (zh) * 2019-12-24 2020-05-08 北京推想科技有限公司 一种信息处理设备、方法和存储介质
CN111178070A (zh) * 2019-12-25 2020-05-19 平安医疗健康管理股份有限公司 基于分词的单词序列获取方法、装置和计算机设备
CN111178070B (zh) * 2019-12-25 2022-11-25 深圳平安医疗健康科技服务有限公司 基于分词的单词序列获取方法、装置和计算机设备
CN111477320B (zh) * 2020-03-11 2023-05-30 北京大学第三医院(北京大学第三临床医学院) 治疗效果预测模型的构建系统、治疗效果预测系统及终端
CN111477320A (zh) * 2020-03-11 2020-07-31 北京大学第三医院(北京大学第三临床医学院) 治疗效果预测模型的构建系统、治疗效果预测系统及终端
CN111755118B (zh) * 2020-03-16 2024-03-08 腾讯科技(深圳)有限公司 医疗信息处理方法、装置、电子设备及存储介质
CN111755118A (zh) * 2020-03-16 2020-10-09 腾讯科技(深圳)有限公司 医疗信息处理方法、装置、电子设备及存储介质
CN111403028A (zh) * 2020-03-19 2020-07-10 医渡云(北京)技术有限公司 医疗文本分类方法及装置、存储介质、电子设备
CN111415751B (zh) * 2020-03-19 2023-08-08 北京嘉和海森健康科技有限公司 电子病历数据的主题切分方法、装置及系统
CN111403028B (zh) * 2020-03-19 2022-12-06 医渡云(北京)技术有限公司 医疗文本分类方法及装置、存储介质、电子设备
CN111415751A (zh) * 2020-03-19 2020-07-14 北京嘉和海森健康科技有限公司 电子病历数据的主题切分方法、装置及系统
CN111522795A (zh) * 2020-04-23 2020-08-11 北京互金新融科技有限公司 处理数据的方法和装置
CN111696663A (zh) * 2020-05-26 2020-09-22 平安科技(深圳)有限公司 疾病风险的分析方法、装置、电子设备及计算机存储介质
CN113744851A (zh) * 2020-05-27 2021-12-03 阿里巴巴集团控股有限公司 一种就医分组方法、设备及存储介质
CN111949795A (zh) * 2020-08-14 2020-11-17 中国工商银行股份有限公司 工单自动分类方法及装置
CN111951976B (zh) * 2020-08-21 2024-03-22 上海交通大学医学院附属第九人民医院 基于医学资料余量的价值判断方法、系统、终端以及介质
CN111951976A (zh) * 2020-08-21 2020-11-17 上海交通大学医学院附属第九人民医院 基于医学资料余量的价值判断方法、系统、终端以及介质
CN112632222B (zh) * 2020-12-25 2023-02-03 海信视像科技股份有限公司 一种终端设备和确定数据所属领域的方法
CN112632222A (zh) * 2020-12-25 2021-04-09 海信视像科技股份有限公司 一种终端设备和确定数据所属领域的方法
CN112836492B (zh) * 2021-01-30 2024-03-08 云知声智能科技股份有限公司 一种医疗项目名称对齐方法
CN112836492A (zh) * 2021-01-30 2021-05-25 云知声智能科技股份有限公司 一种医疗项目名称对齐方法
CN113380414A (zh) * 2021-05-20 2021-09-10 心医国际数字医疗系统(大连)有限公司 基于大数据的数据采集方法及系统
CN113380414B (zh) * 2021-05-20 2023-11-10 心医国际数字医疗系统(大连)有限公司 基于大数据的数据采集方法及系统
CN113421653B (zh) * 2021-06-23 2022-09-09 平安科技(深圳)有限公司 医疗信息的推送方法及装置、存储介质、计算机设备
CN113421653A (zh) * 2021-06-23 2021-09-21 平安科技(深圳)有限公司 医疗信息的推送方法及装置、存储介质、计算机设备
CN113421632A (zh) * 2021-07-09 2021-09-21 中国人民大学 一种基于时间序列的心理疾病类型诊断系统
CN113591458B (zh) * 2021-07-29 2023-09-01 平安科技(深圳)有限公司 基于神经网络的医学术语处理方法、装置、设备及存储介质
CN113591458A (zh) * 2021-07-29 2021-11-02 平安科技(深圳)有限公司 基于神经网络的医学术语处理方法、装置、设备及存储介质
CN113779275A (zh) * 2021-09-18 2021-12-10 中国平安人寿保险股份有限公司 基于医疗数据的特征提取方法、装置、设备及存储介质
CN113779275B (zh) * 2021-09-18 2024-02-09 中国平安人寿保险股份有限公司 基于医疗数据的特征提取方法、装置、设备及存储介质
CN114005522A (zh) * 2021-10-28 2022-02-01 平安国际智慧城市科技股份有限公司 数据处理方法、装置、设备及存储介质
CN114003791B (zh) * 2021-12-30 2022-04-08 之江实验室 基于深度图匹配的医疗数据元自动化分类方法及系统
CN114003791A (zh) * 2021-12-30 2022-02-01 之江实验室 基于深度图匹配的医疗数据元自动化分类方法及系统
WO2023124191A1 (zh) * 2021-12-30 2023-07-06 之江实验室 基于深度图匹配的医疗数据元自动化分类方法及系统
CN114582494A (zh) * 2022-03-03 2022-06-03 数坤(北京)网络科技股份有限公司 诊断结果分析方法、装置、存储介质及电子设备
CN114582494B (zh) * 2022-03-03 2022-11-15 数坤(北京)网络科技股份有限公司 诊断结果分析方法、装置、存储介质及电子设备
CN114613495A (zh) * 2022-03-23 2022-06-10 康键信息技术(深圳)有限公司 数据处理方法、装置、设备及存储介质
CN115146712A (zh) * 2022-06-15 2022-10-04 北京天融信网络安全技术有限公司 物联网资产识别方法、装置、设备及存储介质
CN115146712B (zh) * 2022-06-15 2023-04-28 北京天融信网络安全技术有限公司 物联网资产识别方法、装置、设备及存储介质
CN116092672A (zh) * 2023-03-21 2023-05-09 四川大学华西医院 谵妄识别装置
CN116842330B (zh) * 2023-08-31 2023-11-24 庆云县人民医院 一种可对比历史记录的保健信息处理方法及装置
CN116842330A (zh) * 2023-08-31 2023-10-03 庆云县人民医院 一种可对比历史记录的保健信息处理方法及装置
CN118132753A (zh) * 2024-05-08 2024-06-04 奇点数联(北京)科技有限公司 一种病历文本对应标签的获取系统
CN118132753B (zh) * 2024-05-08 2024-08-20 奇点智保(北京)科技有限公司 一种病历文本对应标签的获取系统

Also Published As

Publication number Publication date
CN110021439B (zh) 2023-01-24
US20210257066A1 (en) 2021-08-19
SG11202008485XA (en) 2020-10-29
JP7162726B2 (ja) 2022-10-28
JP2021532499A (ja) 2021-11-25
WO2020177230A1 (zh) 2020-09-10

Similar Documents

Publication Publication Date Title
CN110021439A (zh) 基于机器学习的医疗数据分类方法、装置和计算机设备
CN108986908B (zh) 问诊数据处理方法、装置、计算机设备和存储介质
Yang et al. Graph-structured referring expression reasoning in the wild
CN109215754A (zh) 病历数据处理方法、装置、计算机设备和存储介质
WO2021042503A1 (zh) 信息分类抽取方法、装置、计算机设备和存储介质
US20210034813A1 (en) Neural network model with evidence extraction
CN112036154B (zh) 基于问诊对话的电子病历生成方法、装置和计算机设备
CN108376151A (zh) 问题分类方法、装置、计算机设备和存储介质
CN109829155A (zh) 关键词的确定方法、自动评分方法、装置、设备及介质
CN110377730A (zh) 案由分类方法、装置、计算机设备和存储介质
CN111710383A (zh) 病历质控方法、装置、计算机设备和存储介质
CN110364234A (zh) 电子病历智能存储分析检索系统及方法
CN109256216A (zh) 医学数据处理方法、装置、计算机设备和存储介质
CN110335653A (zh) 基于openEHR病历格式的非标准病历解析方法
CN112035614B (zh) 测试集生成方法、装置、计算机设备和存储介质
CN113204968B (zh) 医学实体的概念识别方法、装置、设备及存储介质
CN110472049A (zh) 疾病筛查文本分类方法、计算机设备和可读存储介质
CN109800309A (zh) 课堂话语类型分类方法及装置
CN114662477A (zh) 基于中医对话的停用词表生成方法、装置及存储介质
CN111553140A (zh) 数据处理方法、数据处理设备及计算机存储介质
Nguyen et al. Multi-class classification of cancer stages from free-text histology reports using support vector machines
Banerjee et al. Relation extraction using multi-encoder lstm network on a distant supervised dataset
Fan et al. A medical pre-diagnosis system for histopathological image of breast cancer
Xu et al. Gene mutation classification using CNN and BiGRU network
CN114580398A (zh) 文本信息提取模型生成方法、文本信息提取方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant