CN111310792A - 一种基于决策树的药敏实验结果识别方法与系统 - Google Patents

一种基于决策树的药敏实验结果识别方法与系统 Download PDF

Info

Publication number
CN111310792A
CN111310792A CN202010053725.2A CN202010053725A CN111310792A CN 111310792 A CN111310792 A CN 111310792A CN 202010053725 A CN202010053725 A CN 202010053725A CN 111310792 A CN111310792 A CN 111310792A
Authority
CN
China
Prior art keywords
drug
result
decision tree
negative
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010053725.2A
Other languages
English (en)
Other versions
CN111310792B (zh
Inventor
郭玉彬
曾晓银
李西明
孙坚
刘雅红
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
South China Agricultural University
Original Assignee
South China Agricultural University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by South China Agricultural University filed Critical South China Agricultural University
Priority to CN202010053725.2A priority Critical patent/CN111310792B/zh
Publication of CN111310792A publication Critical patent/CN111310792A/zh
Application granted granted Critical
Publication of CN111310792B publication Critical patent/CN111310792B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/24323Tree-organised classifiers
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/50Molecular design, e.g. of drugs
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/70Machine learning, data mining or chemometrics
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H70/00ICT specially adapted for the handling or processing of medical references
    • G16H70/40ICT specially adapted for the handling or processing of medical references relating to drugs, e.g. their side effects or intended usage
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Abstract

本发明公开了一种基于决策树的药敏实验结果识别方法与系统,该方法包括下述步骤:采集药敏实验结果数据,将药敏实验结果数据转化为决策树分类器的训练数据集;构建决策树分类器,训练决策树分类器;训练后的决策树分类器判别药敏板微孔的阴阳性分类结果;根据药敏板微孔的阴阳性分类结果以及微孔的药物布局信息计算MIC;根据MIC结果和折点值标准判断耐药结果。与传统的OD值判别药敏实验阴阳性结果方法相比,本发明基于决策树分类器去判别的方法不受阳性对照孔OD值的大小影响,可以挖掘数据中的规则,依此判断微孔的阴阳性结果,更加灵活,而且与目测法符合率更高,提高了判别阴阳性结果的准确性。

Description

一种基于决策树的药敏实验结果识别方法与系统
技术领域
本发明涉及微生物药敏检测技术领域,具体涉及一种基于决策树的药敏实验结果识别方法与系统。
背景技术
测定抗菌药物在体外对微生物有无抑制作用的方法称为药物敏感性实验,简称药敏实验。药敏实验是目前各实验室最为常用的细菌耐药性测定方法。综合考虑实验条件及成本,目前在大部分养殖场,特别是中小型养殖场,一般利用96孔微孔板,使用微量肉汤稀释法进行药敏实验。判断每个微孔的阴阳性结果主要是通过目测法,即通过实验员肉眼观察实验试剂盒各微孔的颜色变化来确定细菌的MIC值。另一方面也可通过仪器进行检测,目前在基层使用较多的仪器为酶标仪,酶标仪测定的原理是在特定波长下,检测被测物的吸光值,即OD值。OD值是某一分散体系对特定波长光线穿透性的表述,是某一特定分散体系的属性,这其中包括主要吸光物质的吸光作用,以及体系中其他物质对OD值的影响。当OD值未发生变化或变化不显著时,则说明待测药物存在抑菌作用,提示达到最小抑菌浓度。
目测法需要经过专业训练的实验员进行肉眼观察,对人员要求高,受个人因素影响,而且劳动强度强,容易疲劳,导致进行大批量实验时误判率高,而且效率低下,而国内外市场上快速药敏检测的软硬件系统价格昂贵,难以在国内基层推广。
现有技术中采用微量酶标仪比浊法快速测定革兰阴性杆菌药敏,当阳性对照孔OD值<0.1时,这种判断方法与目测法符合率89.7%,而当阳性对照孔OD值≥0.1时符合率则超过95%。可见,这种根据经验规则得到的结果虽然正确率高,但受阳性对照孔OD值影响较大,判断规则不一定适用所有实验,判断规则不够灵活。
发明内容
为了克服现有技术存在的缺陷与不足,本发明提供一种基于决策树的药敏实验结果识别方法与系统,基于决策树算法的分类模型对实验测得的OD值进行分类,判断每个微孔的阴阳性结果,代替根据实验经验制定的判断规则,然后根据96孔微孔板药物分布信息自动计算MIC,最后根据折点值标准判断所测的细菌对各药物的耐药性结果(耐药、中介、敏感),与传统的OD值判别药敏实验阴阳性结果方法相比,本发明基于决策树分类器去判别的方法不受阳性对照孔OD值的大小影响,可以挖掘数据中的规则,依此判断微孔的阴阳性结果,更加灵活,而且与目测法符合率更高,提高了判别阴阳性结果的准确性。
为了达到上述目的,本发明采用以下技术方案:
本发明提供一种基于决策树的药敏实验结果识别方法,包括下述步骤:
采集药敏实验结果数据,将药敏实验结果数据转化为决策树分类器的训练数据集;
构建决策树分类器,训练决策树分类器;
训练后的决策树分类器判别药敏板微孔的阴阳性分类结果;
根据所述药敏板微孔的阴阳性分类结果以及微孔的药物布局信息计算MIC;
根据MIC结果和折点值标准判断耐药结果。
作为优选的技术方案,还包括校正步骤,验证并校正阴阳性分类结果,并将校正后的阴阳性分类结果作为更新训练数据,优化决策树分类器;
作为优选的技术方案,所述采集药敏实验结果数据,具体步骤包括:
将药敏板上的每个微孔标注分类标签,采用酶标仪测试同一批药敏板,得到药敏板微孔对应的OD值数据、药物名称和药物浓度数据。
作为优选的技术方案,所述将药敏实验结果数据转化为决策树分类器的训练数据集,具体步骤包括:
提取每个药敏板上阴性对照孔和阳性对照孔对应的OD值,并与其它孔对应的OD值组合成一个三维数组,将除去阴阳性对照孔的标签转为一维数组作为分类结果,三维数组和一维数组组成了训练分类器的训练集数据D。
作为优选的技术方案,所述构建决策树分类器,采用CART算法构建决策树分类器,具体步骤包括:
计算特征阳性对照OD值、阴性对照OD值、微孔本身OD值对训练数据集的Gini系数值,公式为
Figure BDA0002372097620000031
其中,K=2,pk表示样本点属于第k类的概率,D表示训练数据集;
将训练集中的每一个特征A的连续特征值离散化,取相邻两点的平均值为切分点a,每个切分点a将连续数值离散划分成两类,大于切分点的为第一类,小于切分点的为第二类,将节点数据集按照切分点分为D1和D2子集,计算每个切分点下对应的基尼指数,具体计算公式为:
Figure BDA0002372097620000032
在所有可能的特征A以及所有可能的切分点a中,选择Gini系数最小的特征及其对应的切分点作为最优特征与最优切分点;
根据最优特征与最优切分点,从当前结点生成两个子结点,将训练数据集依照特征分配到两个子结点中;
对两个子结点进行递归计算,直到满足预设条件停止,得到CART决策树分类器。
作为优选的技术方案,根据所述药敏板微孔的阴阳性分类结果以及微孔的药物布局信息计算MIC,具体步骤包括:
遍历药敏板微孔的阴阳性分类结果,获取任意一种药物的识别结果集合dataList,判断dataList的大小是否为1,如果为1,则判断药物是否阴性对照或阳性对照,如果是阴性对照或阳性对照则进行阴性对照或阳性对照的检测计算,如果不是阴性对照或阳性对照则进行单个药物的检测计算;
如果dataList的大小不为1,则进行药物集合的检测计算,检测完成后返回判断遍历是否结束,如果还未结束则继续进行药物检测计算,否则,则返回检测计算后的结果集合;
所述药物集合的检测计算的步骤包括:判断是否出现从1变为0的序列,若有出现,则表示有实验操作不当或有污染,出现跳孔的现象;若没有出现,则判断序列是否全部为0,若全部为0,表示MIC值小于最小浓度值,若不全部为0,则MIC值为最后出现的0对应的微孔所表示的浓度;
所述阴性或阳性对照的检测计算的步骤包括:判断是否为阴性对照,如果为阴性对照,则判断其识别结果是否为0,如果为0则阴性对照结果正常,如果不为0则阴性对照有污染,如果不为阴性对照则判断其识别结果是否为0,如果为0则阳性对照结果有误,如果不为0则阳性对照结果正常;
所述单个药物的检测计算的步骤包括:判断药物识别结果是否为1,如果为1则MIC值为所述药物的浓度值,如果不为0则所述药物没有MIC值。
作为优选的技术方案,所述根据MIC结果和折点值标准判断耐药结果,所述耐药结果包括耐药、敏感和中介,将每个药物测得的MIC值与在折点值标准数据表查找到对应的折点进行比较,大于该折点则耐药结果为耐药,小于该折点则耐药结果为敏感,否则耐药结果为中介。
本发明还提供一种基于决策树的药敏实验结果识别系统,包括:
数据采集模块、训练集构建模块、决策树分类器构建模块、决策树分类器训练模块、阴阳性分类模块、MIC值计算模块和耐药结果输出模块;
所述数据采集模块用于采集药敏实验结果数据;
所述训练集构建模块用于将药敏实验结果数据转化为决策树分类器的训练数据集;
所述决策树分类器构建模块用于构建决策树分类器;
所述决策树分类器训练模块用于训练决策树分类器;
所述阴阳性分类模块用于采用训练后的决策树分类器判别药敏板微孔的阴阳性分类结果;
所述MIC值计算模块用于根据所述药敏板微孔的阴阳性分类结果以及微孔的药物布局信息计算MIC;
所述耐药结果输出模块用于根据MIC结果和折点值标准判断耐药结果。
作为优选的技术方案,还包括校正模块,所述校正模块用于验证并校正阴阳性分类结果,并将校正后的阴阳性分类结果作为更新训练数据,优化决策树分类器。
本发明与现有技术相比,具有如下优点和有益效果:
(1)与传统的OD值判别药敏实验阴阳性结果方法相比,本发明基于决策树分类器去判别的方法不受阳性对照孔OD值的大小影响,可以挖掘数据中的规则,依此判断微孔的阴阳性结果,更加灵活,而且与目测法符合率更高,提高了判别阴阳性结果的准确性。
(2)本发明在硬件上只需基于普通的酶标仪测得OD值,软件上根据OD值计算实验结果,功能简洁。
附图说明
图1为基于决策树的药敏实验结果识别方法的流程示意图;
图2为本实施例遍历dataList数组的流程示意图;
图3为本实施例药物集合的检测计算方法的流程示意图;
图4为本实施例阴性或阳性对照检测计算方法的流程示意图;
图5为本实施例单个药物检测计算方法的流程示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
实施例
如图1所示,本实施例提供一种基于决策树的药敏实验结果识别方法,首先提出基于决策树算法的分类模型对实验测得的OD值进行分类,判断每个微孔的阴阳性结果,代替根据实验经验制定的判断规则,然后根据96孔微孔板药物分布信息自动计算MIC,最后根据折点值标准判断所测的细菌对各药物的耐药性结果(耐药、中介、敏感),具体步骤如下所述:
S1:批量进行药敏实验,采集数据;
首先由专业实验员人工判读一批药敏板每个微孔的阴阳性结果,为每个微孔标注分类标签;分类标签为0和1,0代表该孔结果为阴性,1代表该孔结果为阳性,接着利用酶标仪测试同一批药敏板,得到每块药敏板中96个微孔(其中包括一个阴性对照微孔,一个阳性对照微孔)对应的OD值数据、药物名称、药物浓度;
S2:对采集的数据进行处理,转化为分类器的训练数据集;
采集n块药敏板的数据,每一块药敏板采集的数据包括:96个人工标签、96个OD值、每个微孔对应的药物名称和药物浓度,为训练分类器,首先提取每块药敏板对应的阴性对照孔和阳性对照孔对应的OD值OD阴性、OD阳性,然后两个对照孔的OD值与其它94个孔对应的OD值ODi(1≤i≤94)组合成一个94*3的三维数组OD,形式为[[OD阴性,OD阳性,OD1].....[OD阴性,OD阳性,ODi]......[OD阴性,OD阳性,OD94]](1≤i≤94);接着将94个微孔对应的人工标签(96个标签除去阴阳性两个对照孔的标签,剩余94个标签)转化为94*1的一维数组R,形式为[[R1]...[Ri]...[R94]](1≤i≤94,Ri的值为1或0)作为分类结果;三维数组和一维数组组成一个94*4的数组Dj(1≤j≤n),形式为[[OD阴性,OD阳性,OD1,R1]......[OD阴性,OD阳性,ODi,Ri]......[OD阴性,OD阳性,OD94,R94]](1≤i≤94);最后将n块药敏板的数据全部汇集作为训练分类器的训练集数据D;
S3:构建决策树分类器;
本实施例采用CART算法构建决策树分类器,使用训练集数据D,从二叉树的根开始,递归对每个节点执行算法操作,构建二叉树,利用CART创建决策树算法如下:
S31:设节点的训练集为D,计算特征阳性对照OD值、阴性对照OD值、微孔本身OD值对数据集D的Gini系数值,公式为
Figure BDA0002372097620000071
其中K=2,pk表示样本点属于第k类的概率;
S32:由于数据集中的三个特征“阳性对照OD值”、“阴性对照OD值”、“微孔本身OD值”的特征值均为连续型,因此对数据集的中的每一个特征A的连续特征值离散化,本实施例离散化方法为:特征A有连续值m个,从小到大排列,取相邻两点的平均值为切分点,m个数值就有m-1个切分点,分别使用每个切分点把连续数值离散划分成两类,大于切分点的为一类,小于切分点的为另一类,将节点数据集按照切分点分为D1和D2子集,然后计算每个切分点下对应的基尼指数(公式为
Figure BDA0002372097620000081
)。
S33:在所有可能的特征A以及它们所有可能的切分点a中,选择Gini系数最小的特征及其对应的切分点作为最优特征与最优切分点;
S34:根据最优特征和最优切分点,把数据集划分成两部分D1和D2,同时建立当前节点的左右节点,左节点的数据集D为D1,右节点的数据集D为D2;
在本实施例中,样本点为【OD阴性、OD阳性、ODi、Ri】,其中,Ri表示分类结果,Ri的值为0或1;OD阴性、OD阳性、ODi分别表示“阴性对照OD值”、“阳性对照OD值”、“微孔本身OD值”三个特征对应的特性值,本实施例列举具体数据进行说明如下:
如数据集D有3个样本点:
Figure BDA0002372097620000082
对于特征“微孔本身OD值”,它有3个连续值,将其从小到大排列为:0.048,0.148,0.458;
取相邻两点的平均值为切分点,则切分点为0.098,0.303,对于切分点0.098,D1为0.048;D2为0.148,0.458;对于切分点0.303,D1为0.048,0.148,D2为0.458,分别计算切分点0.098和0.303下对应的Gini系数;
计算完所有特征A下所有可能的切分点a的Gini系数后,如果特征“微孔本身OD值”下切分点0.098的Gini系数最小,那么特征“微孔本身OD值”为最优特征,最优切分点为0.098;
比如根据前面计算得到最优特征为“微孔本身OD值”且其最优切分点为0.098,那么数据集中“微孔本身OD值”这一特征值小于0.059的样本点被划分到左节点D1,大于0.059的样本点被划分到右节点D2;
S35:对两个子结点调用步骤S31~步骤S34进行递归,直到其满足停止条件为止,停止计算的条件是结点中的样本个数小于预定阈值,或样本集的Gini系数小于预定阈值(样本基本属于同一类),或者没有更多特征;
在本实施例中,数据集共有三个特征,“阳性对照OD值”、“阴性对照OD值”、“微孔本身OD值”,没有更多特征即表示结点已经依次根据各个特征完成划分;
S36:生成CART决策树;
S4:应用分类器判别微孔的阴阳性结果;
在初步训练得到分类器后,可直接使用系统进行测试,进行新的药敏实验,利用酶标仪测得每块药敏板对应的96个OD值数据,将其输入分类器直接得到各微孔的分类结果--dataList数组;
在本实施例中,在一开始,使用一批数据按照步骤S3进行构建决策树分类器,即进行初步训练,后面可以加入更多的训练集数据,进行重新训练,得到越来越精准的的分类器;
S5:人工验证并校正分类结果,并将结果作为训练数据,优化分类器;
本实施例的系统提供人工校正实验结果功能,如果实验员认为分类器判断的结果有误,可进行校正,每次实验测得的数据经人工校正后将保存作为分类器新的训练数据集,可进一步优化分类器;
S6:根据药敏板上96孔的分类结果(阴性、阳性)以及药敏板布局信息(药敏板上每个孔对应存放的药物名称及药物浓度)计算MIC;
本实施例的系统根据酶标仪测试后的文件可获取每块药敏板上96孔对应的药物类别及药物浓度,根据该布局信息遍历dataList数组计算各药物MIC值;
如图2所示,一开始获取所有的分类结果集合,将集合进行遍历,获取一种药物的识别结果集合dataList,判断集合dataList的大小是否为1,如果为1,则判断药物是否阴性对照或阳性对照,如果是阴性对照或阳性对照则进行阴性对照或阳性对照的检测计算方法,如果不是阴性对照或阳性对照则进行单个药物的检测计算方法,如果dataList的大小不为1,则进行药物集合的检测计算方法,检测完成后返回判断遍历是否结束,如果还未结束则继续进行药物检测计算,否则,则返回检测计算后的结果集合;
在本实施例中,一种药物的识别结果集合dataList可以表示为一个数组array,形式为[0 0 0 1 1 1 0];
如图3所示,药物集合的检测计算方法为先判断是否出现从1变为0的序列,具体是判断dataList这个序列是否有从1变为0的子序列,若有出现,则表示有实验操作不当或有污染,出现跳孔的现象;若没有出现,则判断序列是否全部为0,若全部为0,表示MIC值小于最小浓度值,若不全部为0,则MIC值为最后出现的0对应的微孔所表示的浓度;
如图4所示,阴性或阳性对照检测计算方法为先判断是否为阴性对照,如果为阴性对照,则判断其识别结果是否为0,如果为0则阴性对照结果正常,如果不为0则阴性对照有污染,如果不为阴性对照则判断其识别结果是否为0,如果为0则阳性对照结果有误,如果不为0则阳性对照结果正常;
如图5所示,单个药物检测计算方法为先判断药物识别结果是否为1,如果为1则其MIC值为该药物的浓度值,如果不为0则该药物没有MIC值;
S7:根据MIC结果和折点值标准判断细菌对各药物的耐药结果(耐药、中介、敏感);
将每个药物测得的MIC值与在折点值标准数据表查找到对应的折点进行比较,大于该折点则耐药结果为耐药,小于该折点则耐药结果为敏感,否则耐药结果为中介。
本实施例还提供一种基于决策树的药敏实验结果识别系统,包括:数据采集模块、训练集构建模块、决策树分类器构建模块、决策树分类器训练模块、阴阳性分类模块、MIC值计算模块和耐药结果输出模块;
在本实施例中,数据采集模块用于采集药敏实验结果数据,训练集构建模块用于将药敏实验结果数据转化为决策树分类器的训练数据集,决策树分类器构建模块用于构建决策树分类器,决策树分类器训练模块用于训练决策树分类器,阴阳性分类模块用于采用训练后的决策树分类器判别药敏板微孔的阴阳性分类结果,MIC值计算模块用于根据所述药敏板微孔的阴阳性分类结果以及微孔的药物布局信息计算MIC,耐药结果输出模块用于根据MIC结果和折点值标准判断耐药结果。
在本实施例中,还设有校正模块,用于验证并校正阴阳性分类结果,并将校正后的阴阳性分类结果作为更新训练数据,优化决策树分类器。
本实施例建立基于决策树的分类模型对酶标仪测得的OD值进行分类(分为阴性和阳性两类),代替根据实验经验制定的判断规则来判断每个微孔的阴阳性结果,然后根据96孔微孔板药物分布信息自动计算MIC,最后根据折点值标准判断所测的细菌对各药物的耐药性结果(耐药、中介、敏感)。
本实施例根据国家兽医微生物耐药性风险评估实验室提供625块药敏板的实验数据(包括酶标仪测得的OD值以及目测法得到的结果)进行初步实验,进行训练建立分类器并验证准确率,然后基于该分类器模型开发一个快速检测药敏实验结果的系统,每次实验将对应的OD数据输入到分类器,分类器输出96孔的分类结果(阴阳性结果),最后根据药敏板的布局信息计算实验中的细菌对不同药物的MIC值及耐药结果(耐药、中介、敏感),基于决策树的分类模型与目测法符合率99.1%,正确率高;同时本实施例可以更灵活地根据OD值判别药敏实验阴阳性结果,判定方法不受阳性对照孔OD值的大小影响,适用性更强。
上述实施例为本发明较佳的实施方式,但本发明的实施方式并不受上述实施例的限制,其他的任何未背离本发明的精神实质与原理下所作的改变、修饰、替代、组合、简化,均应为等效的置换方式,都包含在本发明的保护范围之内。

Claims (9)

1.一种基于决策树的药敏实验结果识别方法,其特征在于,包括下述步骤:
采集药敏实验结果数据,将药敏实验结果数据转化为决策树分类器的训练数据集;
构建决策树分类器,训练决策树分类器;
训练后的决策树分类器判别药敏板微孔的阴阳性分类结果;
根据所述药敏板微孔的阴阳性分类结果以及微孔的药物布局信息计算MIC;
根据MIC结果和折点值标准判断耐药结果。
2.根据权利要求1所述的基于决策树的药敏实验结果识别方法,其特征在于,还包括校正步骤,验证并校正阴阳性分类结果,并将校正后的阴阳性分类结果作为更新训练数据,优化决策树分类器。
3.根据权利要求1所述的基于决策树的药敏实验结果识别方法,其特征在于,所述采集药敏实验结果数据,具体步骤包括:
将药敏板上的每个微孔标注分类标签,采用酶标仪测试同一批药敏板,得到药敏板微孔对应的OD值数据、药物名称和药物浓度数据。
4.根据权利要求1所述的基于决策树的药敏实验结果识别方法,其特征在于,所述将药敏实验结果数据转化为决策树分类器的训练数据集,具体步骤包括:
提取每个药敏板上阴性对照孔和阳性对照孔对应的OD值,并与其它孔对应的OD值组合成一个三维数组,将除去阴阳性对照孔的标签转为一维数组作为分类结果,三维数组和一维数组组成了训练分类器的训练集数据D。
5.根据权利要求1所述的基于决策树的药敏实验结果识别方法,其特征在于,所述构建决策树分类器,采用CART算法构建决策树分类器,具体步骤包括:
计算特征阳性对照OD值、阴性对照OD值、微孔本身OD值对训练数据集的Gini系数值,公式为
Figure FDA0002372097610000021
其中,K=2,pk表示样本点属于第k类的概率,D表示训练数据集;
将训练集中的每一个特征A的连续特征值离散化,取相邻两点的平均值为切分点a,每个切分点a将连续数值离散划分成两类,大于切分点的为第一类,小于切分点的为第二类,将节点数据集按照切分点分为D1和D2子集,计算每个切分点下对应的基尼指数,具体计算公式为:
Figure FDA0002372097610000022
在所有可能的特征A以及所有可能的切分点a中,选择Gini系数最小的特征及其对应的切分点作为最优特征与最优切分点;
根据最优特征与最优切分点,从当前结点生成两个子结点,将训练数据集依照特征分配到两个子结点中;
对两个子结点进行递归计算,直到满足预设条件停止,得到CART决策树分类器。
6.根据权利要求1所述的基于决策树的药敏实验结果识别方法,其特征在于,根据所述药敏板微孔的阴阳性分类结果以及微孔的药物布局信息计算MIC,具体步骤包括:
遍历药敏板微孔的阴阳性分类结果,获取任意一种药物的识别结果集合dataList,判断dataList的大小是否为1,如果为1,则判断药物是否阴性对照或阳性对照,如果是阴性对照或阳性对照则进行阴性对照或阳性对照的检测计算,如果不是阴性对照或阳性对照则进行单个药物的检测计算;
如果dataList的大小不为1,则进行药物集合的检测计算,检测完成后返回判断遍历是否结束,如果还未结束则继续进行药物检测计算,否则,则返回检测计算后的结果集合;
所述药物集合的检测计算的步骤包括:判断是否出现从1变为0的序列,若有出现,则表示有实验操作不当或有污染,出现跳孔的现象;若没有出现,则判断序列是否全部为0,若全部为0,表示MIC值小于最小浓度值,若不全部为0,则MIC值为最后出现的0对应的微孔所表示的浓度;
所述阴性或阳性对照的检测计算的步骤包括:判断是否为阴性对照,如果为阴性对照,则判断其识别结果是否为0,如果为0则阴性对照结果正常,如果不为0则阴性对照有污染,如果不为阴性对照则判断其识别结果是否为0,如果为0则阳性对照结果有误,如果不为0则阳性对照结果正常;
所述单个药物的检测计算的步骤包括:判断药物识别结果是否为1,如果为1则MIC值为所述药物的浓度值,如果不为0则所述药物没有MIC值。
7.根据权利要求1所述的基于决策树的药敏实验结果识别方法,其特征在于,所述根据MIC结果和折点值标准判断耐药结果,所述耐药结果包括耐药、敏感和中介,将每个药物测得的MIC值与在折点值标准数据表查找到对应的折点进行比较,大于该折点则耐药结果为耐药,小于该折点则耐药结果为敏感,否则耐药结果为中介。
8.一种基于决策树的药敏实验结果识别系统,其特征在于,包括:
数据采集模块、训练集构建模块、决策树分类器构建模块、决策树分类器训练模块、阴阳性分类模块、MIC值计算模块和耐药结果输出模块;
所述数据采集模块用于采集药敏实验结果数据;
所述训练集构建模块用于将药敏实验结果数据转化为决策树分类器的训练数据集;
所述决策树分类器构建模块用于构建决策树分类器;
所述决策树分类器训练模块用于训练决策树分类器;
所述阴阳性分类模块用于采用训练后的决策树分类器判别药敏板微孔的阴阳性分类结果;
所述MIC值计算模块用于根据所述药敏板微孔的阴阳性分类结果以及微孔的药物布局信息计算MIC;
所述耐药结果输出模块用于根据MIC结果和折点值标准判断耐药结果。
9.根据权利要求8所述的基于决策树的药敏实验结果识别系统,其特征在于,还包括校正模块,所述校正模块用于验证并校正阴阳性分类结果,并将校正后的阴阳性分类结果作为更新训练数据,优化决策树分类器。
CN202010053725.2A 2020-01-17 2020-01-17 一种基于决策树的药敏实验结果识别方法与系统 Active CN111310792B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010053725.2A CN111310792B (zh) 2020-01-17 2020-01-17 一种基于决策树的药敏实验结果识别方法与系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010053725.2A CN111310792B (zh) 2020-01-17 2020-01-17 一种基于决策树的药敏实验结果识别方法与系统

Publications (2)

Publication Number Publication Date
CN111310792A true CN111310792A (zh) 2020-06-19
CN111310792B CN111310792B (zh) 2023-06-30

Family

ID=71158124

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010053725.2A Active CN111310792B (zh) 2020-01-17 2020-01-17 一种基于决策树的药敏实验结果识别方法与系统

Country Status (1)

Country Link
CN (1) CN111310792B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113449792A (zh) * 2021-06-28 2021-09-28 四创电子股份有限公司 一种无损快速检测食品质量的方法
CN114113510A (zh) * 2021-11-23 2022-03-01 杭州汉菁生物科技有限公司 一种药物mic值确定方法及存储介质
CN114113510B (zh) * 2021-11-23 2024-05-03 杭州汉菁生物科技有限公司 一种药物mic值确定方法及存储介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107604084A (zh) * 2017-10-30 2018-01-19 深圳市第三人民医院 细菌耐药性快速预测系统及其预测方法
CN109022567A (zh) * 2018-08-06 2018-12-18 北京艾克伦医疗科技有限公司 用于鉴定肺结节和/或肺癌状态的试剂盒及其应用

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107604084A (zh) * 2017-10-30 2018-01-19 深圳市第三人民医院 细菌耐药性快速预测系统及其预测方法
CN109022567A (zh) * 2018-08-06 2018-12-18 北京艾克伦医疗科技有限公司 用于鉴定肺结节和/或肺癌状态的试剂盒及其应用

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113449792A (zh) * 2021-06-28 2021-09-28 四创电子股份有限公司 一种无损快速检测食品质量的方法
CN114113510A (zh) * 2021-11-23 2022-03-01 杭州汉菁生物科技有限公司 一种药物mic值确定方法及存储介质
CN114113510B (zh) * 2021-11-23 2024-05-03 杭州汉菁生物科技有限公司 一种药物mic值确定方法及存储介质

Also Published As

Publication number Publication date
CN111310792B (zh) 2023-06-30

Similar Documents

Publication Publication Date Title
CN109948469B (zh) 基于深度学习的巡检机器人仪表自动检测识别方法
CN107862338B (zh) 基于双检验法的海洋环境监测数据质量管理方法及系统
CN111009286A (zh) 对宿主样本进行微生物分析的方法和装置
CN108319813A (zh) 循环肿瘤dna拷贝数变异的检测方法和装置
CN112687344B (zh) 一种基于宏基因组的人腺病毒分子分型和溯源方法及系统
CN115064215B (zh) 一种通过相似度进行菌株溯源及属性鉴定的方法
CN115277180B (zh) 一种区块链日志异常检测与溯源系统
CN109087702B (zh) 用于中医健康状态分析的四诊表征信息融合方法
CN110363228A (zh) 噪声标签纠正方法
Wang et al. Is the Atkinson discriminant function a reliable method for distinguishing between Betula pendula and B. pubescens (Betulaceae)?
CN115019294A (zh) 一种指针式仪表读数识别方法及系统
CN111832389A (zh) 一种骨髓细胞形态学自动检测系统的计数及分析方法
CN111310792A (zh) 一种基于决策树的药敏实验结果识别方法与系统
CN110277139B (zh) 一种基于互联网的微生物限度检查系统及方法
CN114048320B (zh) 一种基于课程学习的多标签国际疾病分类训练方法
CN116757998A (zh) 基于ai的ctc细胞和ctc样细胞的筛查方法及装置
US20160188796A1 (en) Methods of characterizing, determining similarity, predicting correlation between and representing sequences and systems and indicators therefor
CN113889274B (zh) 一种孤独症谱系障碍的风险预测模型构建方法及装置
CN105824871B (zh) 一种图片检测方法与设备
CN111833297B (zh) 一种骨髓细胞形态学自动检测系统的疾病联想方法
CN115312183A (zh) 医学检验报告智能解读方法及系统
CN114782349A (zh) 领域自适应原油泄露检测模型训练方法、检测方法及装置
Czech et al. Scalable methods for post-processing, visualizing, and analyzing phylogenetic placements
JP2022046265A (ja) 菌種同定支援方法、マルチコロニー学習モデルの生成方法、菌種同定支援装置及びコンピュータプログラム
CN115841847B (zh) 一种微生物信息测定及提取系统和方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant