CN1961212A - 诊断系统性自身免疫疾病的模式识别法 - Google Patents

诊断系统性自身免疫疾病的模式识别法 Download PDF

Info

Publication number
CN1961212A
CN1961212A CNA2005800117211A CN200580011721A CN1961212A CN 1961212 A CN1961212 A CN 1961212A CN A2005800117211 A CNA2005800117211 A CN A2005800117211A CN 200580011721 A CN200580011721 A CN 200580011721A CN 1961212 A CN1961212 A CN 1961212A
Authority
CN
China
Prior art keywords
data set
sad
disease
reference data
patient
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CNA2005800117211A
Other languages
English (en)
Inventor
S·R·宾德
J·格鲁森戈
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Bio Rad Laboratories Inc
Original Assignee
Bio Rad Laboratories Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Bio Rad Laboratories Inc filed Critical Bio Rad Laboratories Inc
Publication of CN1961212A publication Critical patent/CN1961212A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/53Immunoassay; Biospecific binding assay; Materials therefor
    • G01N33/564Immunoassay; Biospecific binding assay; Materials therefor for pre-existing immune complex or autoimmune disease, i.e. systemic lupus erythematosus, rheumatoid arthritis, multiple sclerosis, rheumatoid factors or complement components C1-C9
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2413Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
    • G06F18/24147Distances to closest patterns, e.g. nearest neighbour classification
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • G16B40/10Signal processing, e.g. from mass spectrometry [MS] or from PCR
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2800/00Detection or diagnosis of diseases
    • G01N2800/24Immunology or allergic disorders
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Medical Informatics (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Immunology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Molecular Biology (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • General Health & Medical Sciences (AREA)
  • Biotechnology (AREA)
  • Evolutionary Computation (AREA)
  • Hematology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Chemical & Material Sciences (AREA)
  • Biophysics (AREA)
  • Epidemiology (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Databases & Information Systems (AREA)
  • Bioethics (AREA)
  • Urology & Nephrology (AREA)
  • Public Health (AREA)
  • Biomedical Technology (AREA)
  • Analytical Chemistry (AREA)
  • Microbiology (AREA)
  • General Engineering & Computer Science (AREA)
  • Rehabilitation Therapy (AREA)
  • Rheumatology (AREA)
  • Cell Biology (AREA)
  • Signal Processing (AREA)
  • Food Science & Technology (AREA)
  • Medicinal Chemistry (AREA)
  • Biochemistry (AREA)
  • Pathology (AREA)

Abstract

一种定量测定和分析病人样品中自身抗体的阵列,可用于诊断系统性自身免疫疾病。该分析采用各种已知的模式识别技术中的任何一种,例如k-最近邻分析,将此定量数据阵列与先前获自患有已知系统性自身免疫疾病的患者的数据组作比较,从而确定该病人所患的疾病,及此决定的置信程度或可能的准确度。此法能有效鉴定一种疾病和同时存在的两种或多种疾病。此法易于实施自动化数据处理、能消除诊断这些疾病先前遭遇到的许多人为判断错误。

Description

诊断系统性自身免疫疾病的模式识别法
相关申请的交互参考
本申请是2000年10月17日提交的美国专利申请NO.09/691405的部分继续,其内容纳入本文作为参考。
发明背景
1.发明领域
本发明涉及自身免疫疾病和这些疾病及其它疾病的诊断方法领域。本发明也涉及数据分析的统计学方法和它们在免疫诊断学中的应用。
2.现有技术描述
自身免疫疾病是免疫系统攻击患者自身机体的细胞、组织和器官,而非外部侵入机体的细菌、病毒和其它微生物的疾病。有许多不同的自身免疫疾病,攻击机体的不同部位,从肠道到大脑,例如从脉管系统到皮肤,发生攻击的方式不同。某些自身免疫病有组织或器官特异性,而其它则可影响多种组织,后一类型的疾病称为“系统性自身免疫疾病”,病人之间的症状可能不同,其组织损伤和炎症可发生在器官中与疾病抗原摄取无关的多个部位。系统性自身免疫疾病通常指风湿病或结缔组织病(CTD)。系统性自身免疫疾病的例子是类风湿性关节炎、系统性红斑狼疮(SLE)、硬皮病、多肌炎、皮肌炎、斯耶格伦综合征(SS)和脊椎关节病如关节强硬性脊椎炎。自身免疫疾病通常起源于多种因素,一些因素有:遗传素质、宿主因素(如T细胞缺陷和难以控制的B细胞多克隆激活)、环境因素(如某些微生物感染)和抗原产生的机制(如隔离抗原和交叉反应性外源抗原)。自身免疫疾病(的原因)仍然有待验明(如抗磷脂综合征),而有些已确定的疾病在性质上常被认作是自身免疫疾病(如腹腔疾病)。
由于自身免疫疾病的症状重叠和病因复杂而难以诊断。诊断的尝试常常依据症状,加上体检时的发现和实验室检测所得结果。许多自身免疫病的症状是非特异性的,虽然实验室检测结果可给予帮助,但常不足以证实诊断,特别是在疾病的早期。如同许多病例那样,当症状短暂而实验室结果又不可信时此问题更为严重。对于某些自身免疫病而言,如能在早期得到确定,病人对治疗会有完全反应。然而常常是直到疾病晚期才能做出具体诊断。此问题在系统性自身免疫疾病特别严重。
通常认为自身免疫抗体的存在表示患有自身免疫病。然而此看法由于以下事实而不能成立,即几乎任何个体都存在可检测量的自身抗体,与健康个体的参考水平相比由于人口统计数据如性别、年龄、户籍的地理区域、民族和种族关系,正常人的抗体水平差别很大而没法作比较。此外诊断中需要研究的不同抗体的数量很大,想获得特异性和合理的精确诊断,对于临床实验室常常是难以应对的负担。
鉴定系统性自身免疫病应用最为广泛的方法是间接免疫荧光(IFA)显微术,一种需要训练有素技术人员的手工方法。当用此法观察固定在载玻片上,用血清处理,洗涤然后标记的细胞(通常为HeLa细胞)时,结果看到的是一种能区别性特征分析的模式。该模式的可区别性特征是相对的斑点状、相对均匀的外观等,通过将该模式与患有已知疾病的个体的模式作比较而做出诊断。然而,最常见的模式与几种诊断尚不清楚的疾病相关。结果还需要检测特异性抗体。甚至必须请求有经验的免疫学家或风湿病专家来解释这些结果而做出最终诊断。
近年来已采用酶联免疫吸附试验(ELISA)对有自身免疫疾病症状的病人进行初步筛检。筛检试验呈阳性的标本再送交特异性诊断试验以确定是存在那种特异性自身抗体,从而提示患有那种特异性疾病。然而,许多自身免疫病病人患有两种或多种不同的自身免疫病,当采用这种诊断方法时此种努力难以获得准确诊断。此外,许多医生嘱付的筛检试验(如ANA筛检)目前对采用特异性抗体所得结果的经验有限。其结果难以解释。因此,采用特异性抗体的结果(做出诊断)通常不是最佳的。然而,鉴于初步结果的阳性预测价值低,产生阳性筛检结果和产生特异性抗体结果之间的延误对于病人和医生都是困难的。当结果可接受时,它们对某些病例有高度提示性(如抗-Scl-70抗体阳性),但常常是不那么有用(如抗SmRNP单阳性)。甚至极有经验的风湿专家也不能将不常见的模式与疾病状态相关联。
因此需要提供自动化系统和方法,根据特异性抗体检测结果而表明某病人是否可能患有系统性自身免疫疾病。这种系统和方法还应表明是否患有两种或多种自身免疫疾病。
发明概述
本发明各方面的内容是通过提供鉴定病人样品中存在的一种或多种系统性自身免疫疾病的系统和方法,来应对上面列举的困难和其它困难。一方面获得系统性自身免疫疾病疑似患者的多分析物测定数据,对此数据进行统计学模式识别处理或算法,将其与多个参考数据组作比较。这种比较的结果可表明患者所患的具体疾病。在计算机软件帮助下模式识别算法可处理医学决策支持系统(MDSS)中得到的所有模式。以此方式应用模式识别处理使临床医生可利用获自病人的一种生物样品的检测结果来同时获得疾病诊断和对该诊断置信水平的评估。临床医生可利用NDSS结果作为诊断辅助工具,例如辅助医生做出诊断。医生也可利用MDSS结果来提出随访试验。选择的自身抗体可以是已知的在各种系统性自身免疫疾病中经常升高的抗体,可按照它们与具体疾病或可能患的一组疾病已意识到的相关性,将具体抗体包括在其中或将其删除。可同时诊断两种或多种疾病,认定各自的置信水平而不需要分离样品或分别分析样品。
本发明具有优于目前已知诊断方法的一些优点。一个优点是不需要用手工进行检测试验,因为该多种试验本身可用自动化仪器进行。另一优点是筛检后即能获得诊断而不需要再做验证试验。此外,本发明用一步样品分析即能对许多可能的疾病提出诊断。还有本发明不需要熟练的专职人员参与来解释结果。因此可将结果直接转交给主管医生,即使该医生是全科医生对所检测的自身抗体不熟悉。
本发明一方面的内容是,提供一种用计算机执行的、根据某病人测试样品中存在的自身抗体水平来鉴定该病人测试样品是否与一种或多种特定的系统性自身免疫病(SAD)相关的方法。该方法通常包括将多个参考数据组存入存储器,各数据组的数值代表了多种特定自身抗体中每一种的水平,其中各特定SAD的参考数据组包括至少一个与该特定SAD相关的参考数据组,且所述参考数据组包括至少一个与该特定SAD无关的参考数据组。该方法通常包括接收样品数据组,其数值代表某病人测试样品中所述多种自身抗体中每一种的水平,以及将k-最近邻过程(k-nearest neighborprocess)自动应用于该样品数据组和参考数据组,以产生能表明该病人测试样品是否与所述特定SAD无关,或与所述特定SAD中的一种或多种相关的统计学决定。
本发明另一方面的内容是,提供了一种配制成可提供输出数据的计算机系统,根据某病人测试样品中存在的自身抗体水平,所述输出数据可表明该病人测试样品是否与多种特定的系统性自身免疫疾病(SAD)中的一种或多种相关。该系统通常包括存储多个参考数据组的存储装置,各数据组的数值代表了多种特定自身抗体中每一种的水平,其中各特定SAD的参考数据组包括至少一个与该特定SAD相关的参考数据组,且所述参考数据组包括至少一个与该特定SAD无关的参考数据组。该系统通常还包括接收样品数据组的装置,该样品数据组的数值代表某病人测试样品中所述多种自身抗体中每一种的水平,和处理所述样品数据组和参考组数据的装置,处理采用k-最近邻过程,以产生表明该病人测试样品是否与所述特定SAD无关,或与所述特定SAD中的一种或多种相关的统计学决定。该系统还可包括能提供包括所述统计学决定的输出数据的装置。
本发明的这些和其它目的、优点、特征和实施方式可从以下描述中得以明白。
附图简述
图1说明了本发明可能实施的医学决策支持系统(MDSS)。
图2说明了本发明数据表的一个例子。
图3和4说明了按照本发明一种实施方式进行KNN处理推理的一个例子。
图5说明了MDSS系统显示的GUI显示面板的一个例子。
图6说明了可能的用户显示MDSS系统产生的输出数据。
发明详述
图1说明了可实现本发明目的的医学决策支持系统(MDSS)100。如图所示,MDSS100包括MDSS计算机系统105,如图所示,其具有处理器115和存储器模块110。计算机系统105还包括通过一个或多个直连(如USB、火线或其他接口)和一个或多个网络连接(如,包括调制解调器或其他网络接口设备)来发送和接收信息的通信模块(未显示),。存储器模块110可包括内部存储装置和一个或多个外部存储装置。计算机105还包括显示模块,如监视器或打印机。一方面,计算机105通过直连或网络140从测试系统150或其他测试结果来源接收数据,例如患者测试的结果。例如,测试系统150可被配制成对一个或多个样品155进行多分析物检测并向计算机105自动提供测试结果。测试系统150可以直接与计算机系统105耦合,或者可通过网络140远程耦合。众所周知,计算机105也可以通过网络140从一个或多个客户系统130接收或发送数据。例如,提问的医生可利用客户系统130,从安装在实验室或医院内的MDSS计算机105获取并查看报告。
网络140可以是LAN(局域网)、WAN(广域网)、无线网络、点到点网络、星形网络、令牌环网、集线器网络或其它配置。目前最常用的网络类型是TCP/IP(传输控制协议和网间协议)网络,如常称作“英特网”的用大写字母“I”表示的全球网,是本文许多实施例中采用的,但应知道本发明可采用的网络不限于此,虽然TCP/IP是当前优选的方案。
图1显示该系统中的几种元件可包括常规熟知的元件,无需在此详述。例如,计算机105可包括台式个人计算机、工作站、主机、膝上型计算机等。各客户系统130可包括台式个人计算机、工作站、膝上型计算机、PDA、移动电话、或任何支持WAP的装置,或任何其它能直接或间接连通英特网或其它网络连接的计算机装置。客户系统130通常运行HTTP客户端,例如浏览器程序,如微软的Internet ExplorerTM浏览器、Netscape的NavigatorTM浏览器、Opera的浏览器、或者移动电话、PDA或其它无线装置等使用的支持WAP的浏览器,使客户系统的使用者可通过网络140访问计算机105,从其获得、处理和查看信息和网页。各客户系统130通常也包括一个或多个用户接口装置,如键盘、鼠标、触摸屏、书写笔等,以便能在显示器(如监视屏、LCD显示器等)135上通过浏览器提供的图形用户介面(GUI)进行人机对话,与计算机105提供的网页形式和其它信息一起运作。如上所述,本发明适合英特网使用,英特网指特定的全球国际网络。然而应知道也可利用其它网络来代替英特网,如内联网、外联网、虚拟个人网络(VPN)、不基于TCP/IP的网络、任何LAN或WAN等。
按照一实施方式,每个客户系统130及其所有组件可由操作人员利用诸如浏览器的应用软件加以配置,所述应用软件包括用中央处理单元如Intel Pentium处理器等运行的计算机代码。类似的,MDSS计算机105及其所有组件可由操作人员利用应用软件加以配置,所述应用软件包括用中央处理单元115如Intel Pentium处理器等或多处理单元运行的计算机代码。宜将操作和配置MDSS计算机105以按本文所述处理数据的检测结果的计算机代码下载并贮存在硬盘中,但整个程序代码或其部分也可贮存在熟知的任何其它易失或不易失存储介质或装置如ROM或RAM中,或提供在能贮存程序代码的任何其它计算机可读介质160上,如高密度磁盘(CD)介质、数字多功能盘(DVD)介质、软盘等。此外,如熟知的那样,例如通过英特网可软件源或从服务器传输和下载整个程序代码或其一部分,或者通过利用任何熟知通信媒介和协议(如TCP/IP、HTTP、HTTPS、Ethernet等)的任何熟知的其它常规网络连接传输。也可认为实现本发明诸方面内容的计算机代码可采用能用计算机系统执行的任何编程语言来执行,如C、C+、HTML、Java、JavaScript语言,或任何其它脚本语言如VBScript。
在本发明一优选方面,MDSS计算机105实施模式识别系统,根据贮存的各自与一种或多种已知疾病或未知疾病检测结果的数据库,分析病人的检测结果,数据可贮存在存储存储器110中的一张或多张数据表或其它逻辑数据结构中,或分别贮存,或使数据库系统与计算机105耦合。
用于实施本发明的模式识别系统通常开始时是产生一种“训练组(training set)”,此术语如统计学数据分析领域所理解,指得自可靠(“纯种(pedigreed)”)来源的一组样品的数据。此组包括的样品是先前曾独立诊断为患病者的以及无病者的样品。实施本发明一个方面的方法,开始时是获得和分析从已知患有,或曾经患有某特定自身免疫疾病的一组病人,以及已知无此病的一位或多位的一组对象的参比样品。该训练组包括需要研究的特定病人或病人总体所有范围的系统性自身免疫疾病。对该训练组的每个样品进行多种分析,将结果输入计算机系统以类似于多维阵列的方式贮存,阵列中各样品成为多维空间中的一个点。确定某点在该空间中的位置的该点坐标代表了测试的结果,每个测试一个坐标。例如一个例子是,如果对该训练组中每个样品进行测试的数目只是两种,那么训练组的诸点显示排列为二维图象(x,y),其中水平轴(x)对应于一种测试,而垂直轴(y)对应于另一测试。除测试结果所确定的二维图中的位置(即x和y值)外,每个点都标记为与其来源相关的具体疾病。三种测试系统对应的阵列是含有正交x、y和z轴的三维图。涉及4种或更多种测试系统的相应阵列无法显示,但能以类似方式建立。
一旦建立了训练组,将其测试数据输入数据库。例如,可将代表抗体检测结果的数据或代表抗体水平的数值贮存在按行列或区域局部排列的数据表中。图2显示这种数据表一部分的例子。如所示,可加入一区域来包括病人D或显示样品来源的其它信息。人口统计学信息,如性别、年龄等也可包括在这些区域中。在此方式中,数据表的每一行(或记录)均代表某具体测试样品的测定值。每行还包括与该测试样品相关的先前曾作出的疾病诊断,如果已知提供该样品的病人无病,此诊断可以是“无病”或“NEG”。一实施方式中,与一种以上疾病相关的测试组,每种疾病产生不同的行。例如,一组测定数据与SLE和SS两种病相关时,在该训练组数据表中产生二行,一行为SLE,一行为SS,在抗体区域中的值也分成同样的每行。
一旦将训练组数据输入数据库,计算机系统就准备接收一个病人样品数据或一连串病人样品数据,而不需要重建该数据库,或重新分析该训练组,或选择并分析不同的训练组。对病人样品进行与训练组样品相同的检测。“未知”病人样品的一个例子见图2表中最上行。利用前节的说明性描述,可将病人样品检测结果显示为N-维空间中的一个点,以其测定值相应的坐标可确定其位置。
通过病人样品检测结果值(图2中的“未知”)和训练组值之间的统计学比较可实现具体疾病的认定。进行比较例子的可采用的各种统计学分析方法是k-最近邻过程、多重线性回归分析、贝叶斯概率推理、神经网络分析和主成分分析。虽然这些方法的每一种是本领域已知的,但以下解释有助于读者了解如何应用各算法来实施本发明。
最近邻模式识别
最近邻模式识别是一种已良好建立的比较不同数据组的方法,上世纪70年代广泛用于自动化分析质谱数据,质谱仪输出一系列的谱线(m/z比)和强度。用户准备已知化合物的质谱库,或利用公众库,然后用最近邻算法来评价未知化合物。例如,可将未知物与库中的几种邻苯二甲酸盐作匹配;也许没有一种适宜匹配或良好匹配,但分析者确信该未知化合物是某种类型的邻苯二甲酸盐,这种“思路”就足以认定需要进行下面的步骤。一方面,本发明系统的操作方式相似。因为输入的是一系列强度(抗体水平),将这些强度与先前创建的库中病人的强度作比较,而输出是一系列与该库中病人(强度)可能的匹配。本发明系统可进行其它软件处理来检验匹配和产生输出数据,总结那种疾病是具有最佳匹配病人中最常见的。该系统也提供表明一致性值的输出。例如,所述输出可包括关于该报告疾病在具有最佳匹配(如75%或以上)病人中是否是“有非常强代表性的”一致性值或文本指示符;或例如以“强”和“中等”所代表的具有较少的一致性程度。
最近邻模式识别有两个重要特征。第一个是事先建立库(训练组数据库)本身的大小和品质。第二个是收集供检验的邻居数(number of neighbor)。邻居数通常称为“k”;因此将k-最近邻缩写为kNN。这两种特征是相联的,因为大的库能允许贮存更大的k值。实际采用的k值优选10-15,因为这意味着由于只与该库中一个病人匹配因此没有匹配可报告。故可理解应采用小于10或大于15的k值。在下述的一具体实施方式中,采用的k值为11。
在k-最近邻的一个实施方式中,所述系统读取病人样品的数据,将其输入也含有训练组数据库的存储器(如存储器110)中。处理然后计算出从该病人测试点到存储器中邻近该病人测试点的数据(训练组)点的数字距离。从这些点,经处理选出距离最短或最小的k数据点。例如,二维图中的数字距离通常是公式[(x1-x2)2+(y1-y2)2]1/2的笛卡尔距离度量。因此,如果k是11,该算法选择离病人测试点距离最短的11个数据点。然后认定与该k最近数据点相关的疾病是该病人样品所代表的疾病,如果这些k点与一种以上疾病相关,在诊断中注明每种疾病。精细处理是比较不同点的距离数值,当代表两种不同疾病点的数值相差不到最低差异值时,可认为此两种疾病可能相同。进一步精细处理时,配置的处理器能处理距离的数字值以确定置信水平。这可利用病人测定结果和每个K数据点之间的“类似”值来进行,通过该疾病的类似值和除以类似值之和来认定每种疾病的相对值。通常选择具有最高相关值的疾病作为最终诊断。
通常,k最近邻算法是一种“病例取向(case-oriented)”系统,可用于比较病人测试数据与其它个体的数据,所述其它个体的数据指除疾病外,可得到的例如该个体的年龄、性别、患病时间多长和类似因素的人口统计学信息和其它个人信息。这些信息使得诊断医生可能就是否采用该处理所提出的这些病人的信息作为诊断参考点做出个人判断。
示范性kNN匹配过程
图3和4说明本发明实施方式的一种示范性KNN过程。简而言之,在MDSS 100的处理空间(如包括一个或多个处理器105和存空间)中执行KNN算法。KNN算法从数据表检索训练组的分析物值(如通过SQL调用),并用检索到的数据处理测试样品的分析物值产生输出值。优选将输出值显示在屏幕上(如显示监视仪125上),打印或传送到远程系统。较后将描述的输出内容可包括,例如简单的阳性或阴性指示,诊断,或包括诊断和数据库表返回行并提示疾病名称和各行的行一致性的图。例如,下表1提供了可能显示的输出值。也可通过网络140向客户系统130提供输出数据,显示在客户监视器135上或供进一步处理。图5显示了一种显示输出的例子(如通过浏览器显示在面板上),该输出显示了对疾病的诊断,病人测试结果与所诊断疾病之间相关的程度,和病人的具体信息如病人的ID。应理解如需要,也可采用其它显示方式和展示其它信息。
如图3所示,在优化的处理步骤10中,要标准化测试对象或病人的分析物输入值。例如,将这些值转变到0-100标准范围内。例如,一实施方式中,通过以下计算:log10(x+1)×99.66将分析物值加工成为抗体指数形式。应理解,也可部分依照数据格式采用其它标准化技术。在优选方面,贮存在数据表中的数据也要标准化,然而数据表中可包括未标准化的数据,但当检索数据库时,这种数据宜标准化。在步骤15中,此过程能确定所有的分析物输入值是否符合分析物截取值的下限(LAVC)域值。如果所有的分析物输入值低于LAVC,步骤20中将返回阴性结果(NEG)。否则该结果为阳性。例如,在一方面,将LAVC设置在0-100范围中的30,然而如需要也可采用其它LAVC域值。
在步骤25中,kNN行将构成确定诊断的基础。例如,在一实施方式中,通过用距离度量将分析物输入值与数据库中的所有行作比较,来确定k最近行。一方面,所述距离度量是一种简单的N-维距离度量,如上所述,其形式为[(x1-x2)2+(y1-y2)2]1/2的。因此k行与返回的输入数据距离“最短”。在一实施方式中,利用特异性水平域值来判断某行是否可包括在构成诊断依据的kNN行中。此实施方式中,不包括行一致性低于该特异性水平的行。行一致性通常指kNN数据库表的某行如何与该病人的分析物输入值密切匹配。一方面,距离度量被用于行一致性。一方面,此过程通过比较病人的分析物值与数据表各行的值,可产生每行的行一致性值。然后此过程选出行一致性值符合该特异性水平域值的那些行,此过程可返回具有最佳行一致性值的那些行。可返回许多k行,但可能k行的少数符合该特异性水平域值。在一方面,有三种可判断的特异性水平(虽然可采用更多或更少的),具体例子如下:
10%(中等);
35%(高);和
60%(最高)。
因此如果将该特异性水平设为高时,不采用经测定kNN行的行一致性值低于此“高”特异性域值(如<35%)的行。
在步骤30中,此过程可确定步骤25中返回的或“创建”的kNN行数是否超过最小截取(MinCutoff)域值。如果“创建了”较少的低于“MinCutoff”的行,则步骤35的返回值为“NA”或“无病”。“NA”结果指这些分析物通过了LAVC域值(因此必然是阳性)的情况,但该算法(kNN)不能使它们与某特定疾病完全一致。此两种情况包括:
阴性特定病例。kNN(值)决定了其结果是阴性,但这可能与LAVC规定不一致。
返回值为无病。kNN无法(a)找到足够好的kNN行用于其计算,或(b)鉴定一种疾病一致性足够强的疾病结果。
kNN算法返回了行的k值,但只“创建”行结果符合该特异性水平域值的那些行。例如,假设k=5,但5个返回行中有3行结果不符合该特异性水平域值,因此只创建了二行。如果将MinCutoff设置为3,则返回值为”NA”。如果kNN行数大于MinCutoff,可利用步骤40中的kNN行来确定相一致的疾病。相一致疾病的计算指计算出KNN诸行中显示疾病结果重要性的(行)。一方面,kNN诸行所鉴定的某具体疾病的相一致疾病等于该疾病的行数除以总行数。例如,如果k=5和诸行显示为SS、SS、SS、SLE和MYO,那么与SS相符的疾病(可能性)=60.0%,与SLE相符的疾病=20%;与MYO相符的疾病=20%。
在步骤45中,此过程可确定疾病一致性是否高于用户可判断的域值,如非常强的截取(VSC)域值。例如,可将VSC设为75%或90%。如果与某疾病的一致性大于该VSC,则在步骤50中进行阴性特定病例(NSC,Negative Special Case)检测,此时如果确定将该疾病称作阴性或NEG,则将其结果改变成“NA”(见上述阴性特定病倒)。否则输出值将该疾病称作为非常强的一致性或相关性(疾病)。
如果不能确定某疾病的一致性大于或等于该VSC,那么在步骤60中(图4),该算法可确定最佳一致性的疾病是否超过用户可判断的中等截取(MC)域值。例如,可将MC设置为25%或30%。如果具有最佳一致性的疾病不符合该MC域值则步骤65返回值为“NA”结果。如果具有最佳一致性的疾病不能满足该MC域值,则步骤70中该算法可确定具有第二最佳一致性的疾病是否满足该MC域值。如果是,在步骤75中进行NSC检测,如果NSC检测满意,则表明它们一致性的步骤80中返回(显示)出最佳和第二最佳疾病。如果该MC域值不满意,则在步骤85中进行最佳疾病的NSC检测,如果满意,则在表明其一致性的步骤90中返回(显示)出最佳疾病。在以上实例中,SS、SLE和MYO的相符值分别为60%、20%和20%,如果将VSC设置为65%,将MC设置为35%,则该算法将返回(显示)“具有中等相符的SS”。
一方面,在此过程中也采用强截取(SC)域值。例如,此过程可确定满足MC域值的某疾病是否也满足SC域值,如果是,输出结果将显示强相符。例如,如果在上述例子中将SC设置为50%,结果可能是“具有强相符的SS”。故宜将SC设置为50%或更高。
下表1显示在kNN匹配期间真实原始数据的一个例子。表1显示了“未知”以及被该过程认为是“最佳匹配”的11个邻居的11种分析物的结果,用AI表示(除分析物dsDNA用IU/ml表示)。一方面,提供表1中的数据作为用户显示输出,优选将AI值参见如图3步骤10所述标准化。将dsDNA值先除以10以转变成AI。
                           表1 MDSS结果的例子
  病人  dsDNA(IU/ml)   染色质A.I   核糖体PA.I  SmA.I   SmRNPA.I   RNPA.I   Scl-70A.I   Jo-1A.I  SSAA.I   SSBA.I   着丝粒A.I   医生诊断
  未知匹配#1匹配#2匹配#3匹配#4匹配#5匹配#6匹配#7匹配#8匹配#9匹配#10匹配#11  6222131504440>4001436554340   >8.0>8.06.0>8.077.1>8.0>8.0>8.01.37.76.2   3.43.4>8.00.2<0.2<0.2<0.20.6<0.22.4<0.2<0.2  0.30.60.50.2<0.2<0.20.30.3<0.2<0.20.2<0.2   0.40.31.30.30.2<0.2<0.20.4<0.2<0.2<0.2<0.2   0.80.20.3<0.2<0.21.20.20.50.40.21.9<0.2   0.8<0.2<0.20.80.4<0.2<0.2<0.2<0.2<0.2<0.2<0.2   <0.2<0.2<0.2<0.2<0.2<0.2<0.2<0.2<0.2<0.2<0.2<0.2  <0.310.5<0.2<0.2<0.2<0.2<0.2<0.2<0.2<0.2<0.2   <0.4<0.2<0.2<0.2<0.2<0.2<0.2<0.2<0.2<0.2<0.2<0.2   <0.5<0.2<0.2<0.2<0.2<0.2<0.2<0.2<0.2<0.20.3<0.2 SLESLESLESLENEGSLESLESLESLENEGSLE
该算法选出和匹配疾病是SLE,非常强相关性
AI≥1.0为阳性
dsDNA:≥10IU/ml为阳性;<5为阴性;5-9不确定。
在此例中,11个“邻居”中有9个被诊断为SLE,二个不是;医生诊断术语说“应该报告为CTD阴性”。医生对这二例提供的确切诊断是“类风湿性关节炎”(RA)和“无病”。可能令人惊奇的是二例具有典型SLE的dsDNA和染色质抗体水平而未诊断为此病,但这是常见的。诊断为SA的病人可能有称为“RUPUS”的状态,这基本上是一种SLE和RA相重叠的疾病,见于<5%的RA病人。“无病”病人可能不符合SLE标准,即使血清学结果强烈提示为此病。
图6显示的是为KNN匹配产生的一种可能的用户显示输出。如所示,所有数值都已标准化。“特异性”指如上所述的行一致性值。此例中,MDSS报告提示SLE具有非常强(如100%)的疾病一致性。
训练组所用的样品
本发明系统数据库中所用的血清库应符合许多标准。首先,应反映遵照识别标准的高级医生的临床诊断。训练组实例所用的1413个样品见表2,是由众所周知的研究院:俄克拉荷马医学研究基金会(Oklahoma Medical Research Foundation)、斯坦佛大学(Stanford University)和UCLA的医生收集的具有CTD的那些样品。这些医生也提供了无病者的样品,和纤维肌痛、骨关节炎、其它结缔组织病如抗磷脂综合征及脉管炎个体的样品。其它样品获自缅因州血液研究基金会(Foundation for BloodResearch);加入这些样品使该数据库包括没有诊断为CTD的不明确和阳性ANA的样品,因为这类样品临床上常遇到。训练组的样品确切分布见下表2。
表2  MDSS训练组中的样品
医生诊断                    N
CREST                       34
CREST/SS                    1
CTD                         29
DMYO                        20
DMYO/SLE                    1
纤维肌痛                    68
纤维肌痛/OA                 2
纤维肌痛/SLE                1
MCTD/SLE                    1
MCTD                        25
MCTD/CREST/SLE              1
MCTD/雷诺病/SLE             1
MCTD/SLE                    1
NEG                         373
OA                          70
OA/纤维肌痛                 2
OA/RA                       3
OA/SLE                      1
PMYO                    51
RA                      232
RA/纤维肌痛             2
RA/SS                   2
雷诺病                  2
SLE                     374
SLE/CREST               1
SLE/雷诺病              14
SLE/SS                  19
SLE/AA/雷诺病           2
SLE/UCTD                1
SS                      24
SS/UCTD                 1
硬皮病                  29
UCTD                    25
总计                    1413
当该系统产生阳性结果时,临床医生根据表3所示的输出提供可进行随访检测的相关建议。
表3  可能输出的列表
  系统注释   适合的随访检测
  SLE   dsDNA、染色质、Sm、RiboP、着丝粒
  MCTD   RNP、SmRNP
  斯耶格伦综合征(SS)   SSA、SSB
  硬皮病/CREST/雷诺病(SclCR)   Scl-70、着丝粒
  肌炎(MYO)   Jo-1
  NA(不相关-抗体水平不显示可能与系统性自身免疫疾病相关的模式)   没有根据所观察到的抗体模式建立模式。可能榈具有不典型模式。表明不需要进一步检测,除非有强的临床证据支持一种上述疾病。
本发明在改进ANA筛检时特别有用。ANA筛检具体可用作SLE的“排除”试验,但在差别诊断中价值很小。由于对阳性NA筛检要进行随访,医生必然要求测定特异性抗体。通过赋予相关性或提议考虑合适的随访检测,本发明系统可帮助医生完成此任务。实施例见表3所示。这些相关性在性质上类似于SLE“同源性”模式和硬皮病“核仁模式”的传统相关性;医生已运用这些传统相关性数十年。这些传统相关性的高水平舒适度得以从IFA方法转变为更新的EIA方法,为许多实验室难以进行。除了将本发明系统加入ANA筛检外,实验室引导医生适当进行随访检测的能力得到恢复并且事实上得到改进。
NA相关性和显示一种以上相关性的报告
如以上和表3中所述,本系统的一种可能输出值包括“NA(无相关疾病-抗体水平没能显示与系统性自身免疫病相关的模式)”。一方面,此输出数值表明至少检测到一种阳性抗体,但该数据库成员匹配不充分,超过给定的截取值,和/或匹配的疾病总共低于某百分比,如25%。因为有许多样品得自数据库中的非-CTD,如纤维肌痛和RA,NA相关常表示所获得的匹配疾病是RA而不是SLE。
该数据库中的许多样品可不含有阳性抗体。数据库中宜包括这类样品,因为如果需要,它们可使本系统能计算特异性。得自纤维肌痛、骨关节炎(OA)、皮肌炎(DMYO)和类风湿性关节炎病人的大多数样品是抗体阴性。
采用kNN算法的一个主要优点是能报告两种联合征(association)。如表2所示,医生常常做作一种以上的诊断;SLE合并SS(斯耶格伦病)最常见。许多SLE病人还常合并雷诺综合征。本发明的系统将经常报告SLE/SS、SLE/SclCR和SLE/NA。
表1所示的实例得自抗-dsDNA抗体和抗染色质抗体水平非常高的病人(“未知”)。存在两种非常高的抗体几乎总会导致良好的疾病相关。然而,许多样品缺乏这种明确的模式。这类病例中,典型的输出相关可能是SLE/NA,表明该系统未能报告类似于SLE病人但也类似于患其它疾病的病人,见表3。
由于本系统的一个目的是提供高预测价值,故有时会将SLE样品报告为NA。这些样品可能含有中等水平的诊断性抗体,如抗dsDNA抗体和抗-Sm抗体。
如表1所示,某些模式可能与某疾病强相关,而其它可能是更适度相关。SLE/NA代表了给定的某未知样品与狼疮最适度相关一方面,具有更强相关的样品在输出中鉴定为“中等”、“强”或“非常强”相关。表1显示非常强相关的一个例子(如大于所选择匹配疾病的75%诊断为同一疾病)。另外,图5说明显示面板的一个例子,包括表示相关疾病强度的图例。
屏幕输出与详细的抗体报告
在美国,希望医生遵照临床实践指南(clinical practice guidelines)来选择ANA测试的病人和排序随访试验。因为特异性抗体检测与屏幕补尝不相适合,大多数医院和研究所不能得到抗体输出,如表1所示本发明产生的11种抗体的输出。通过本系统输出与ANA屏幕上的“阳性”输出的联合,一方面,本发明给予医生的报能表提供了相关疾病的选项而不会招致增加排序特异性抗体的费用。用于产生屏幕显示结果的样品通常不能用于产生特异性抗体结果;实验室必须用适当排序重新分析这些样品。
在某些医院临床实施指南能支持所有抗体输出,不论是第一线测试的或随访测试的抗体的直接报表用另一方法进行筛选检测。因此在一方面,本发明系统的配制有利于提供一报表选项将抗体输出与相关疾病组合在一起。图5说明在显示面板中提供的这种输出的一个例子。一方面,对任何样品不提供抗体输出,除非需要所有的如11种特异性抗体。
其它有用的智能系统/统计学分析方法
贝叶斯算法与k最近邻算法的不同在于以训练组的所有数据为基础,而非根据其接近测试病人所选择的有限组来计算概率结果。贝叶斯算法从训练组数据库中的诸数据点抽取两种类型数据,一种提供疾病的流行性,另一种提供统计学度量如平均值和标准差。测定病人样品和每种疾病的概率密度(函数),计算每种疾病的可能性。然后以该疾病的似然率除以所有疾病的总似然率确定各疾病的相对值,选出具有相对值的疾病完成诊断。类似k最近邻算法,贝叶斯算法可用于检测一位病人存在的两种疾病。
神经网络系统是按层排列通过通信通道连接的节点或单纯数字处理单元组成的网络。所述通道按训练组输入的信息作了不同加权。数据按对这些通道指定的不同加权从第一层通过进入后续层。给定层的每个节点乘以先前层所有节点值再除以加入二层节点中的连接通道的权重,然后确定这些值的和。然后使所述和通过S形(“S曲线”)函数来鉴定疾病。
主要成分分析是一种多变量技术,利用正交因子空间将数据矩阵还原为其最低维度。可按照此技术处理训练组来鉴定许多主要成分。然后利用此信息来模拟病人测试数据,所用技术为例如靶转换或曲线拟合。主要成分分析或神经网络分析都不适合检测两种疾病。
也可采用统计学数据分析技术人员已知的其它模式识别技术,本领域技术人员不难明白本发明提出可采纳这些技术用于系统性自身免疫疾病。不论采用(那种)模式识别技术,不难使该技术及其应用在本发明中用计算机来执行。为具体分析专门设计的软件业已开发成为熟练的软件工程师的常规材料。
抗体和试验
本发明用的测试数据包括与系统性自身免疫疾病不同程度相关的各种抗体水平成比例的或代表性的数值。目前已知自身免疫疾病表达了100种以上的抗体。例子见Peter,J.B.等,Autoantibodies(自身抗体);Elsevier Science B,V,Amsterdam(1996)所列的表,其内容纳入本文作参考。可从市场上购买到这些抗体中许多种的抗原,根据文献中对它们的描述不难合成其它抗体的相应抗原。这些抗原的一些来源有:BioPacific,Emeryville,California,USA;Immunovision,Springdale,Arkansas,USA;和KMI Diagnostics,Inc.,Minneapolis,Minnesota,USA。自身免疫性疾病中表达的可在免疫试验中用与其结合的抗原鉴定的抗体例子见下表:
SSA 60
SSA 60SSA 52
SSB 48
Sm BB’
Sm D1
Sm
SmRNP
RNP 68
RNP A
RNP C
核仁纤维蛋白
核糖体蛋白P0、P1和P2
dsDNA
核小体
Ku
着丝粒A
着丝粒B
Scl-70
Pm-Scl
RNA-聚合酶1、2和3
Th
Jo-1
Mi-2
PL7
PL12
SRP
本发明不限于用上表所列抗原鉴定的抗体。而是,训练组要检测和定量的抗体数目,及病人样品中要检测和定量的抗体数目可以不同,这不是本发明的关键处。然而所选择的具体抗体和选出组中这类抗体的数目可能影响试验的准确度和鉴定所存在的自身免疫疾病的能力。在大多数病倒中,考虑可检测10-100种抗体,优选15-25种抗体。在本发明优选实施方式中,用上表所列抗原鉴定至少10种抗体,在其它优选实施方式中,采用上表所列的所有抗体。
例如,在一实施方式中,测试组采用了以下抗体(用它们所结合的抗原鉴定):
SSA 60,
SSA 52,
SSB 48,
Sm,
SmRNP,
RNP 68,
RNP A,
核糖体蛋白P0、P1和P2,
dsDNA,
核小体,
着丝粒B,
Scl-70,和
Jo-1。
然而,对于上列抗原不可能鉴定皮肌炎。
在一实施方式中,检测和采用称为SmRNP的抗原,它是一种多种蛋白的复合物,包含SmD1和RNP 68RNPA,可用作“验证”个体抗原的测试结果,因为它可帮助该系统检索出这些蛋白质。
类似地,用于开发训练组的不同来源参比样品的数目也可以不同,这不是本发明的关键处,虽然所选择的数目可能影响可检测自身免疫病的范围。大多数病例考虑采用100-10000个参比样品,优选200-2000个或更多。
可用常规抗体试验检测每种抗体的定量水平。通常优选免疫试验。可采用抗原捕获(间接免疫试验)和(抗体)类型捕获试验,优选抗原捕获,可用酶标记、放射标记或荧光标记进行检测。试验可以是比色法、发光法、荧光法、酶法、放射法或其它方法如浊度法、比浊法、颗粒计数或肉眼观察评估。酶标记的例子有:碱性磷酸酶、D-半乳糖苷酶、葡萄糖-6-磷酸脱氢酶、辣根过氧化氢酶、内酰胺酶、蜂毒肽和脲酶。放射性同位素标记的例子有钴-57和碘-125。荧光标记的例子有以下的琥珀酰亚胺酯和乙烯基砜:呫吨、花青、香豆素、苯甲亚胺、菲啶、乙啡啶染料、吖啶染料、咔唑染料、吩嗪染料、卟啉染料、喹啉染料和天然产生的蛋白质染料。荧光素和罗丹明是呫吨染料的具体类型。具体例子有:6-羧基荧光素黄、6-羧基-4’,5’-二氯-2’,7’-二甲氧基荧光素、N,N,N’,N’-四甲基-6-羧基罗丹明、6-羧基-X-罗丹明、5-羧基罗丹明-6G、5-羧基罗丹明-6G、四甲基罗丹明、罗丹明绿和罗丹明红。7-羟基香豆素是香豆素的一个例子。Hoechst 33258是苯甲亚胺染料的一个例子。德克萨斯红是菲啶染料的一个例子。花青琥珀酰亚胺酯染料的例子有:硫碘花青琥珀酰亚胺酯、(羧基烷基)花青琥珀酰亚胺酯和BODIPY琥珀酰亚胺酯(Molecular Probes,Inc.,Eugene,Oregon,USA)。天然产生的蛋白质染料例子是藻红素。本领域技术人员不难明白还有许多其它例子。
实施本发明进行多种抗体定量试验所用的序列和方式可有很大不同。在优选实施方式中,通过多重系统对一个样品进行这些试验,所述多重系统能区分这些试验从而提供每种抗体的检测值。这可通过多种方式实现。在异质性结合试验中,将一种结合成员固定在固相上是最有效的,因为此法可使结合对与未结合物质相分离。在多重异质结合试验中,作为说明性例子,将固体颗粒,优选磁性微球作为固定相。这些试验中,将微球分成许多组,各组含有供一种试验用的能共价结合在微球表面的试剂,凭借可鉴别特征不同组可相互区别,从而得以分别检测一组与其它组的试验结果。区别参数可以是颗粒大小、荧光(当采用荧光标记的试验时,该试验应采用独立的荧光标记)、光散射、发射光和光吸收。共价结合于微球表面的结合成员依据所用免疫试验的类型而不同。因为本发明的分析物都是抗体,故明确这些抗体的相应抗原是结合微球表面的特别方便的结合成员。通过流式细胞术不难实现各组的实际区分。
当采用磁珠时,其磁性使得能快速分离固相与液相,并且固相洗涤方便。可采用顺磁材料、磁铁材料、铁氧磁性材料或金属磁性材料制成的珠以赋予这些珠磁性。磁性反应材料宜作为该珠的一种成分,珠的其余成分为加入该磁性材料中的聚合材料,或将它们混合。所述聚合材料可以是化学方法产生的能允许加入到该结合反应中的抗原或其它试验试剂附着。
这里描述的多重系统以及对于实践本发明有用的其它系统披露于1999年4月30日提交的题为“Multiplex Flow Assays Preferably With Magnetic Particles as SolidsPhase(优选含有磁珠作为固相的多重流动试验)”的发明人为Micheal I.Watkins等的待批美国专利申请No.09/302,920中。该申请的完整内容纳入本文作为参考。
进行测试的生物样品可以是抽取自病人的任何生物液体,其中含有要检测的疾病的特征性可检测抗体群。可采用血清、血浆、尿液或脑脊液。优选血清样品。
本发明总体上可用于检测和诊断系统性自身免疫疾病。例子包括系统性红斑狼疮(SLE)、斯耶格伦综合征(SS)、硬皮病、多肌炎和皮肌炎、CREST(钙质沉着、雷诺现象、累及食道、指趾硬皮病和毛细血管扩张)、混合性结缔组织病,韦格纳病、类风湿性关节炎和脊椎结节病。
以上所述目的是为了说明。本领域技术人员不难明白可对本发明的组成和方法的各种参数作进一步修改和变化。例如,可调整模式识别算法,通过设置能区分某具体疾病的“健康”与“不健康”的边界线水平高于其它疾病的相应边界线,从而减少表明该疾病存在与否的样品数目,来控制假阴性率。但是这些和其它变化均属于本发明的范围内。

Claims (31)

1.一种用计算机执行的根据病人测试样品中存在的自身抗体来鉴定该病人测试样品是否与一种或多种特定的系统性自身免疫疾病(SAD)相关的方法,其特征在于,该方法包括:
将多个参考数据组存入存储器,各数据组的数值代表多种特定自身抗体中每一种的水平,其中各特定SAD的参考数据组包括至少一个与该特定SAD相关的参考数据组,且所述参考数据组包括至少一个与该特定SAD无关的参考数据组;
接收样品数据组,其数值代表病人测试样品中所述多种自身抗体中每一种的水平;和
将k-最近邻过程自动应用于该样品数据组和参考数据组,以产生能表明该病人测试样品是否与所述特定SAD无关,或与所述特定SAD中的一种或多种相关的统计学决定。
2.如权利要求1所述的用计算机执行的方法,其特征在于,所述SAD包括选自系统性红斑狼疮、硬皮病(SLE)、斯耶格伦综合征(SS)、多肌炎(PMYO)、皮肌炎(DMYO)、CREST和混合性结缔组织病(MCTD)的两种或多种系统性自身免疫疾病。
3.如权利要求1所述的用计算机执行的方法,其特征在于,所述SAD包括选自系统性红斑狼疮(SLE)、硬皮病、斯耶格伦综合征(SS)、肌炎(MYO)、多肌炎(PMYO)、皮肌炎(DMYO)、CREST、结缔组织病(MCTD)、纤维肌痛、骨关节炎(OA)、雷诺综合征和类风湿性关节炎(RA)的两种或多种系统性自身免疫疾病。
4.如权利要求1所述的用计算机执行的方法,其特征在于,所述多种自身抗体包括针对以下抗原中至少十种的抗体:
SSA 60,
SSA 52,
SSB 48,
Sm BB’,
Sm D1,
Sm,
SmRNP,
RNP 68,
RNP A,
RNP C,
核仁纤维蛋白,
核糖体蛋白P0、P1和P2,
dsDNA,
核小体,
Ku,
着丝粒A,
着丝粒B,
Scl-70,
Pm-Scl,
RNA-聚合酶1、2和3,
Th,
Jo-1,
Mi-2,
PL7,
PL12,和
SRP。
5.如权利要求1所述的用计算机执行的方法,其特征在于,所述多种自身抗体由针对以下抗原的抗体构成:
SSA 60,
SSA 52,
SSB 48,
Sm,
SmRNP,
RNP 68,
RNP A,
核糖体蛋白P0、P1和P2,
dsDNA,
核小体,
着丝粒B,
Scl-70,和
Jo-1。
6.如权利要求1所述的用计算机执行的方法,还包括生成能说明该病人测试样品是否与所述特定SAD无关,或与所述特定SAD中的一种或多种相关的显示输出。
7.如权利要求6所述的用计算机执行的方法,其特征在于,所述生成包括发送显示输出到远程计算机系统并在与远程计算机系统耦合的显示屏上提供该显示输出。
8.如权利要求1所述的用计算机执行的方法,其特征在于,所述接收包括通过网络连接从自动化测试系统接收样品数据组。
9.如权利要求8所述的用计算机执行的方法,其特征在于,所述存储包括通过网络连接从自动化测试系统接收参考组数据。
10.如权利要求1所述的用计算机执行的方法,其特征在于,所述存储包括从一个或多个测试来源接收参考数据组。
11.如权利要求1所述的用计算机执行的方法,其特征在于,所述k-最近邻过程包括对各参考数据组确定样品数据组与参考数据组之间的一致性值,并将各一致性值与域值作比较,该过程只采用一致性值高于域值的最先几个参考数据组。
12.如权利要求11所述的用计算机执行的方法,其特征在于,所述k-最近邻过程还包括对各参考数据组确定样品数据组与参考数据组之间的距离度量值。
13.如权利要求11所述的用计算机执行的方法,其特征在于,所述过程还包括:
确定所述最先几个参考数据组的数目是否高于最小截取值,
如果不,表明该病人测试样品与任何特定SAD不相关,和
如果是,确定该病人测试样品是否与一种或多种特定SAD相关。
14.如权利要求11所述的用计算机执行的方法,其特征在于,所述过程还包括确定所述最先几个参考数据组中每一组的疾病一致性值。
15.如权利要求14述的用计算机执行的方法,其特征在于,确定疾病一致性值包括:
对于与最先几个参考数据组相关的各SAD:
加入与该SAD相关的最先几个参考数据组的数目并除以最先几个参考数据组的总数以产生该SAD的疾病一致性值。
16.如权利要求15所述的用计算机执行的方法,还包括将各疾病一致性值与第一域值作比较,并返回一致性值高于第一域值的相关SAD。
17.如权利要求16所述的用计算机执行的方法,还包括将各疾病一致性值与第二域值作比较,并返回一致性值高于第二域值的相关SAD。
18.一种配制成提供输出数据的计算机系统,根据病人测试样品中存在的自身抗体水平,所述输出数据表明该病人的测试样品是否与多种特定的系统性自身免疫疾病(SAD)中的一种或多种相关;该系统包括:
存储多个参考数据组的存储装置,各数据组的数值代表多种特定自身抗体中每一种的水平,其中各特定SAD的参考数据组包括至少一个与该特定SAD相关的参考数据组,且所述参考数据组包括至少一个与该特定SAD无关的参考数据组;
接收样品数据组的装置,该样品数据组的数值代表了病人测试样品中所述多种自身抗体中每一种的水平;
处理所述样品数据组和参考组数据的装置,处理采用k-最近邻过程,以产生表明该病人测试样品是否与所述特定SAD无关,或与所述特定SAD中的一种或多种相关的统计学决定;和
提供包括所述统计学决定的输出数据的装置。
19.如权利要求18所述的系统,其特征在于,所述SAD包括选自系统性红斑狼疮(SLE)、硬皮病、斯耶格伦综合征(SS)、肌炎(MYO)、多肌炎(PMYO)、皮肌炎(DMYO)、CREST、结缔组织病(MCTD)、纤维肌痛、骨关节炎(OA)、雷诺综合征和类风湿性关节炎(RA)的两种或多种系统性自身免疫疾病。
20.如权利要求18所述的系统,其特征在于,所述多种自身抗体包括针对以下抗原中至少十种的抗体:
SSA 60,
SSA 52,
SSB 48,
Sm BB’,
Sm D1,
Sm,
SmRNP,
RNP 68,
RNP A,
RNP C,
核仁纤维蛋白,
核糖体蛋白P0、P1和P2,
dsDNA,
核小体,
Ku,
着丝粒A,
着丝粒B,
Scl-70,
Pm-Scl,
RNA-聚合酶1、2和3,
Th,
Jo-1,
Mi-2,
PL7,
PL12,和
SRP。
21.如权利要求18所述的系统,其特征在于,所述多种自身抗体由针对以下抗原的抗体构成:
SSA 60,
SSA 52,
SSB 48,
Sm,
SmRNP,
RNP 68,
RNP A,
核糖体蛋白P0、P1和P2,
dsDNA,
核小体,
着丝粒B,
Scl-70,和
Jo-1。
22.如权利要求18所述的系统,其特征在于,所述提供输出数据的装置包括:一个显示输出数据的监视器,打印输出数据的打印机和将输出数据提供给各计算机系统的通信接口装置。
23.如权利要求18所述的系统,其特征在于,所述接收样品数据组的装置包括配置成从远程自动检测系统接收数据的界面装置,手动输入装置,和配置成从计算机可读介质读取数据的装置。
24.如权利要求18所述的系统,其特征在于,所述存储装置包括RAM、ROM、计算机可读磁盘介质、硬盘装置和单独的数据库系统中的一种。
25.如权利要求18所述的系统,其特征在于,所述k-最近邻过程对各参考数据组确定样品数据组与参考数据组之间的一致性值,并将各一致性值与域值作比较,该过程只采用一致性值高于域值的最先几个参考数据组。
26.如权利要求25所述的系统,其特征在于,所述k-最近邻过程还对各参考数据组确定样品数据组与参考数据组之间的距离度量值。
27.如权利要求25所述的系统,其特征在于,所述k-最近邻过程还确定最先几个参考数据组的数目是否高于最小截取值,
如果不,表明该病人测试样品与任何特定SAD不相关,和
如果是,确定该病人测试样品是否与一种或多种特定SAD相关。
28.如权利要求25所述的系统,其特征在于,所述k-最近邻过程还确定最先几个参考数据组中每一组的疾病一致性值。
29.如权利要求28所述的系统,其特征在于,对于与最先几个参考数据组相关的各SAD,通过加入与该SAD相关的最先几个参考数据组的数目并除以最先几个参考数据组的总数以产生该SAD的疾病一致性值来确定疾病一致性值。
30.如权利要求29所述的系统,其特征在于,所述过程还将各疾病一致性值与第一域值作比较,并返回一致性值高于第一域值的相关SAD。
31.如权利要求30所述的系统,其特征在于,所述过程还将各疾病一致性值与第二域值作比较,并返回一致性值高于第二域值的相关SAD。
CNA2005800117211A 2004-04-20 2005-04-20 诊断系统性自身免疫疾病的模式识别法 Pending CN1961212A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US10/828,846 2004-04-20
US10/828,846 US20040265874A1 (en) 2000-10-17 2004-04-20 Pattern recognition method for diagnosis of systemic autoimmune diseases

Publications (1)

Publication Number Publication Date
CN1961212A true CN1961212A (zh) 2007-05-09

Family

ID=35197561

Family Applications (1)

Application Number Title Priority Date Filing Date
CNA2005800117211A Pending CN1961212A (zh) 2004-04-20 2005-04-20 诊断系统性自身免疫疾病的模式识别法

Country Status (7)

Country Link
US (1) US20040265874A1 (zh)
EP (1) EP1738168A4 (zh)
JP (1) JP2007534086A (zh)
CN (1) CN1961212A (zh)
AU (1) AU2005236067A1 (zh)
CA (1) CA2562530A1 (zh)
WO (1) WO2005103300A2 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101358983B (zh) * 2007-07-31 2013-01-16 希森美康株式会社 辅助诊断系统及辅助诊断信息提供装置
CN110412290A (zh) * 2019-07-29 2019-11-05 冯仕品 Sle总体疾病活动度和肾脏疾病活动度信息检测系统

Families Citing this family (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009505270A (ja) * 2005-08-19 2009-02-05 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 健康管理データの管理システム
EP2076590A4 (en) * 2007-05-03 2011-06-01 Medimmune Llc SELF-IMMUNE DISEASE SELF-ANTIBODY MARKERS
NZ587241A (en) 2008-02-08 2013-05-31 Phadia Ab Method, computer program product and system for enabling clinical decision support
FR2935802B1 (fr) * 2008-09-05 2012-12-28 Horiba Abx Sas Procede et dispositif de classification, de visualisation et d'exploration de donnees biologiques
WO2011127042A1 (en) * 2010-04-06 2011-10-13 The Broad Institute High capacity analyte detection
US10619195B2 (en) 2010-04-06 2020-04-14 Massachusetts Institute Of Technology Gene-expression profiling with reduced numbers of transcript measurements
EP2418491A1 (en) * 2010-08-10 2012-02-15 Bioftalmik, S.L. Method for the diagnosis of dry eye and blepharitis
RS20110272A3 (en) 2011-06-22 2013-06-28 Jentsch, Klaus Dieter DEVICE AND PROCEDURE FOR REMOTE DIAGNOSTICS AND CONTROL OF AUTOMATED TECHNICAL DEVICES
CA2883218A1 (en) * 2012-08-28 2014-03-06 The Regents Of The University Of California Methods and systems for calculating and using statistical models to predict medical events
WO2015026953A1 (en) * 2013-08-20 2015-02-26 Ohio State Innovation Foundation Methods for predicting prognosis
GB2517702A (en) * 2013-08-28 2015-03-04 Ibm Collaborative electronic nose management in personal devices
US20170330045A1 (en) * 2015-10-28 2017-11-16 Dario B. Crosetto Method and apparatus to build new electronic instruments and devices: the 3d-flow opra to solve applications of fast, real-time, multi-dimension object pattern recognition algorithms (opra) and the 3d-cbs (3-d complete body screening) to accurately measure minimum abnormal biological processes of diseases at an early curable stage such as cancer improving diagnosis and prognoses for maximizing reduction of premature deaths and minimize the cost per each life saved
GB201613318D0 (en) 2016-08-02 2016-09-14 Univ Oxford Innovation Ltd System monitor and method of system monitoring
CA3003032A1 (en) * 2018-04-27 2019-10-27 Nanostics Inc. Methods of diagnosing disease using microflow cytometry
WO2021207466A1 (en) * 2020-04-09 2021-10-14 Credo Science, Llc Diagnosing and treating fibromyalgia
US20220028527A1 (en) * 2020-07-22 2022-01-27 Optimdosing Llc Smart nutrition dosing
US20220130542A1 (en) * 2020-10-22 2022-04-28 The Regents Of The University Of Michigan Using machine learning to assess medical information based on a spatial cell organization analysis
US11367521B1 (en) 2020-12-29 2022-06-21 Kpn Innovations, Llc. System and method for generating a mesodermal outline nourishment program

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5293454A (en) * 1989-03-08 1994-03-08 Sharp Kabushiki Kaisha Learning method of neural network
JP3703858B2 (ja) * 1993-09-30 2005-10-05 シスメックス株式会社 帰属度判別装置
US5874688A (en) * 1993-11-29 1999-02-23 Aeci Explosives Limited Explosives dispersed from a pressurized container
US5681700A (en) * 1994-05-25 1997-10-28 Oklahoma Medical Research Foundation Assay for pathogenicity of anti-DNA antibodies
US6031232A (en) * 1995-11-13 2000-02-29 Bio-Rad Laboratories, Inc. Method for the detection of malignant and premalignant stages of cervical cancer
US6024705A (en) * 1998-11-06 2000-02-15 Bioacoustics, Inc. Automated seismic detection of myocardial ischemia and related measurement of cardiac output parameters
EP1233366A3 (en) * 1999-06-25 2004-10-13 Genaissance Pharmaceuticals, Inc. Methods for obtaining and using Haplotype data
AU2001296883A1 (en) * 2000-10-17 2002-04-29 Bio-Rad Laboratories, Inc. Pattern recognition method for diagnosis of systemic autoimmune diseases

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101358983B (zh) * 2007-07-31 2013-01-16 希森美康株式会社 辅助诊断系统及辅助诊断信息提供装置
CN110412290A (zh) * 2019-07-29 2019-11-05 冯仕品 Sle总体疾病活动度和肾脏疾病活动度信息检测系统

Also Published As

Publication number Publication date
EP1738168A4 (en) 2009-06-10
AU2005236067A1 (en) 2005-11-03
US20040265874A1 (en) 2004-12-30
JP2007534086A (ja) 2007-11-22
EP1738168A2 (en) 2007-01-03
WO2005103300A2 (en) 2005-11-03
WO2005103300A9 (en) 2006-05-11
CA2562530A1 (en) 2005-11-03
WO2005103300A3 (en) 2006-07-20

Similar Documents

Publication Publication Date Title
CN1961212A (zh) 诊断系统性自身免疫疾病的模式识别法
Greenhawt et al. Peanut allergy diagnosis: a 2020 practice parameter update, systematic review, and GRADE analysis
Farrell et al. Diagnosis of cystic fibrosis in screened populations
Quinn et al. Informant Questionnaire on Cognitive Decline in the Elderly (IQCODE) for the diagnosis of dementia within community dwelling populations
Rigon et al. Indirect immunofluorescence in autoimmune diseases: assessment of digital images for diagnostic purpose
Bizzaro et al. Automated antinuclear immunofluorescence antibody screening: a comparative study of six computer-aided diagnostic systems
US20210215610A1 (en) Methods of disease detection and characterization using computational analysis of urine raman spectra
Scala et al. IgE recognition patterns of profilin, PR-10, and tropomyosin panallergens tested in 3,113 allergic patients by allergen microarray-based technology
Rigon et al. The inter-observer reading variability in anti-nuclear antibodies indirect (ANA) immunofluorescence test: A multicenter evaluation and a review of the literature
JP7286863B2 (ja) 医療データの自動化された検証
CN1667634A (zh) X射线照射报告系统、医用装置以及检查规程发送系统
CN1811447A (zh) 核酸薄膜层析快速检测方法及其试纸条及其用途
JP2013505730A (ja) 患者を分類するためのシステムおよび方法
CN1194045A (zh) 计算机辅助疾病诊断方法
US20220057394A1 (en) Biomarkers and methods for measuring and monitoring axial spondyloarthritis activity
US20120190578A1 (en) Plasma Complement Components as Expression Markers for Age-Related Macular Degeneration and Related Phenotypes
Melendez et al. Automatic versus human reading of chest X-rays in the Zambia National Tuberculosis Prevalence Survey
Shemesh et al. Machine learning analysis of naïve B-cell receptor repertoires stratifies celiac disease patients and controls
US10126300B2 (en) Immunosignature based diagnosis and characterization of canine lymphoma
van Baardwijk et al. A decentralized kidney transplant biopsy classifier for transplant rejection developed using genes of the Banff-human organ transplant panel
CN113409947A (zh) 新冠肺炎重症化预测模型、系统及其建立方法、预测方法
Quinn et al. Informant Questionnaire on Cognitive Decline in the Elderly (IQCODE) for the detection of dementia within community dwelling populations
CN111710423A (zh) 基于回归模型测定心境障碍发病风险概率的方法
Majsiak et al. Evaluation of the Usefulness of a Serological Test for Diagnosis of Celiac Disease Simultaneously Detecting Specific Antibodies and Total IgA
WO2002033415A2 (en) Pattern recognition method for diagnosis of systemic autoimmune diseases

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Open date: 20070509