CN101568838A - 评估癌症状态的方法、癌症评估装置、癌症评估方法、癌症评估系统、癌症评估程序和记录介质 - Google Patents

评估癌症状态的方法、癌症评估装置、癌症评估方法、癌症评估系统、癌症评估程序和记录介质 Download PDF

Info

Publication number
CN101568838A
CN101568838A CNA2007800476016A CN200780047601A CN101568838A CN 101568838 A CN101568838 A CN 101568838A CN A2007800476016 A CNA2007800476016 A CN A2007800476016A CN 200780047601 A CN200780047601 A CN 200780047601A CN 101568838 A CN101568838 A CN 101568838A
Authority
CN
China
Prior art keywords
discriminant
cancer
multivariate discriminant
amino acid
multivariate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CNA2007800476016A
Other languages
English (en)
Inventor
今泉明
安东敏彦
冈本直幸
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ajinomoto Co Inc
Original Assignee
Ajinomoto Co Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ajinomoto Co Inc filed Critical Ajinomoto Co Inc
Priority to CN201410049717.5A priority Critical patent/CN103760367B/zh
Publication of CN101568838A publication Critical patent/CN101568838A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/53Immunoassay; Biospecific binding assay; Materials therefor
    • G01N33/574Immunoassay; Biospecific binding assay; Materials therefor for cancer
    • G01N33/57484Immunoassay; Biospecific binding assay; Materials therefor for cancer involving compounds serving as markers for tumor, cancer, neoplasia, e.g. cellular determinants, receptors, heat shock/stress proteins, A-protein, oligosaccharides, metabolites
    • G01N33/57488Immunoassay; Biospecific binding assay; Materials therefor for cancer involving compounds serving as markers for tumor, cancer, neoplasia, e.g. cellular determinants, receptors, heat shock/stress proteins, A-protein, oligosaccharides, metabolites involving compounds identifable in body fluids
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/68Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
    • G01N33/6803General methods of protein analysis not limited to specific proteins or families of proteins
    • G01N33/6806Determination of free amino acids
    • G01N33/6812Assays for specific amino acids
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • G16B40/20Supervised data analysis

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Immunology (AREA)
  • Chemical & Material Sciences (AREA)
  • Medical Informatics (AREA)
  • Biotechnology (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Urology & Nephrology (AREA)
  • Hematology (AREA)
  • Biomedical Technology (AREA)
  • Data Mining & Analysis (AREA)
  • Cell Biology (AREA)
  • Biophysics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Analytical Chemistry (AREA)
  • Pathology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Public Health (AREA)
  • Evolutionary Biology (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Databases & Information Systems (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Epidemiology (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioethics (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Food Science & Technology (AREA)
  • General Physics & Mathematics (AREA)
  • Medicinal Chemistry (AREA)
  • Hospice & Palliative Care (AREA)
  • Oncology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Organic Chemistry (AREA)

Abstract

提供了评估癌症状态的方法,癌症评估装置,癌症评估方法,癌症评估系统,癌症评估程序和记录介质,其能够精确评估癌症状态,这利用血液的氨基酸中涉及癌症状态的氨基酸的浓度。根据本发明评估癌症状态的方法,测量从待评估个体手机的血液中关于氨基酸浓度的氨基酸浓度数据,并评估个体的癌症状态,这基于在个体的所测量氨基酸浓度数据中所包含的Cys、Gln、Trp、Orn、Arg、Glu、His、Ser和ABA中的至少一个浓度值。

Description

评估癌症状态的方法、癌症评估装置、癌症评估方法、癌症评估系统、癌症评估程序和记录介质
技术领域
【0001】本发明涉及评估评估癌症状态的方法、癌症评估装置、癌症评估方法、癌症评估系统、癌症评估程序和记录介质,其利用血液(血浆)中氨基酸的浓度。
背景技术
【0002】2004年日本死于癌症的人数是男性193075人,女性127259人,并且该死亡人数在全部死亡总人数中排第一位。存活率可能依赖于癌症的类型,但存在某些类型,其早期癌症的五年存活率是80%或更高,但其晚期癌症(progressive cancer)的五年存活率非常低例如大约10%。因此,早期检测对于治疗癌症而言是重要的。
【0003】此处,结直肠癌的诊断包括例如基于免疫学排泄物显微镜观察血液反应的诊断、通过结肠镜检查的结直肠活组织检查。
然而,基于排泄物显微镜观察血液测试的诊断不能作为确定的诊断,并且大部分具有阳性结果的人是假阳性。而且,关于早期结直肠癌,存在关于检测灵敏度和检测特异性二者在基于排泄物显微镜观察血液测试的诊断中都变低的考虑。特别的,在通过排泄物显微镜观察血液测试进行诊断时,通常会忽视右侧结肠中的早期癌症。通过CT(计算机断层扫描)、MRI(磁共振成像)、PET(正电子发射计算机断层扫描)等的成像不适于诊断结直肠癌。
另一方面,通过结肠镜检查的结直肠活组织检查作为确定的诊断,但是高度侵入性检查,并且在筛选阶段采用结直肠活组织检查是不实际的。而且,侵入性诊断例如结直肠活组织检查为患者施加了压力,例如伴随的疼痛,还有可能在检查后出血的风险,等。
因此,从施加给患者的生理负担和性价比的角度,期望缩小发生结直肠癌可能性高的测试个体的靶范围,并对这些人进行治疗。具体的,期望通过侵入性较低的方法选择测试个体,并通过对所选择的测试个体进行结肠镜检查而缩小所选择测试个体的靶范围,并对确定诊断为患有结直肠癌的测试个体进行治疗。
【0004】作为另一个例子,肺癌的诊断包括通过使用X-射线图片、CT、MRI、PET等进行成像、痰液细胞学诊断、利用支气管镜的肺活组织检查、利用经皮针的肺活组织检查、通过解释式(explanatory)胸廓切开术或利用胸腔镜的肺活组织检查的诊断,等。
然而,通过成像的诊断不能作为确定的诊断。例如,在胸部X-射线检查(间接X光线照相术)中,阳性结果率是20%,而特异性是0.1%,大部分具有阳性结果的人都是假阳性。而且,在胸部X-射线检查中,检测灵敏度低,根据日本厚生劳动省的某些检查结果还报道大约80%的已经发生肺癌的患者被忽视。特别地,在早期肺癌中,存在通过成像的诊断检测灵敏度低的考虑。在胸部X-射线检查中,还存在将测试个体暴露到辐射的问题。从便利和成本的角度,通过CT、MRI、PET等诊断性成像也不适于作为大量筛选进行。在痰液细胞学诊断中,只能确定地诊断大约20~30%的患者。
另一方面,使用支气管镜、经皮针、解释式胸廓切开术或胸腔镜的肺活组织检查作为确定的诊断,但是高度侵入性检查,并且对所有怀疑患有肺癌的患者执行肺活组织检查是不实际的。而且,这些侵入性检查对患者产生了压力,例如伴随的疼痛,并且还可以有在检查后出血的风险,等。
因此,从施加给患者的生理负担和性价比的角度,期望缩小发生肺癌可能性高的测试个体的靶范围,并对这些人进行治疗。具体的,期望通过侵入性较低的方法选择测试个体,并通过对所选择的测试个体进行肺活组织检查而缩小所选择测试个体的靶范围,并对确定诊断为患有肺癌的测试个体进行治疗。
【0005】作为另一个例子,乳癌的诊断包括自身检查、乳房触诊和视觉检测、通过乳房X线照相术、CT、MRI、PET等进行诊断成像、穿刺活检等。
然而,自身检查、乳房触诊和视觉检测和诊断成像不能作为确定的诊断。特别的,自身检查不能有效地达到降低乳癌死亡率的程度。而且,自身检查不能如同通过乳房X线照相术所进行的常规筛选一样实现发现大量早期癌症。在早期乳癌中,存在自身检查、乳房触诊和视觉检测或诊断成像在检测灵敏度和检测特异性二者中更差的考虑。通过乳房X线照相术进行诊断成像还具有将测试个体暴露到辐射或过度诊断(overdiagnosis)的问题。从便利和成本的角度,通过CT、MRI、PET等进行诊断成像还不适于作为大量筛选而进行。
另一方面,穿刺活检作为确定的诊断,但是高度侵入性检查,并且对所有根据诊断成像怀疑患有乳癌的患者进行穿刺活检是不实际的。而且,诸如穿刺活检的侵入性诊断对患者产生了压力,例如伴随的疼痛,还可能有在检查后出血的风险,等。
通常,认为,在除了自身检查外的许多情况中,乳癌的检查会使得测试个体犹豫不决。
因此,从施加给生理压力和心理压力,以及性价比的角度,期望缩小发生乳癌可能性高的测试个体的靶范围,并对这些人进行治疗。具体的,期望通过伴随较少心理痛苦或侵入性较低的方法对测试个体进行选择,并对确定诊断为患有乳癌的测试个体进行治疗。
【0006】作为另一个例子,胃癌的诊断包括胃蛋白酶原测试、X-射线检查(间接X光线照相术)、胃窥镜检查、利用肿瘤标记物的诊断,等。
然而,胃蛋白酶原测试、X-射线检查和利用肿瘤标记物的诊断不能作为确定的诊断。例如,胃蛋白酶原测试侵入性较低,但灵敏度在不同的报道中变化,大约40%~85%,而特异性是70%~85%。然而,在胃蛋白酶原测试中,整个检查的选出率(rate of recall)是20%,认为这些结果通常被忽视。在X-射线检查中,灵敏度在不同的报道中变化,大约70~80%,而特异性是85~90%。然而,X-射线检查可能会造成不利的不作用,因为引用了钡,或者暴露到辐射。在利用肿瘤标记物的诊断中,目前还不存在能有效诊断发生胃癌的肿瘤标记物。
另一方面,胃窥镜检查作为确定的诊断,但是高度侵入性检查,并且在筛选阶段执行胃窥镜检查是不实际的。而且,侵入性诊断例如胃窥镜检查会对患者造成压力,例如伴随的疼痛,还可能有在检查后出血的风险,等。
因此,从对患者施加的生理压力和性价比的角度,期望缩小发生胃癌可能性高的测试个体的靶范围,以及对这些人进行治疗。具体的,期望通过具有高灵敏度和特异性的方法对测试个体进行选择,并通过对测试个体进行胃窥镜检查而缩小所选择的测试个体,并对确定诊断为患有胃癌的测试个体进行治疗。
【0007】而且,还存在难以早期检测的癌症,例如胰腺癌。
在胰腺癌中,在患者表达主观症状的时候,通过彻底检查患者被确定地诊断为胰腺癌,但在许多情况中,该癌症被诊断为晚期癌症。
因此,从对患者施加的生理压力和性价比的角度,期望通过适当的筛选缩小发生胰腺癌可能性高的测试个体的靶范围,并对这些人进行治疗。具体的,期望通过具有高灵敏度和特异性的方法对测试个体进行选择,并通过对所选择的测试个体进行全面检查而缩小所选择测试个体的靶范围,并对确定诊断为患有胰腺癌的测试个体进行治疗。
【0008】顺便提一下,已知血液中氨基酸的浓度会因为癌症的发生而变化。例如,Cynober(非专利文献1)已经报道癌症细胞中消耗量的提高,其中分别地,谷氨酰胺主要作为氧化能量来源,精氨酸作为氮氧化物和多胺的前体,甲硫氨酸通过激活癌细胞的能力以摄入甲硫氨酸。Vissers等人(非专利文献2)和Park(非专利文献3)已经报道在结直肠癌患者中血浆中氨基酸消耗与健康个体的不同。Proenza等人(非专利文献4)和Cascino(非专利文献5)已经报道乳癌患者中血浆中的氨基酸消耗与健康个体的不同。
[0009]Nonpatent Literature 1:Cynober,L.ed.,Metabolic and therapeutic aspects of amino acids inclinical nutrition.2nd ed.,CRC Press.
Nonpatent Literature 2:Vissers,Y.LJ.,et.al.,Plasmaarginine concentra tion are reduced in cancer patients:evidence for arginine deficiency?,The American Journal ofClinical Nutrition,200581,p.1142-1146
Nonpatent Literature 3:Park,K.G.,et al.,Argininemetabolism in benign and maglinant disease of breast andcolon:evidence for possible inhibition of tumor-infiltrating macropharges.,Nutrition,19917,p.185-188
Nonpatent Literature 4:Proenza,A.M.,J.Oliver,A.Palouand P.Roca,Breast and lung cancer are associated with adecrease in blood cell amino acid content.J Nutr Biochem,2003.14(3):p.133-8.
Nonpatent Literature 5:Cascino,A.,M.Muscaritoli,C.Cangiano,L.Conversano,A.Laviano,S.Ariemma,M.M.Meguid and F.Rossi Fanelli,Plasma amino acid imbalance inpatients with lung and breast cancer.Anticancer Res,1995.15(2):p.507-10.
发明内容
本发明所要解决的问题
【0010】然而,存在问题,即从时间和成本的角度,并没有进行开发利用多种氨基酸作为解释变量而诊断癌症发生的存在或不存在的技术,并且没有被实际使用。
【0011】本发明是根据上述的问题而进行的,并且本发明的目的是提供评估癌症状态的方法、癌症评估装置、癌症评估方法、癌症评估系统、癌症评估程序和记录介质,其能够通过利用血液中的氨基酸中与癌症状态相关的氨基酸的浓度而精确评估癌症状态。
解决问题的手段。
【0012】本发明的发明人已经进行了深入的研究以解决上述问题,结果,他们已经鉴定了可以用于2组癌症和非癌症之间的鉴别的氨基酸(具体的,在2组之间,以统计学上显著的区别而变化的氨基酸),并且已经发现了包括所鉴定氨基酸的浓度作为解释变量的多变量判别式(关联方程式,指数),其与癌症(具体的,早期癌症)的状态(具体的,病态的进展)显著相关联,这样完成了本发明。
【0013】为了解决所述问题,并达到上面所述的目的,根据本发明的一个方面的评估癌症状态的方法包括测量步骤,其测量关于从待评估的个体收集的血液中氨基酸的浓度值的氨基酸浓度数据;以及浓度值标准评估步骤,其基于在测量步骤所测量的个体的氨基酸浓度数据中所包含的Cys、Gln、Trp、Orn、Arg、Glu、His、Ser和ABA(ABA是α-氨基丁酸)中的至少一个的浓度值,对个体中的癌症状态进行评估。
【0014】本发明的另一个方面是评估癌症状态的方法,其中浓度值标准评估步骤还包括浓度值标准鉴别步骤,其鉴别癌症患者和无癌症个体,这基于在测量步骤中所测量的个体的氨基酸浓度数据中所包含的Cys、Gln、Trp、Orn、Arg、Glu、His、Ser和ABA中的至少一个的浓度值。
【0015】本发明的另一个方面是评估癌症状态的方法,其中浓度标准评估步骤还包括判别式值计算步骤,其计算判别式值,其中判别式值是多变量判别式的数值,其基于在测量步骤所测量的个体的氨基酸浓度数据中所包含的Cys、Gln、Trp、Orn、Arg、Glu、His、Ser和ABA中的至少一个的浓度值以及之前利用氨基酸的浓度作为解释变量而建立的多变量判别式二者的浓度;以及判别式值标准评估步骤,其评估个体中的癌症状态,这基于在判别式值计算步骤中所计算的判别式值,其中多变量判别式包含Cys、Gln、Trp、Orn、Arg、Glu、His、Ser和ABA中的至少一个作为解释变量。
【0016】本发明的另一个方面是评估癌症状态的方法,其中判别式值标准评估步骤还包括判别式值标准鉴别步骤,其鉴别癌症患者和无癌症个体,这基于在判别式值计算步骤所计算的判别式值。
【0017】本发明的另一个方面是评估癌症状态的方法,其中多变量判别式表达为一个分数式,或者多个分数式的总和,并且在构成多变量判别式的分数式的分子和分母的任一个或二者中包含Cys、Gln、Trp、Orn、Arg、Glu、His、Ser和ABA中的至少一个作为解释变量。
【0018】本发明的另一个方面是评估癌症的方法,其中多变量判别式是式1或式2:
a1×Orn/(Trp+Arg)+b1×(Cys+Ile)/Leu+c1              (式1)
a2×Glu/His+b2×Ser/Trp+c2×Val/Lys+d2×Pro/Arg+e2  (式2)
其中式1中的a1和b1是任意非零实数,式1中的c1是任意实数,式2中的a2、b2、c2和d2是任意非零实数,式2中的e2是任意实数。
【0019】本发明的另一个方面试评估癌症状态的方法,其中多变量判别式是Logistic回归方程、线性判别式、多重回归方程、通过支持向量机(Support Vector Machine)所生成的判别式、通过Mahalanobis广义距离方法所生成的判别式、通过典型判别式分析所生成的判别式和通过决策树所生成的判别式的任意一种。
【0020】本发明的另一个方面是评估癌症状态的方法,其中多变量判别式是利用Orn、Cys、Tau、Trp、Gln、和Cit作为解释变量的Logistic回归方程,利用Orn、Cys、Arg、Tau、Trp和Gln作为解释变量的线性判别式,利用Glu、Gly、ABA、Val、His和Lys作为解释变量的Logistic回归方程,或者利用Glu、Ala、ABA、Val、His和Orn作为解释变量的线性判别式。
【0021】本发明还涉及癌症评估装置,根据本发明一个方面的癌症评估装置包括控制单元和存储器单元用于评估待评估个体中的癌症状态。控制单元包括判别式值计算单元,其计算作为多变量判别式的值的判别式值,这基于在先前获得的关于个体中氨基酸浓度值的氨基酸浓度数据中所包含的Cys、Gln、Trp、Orn、Arg、Glu、His、Ser和ABA中的至少一个的浓度值,以及在存储器单元中所存储的利用氨基酸浓度作为解释变量的多变量判别式二者,其中含有Cys、Gln、Trp、Orn、Arg、Glu、His、Ser和ABA中的至少一个作为解释变量;判别式值标准评估单元,其评估个体中的癌症状态,这基于判别式值计算单元所计算的判别式值。
【0022】本发明的另一个方面是癌症评估装置,其中判别式值标准评估单元还包括判别式值标准鉴别单元,其鉴别癌症患者和无癌症个体,这根据判别式值计算单元所计算的判别式值。
【0023】本发明的另一个方面是癌症评估装置,其中多变量判别式表达为一个分数式,或者多个分数式的总和,并且在构成多变量判别式的分数式的分子和分母的任一个或二者中包含Cys、Gln、Trp、Orn、Arg、Glu、His、Ser和ABA中的至少一个作为解释变量。
【0024】本发明的另一个方面是癌症评估装置,其中多变量判别式是式1或式2:
a1×Orn/(Trp+Arg)+b1×(Cys+Ile)/Leu+c1              (式1)
a2×Glu/His+b2×Ser/Trp+c2×Val/Lys+d2×Pro/Arg+e2  (式2)
其中式1中的a1和b1是任意非零实数,式1中的c1是任意实数,式2中的a2、b2、c2和d2是任意非零实数,式2中的e2是任意实数。
【0025】本发明的另一个方面是癌症评估装置,其中多变量判别式是Logistic回归方程、线性判别式、多重回归方程、通过支持向量机(Support Vector Machine)所生成的判别式、通过Mahalanobis广义距离方法所生成的判别式、通过典型判别式分析所生成的判别式和通过决策树所生成的判别式的任意一种。
【0026】本发明的另一个方面是癌症评估装置,其中多变量判别式是利用Orn、Cys、Tau、Trp、Gln、和Cit作为解释变量的Logistic回归方程,利用Orn、Cys、Arg、Tau、Trp和Gln作为解释变量的线性判别式,利用Glu、Gly、ABA、Val、His和Lys作为解释变量的Logistic回归方程,或者利用Glu、Ala、ABA、Val、His和Orn作为解释变量的线性判别式。
【0027】本发明的另一个方面是癌症评估装置,其中,控制单元还包括多变量判别式生成单元,其生成存储在存储器单元中的多变量判别式,这基于存储在存储器单元的癌症状态信息,其中癌症状态信息含有氨基酸浓度数据和关于指示癌症状态指数的癌症状态指数数据。多变量判别式生成单元还包括候选多变量判别式生成单元,其从癌症状态信息生成作为多变量判别式候选的候选多变量判别式,这基于预定的生成判别式的方法;候选多变量判别式校验单元,其校验由候选多变量判别式生成单元生成的候选多变量判别式,这基于预定的校验方法;以及解释变量选择单元,其从通过候选多变量判别式校验单元所获得的校验结果选择候选多变量判别式的解释变量,这基于预定的解释变量选择方法,这样选择了用于生成候选多变量判别式中的癌症状态信息中所含有的氨基酸浓度数据的组合。多变量判别式生成单元生成了多变量判别式,其通过从多个候选多变量判别式选择用作多变量判别式的候选多变量判别式,这基于通过重复执行候选多变量判别式生成单元、候选多变量判别式校验单元和解释变量选择单元而积累的校验结果。
【0028】本发明还涉及癌症评估方法,本发明的一个方面是评估待评估的个体中癌症状态的癌症评估方法。利用包括控制单元和存储器单元的信息处理装置实施该方法。该方法包括:(i)判别式值计算步骤,其计算作为多变量判别式数值的判别式值,这基于在之前所获得的关于个体中氨基酸浓度值的氨基酸浓度数据中Cys、Gln、Trp、Orn、Arg、Glu、His、Ser和ABA中的至少一个的浓度值以及存储在存储器单元中利用氨基酸浓度作为解释变量的多变量判别式二者,其中含有Cys、Gln、Trp、Orn、Arg、Glu、His、Ser和ABA中的至少一个作为解释变量,以及(ii)判别式值标准评估步骤,其评估个体中的癌症状态,这基于在判别式值计算步骤中所计算的判别式值。步骤(i)和(ii)都是通过控制单元执行的。
【0029】本发明的另一个方面是癌症评估方法,其中判别式值标准评估步骤还包括判别式值标准鉴别步骤,其鉴别癌症患者和无癌症个体,这基于在判别式值计算步骤中所计算的判别式值。
【0030】本发明的另一个方面是癌症评估方法,其中多变量判别式表达为一个分数式,或者多个分数式的总和,并且在构成多变量判别式的分数式的分子和分母的任一个或二者中包含Cys、Gln、Trp、Orn、Arg、Glu、His、Ser和ABA中的至少一个作为解释变量。
【0031】本发明的另一个方面是癌症评估方法,其中多变量判别式是式1或式2:
a1×Orn/(Trp+Arg)+b1×(Cys+Ile)/Leu+c1              (式1)
a2×Glu/His+b2×Ser/Trp+c2×Val/Lys+d2×Pro/Arg+e2  (式2)
其中式1中的a1和b1是任意非零实数,式1中的c1是任意实数,式2中的a2、b2、c2和d2是任意非零实数,式2中的e2是任意实数。
【0032】本发明的另一个方面是癌症评估方法,其中多变量判别式是Logistic回归方程、线性判别式、多重回归方程、通过支持向量机(Support Vector Machine)所生成的判别式、通过Mahalanobis广义距离方法所生成的判别式、通过典型判别式分析所生成的判别式和通过决策树所生成的判别式的任意一种。
【0033】本发明的另一个方面是癌症评估方法,其中多变量判别式是利用Orn、Cys、Tau、Trp、Gln、和Cit作为解释变量的Logistic回归方程,利用Orn、Cys、Arg、Tau、Trp和Gln作为解释变量的线性判别式,利用Glu、Gly、ABA、Val、His和Lys作为解释变量的Logistic回归方程,或者利用Glu、Ala、ABA、Val、His和Orn作为解释变量的线性判别式。
【0034】本发明的另一个方面是癌症评估方法,其中该方法还包括控制单元执行的多变量判别式生成步骤,其生成存储在存储器单元中的多变量判别式,这基于存储在存储器单元的癌症状态信息,其中癌症状态信息含有氨基酸浓度数据和关于指示癌症状态指数的癌症状态指数数据。多变量判别式生成步骤还包括控制单元执行的候选多变量判别式生成步骤,其从癌症状态信息生成作为多变量判别式候选的候选多变量判别式,这基于预定的生成判别式的方法;候选多变量判别式校验步骤,其校验在候选多变量判别式生成步骤生成的候选多变量判别式,这基于预定的校验方法;以及解释变量选择单元,其从在候选多变量判别式校验步骤中所获得的校验结果选择候选多变量判别式的解释变量,这基于预定的解释变量选择方法,这样选择了用于生成候选多变量判别式中的癌症状态信息中所含有的氨基酸浓度数据的组合。在多变量判别式生成步骤,生成了多变量判别式,其通过从多个候选多变量判别式选择用作多变量判别式的候选多变量判别式,这基于通过重复执行候选多变量判别式生成步骤、候选多变量判别式校验步骤和解释变量选择步骤而积累的校验结果。
【0035】本发明还涉及癌症评估系统,根据本发明一个方面的癌症评估系统包括癌症评估装置,该装置包括控制单元和存储器单元以评估待评估个体中的癌症状态;以及信息通信终端装置,其提供关于通过网络为相互通信连接的个体中氨基酸浓度值的氨基酸浓度数据。信息通信终端装置包括氨基酸浓度数据发送单元,其将个体的氨基酸浓度数据传输到癌症评估装置;以及评估结果接收单元,其接收从癌症评估装置传输的个体的癌症状态的评估结果。癌症评估装置的控制单元包括氨基酸浓度数据接收单元,其接受从信息通信终端装置传输的个体的氨基酸浓度数据;判别式值计算单元,其计算作为多变量判别式的数值的判别式值,这基于氨基酸浓度数据接收单元所接受的个体的氨基酸浓度数据中所包含的Cys、Gln、Trp、Orn、Arg、Glu、His、Ser和ABA中的至少一个的浓度值以及存储在存储器单元中的利用氨基酸浓度作为解释变量的多变量判别式二者,其中含有Cys、Gln、Trp、Orn、Arg、Glu、His、Ser和ABA中的至少一个作为解释变量;判别式值标准评估单元,其评估个体中的癌症状态,这基于判别式值计算单元所计算的判别式值;以及评估结果发送单元,其将通过判别式值标准评估单元所获得的个体的评估结果传输到信息通信终端装置。
【0036】本发明的另一个方面是癌症评估系统,其中判别式值标准评估单元还包括判别式值标准鉴别单元,其鉴别癌症患者和无癌症个体,这基于判别式值计算单元所计算的判别式值。
【0037】本发明的另一个方面是癌症评估系统,其中多变量判别式表达为一个分数式,或者多个分数式的总和,并且在构成多变量判别式的分数式的分子和分母的任一个或二者中包含Cys、Gln、Trp、Orn、Arg、Glu、His、Ser和ABA中的至少一个作为解释变量。
【0038】本发明的另一个方面是癌症评估系统,其中多变量判别式是式1或式2:
a1×Orn/(Trp+Arg)+b1×(Cys+Ile)/Leu+c1              (式1)
a2×Glu/His+b2×Ser/Trp+c2×Val/Lys+d2×Pro/Arg+e2  (式2)
其中式1中的a1和b1是任意非零实数,式1中的c1是任意实数,式2中的a2、b2、c2和d2是任意非零实数,式2中的e2是任意实数。
【0039】本发明的另一个方面是癌症评估系统,其中多变量判别式是Logistic回归方程、线性判别式、多重回归方程、通过支持向量机(Support Vector Machine)所生成的判别式、通过Mahalanobis广义距离方法所生成的判别式、通过典型判别式分析所生成的判别式和通过决策树所生成的判别式的任意一种。
【0040】本发明的另一个方面是癌症评估系统,其中多变量判别式是利用Orn、Cys、Tau、Trp、Gln、和Cit作为解释变量的Logistic回归方程,利用Orn、Cys、Arg、Tau、Trp和Gln作为解释变量的线性判别式,利用Glu、Gly、ABA、Val、His和Lys作为解释变量的Logistic回归方程,或者利用Glu、Ala、ABA、Val、His和Orn作为解释变量的线性判别式。
【0041】本发明的另一个方面是癌症评估系统,其中癌症评估装置的控制单元还包括多变量判别式生成单元,其生成存储在存储器单元中的多变量判别式,这基于存储在存储器单元的癌症状态信息,其中癌症状态信息含有氨基酸浓度数据和关于指示癌症状态指数的癌症状态指数数据。多变量判别式生成单元还包括候选多变量判别式生成单元,其从癌症状态信息生成作为多变量判别式候选的候选多变量判别式,这基于预定的生成判别式的方法;候选多变量判别式校验单元,其校验由候选多变量判别式生成单元生成的候选多变量判别式,这基于预定的校验方法;以及解释变量选择单元,其从通过候选多变量判别式校验单元所获得的校验结果选择候选多变量判别式的解释变量,这基于预定的解释变量选择方法,这样选择了用于生成候选多变量判别式中的癌症状态信息中所含有的氨基酸浓度数据的组合。多变量判别式生成单元生成了多变量判别式,其通过从多个候选多变量判别式选择用作多变量判别式的候选多变量判别式,这基于通过重复执行候选多变量判别式生成单元、候选多变量判别式校验单元和解释变量选择单元而积累的校验结果。
【0042】本发明还涉及癌症评估程序产品,本发明的一个方面是癌症评估程序产品,其使得包括控制单元和存储器单元的信息处理装置执行评估待评估的个体中癌症状态的方法。该方法包括:(i)判别式值计算步骤,其计算作为多变量判别式数值的判别式值,这基于在之前所获得的关于个体中氨基酸浓度值的氨基酸浓度数据中Cys、Gln、Trp、Orn、Arg、Glu、His、Ser和ABA中的至少一个的浓度值以及存储在存储器单元中利用氨基酸浓度作为解释变量的多变量判别式二者,其中含有Cys、Gln、Trp、Orn、Arg、Glu、Hi s、Ser和ABA中的至少一个作为解释变量,以及(ii)判别式值标准评估步骤,其评估个体中的癌症状态,这基于在判别式值计算步骤中所计算的判别式值。步骤(i)和(ii)都是通过控制单元执行的。
【0043】本发明的另一个方面是癌症评估程序产品,其中判别式值标准评估步骤还包括判别式值标准鉴别步骤,其鉴别癌症患者和无癌症个体,这基于在判别式值计算步骤中所计算的判别式值。
【0044】本发明的另一个方面是癌症评估程序产品,其中多变量判别式表达为一个分数式,或者多个分数式的总和,并且在构成多变量判别式的分数式的分子和分母的任一个或二者中包含Cys、Gln、Trp、Orn、Arg、Glu、His、Ser和ABA中的至少一个作为解释变量。
【0045】本发明的另一个方面是癌症评估程序产品,其中多变量判别式是式1或式2:
a1×Orn/(Trp+Arg)+b1×(Cys+Ile)/Leu+c1              (式1)
a2×Glu/His+b2×Ser/Trp+c2×Val/Lys+d2×Pro/Arg+e2  (式2)
其中式1中的a1和b1是任意非零实数,式1中的c1是任意实数,式2中的a2、b2、c2和d2是任意非零实数,式2中的e2是任意实数。
【0046】本发明的另一个方面是癌症评估程序产品,其中多变量判别式是Logistic回归方程、线性判别式、多重回归方程、通过支持向量机(Support Vector Machine)所生成的判别式、通过Mahalanobis广义距离方法所生成的判别式、通过典型判别式分析所生成的判别式和通过决策树所生成的判别式的任意一种。
【0047】本发明的另一个方面是癌症评估程序产品,其中多变量判别式是利用Orn、Cys、Tau、Trp、Gln、和Cit作为解释变量的Logistic回归方程,利用Orn、Cys、Arg、Tau、Trp和Gln作为解释变量的线性判别式,利用Glu、Gly、ABA、Val、His和Lys作为解释变量的Logistic回归方程,或者利用Glu、Ala、ABA、Val、His和Orn作为解释变量的线性判别式。
【0048】本发明的另一个方面是癌症评估程序产品,其中该方法还包括控制单元执行的多变量判别式生成步骤,其生成存储在存储器单元中的多变量判别式,这基于存储在存储器单元的癌症状态信息,其中癌症状态信息含有氨基酸浓度数据和关于指示癌症状态指数的癌症状态指数数据。多变量判别式生成步骤还包括控制单元执行的候选多变量判别式生成步骤,其从癌症状态信息生成作为多变量判别式候选的候选多变量判别式,这基于预定的生成判别式的方法;候选多变量判别式校验步骤,其校验在候选多变量判别式生成步骤生成的候选多变量判别式,这基于预定的校验方法;以及解释变量选择单元,其从在候选多变量判别式校验步骤中所获得的校验结果选择候选多变量判别式的解释变量,这基于预定的解释变量选择方法,这样选择了用于生成候选多变量判别式中的癌症状态信息中所含有的氨基酸浓度数据的组合。在多变量判别式生成步骤,生成了多变量判别式,其通过从多个候选多变量判别式选择用作多变量判别式的候选多变量判别式,这基于通过重复执行候选多变量判别式生成步骤、候选多变量判别式校验步骤和解释变量选择步骤而积累的校验结果。
【0049】本发明还设计记录介质,根据本发明一个方面的记录介质包括上面所述的癌症评估程序。
发明效果
【0050】根据本发明评估癌症状态的方法,测量关于从待评估的个体收集的血液中的氨基酸浓度值的氨基酸浓度数据,以及评估个体中的癌症状态,这基于在所测量的个体的氨基酸浓度数据中所包含的Cys、Gln、Trp、Orn、Arg、Glu、His、Ser和ABA中的至少一个的浓度值。因此,血液中的氨基酸中涉及癌症状态的氨基酸浓度,可以用于达到实现精确评估癌症状态的效果。
【0051】根据本发明的评估癌症状态的方法,鉴别癌症患者和无癌症个体,这基于在所测量的个体的氨基酸浓度数据中所包含的Cys、Gln、Trp、Orn、Arg、Glu、His、Ser和ABA中的至少一个的浓度值。因此,在血液中氨基酸中可以用于鉴别2组癌症和非癌症氨基酸的浓度,其可以用于达到实现精确鉴别2组癌症和非癌症的效果。
【0052】根据本发明评估癌症状态的方法,计算作为多变量判别式的数值的判别式值,这基于在个体的所测量氨基酸浓度数据中所包含的Cys、Gln、Trp、Orn、Arg、Glu、His、Ser和ABA中的至少一个的浓度值以及之前建立的利用氨基酸浓度作为解释变量的多变量判别式二者,其中含有Cys、Gln、Trp、Orn、Arg、Glu、His、Ser和ABA中的至少一个作为解释变量评估个体中的癌症状态,这基于所计算的判别式值。因此,在与癌症状态显著相关的多变量判别式中所获得的判别式值可以用于达到实现精确评估癌症状态的效果。
【0053】根据本发明的评估癌症状态的方法,鉴别癌症患者和无癌症个体,这基于所计算的判别式值。因此,在可以用于鉴别2组癌症和非癌症的多变量判别式中所获得的判别式值可以用于达到实现精确鉴别2组癌症和非癌症的效果。
【0054】根据本发明的评估癌症状态的方法,多变量判别式表达为一个分数式,或者多个分数式的总和,并且在构成多变量判别式的分数式的分子和分母的任一个或二者中包含Cys、Gln、Trp、Orn、Arg、Glu、His、Ser和ABA中的至少一个作为解释变量。因此,在特别地可以用于鉴别2组癌症和非癌症的多变量判别式中获得的判别式值可以用于达到实现更精确鉴别2组癌症和非癌症的效果。
【0055】根据本发明的评估癌症状态的方法,多变量判别式是式1或式2:
a1×Orn/(Trp+Arg)+b1×(Cys+Ile)/Leu+c1              (式1)
a2×Glu/His+b2×Ser/Trp+c2×Val/Lys+d2×Pro/Arg+e2  (式2)
其中式1中的a1和b1是任意非零实数,式1中的c1是任意实数,式2中的a2、b2、c2和d2是任意非零实数,式2中的e2是任意实数。因此,在特别地可以用于鉴别2组癌症和非癌症的多变量判别式中获得的判别式值可以用于达到实现更精确鉴别2组癌症和非癌症的效果。
【0056】根据本发明的评估癌症状态的方法,多变量判别式是Logistic回归方程、线性判别式、多重回归方程、通过支持向量机(Support Vector Machine)所生成的判别式、通过Mahalanobis广义距离方法所生成的判别式、通过典型判别式分析所生成的判别式和通过决策树所生成的判别式的任意一种。因此,在特别地可以用于鉴别2组癌症和非癌症的多变量判别式中获得的判别式值可以用于达到实现更精确鉴别2组癌症和非癌症的效果。
【0057】根据本发明的评估癌症状态的方法,多变量判别式是利用Orn、Cys、Tau、Trp、Gln、和Cit作为解释变量的Logistic回归方程,利用Orn、Cys、Arg、Tau、Trp和Gln作为解释变量的线性判别式,利用Glu、Gly、ABA、Val、His和Lys作为解释变量的Logistic回归方程,或者利用Glu、Ala、ABA、Val、His和Orn作为解释变量的线性判别式。因此,在特别地可以用于鉴别2组癌症和非癌症的多变量判别式中获得的判别式值可以用于达到实现更精确鉴别2组癌症和非癌症的效果。
【0058】根据本发明的癌症评估装置、癌症评估方法和癌症评估程序,计算作为多变量判别式的数值的判别式值,这基于在之前获得的关于个体中氨基酸浓度值的氨基酸浓度数据中所含有的Cys、Gln、Trp、Orn、Arg、Glu、His、Ser和ABA中的至少一个的浓度数值以及存储在存储器单元中的利用氨基酸浓度作为解释变量的多变量判别式二者,其中包含Cys、Gln、Trp、Orn、Arg、Glu、His、Ser和ABA中的至少一个作为解释变量,并评估个体中的癌症状态,这基于所计算的判别式值。因此,因此,在与癌症状态显著相关的多变量判别式中所获得的判别式值可以用于达到实现精确评估癌症状态的效果。
【0059】根据本发明的癌症评估装置、癌症评估方法和癌症评估程序,鉴别癌症患者和无癌症个体,这基于所计算的判别式值。因此,在可以用于鉴别2组癌症和非癌症的多变量判别式中所获得的判别式值可以用于达到实现精确鉴别2组癌症和非癌症的效果。
【0060】根据本发明的癌症评估装置、癌症评估方法和癌症评估程序,多变量判别式表达为一个分数式,或者多个分数式的总和,并且在构成多变量判别式的分数式的分子和分母的任一个或二者中包含Cys、Gln、Trp、Orn、Arg、Glu、His、Ser和ABA中的至少一个作为解释变量。因此,在特别地可以用于鉴别2组癌症和非癌症的多变量判别式中获得的判别式值可以用于达到实现更精确鉴别2组癌症和非癌症的效果。
【0061】根据本发明的癌症评估装置、癌症评估方法和癌症评估程序,多变量判别式是式1或式2:
a1×Orn/(Trp+Arg)+b1×(Cys+Ile)/Leu+c1              (式1)
a2×Glu/His+b2×Ser/Trp+c2×Val/Lys+d2×Pro/Arg+e2  (式2)
其中式1中的a1和b1是任意非零实数,式1中的c1是任意实数,式2中的a2、b2、c2和d2是任意非零实数,式2中的e2是任意实数。因此,在特别地可以用于鉴别2组癌症和非癌症的多变量判别式中获得的判别式值可以用于达到实现更精确鉴别2组癌症和非癌症的效果。
【0062】根据本发明的癌症评估装置、癌症评估方法和癌症评估程序,多变量判别式是Logistic回归方程、线性判别式、多重回归方程、通过支持向量机(Support Vector Machine)所生成的判别式、通过Mahalanobis广义距离方法所生成的判别式、通过典型判别式分析所生成的判别式和通过决策树所生成的判别式的任意一种。因此,在特别地可以用于鉴别2组癌症和非癌症的多变量判别式中获得的判别式值可以用于达到实现更精确鉴别2组癌症和非癌症的效果。
【0063】根据本发明的癌症评估装置、癌症评估方法和癌症评估程序,多变量判别式是利用Orn、Cys、Tau、Trp、Gln、和Cit作为解释变量的Logistic回归方程,利用Orn、Cys、Arg、Tau、Trp和Gln作为解释变量的线性判别式,利用Glu、Gly、ABA、Val、His和Lys作为解释变量的Logistic回归方程,或者利用Glu、Ala、ABA、Val、His和Orn作为解释变量的线性判别式。因此,在特别地可以用于鉴别2组癌症和非癌症的多变量判别式中获得的判别式值可以用于达到实现更精确鉴别2组癌症和非癌症的效果。
【0064】根据本发明的癌症评估装置、癌症评估方法和癌症评估程序,存储在存储器单元中的多变量判别式是根据存储在存储器单元中的癌症状态信息而生成的,其中癌症状态信息含有氨基酸浓度数据和关于指示癌症状态指数的癌症状态指数数据。具体的,(1)根据预定的判别式生成方法,从癌症状态信息生成候选多变量判别式;(2)校验所生成的候选多变量判别式,这基于预定的校验方法;(3)基于预定的解释变量选择方法,从(2)中的校验结果选择候选多变量判别式中的解释变量,这样选择了用于生成候选多变量判别式中的在癌症状态信息中包含的氨基酸浓度组合;以及(4)根据通过重复执行(1)、(2)和(3)而积累的校验结果,从多个候选多变量判别式选择用作多变量判别式的候选多变量判别式,这样生成了多变量判别式。因而,能够达到实现生成多变量判别式的效果,其最适于评估癌症状态(具体的,多变量判别式,其与癌症的状态(疾病状态的进展)(早期癌症)显著相关(更具体的,可以用于鉴别2组癌症和非癌症的多变量判别式))。
【0065】根据本发明的癌症评估系统,首先,信息通信终端装置将待评估的个体的氨基酸浓度数据传输到癌症评估装置。癌症评估装置接收从信息通信终端装置传输的个体的氨基酸浓度数据;计算作为多变量判别式的数值的判别式值,这基于所接受的个体的氨基酸浓度数据中所包含的Cys、Gln、Trp、Orn、Arg、Glu、His、Ser和ABA中的至少一个的浓度值以及存储在存储器单元中的利用氨基酸浓度作为解释变量的多变量判别式二者,其中含有Cys、Gln、Trp、Orn、Arg、Glu、His、Ser和ABA中的至少一个作为解释变量;以及评估个体中的癌症状态,这基于所计算的判别式值;以及将个体的评估结果传输到信息通信终端装置。接着,信息通信终端装置接收从癌症评估装置传输的关于癌症状态的个体的评估结果。因此,在与癌症状态显著相关的多变量判别式中所获得的判别式值可以用于达到实现精确评估癌症状态的效果。
【0066】根据本发明的评估癌症状态的系统,鉴别癌症患者和无癌症个体,这基于所计算的判别式值。因此,在可以用于鉴别2组癌症和非癌症的多变量判别式中所获得的判别式值可以用于达到实现精确鉴别2组癌症和非癌症的效果。
【0067】根据本发明的评估癌症状态的系统,多变量判别式表达为一个分数式,或者多个分数式的总和,并且在构成多变量判别式的分数式的分子和分母的任一个或二者中包含Cys、Gln、Trp、Orn、Arg、Glu、His、Ser和ABA中的至少一个作为解释变量。因此,在特别地可以用于鉴别2组癌症和非癌症的多变量判别式中获得的判别式值可以用于达到实现更精确鉴别2组癌症和非癌症的效果。
【0068】根据本发明的评估癌症状态的系统,多变量判别式是式1或式2:
a1×Orn/(Trp+Arg)+b1×(Cys+Ile)/Leu+c1              (式1)
a2×Glu/His+b2×Ser/Trp+c2×Val/Lys+d2×Pro/Arg+e2  (式2)
其中式1中的a1和b1是任意非零实数,式1中的c1是任意实数,式2中的a2、b2、c2和d2是任意非零实数,式2中的e2是任意实数。因此,在特别地可以用于鉴别2组癌症和非癌症的多变量判别式中获得的判别式值可以用于达到实现更精确鉴别2组癌症和非癌症的效果。
【0069】根据本发明的评估癌症状态的系统,多变量判别式是Logistic回归方程、线性判别式、多重回归方程、通过支持向量机(Support Vector Machine)所生成的判别式、通过Mahalanobis广义距离方法所生成的判别式、通过典型判别式分析所生成的判别式和通过决策树所生成的判别式的任意一种。因此,在特别地可以用于鉴别2组癌症和非癌症的多变量判别式中获得的判别式值可以用于达到实现更精确鉴别2组癌症和非癌症的效果。
【0070】根据本发明的评估癌症状态的系统,多变量判别式是利用Orn、Cys、Tau、Trp、Gln、和Cit作为解释变量的Logistic回归方程,利用Orn、Cys、Arg、Tau、Trp和Gln作为解释变量的线性判别式,利用Glu、Gly、ABA、Val、His和Lys作为解释变量的Logistic回归方程,或者利用Glu、Ala、ABA、Val、His和Orn作为解释变量的线性判别式。因此,在特别地可以用于鉴别2组癌症和非癌症的多变量判别式中获得的判别式值可以用于达到实现更精确鉴别2组癌症和非癌症的效果。
【0071】根据本发明的评估癌症状态的系统,存储在存储器单元中的多变量判别式是根据存储在存储器单元中的癌症状态信息而生成的,其中癌症状态信息含有氨基酸浓度数据和关于指示癌症状态指数的癌症状态指数数据。具体的,(1)根据预定的判别式生成方法,从癌症状态信息生成候选多变量判别式;(2)校验所生成的候选多变量判别式,这基于预定的校验方法;(3)基于预定的解释变量选择方法,从(2)中的校验结果选择候选多变量判别式中的解释变量,这样选择了用于生成候选多变量判别式中的在癌症状态信息中包含的氨基酸浓度组合;以及(4)根据通过重复执行(1)、(2)和(3)而积累的校验结果,从多个候选多变量判别式选择用作多变量判别式的候选多变量判别式,这样生成了多变量判别式。因而,能够达到实现生成多变量判别式的效果,其最适于评估癌症状态(具体的,多变量判别式,其与癌症的状态(疾病状态的进展)(早期癌症)显著相关(更具体的,可以用于鉴别2组癌症和非癌症的多变量判别式))。
【0072】根据本发明的记录介质,计算读取并执行记录在该记录介质上的癌症评估程序,这样使得计算机可以执行癌症评估程序,因此达到了在癌症评估程序中所获得相同的效果。
【0073】当在本发明中评估癌症状态时(具体的,进行鉴别癌症和非癌症),除了氨基酸浓度外,还可以使用其他代谢物的浓度、蛋白质表达水平、个体的年龄和性别等。当在本发明中评估癌症状态时(具体的,进行鉴别癌症和非癌症),除了氨基酸浓度外,在多变量判别式中还可以使用其他代谢物的浓度、蛋白质表达水平、个体的年龄和性别等作为解释变量。
附图说明
【0074】图1是显示本发明基本原理的主要配置图。
图2是显示根据第一实施方式的评估癌症状态的一个实例的流程图。
图3是显示本发明基本原理的主要配置图。
图4是显示本发明整个配置的实例的图。
图5是显示本发明整个配置的另一个实例的图。
图6是方块图,其显示本发明的系统系统中癌症评估装置100的配置的实例。
图7是显示在用户信息档案106a中所储存的信息的实例的表。
图8是显示氨基酸浓度数据档案106b中所储存的信息的实例的表。
图9是显示癌症状态信息档案106c中所储存的信息的实例的表。
图10是显示指定的癌症状态信息档案106d中所储存的信息的实例的表。
图11是显示候选多变量判别式档案106e1中所储存的信息的实例的表。
图12是显示校验结果档案106e2中所储存的信息的实例的表。
图13是显示所选择癌症状态信息档案106e3中所储存的信息的实例的表。
图14是显示多变量判别式档案106e4中所储存的信息的实例的表。
图15是显示判别式值档案106f中所储存的信息的实例的表。
图16是显示评估结果档案106g中所储存的信息的实例的表。
图17是显示多变量判别式生成部分102h的配置的方块图。
图18是显示判别式标准评估部分102j的配置的方块图。
图19是显示本发明的系统中客户端装置200的配置的实例的方块图。
图20是显示本发明的系统中数据库装置400的配置的实例的方块图。
图21是显示在本发明的系统中进行的癌症评估服务处理的实例的流程图。
图22是显示本发明的系统中癌症评估装置100中进行的多变量判别式生成处理的实例的流程图。
图23是显示2组非癌症和癌症之间氨基酸解释变量分布的箱线图(boxplot)。
图24是显示氨基酸解释变量的ROC曲线的AUC的曲线图。
图25是显示2组之间评估用于诊断性能的ROC曲线的曲线图。
图26是显示与指数式1具有相同诊断性能的指数列表的图表。
图27是显示与指数式1具有相同诊断性能的指数列表的图表。
图28是显示与指数式1具有相同诊断性能的指数列表的图表。
图29是显示与指数式1具有相同诊断性能的指数列表的图表。
图30是显示2组之间评估用于诊断性能的ROC曲线的曲线图。
图31是显示与指数式2具有相同诊断性能的指数列表的图表。
图32是显示与指数式2具有相同诊断性能的指数列表的图表。
图33是显示与指数式2具有相同诊断性能的指数列表的图表。
图34是显示与指数式2具有相同诊断性能的指数列表的图表。
图35是显示2组之间评估用于诊断性能的ROC曲线的曲线图。
图36是显示与指数式3具有相同诊断性能的指数列表的图表。
图37是显示与指数式3具有相同诊断性能的指数列表的图表。
图38是显示与指数式3具有相同诊断性能的指数列表的图表。
图39是显示与指数式3具有相同诊断性能的指数列表的图表。
图40是显示基于AUC和ROC曲线而提取的氨基酸列表的图。
图41是显示癌症患者和非癌症患者的氨基酸解释变量的分布的箱线图。
图42是显示氨基酸解释变量的ROC曲线的AUC的图。
图43是显示2组之间评估用于诊断性能的ROC曲线的曲线图。
图44是显示与指数式4具有相同诊断性能的指数列表的图表。
图45是显示与指数式4具有相同诊断性能的指数列表的图表。
图46是显示2组之间评估用于诊断性能的ROC曲线的曲线图。
图47是显示与指数式5具有相同诊断性能的指数列表的图表。
图48是显示与指数式5具有相同诊断性能的指数列表的图表。
图49是显示2组之间评估用于诊断性能的ROC曲线的曲线图。
图50是显示与指数式6具有相同诊断性能的指数列表的图表。
图51是显示与指数式6具有相同诊断性能的指数列表的图表。
图52是显示基于AUC和ROC曲线而提取的氨基酸列表的图。
参数的解释
【0075】100癌症评估装置
102控制装置
102a请求解释部分
102b浏览处理部分
102c鉴定处理部分
102d电子邮件产生部分
102e网页产生部分
102f接收部分
102g癌症状态信息指定部分
102h多变量判别式生成部分
102h1候选多变量判别式生成部分
102h2候选多变量判别式校验部分
102h3解释变量选择部分
102i判别式值计算部分
102j判别式值标准评估部分
102j1判别式值标准评估部分
102k结果输出部分
102m发送部分
104通信界面
106存储器设备
106a用户信息档案
106b氨基酸浓度数据档案
106c癌症状态信息档案
106d指定的癌症状态信息档案
106e多变量判别式相关信息数据库
106e1候选多变量判别式档案
106e2校验结果档案
106e3所选择的癌症状态信息档案
106e4多变量判别式档案
106f判别式值档案
106g评估结果档案
108输入/输出界面
112输入设备
114输出设备
200客户端装置(信息通信终端装置)
300网络
400数据库装置
实施本发明的最佳模式
【0076】后面,参考附图详细描述本发明的评估癌症状态的方法的实施方式(第一实施方式),以及本发明癌症评估装置、癌症评估方法、癌症评估系统、癌症评估程序和记录介质的实施方式(第二实施方式)。本发明不限于这些实施方式。
【0077】第一实施方式
1-1发明的概要
这里,将参考图1描述本发明的评估癌症状态的方法的概要。图1是显示本发明的基本原理的主要配置图表。
【0078】在本发明中,首先测量关于从待评估个体(例如个体例如动物或人类)收集的血液中氨基酸的浓度数值的氨基酸浓度数据(步骤S-11)。按照下面的方式分析血液中氨基酸的浓度。在肝素处理的管中收集血液样品,接着通过对所收集的血液样品进行离心而分离血浆。将所分离的所有血浆样品冷冻,在测量氨基酸浓度之前储存在-70℃。在测量氨基酸浓度之前,通过加入硫代水杨酸达到浓度3%而对血浆样品进行除去蛋白质。使用通过在后柱中使用茚三酮反应的高效液相色谱(HPLC)的氨基酸分析仪用于测量氨基酸浓度。氨基酸浓度的单位可以是例如摩尔浓度、重量浓度,或将这些浓度进行加、减、乘或除以任意常数。
【0079】在本发明中,评估个体中的癌症状态,这基于在步骤S-11中所测量的个体的氨基酸浓度数据中所包含的Cys、Gln、Trp、Orn、Arg、Glu、His、Ser和ABA中的至少一个的浓度数值(步骤S-12)。
【0080】根据上面所述的本发明,测量关于从个体收集的血液中氨基酸浓度值的氨基酸浓度数据,并评估个体中的癌症状态,这基于在所测量的个体的氨基酸浓度数据中所包含的Cys、Gln、Trp、Orn、Arg、Glu、His、Ser和ABA中的至少一个的浓度数值。因此,在血液的氨基酸中涉及癌症状态的氨基酸的浓度可以用于达到实现精确评估癌症状态的效果。
【0081】在执行步骤S-12之前,可以从在步骤S-11中所测量的个体的氨基酸浓度数据移出数据例如有缺陷的数据和无关的数据(outlier)。进而,可以更精确地评估癌症状态。
【0082】在步骤S-12中,可以鉴别癌症患者和无癌症个体,这基于在步骤S-11中所测量的个体的氨基酸浓度数据中所包含的Cys、Gln、Trp、Orn、Arg、Glu、His、Ser和ABA中的至少一个的浓度数值。具体的,可以将Cys、Gln、Trp、Orn、Arg、Glu、His、Ser和ABA中的至少一个的浓度数值与之前建立的阙值(截止值(cutoff value))进行比较,进而鉴别癌症患者和无癌症个体。因此,在血液中的氨基酸中可以用于鉴别2组癌症和非癌症的氨基酸的浓度,可以用于达到实现精确鉴别2组癌症和非癌症的效果。
【0083】在步骤S-12中,可以计算作为多变量判别式的值的判别式值,这基于在步骤S-11中所测量的个体的氨基酸浓度数据中所包含的Cys、Gln、Trp、Orn、Arg、Glu、His、Ser和ABA中的至少一个的浓度数值,以及之前建立的利用氨基酸浓度作为解释变量的多变量判别式二者,其中含有Cys、Gln、Trp、Orn、Arg、Glu、His、Ser和ABA中的至少一个作为解释变量,并可以评估个体中的癌症状态,这基于所计算的判别式值。因此,在与癌症状态显著相关的多变量判别式中所获得的判别式值可以用于达到实现精确评估癌症状态的效果。
【0084】在步骤S-12中,可以计算作为多变量判别式的值的判别式值,这基于在步骤S-11中所测量的个体的氨基酸浓度数据中所包含的Cys、Gln、Trp、Orn、Arg、Glu、His、Ser和ABA中的至少一个的浓度数值,以及之前建立的利用氨基酸浓度作为解释变量的多变量判别式二者,其中含有Cys、Gln、Trp、Orn、Arg、Glu、His、Ser和ABA中的至少一个作为解释变量;以及可以鉴别癌症患者和无癌症个体,基于所计算的判别式值。具体的,可以将判别式值与之前建立的建立的阙值(截止值(cutoff value))进行比较,进而鉴别癌症患者和无癌症个体。因此,在可以用于鉴别2组癌症和非癌症的多变量判别式中所获得的判别式值可以用于达到实现精确鉴别2组癌症和非癌症的效果。
【0085】多变量判别式表达为一个分数式,或者多个分数式的总和,并且在构成多变量判别式的分数式的分子和分母的任一个或二者中包含Cys、Gln、Trp、Orn、Arg、Glu、His、Ser和ABA中的至少一个作为解释变量。具体的,多变量判别式可以是式1或式2:
a1×Orn/(Trp+Arg)+b1×(Cys+Ile)/Leu+c1              (式1)
a2×Glu/His+b2×Ser/Trp+c2×Val/Lys+d2×Pro/Arg+e2  (式2)
其中式1中的a1和b1是任意非零实数,式1中的c1是任意实数,式2中的a2、b2、c2和d2是任意非零实数,式2中的e2是任意实数。因此,在特别地可以用于鉴别2组癌症和非癌症的多变量判别式中获得的判别式值可以用于达到实现更精确鉴别2组癌症和非癌症的效果。可以通过在国际公开WO 2004/052191中所描述的方法,或者通过在国际申请WO 2006/098192中所描述的方法(在后面所描述的第二实施方式中所描述的多变量判别式生成处理)生成上述的多变量判别式,其中,国际公开WO 2004/052191是由本发明的申请人提交的国际申请,国际申请WO 2006/098192是由本发明的申请人提交的国际申请。优选使用通过这些方法获得的所有多变量判别式用于评估癌症状态,而与在作为输入数据的氨基酸浓度数据中氨基酸浓度的单位无关。
【0086】在分数式中,分数式的分子表达为氨基酸A、B、C等的总和。分数式的坟墓表达为氨基酸a、b、b等的总和。分数式还包括具有这些构成的分数式α、β、γ等的总和(例如α+β)。分数式还包括相除(divided)的分数式。用于分子或分母的氨基酸可以分别具有适当的系数。用于分子或分母的氨基酸可以重复出现。每个分数式可以具有适当的系数。每个解释变量的系数的数值,和常数的数值可以是任意实数。在分数式中分子中的解释变量和分母中的解释变量相互切换的组合中,正(或负)符号通常会根据目标解释变量而转换,但因为保持它们的关系,所以这些组合可以被认为在鉴别中与另一种是等价的,因此分数式还包括分数式中分子中的解释变量和分母中的解释变量的组合相互切换的组合。
【0087】多变量判别式可以是Logistic回归方程、线性判别式、多重回归方程、通过支持向量机(Support Vector Machine)所生成的判别式、通过Mahalanobis广义距离方法所生成的判别式、通过典型判别式分析所生成的判别式和通过决策树所生成的判别式的任意一种。具体的,多变量判别式可以是利用Orn、Cys、Tau、Trp、Gln、和Cit作为解释变量的Logistic回归方程,利用Orn、Cys、Arg、Tau、Trp和Gln作为解释变量的线性判别式,利用Glu、Gly、ABA、Val、His和Lys作为解释变量的Logistic回归方程,或者利用Glu、Ala、ABA、Val、His和Orn作为解释变量的线性判别式。因此,在特别地可以用于鉴别2组癌症和非癌症的多变量判别式中获得的判别式值可以用于达到实现更精确鉴别2组癌症和非癌症的效果。可以通过在国际申请WO2006/098192中所描述的方法(在后面所描述的第二实施方式中所描述的多变量判别式生成处理)生成上述的多变量判别式,其中,国际申请WO 2006/098192是由本发明的申请人提交的国际申请。优选使用通过这些方法获得的所有多变量判别式用于评估癌症状态,而与在作为输入数据的氨基酸浓度数据中氨基酸浓度的单位无关。
【0088】多变量判别式是指通常用于多变量分析的方程形式,包括例如多重回归方程、多重Logistic回归方程、线性判别式函数、Mahalanobis广义距离、典型判别式函数、支持向量机(Support VectorMachine)和决策树。多变量判别式还包括通过不同形式多变量判别式的总和而显示的方程。在多重回归方程、多重Logistic回归方程和典型判别式函数中,向每个解释变量加入系数和常数,并且在这种情况中优选系数和常数是实数,更优选在从用于鉴别的数据获得的系数和常数的99%置信区间范围内的数值,更优选在从用于鉴别的数据获得的系数和常数的95%置信区间范围内的数值。每个系数的数值和其置信区间可以乘以实数,并且每个常数的数值和其置信区间可以加、减任意真实的常数,或者乘以或除以任意真实的常数。
【0089】在本发明中评估癌症状态时(具体的,进行鉴别癌症和非癌症),除了氨基酸浓度外,还可以使用其他代谢物的浓度、蛋白质表达水平、个体的年龄和性别等。当在本发明中评估癌症状态时(具体的,进行鉴别癌症和非癌症),除了氨基酸浓度外,在多变量判别式中还可以使用其他代谢物的浓度、蛋白质表达水平、个体的年龄和性别等作为解释变量。
【0090】1-2.根据第一实施方式的评估癌症状态的方法
这里,参考图2描述根据第一实施方式的评估癌症状态的方法。图2是显示根据第一实施方式的评估癌症状态的一个实例的流程图。
【0091】从自个体例如动物或人类收集的血液,测量关于氨基酸浓度值的氨基酸浓度数据(步骤SA-11)。通过上面所述的方法进行氨基酸浓度值的测量。
【0092】从步骤SA-11中所测量的个体的氨基酸浓度数据,移出数据例如有缺陷的数据和无关的数据(步骤SA-12)。
【0093】接着,将已经移出有缺陷的数据和无关的数据的氨基酸浓度数据中所包含的Cys、Gln、Trp、Orn、Arg、Glu、His、Ser和ABA中的至少一个的浓度数值与之前建立的阙值(截止值(cutoff value))进行比较,这样鉴别个体中的癌症和非癌症;或者计算判别式数值,这基于步骤SA-12中已经移出有缺陷的数据和无关的数据的个体的氨基酸浓度数据中所包含的Cys、Gln、Trp、Orn、Arg、Glu、His、Ser和ABA中的至少一个的浓度数值以及之前建立的含有Cys、Gln、Trp、Orn、Arg、Glu、His、Ser和ABA中的至少一个作为解释变量的多变量判别式二者,以及将所计算的判别式值与之前建立的阙值(截止值(cutoff value))进行比较,这样鉴别个体中的癌症和非癌症(步骤SA-13)。
【0094】1-3第一实施方式和其他实施方式的总结
在上面详细描述的评估癌症状态的方法中,(1)从自个体收集的血液测量氨基酸浓度数据,(2)从个体的所测量氨基酸浓度数据移出数据例如有缺陷的数据和无关的数据,和(3)将已经移出有缺陷的数据和无关的数据的个体氨基酸浓度数据中所包含的Cys、Gln、Trp、Orn、Arg、Glu、His、Ser和ABA中的至少一个的浓度数值与之前建立的阙值(截止值(cutoff value))进行比较,这样鉴别个体中的癌症和非癌症,或者计算判别式数值,这基于已经移出有缺陷的数据和无关的数据的个体的氨基酸浓度数据中所包含的Cys、Gln、Trp、Orn、Arg、Glu、His、Ser和ABA中的至少一个的浓度数值以及之前建立的含有Cys、Gln、Trp、Orn、Arg、Glu、His、Ser和ABA中的至少一个作为解释变量的多变量判别式二者,以及将所计算的判别式值与之前建立的阙值(截止值(cutoff value))进行比较,这样鉴别个体中的癌症和非癌症。因此,在血液中的氨基酸中可以用于鉴别2组癌症和非癌症的氨基酸浓度,以及在可以用于鉴别2组癌症和非癌症的多变量判别式中所获得的判别式值可以用于达到实现精确鉴别2组癌症和非癌症的效果。
【0095】在步骤SA-13中,多变量判别式可以表达为一个分数式,或者多个分数式的总和,并且在构成多变量判别式的分数式的分子和分母的任一个或二者中包含Cys、Gln、Trp、Orn、Arg、Glu、His、Ser和ABA中的至少一个作为解释变量。具体的,多变量判别式可以是式1或式2:
a1×Orn/(Trp+Arg)+b1×(Cys+Ile)/Leu+c1              (式1)
a2×Glu/His+b2×Ser/Trp+c2×Val/Lys+d2×Pro/Arg+e2  (式2)
其中式1中的a1和b1是任意非零实数,式1中的c1是任意实数,式2中的a2、b2、c2和d2是任意非零实数,式2中的e2是任意实数。因此,在特别地可以用于鉴别2组癌症和非癌症的多变量判别式中获得的判别式值可以用于达到实现更精确鉴别2组癌症和非癌症的效果。可以通过在国际公开WO 2004/052191中所描述的方法,或者通过在国际申请WO 2006/098192中所描述的方法(在后面所描述的第二实施方式中所描述的多变量判别式生成处理)生成上述的多变量判别式,其中,国际公开WO 2004/052191是由本发明的申请人提交的国际申请,国际申请WO 2006/098192是由本发明的申请人提交的国际申请。优选使用通过这些方法获得的所有多变量判别式用于评估癌症状态,而与在作为输入数据的氨基酸浓度数据中氨基酸浓度的单位无关。
【0096】在步骤SA-13中,多变量判别式可以是Logistic回归方程、线性判别式、多重回归方程、通过支持向量机(Support Vector Machine)所生成的判别式、通过Mahalanobis广义距离方法所生成的判别式、通过典型判别式分析所生成的判别式和通过决策树所生成的判别式的任意一种。具体的,多变量判别式可以是利用Orn、Cys、Tau、Trp、Gln、和Cit作为解释变量的Logistic回归方程,利用Orn、Cys、Arg、Tau、Trp和Gln作为解释变量的线性判别式,利用Glu、Gly、ABA、Val、His和Lys作为解释变量的Logistic回归方程,或者利用Glu、Ala、ABA、Val、His和Orn作为解释变量的线性判别式。因此,在特别地可以用于鉴别2组癌症和非癌症的多变量判别式中获得的判别式值可以用于达到实现更精确鉴别2组癌症和非癌症的效果。可以通过在国际申请WO 2006/098192中所描述的方法(在后面所描述的第二实施方式中所描述的多变量判别式生成处理)生成上述的多变量判别式,其中,国际申请WO 2006/098192是由本发明的申请人提交的国际申请。优选使用通过这些方法获得的所有多变量判别式用于评估癌症状态,而与在作为输入数据的氨基酸浓度数据中氨基酸浓度的单位无关。
【0097】第二实施方式
2-1.发明的概要
这里,参考图3对本发明的癌症评估装置、癌症评估方法、癌症评估系统、癌症评估程序和记录介质进行详细描述。图3是显示本发明基本原理的主要配置图表。
【0098】在本发明中,在控制设备中计算作为多变量判别式的数值的判别式值,这基于在之前所获得的待评估个体(例如,个体如动物或人类)的氨基酸浓度数据中所包含的Cys、Gln、Trp、Orn、Arg、Glu、His、Ser和ABA中的至少一个的浓度数值以及存储在存储器设备中的利用氨基酸浓度作为解释变量的之前建立的多变量判别式二者,其中包含Cys、Gln、Trp、Orn、Arg、Glu、His、Ser和ABA中的至少一个作为解释变量(步骤S-21)。
【0099】在本发明中,在控制设备中评估个体中的癌症状态,这基于在步骤S-21中所计算的判别式值(步骤S-22)。
【0100】根据上面所描述的本发明,计算作为多变量判别式的数值的判别式值,这基于在之前所获得的个体的氨基酸浓度数据中所包含的Cys、Gln、Trp、Orn、Arg、Glu、His、Ser和ABA中的至少一个的浓度数值以及存储在存储器设备中的利用氨基酸浓度作为解释变量的之前建立的多变量判别式二者,其中包含Cys、Gln、Trp、Orn、Arg、Glu、His、Ser和ABA中的至少一个作为解释变量;以及评估个体中的癌症状态,这基于所计算的判别式值。因此,在与癌症状态显著相关的多变量判别式中所获得的判别式值可以用于达到实现精确评估癌症状态的效果。
【0101】在步骤S-22中,可以鉴别癌症患者和无癌症个体,这基于在步骤S-21中所计算的判别式值。具体的,可以将判别式值与之前建立的阙值(截止值(cutoff value))进行比较,进而鉴别癌症患者和无癌症个体。因此,在血液中的氨基酸中可以用于鉴别2组癌症和非癌症的氨基酸的浓度,可以用于达到实现精确鉴别2组癌症和非癌症的效果。
【0102】多变量判别式可以表达为一个分数式,或者多个分数式的总和,并且在构成多变量判别式的分数式的分子和分母的任一个或二者中包含Cys、Gln、Trp、Orn、Arg、Glu、His、Ser和ABA中的至少一个作为解释变量。具体的,多变量判别式可以是式1或式2:
a1×Orn/(Trp+Arg)+b1×(Cys+Ile)/Leu+c1              (式1)
a2×Glu/His+b2×Ser/Trp+c2×Val/Lys+d2×Pro/Arg+e2  (式2)
其中式1中的a1和b1是任意非零实数,式1中的c1是任意实数,式2中的a2、b2、c2和d2是任意非零实数,式2中的e2是任意实数。因此,在特别地可以用于鉴别2组癌症和非癌症的多变量判别式中获得的判别式值可以用于达到实现更精确鉴别2组癌症和非癌症的效果。可以通过在国际公开WO 2004/052191中所描述的方法,或者通过在国际申请WO 2006/098192中所描述的方法(后面所描述的多变量判别式生成处理)生成上述的多变量判别式,其中,国际公开WO 2004/052191是由本发明的申请人提交的国际申请,国际申请WO 2006/098192是由本发明的申请人提交的国际申请。优选使用通过这些方法获得的所有多变量判别式用于评估癌症状态,而与在作为输入数据的氨基酸浓度数据中氨基酸浓度的单位无关。
【0103】在分数式中,分数式的分子表达为氨基酸A、B、C等的总和,分数式的坟墓表达为氨基酸a、b、c等的总和。分数式还包括具有这些构成的分数式α、β、γ等的总和(例如α+β)。分数式还包括相除(divided)的分数式。用于分子或分母的氨基酸可以分别具有适当的系数。用于分子或分母的氨基酸可以重复出现。每个分数式可以具有适当的系数。每个解释变量的系数的数值,和常数的数值可以是任意实数。在分数式中分子中的解释变量和分母中的解释变量相互切换的组合中,正(或负)符号通常会根据目标解释变量而转换,但因为保持它们的关系,所以这些组合可以被认为在鉴别中与另一种是等价的,因此分数式还包括分数式中分子中的解释变量和分母中的解释变量的组合相互切换的组合。
【0104】多变量判别式可以是Logistic回归方程、线性判别式、多重回归方程、通过支持向量机(Support Vector Machine)所生成的判别式、通过Mahalanobis广义距离方法所生成的判别式、通过典型判别式分析所生成的判别式和通过决策树所生成的判别式的任意一种。具体的,多变量判别式可以是利用Orn、Cys、Tau、Trp、Gln、和Cit作为解释变量的Logistic回归方程,利用Orn、Cys、Arg、Tau、Trp和Gln作为解释变量的线性判别式,利用Glu、Gly、ABA、Val、His和Lys作为解释变量的Logistic回归方程,或者利用Glu、Ala、ABA、Val、His和Orn作为解释变量的线性判别式。因此,在特别地可以用于鉴别2组癌症和非癌症的多变量判别式中获得的判别式值可以用于达到实现更精确鉴别2组癌症和非癌症的效果。可以通过在国际申请WO2006/098192中所描述的方法(后面所描述的多变量判别式生成处理)生成上述的多变量判别式,其中,国际申请WO 2006/098192是由本发明的申请人提交的国际申请。优选使用通过这些方法获得的所有多变量判别式用于评估癌症状态,而与在作为输入数据的氨基酸浓度数据中氨基酸浓度的单位无关。
【0105】多变量判别式是指通常用于多变量分析的方程形式,包括例如多重回归方程、多重Logistic回归方程、线性判别式函数、Mahalanobis广义距离、典型判别式函数、支持向量机(Support VectorMachine)和决策树。多变量判别式还包括通过不同形式多变量判别式的总和而显示的方程。在多重回归方程、多重Logistic回归方程和典型判别式函数中,向每个解释变量加入系数和常数,并且在这种情况中优选系数和常数是实数,更优选在从用于鉴别的数据获得的系数和常数的99%置信区间范围内的数值,更优选在从用于鉴别的数据获得的系数和常数的95%置信区间范围内的数值。每个系数的数值和其置信区间可以乘以实数,并且每个常数的数值和其置信区间可以加、减任意真实的常数,或者乘以或除以任意真实的常数。
【0106】在本发明中评估癌症状态时(具体的,进行鉴别癌症和非癌症),除了氨基酸浓度外,还可以使用其他代谢物的浓度、蛋白质表达水平、个体的年龄和性别等。当在本发明中评估癌症状态时(具体的,进行鉴别癌症和非癌症),除了氨基酸浓度外,在多变量判别式中还可以使用其他代谢物的浓度、蛋白质表达水平、个体的年龄和性别等作为解释变量。
【0107】这里,对多变量判别式生成处理(步骤1~4)的总结进行详细描述。
【0108】首先,在控制设备,从存储在存储器设备中包括氨基酸浓度数据和涉及显示癌症状态的指数的癌症状态指数数据,生成作为多变量判别式候选的候选多变量判别式多变量判别式(例如,y=a1x1+a2x2+…+anxn,y:癌症状态指数数据,xi:氨基酸浓度数据,ai:常数,i=1,2,…,n),其通过预定的判别式生成方法(步骤1)。含有有缺陷数据和无关数据的数据可以从癌症状态信息中提前被移出。
【0109】在步骤1中,可以从癌症状态信息生成多种候选多变量判别式,其通过使用多种不同的判别式生成方法(包括用于多变量分析的那些,例如主成分分析、判别式分析、支持向量机、多重回归分析、Logistic回归分析、K-均值法、聚类分析(Cluster Analysis)和决定树)。具体的,可以同时且并行地生成多个候选多变量判别式组,其通过使用多个不同的运算法则,利用作为通过分析来自大量健康个体和癌症患者的氨基酸浓度数据和癌症状态指数数据锁构成的多变量数据的癌症状态信息。例如,可以通过同时利用不同的运算法则进行判别式分析和Logistic回归分析形成不同的候选多变量判别式。可替换的,可以利用通过进行主成分分析候选多变量判别式,通过转化癌症状态信息,接着对经转化的癌症状态信息进行判别式分析,而形成候选多变量判别式。以这种方式,可以最终生成适于诊断条件的多变量判别式。
【0110】通过主成分生成的候选多变量判别式是线性表达式,其由氨基酸解释变量构成,使得所有氨基酸浓度数据的变化最大化。通过判别式分析生成的候选多变量判别式是高幂表达式(high poweredexpression)(包括指数和对数表达式),其由氨基酸解释变量构成,在每个组中所有氨基酸浓度数据的变化中的变化总和的比例最小化。通过使用支持向量机生成的候选多变量判别式是高幂表达式(highpowered expression)”(核函数),其由氨基酸解释变量构成,使得组之间的边界最大化。通过多重回归分析生成的候选多变量判别式是是高幂表达式,其由氨基酸解释变量构成,使得来自所有氨基酸浓度数据的距离的总和最小化。通过Logistic回归分析生成的候选多变量判别式是分数式,其具有作为成分的具有线性表达的自然对数,其由氨基酸解释变量构成,这使得与幂函数的相似性最大化。k-均值方法是一种方法,其寻找各个组中相邻氨基酸数据的k块(pieces),指定该组含有最大数目的相邻点作为拥有数据的组,以及选择氨基酸解释变量,其使得输入氨基酸浓度数据的组与所指定的组完全符合。聚类分析是一种将整个氨基酸浓度数据中最接近的点聚类(分组)的方法。决定树是一种方法,其将氨基酸解释变量分类,并从较高等级氨基酸解释变量所可能保持的模式预测氨基酸浓度数据的组。
【0111】返回到多变量判别式生成处理的描述,在控制设备中通过特定的校验方法对步骤1中生成的候选多变量判别式进行校验(交互校验)(步骤2)。对步骤1中生成的候选多变量判别式,相互进行候选多变量判别式的校验。
【0112】在步骤2中,可以通过Bootstrap方法、保持评判方法(holdout method)、留一方法(leave one out method)等的至少一种对候选多变量判别式的鉴别率、灵敏度、信息标准等进行校验。以这种方式,通过考虑癌症状态信息和诊断条件,可以生成可预测性或可靠性更高的候选多变量判别式。
【0113】鉴别率是根据本发明评估的癌症状态在所有输入数据中都正确的数据的比例。灵敏度是在输入数据中声明癌症的癌症状态中根据本发明判断正确的癌症状态的比例。特异性是在输入数据中描述健康的癌症状态中根据本发明判断正确的癌症状态的比例。信息标准是在步骤1中生成的候选多变量判别式中氨基酸解释变量的数目,以及根据本发明评估的癌症状态与输入数据中所描述的癌症状态的数目的差异的总和。可预测性是通过重复校验候选多变量判别式所获得的,鉴别率、灵敏度或特异性的平均。可替换的,可靠性是通过重复校验候选多变量判别式所获得的,鉴别率、灵敏度或特异性的变化。
【0114】返回到多变量判别式生成处理的描述,在控制设备中根据预定的解释变量选择方法,选择用于生成候选多变量判别式中的癌症状态信息中所包含的氨基酸浓度数据的组合,其通过选择来自步骤2中的校验结果的候选多变量判别式的解释变量(步骤3)。对步骤1中生成的每个候选多变量判别式进行氨基酸解释变量的选择。以这种方式,可以正确选择候选多变量判别式的氨基酸解释变量。通过使用包括在步骤3中选择的氨基酸浓度数据的癌症状态信息再次执行步骤1.
【0115】从步骤2中的校验结果,可以在步骤3中选择候选多变量判别式的氨基酸解释变量,这基于逐步方法、最佳路径方法(bestpath method)、局部检索方法和遗传运算法则的至少一种。
【0116】最佳路径方法是选择氨基酸解释变量的方法,其通过优化候选多变量判别式的评估指数,同时逐个消除候选多变量判别式中所包含的候选多变量判别式。
【0117】返回到多变量判别式生成处理的描述,在控制设备中重复进行步骤1、2和3,并基于这样所积累的校验结果,从多种候选多变量判别式选择用作多变量判别式的候选多变量判别式,这样生成了多变量判别式(步骤4)。在候选多变量判别式的选择中,存在从所生成的候选多变量判别式以相同的方式选择最佳多变量判别式的情况,或者从所有候选多变量判别式选择最佳多变量判别式。
【0118】正如上面所述的,生成候选多变量判别式、候选多变量判别式的校验以及选择候选多变量判别式中的解释变量的处理,是基于多变量判别式生成中以系统化方式在一些列操作中的癌症状态信息进行的,这样,可以生成最佳多变量判别式用于癌症状态的评估。
【0119】2-2系统配置
后面,将参考图4~20对根据本发明第二实施方式的癌症评估系统(后面有时也称作本发明的系统)的配置进行描述。该系统仅仅是一个实例,本发明并不限于此。
【0120】首先,参考图4和5描述本发明的系统的整个配置。图4是显示本发明的系统结构的整个配体的实例的图。图5是显示本发明的系统结构的整个配体的另一个实例的图。正如图4中所显示的,本发明的系统被构建成,癌症评估装置100和客户端装置200(对应本发明的信息通信终端装置)通过网络300相互通信连接,其中癌症评估装置100评估待评估个体中的癌症状态,客户端200提供关于个体中氨基酸浓度值的氨基酸浓度数据。
【0121】在图5所显示的本发明的系统中,除了癌症评估装置100和客户端装置200外,数据库装置400也可以通过网络300通信连接,其中数据库装置400存储例如用于生成多变量判别式的癌症状态信息,和用于在癌症评估装置100中评估癌症状态的多变量判别式。在该配置中,通过网络300将关于癌症状态等的信息从癌症评估装置100提供到客户端装置200和数据库装置400,或者从客户端装置200和数据库装置400提供到癌症评估装置100。“关于癌症状态的信息”是关于生物体包括人类的癌症状态的特定项目的所测量数值的信息。在癌症评估装置100、客户端装置200和其他装置(例如各个测量装置)中产生关于癌症状态的信息,并主要存储在数据库数据库装置400中。
【0122】现在,参考图6~18描述本发明的系统中的癌症评估装置100的配置。图6是显示本发明的系统中癌症评估装置100的配置的实例的方块图,其仅仅大概显示了与本发明相关的区域。
【0123】癌症评估装置100包括控制设备102例如CPU(中央处理器),其整合地控制癌症评估装置100;通信界面104,其将癌症评估装置100通过通信装置连接到网络300,其中通信装置例如路由器和有线或无线连接线路如专用线;存储器设备106,其存储各种数据库、表、档案等;以及输入/输出界面108,其连接到通过任何通信通道相互通信连接的输入设备112和输出设备114。癌症评估装置100可以与各种分析器在相同的构架中共同存在(例如氨基酸分析器)。癌症评估装置100的分解/整合的典型配置并不限于在图中所显示的,并且且全部或一部分都可以在功能或物理上以任何单位分解或整合,例如根据所施加的各种负荷。例如,可以通过CGI(通用网关接口)进行一部分处理。
【0124】存储器设备106是存储手段,其例子包括存储器装置例如RAM(随机存取存储器)和ROM(只读存储器)、硬盘驱动器例如硬盘、移动硬盘、光盘等。存储器设备106存储计算机程序,其连同OS(操作系统)为CPU提供指令进行各种处理。正如图中所示,存储器设备106存储用户信息档案106a、氨基酸浓度数据档案106b、癌症状态信息档案106c、指定的癌症状态信息档案106d、多变量判别式相关信息数据库106e、判别式值档案106f和评估结果档案106g。
【0125】用户信息档案106a存储关于用户的用户信息。图7是显示在用户信息档案106a中所储存的信息的实例的表。正如图7中所示,在用户信息档案106a中存储的信息包括相互关联的用户ID(身份)用于唯一地识别用户、用户密码用于鉴定用户、用户姓名、组织ID用于唯一地识别用户的组织、部门ID用于唯一地识别用户组织的部门、部门名称和用户的电子邮件地址。
【0126】返回到图6,氨基酸浓度数据档案106b存储关于氨基酸浓度值的氨基酸浓度数据。图8是显示氨基酸浓度数据档案106b中所储存的信息的实例的表。正如图8中所示,在氨基酸浓度数据档案106b中存储的信息包括相互关联的个体编号用于唯一地识别个体(样品)为待评估的个体和氨基酸浓度数据。在图8中,氨基酸浓度数据被假定为数字数值即在连续尺度(continuous scale)上,但氨基酸浓度数据可以在名义尺度(nominal scale)或顺序尺度(ordinal scale)上表达。在名义尺度和顺序尺度的情况中,可以分配任何数字进行分析。氨基酸浓度数据可以与其他生物信息组合(例如性别差异、年龄、吸烟、数字化心电图波形、酶浓度、基因表达水平和氨基酸以外的代谢物的浓度)。
【0127】返回到图6,癌症状态信息档案106c存储用于生成多变量判别式的癌症状态信息。图9图9是显示癌症状态信息档案106c中所储存的信息的实例的表。正如图9中所显示的,癌症状态信息档案106c中所储存的信息包括相互关联的个体(样品)编号、对应癌症状态指数的癌症状态指数数据(T)(指数T1、指数T2、指数T3...)以及氨基酸浓度数据。在图9中,癌症状态指数数据被假定为数字数值即在连续尺度(continuous scale)上,但癌症状态指数数据可以在名义尺度(nominal scale)或顺序尺度(ordinal scale)上表达。在名义尺度和顺序尺度的情况中,可以为每种状态分配任何数字进行分析。癌症状态指数数据是已知的单个状态指数,其作为癌症状态的标记,并且可以使用数字数据。
【0128】返回到图6,指定的癌症状态信息档案106d存储在下面所描述的癌症状态信息指定部分102g中所制定的癌症状态信息。图10是显示指定的癌症状态信息档案106d中所储存的信息的实例的表。正如图10中所显示的,指定的癌症状态信息档案106d中所储存的信息包括相互关联的个体编号、指定的癌症状态指数数据和指定的氨基酸浓度数据。
【0129】返回到图6,多变量判别式相关信息数据库106e包括候选多变量判别式档案106e1,其存储在下面所描述的候选多变量判别式生成部分102h1中所生成的候选多变量判别式;校验结果档案106e2,其存储在下面所描述的候选多变量判别式校验部分102h2中的校验结果;所选择的癌症状态信息档案106e3,其存储含有在下面所描述的解释变量选择部分102h3中选择的氨基酸浓度数据组合的癌症状态信息;多变量判别式档案106e4,其存储在下面所描述的多变量判别式生成部分102h中所生成的多变量判别式。
【0130】候选多变量判别式档案存储在下面所描述的候选多变量判别式生成部分102h1中所生成的候选多变量判别式。图11是显示候选多变量判别式档案106e 1中所储存的信息的实例的表。正如图11中所显示的,候选多变量判别式档案106e 1中存储的信息包括相互关联的排序和候选多变量判别式(例如图11中的F1(Gly,Leu,Phe,…)、F2(Gly,Leu,Phe,…)、F3(Gly,Leu,Phe,…))。
【0131】返回到图6,校验结果档案106e2存储在下面所描述的候选多变量判别式校验部分102h2中的校验结果图12是显示校验结果档案106e2中所储存的信息的实例的表。正如图12中所显示的,校验结果档案106e2中存储的信息包括相互关联的排序和候选多变量判别式(例如图12中的Fk(Gly,Leu,Phe,…)、Fm(Gly,Leu,Phe,…)、Fl(Gly,Leu,Phe,…))以及每个候选多变量判别式的校验结果(例如每个候选多变量判别式的评估值)。
【0132】返回到图6,所选择的癌症状态信息档案106e3存储含有在下面所描述的解释变量选择部分102h3中选择的氨基酸浓度数据组合的癌症状态信息。图13是显示所选择癌症状态信息档案106e3中所储存的信息的实例的表。正如图13中所显示的,所选择癌症状态信息档案106e3中所储存的信息包括相互关联的个体编号、在下面所描述的癌症状态信息指定部分102g中指定的癌症状态指数数据以及在释变量选择部分102h3中所选择的氨基酸浓度数据。
【0133】返回到图6,多变量判别式档案106e4,存储在下面所描述的多变量判别式生成部分102h中所生成的多变量判别式。图14是显示多变量判别式档案106e4中所储存的信息的实例的表。正如图14中所显示的,多变量判别式档案106e4中所储存的信息包括相互关联的排序和多变量判别式(例如图14中的Fp(Phe,…)、Fp(Gly,Leu,Phe)、Fk(Gly,Leu,Phe,…))、对应每种判别式生成方法的阙值和每个多变量判别式的校验结果(例如每个多变量判别式的评估值)。
【0134】返回到图6,判别式值档案106f存储在下面所描述的判别式值计算部分102i中计算的判别式值。图15是显示判别式值档案106f中所储存的信息的实例的表。正如图15中所显示的,判别式值档案106f中所储存的信息包括相互关联的个体编号用于唯一地识别个体(样品)作为待评估的个体,排序(用于唯一地识别多变量判别式的编号)和判别式值。
【0135】返回到图6,评估结果档案106g存储在下面所描述的判别式值标准评估部分102j中所获得的评估结果(具体地,在判别式值标准评估部分102j1中获得的鉴别结果)。图16是显示评估结果档案106g中所储存的信息的实例的表。评估结果档案106g中所储存的信息包括相互关联的个体编号用于唯一地识别个体(样品)作为待评估的个体,之前获得的关于待评估个体的氨基酸浓度数据和关于癌症状态的评估结果(具体的,关于鉴别癌症和非癌症的鉴别结果)。
【0136】返回到图6,存储器设备106存储各种网页数据、CGI程序等用于为客户端装置200提供关于上面所述信息以外信息的网站信息。网页数据包括各种数据用于展示下面所描述的网页等,数据作为例如HTML(超文本标志语言)或XML(可扩展标记语言)文本档案。其他临时文件例如用于产生网页数据和用于操作的组分的档案等也被存储在存储器设备106中。此外,根据需要可以以WAVE或AIFF(音频交换文件格式)格式的声音信号用于传输到客户端装置200,以及JPEG(联合图像专家组)或MPEG2(运动图像专家组相2)格式的静态或动态图片的图像档案。
【0137】通信界面104允许在癌症评估装置100与网络300(或通信装置例如路由器)之间通信。因此,通信界面104具有通过通信线路与其他终端通信数据的功能。
【0138】输入/输出界面108连接到输入设备102和输出设备114。显示器(包括家用电视)、扬声器或打印机可以用作输出设备114(后面输出设备114也可以被描述为显示器114)。键盘、鼠标、麦克风或发挥指示设备功能的显示器连同鼠标也可以用作输入设备112。
【0139】控制设备102具有内部存储器存储控制程序例如OS(操作系统)、用于各种处理程序的程序和其他需要的数据并根据这些程序进行信息处理。正如图中所显示的,控制设备102主要包括请求解释部分102a、浏览处理部分102b、鉴定处理部分102c、电子邮件产生部分102d、网页产生部分102e、接收部分102f、癌症状态信息指定部分102g、多变量判别式生成部分102h、判别式值计算部分102i、判别式值标准评估部分102j、结果输出部分102k和发送部分102m。控制设备102进行数据处理例如移出在从数据库装置400传输的癌症状态信息中以及从客户端装置200传输的氨基酸浓度数据中,包括有缺陷数据或许多无关数据的数据,以及包括有缺陷数值的数据的解释变量。
【0140】请求解释部分102a解释来自客户端装置200或数据库装置400的请求,并根据分析结果将请求发送到控制设备102中的其他部分。在接收来自客户端装置200的用于各种显示器的浏览请求后,浏览处理部分102b产生并将网页数据传输到这些显示器。在从客户端装置200或数据库装置400接收鉴定请求鉴定请求后,鉴定处理部分102c进行鉴定。电子邮件产生部分102d产生包含各种类型信息的电子邮件。网页产生部分102e产生网页,用于客户利用客户端装置200浏览。
【0141】接收部分102f通过网络300接收从客户端装置200和数据库装置400传输的信息(具体的,氨基酸浓度数据、癌症状态信息、多变量判别式等)。癌症状态信息指定部分102g在生成多变量判别式中指定目标癌症状态指数数据和氨基酸浓度数据。
【0142】多变量判别式生成部分102h产生多变量判别式,这基于在接收部分102f接收的癌症状态信息,和在癌症状态信息指定部分102g中指定的癌症状态信息。具体的,多变量判别式生成部分102h产生多变量判别式,其通过从多个候选多变量判别式选择候选多变量判别式用作多变量判别式,这根据通过重复从癌症状态信息在候选多变量判别式生成部分102h1、候选多变量判别式校验部分102h2和解释变量选择部分102h3中的处理而积累的校验结果。
【0143】如果之前生成的多变量判别式被存储在存储器设备106的预定区域中,则多变量判别式生成部分102h可以产生多变量判别式,这通过从存储器设备106选择期望的多变量判别式。可替换的,多变量判别式生成部分102h可以产生多变量判别式,其通过从在另一个计算机装置(例如数据库装置400)中存储的多变量判别式选择并下载期望的多变量判别式。
【0144】后面,将参考图17描述多变量判别式生成部分102h的配置。图17是显示多变量判别式生成部分102h的配置的方块图,其仅仅大概显示了配置中与本发明相关的部分。另外,多变量判别式生成部分102h具有候选多变量判别式生成部分102h1,候选多变量判别式校验部分102h2和解释变量选择部分102h3。候选多变量判别式生成部分102h1从癌症状态信息产生作为多变量判别式的候选的候选多变量判别式,这根据预定的判别式生成方法。具体地,候选多变量判别式生成部分102h1可以从癌症状态信息产生多个候选多变量判别式,其通过使用多种不同的判别式生成方法。候选多变量判别式校验部分102h2校验在候选多变量判别式生成部分102h1中生成的候选多变量判别式,其根据特定的校验方法。具体的,候选多变量判别式校验部分102h2可以通过Bootstrap方法、保持评判方法(holdout method)、留一方法(leave one out method)等的至少一种对候选多变量判别式的鉴别率、灵敏度、信息标准的至少一种进行校验。解释变量选择部分102h3选择用于生成候选多变量判别式的癌症状态信息中所包含氨基酸浓度数据的组合,其通过从候选多变量判别式校验部分102h2中的候选多变量判别式的解释变量,这根据特定的解释变量选择方法。解释变量选择部分102h3可以从校验结果选择候选多变量判别式的解释变量,这根据逐步方法、最佳路径方法(best path method)、局部检索方法和遗传运算法则的至少一种。
【0145】返回到图6,多变量值计算部分102i计算计算作为多变量判别式的值的判别式值,这基于在接收部分102f中接受的待评估个体的氨基酸浓度数据中所包含的Cys、Gln、Trp、Orn、Arg、Glu、His、Ser和ABA中的至少一个的浓度值,以及在多变量判别式生成部分102h中生成的含有Cys、Gln、Trp、Orn、Arg、Glu、His、Ser和ABA中的至少一个作为解释变量的多变量判别式。
【0146】多变量判别式可以表达为一个分数式,或者多个分数式的总和,并且在构成多变量判别式的分数式的分子和分母的任一个或二者中包含Cys、Gln、Trp、Orn、Arg、Glu、His、Ser和ABA中的至少一个作为解释变量。具体的,多变量判别式可以是式1或式2:
a1×Orn/(Trp+Arg)+b1×(Cys+Ile)/Leu+c1              (式1)
a2×Glu/His+b2×Ser/Trp+c2×Val/Lys+d2×Pro/Arg+e2  (式2)
其中式1中的a1和b1是任意非零实数,式1中的c1是任意实数,式2中的a2、b2、c2和d2是任意非零实数,式2中的e2是任意实数。
【0147】多变量判别式可以是Logistic回归方程、线性判别式、多重回归方程、通过支持向量机(Support Vector Machine)所生成的判别式、通过Mahalanobis广义距离方法所生成的判别式、通过典型判别式分析所生成的判别式和通过决策树所生成的判别式的任意一种。具体的,多变量判别式可以是利用Orn、Cys、Tau、Trp、Gln、和Cit作为解释变量的Logistic回归方程,利用Orn、Cys、Arg、Tau、Trp和Gln作为解释变量的线性判别式,利用Glu、Gly、ABA、Val、His和Lys作为解释变量的Logistic回归方程,或者利用Glu、Ala、ABA、Val、His和Orn作为解释变量的线性判别式。
【0148】判别式值标准评估部分102j评估待评估个体中的癌症状态,这基于在判别式值计算部分102i中所计算的判别式值。判别式值标准评估部分102j还包括判别式值标准鉴别部分102j1。现在参考图18描述判别式值标准评估部分102j的配置。图18是显示判别式标准评估部分102j的配置的方块图,其仅仅大概显示了配置中与本发明相关的部分。根据判别式值,判别式值标准鉴别部分102j1鉴别待评估的癌症患者和无癌症个体。具体的,判别式值标准鉴别部分102j1将判别式值与预定的阙值(截止值(cutoff value))进行比较,进而待评估的癌症患者和无癌症个体。
【0149】返回到图6,结果输出部分102k将控制设备102中每个处理部分的处理结果(判别式值标准评估部分102j中的评估结果(具体的,判别式值标准鉴别部分102j1中的鉴别结果))等输出到输出部分。
【0150】发送部分102m将评估结果发送到客户端装置200,其作为待评估个体的氨基酸浓度数据的发送器,或者发送在癌症评估装置100中生成的多变量判别式以及评估结果发送到数据库装置400。
【0151】后面,参考图19对本发明的系统中的客户端装置200的配置进行描述。图19是显示本发明的系统中客户端装置200的配置的实例的方块图,其仅仅大概显示了配置中与本发明相关的部分。
【0152】客户端装置200包括通过通信通道相互通信连接的控制设备210、ROM220、HD(硬盘)230、RAM240、输入设备250、输出设备260、输入/输出IF270和通信IF280。
【0153】控制设备210具有网页浏览器211、电邮器(electronicmailer)212、接收部分213和发送部分214.网页浏览器进行解释网页数据的浏览处理,并将解释的网页数据展示在下面描述的显示器261行。网页浏览器211可以具有各种嵌入软件例如流媒体播放器具有接受、真实和返回流式屏幕图像的功能。电邮器212发送并接受电子邮件,其使用特定的协议(例如SMTP(简单邮件传送协议)或POP3(邮局协议第三版))。接收部分213接收各种信息,例如从癌症评估装置100通过通信IF280传输的评估结果。发送部分214通过通信IF280将各种信息例如关于待评估个体的氨基酸浓度数据发送到癌症评估装置100。
【0154】输入设备250是例如键盘、鼠标、麦克风。下面描述的显示器261连同鼠标也可以发挥指示设备功能。输出设备260是输出手段,其通过通信IF280输出接受的信息,并且包括显示器(包括家用电视)261和打印机262.。此外,输出设备260可以具有扬声器等。输入/输出IF270连接到输入设备250和输出设备260。
【0155】通信IF280将客户端装置200通信连接到网络300(或通信装置例如路由器)。换句话说,客户端装置200通过通信装置例如调制解调器(终端适配器)或路由器和电话线或专用线路链接到网络300。以这种方式,客户端装置200可以通过使用特定的协议进入癌症评估装置100。
【0156】可以通过根据需要与外围设备如打印机、显示器和图像扫描仪连接的为信息处理装置(例如信息处理终端例如已知的个人电脑、工作站、家用电脑、网络TV(电视)PHS(个人手机系统)终端、移动手机终端、移动单元通信终端或PDA(个人数码助理))安装用于网页数据浏览功能和电子邮件处理功能的软件(包括程序、数据等)实现客户端装置200。
【0157】可以通过CPU和CPU读取和执行的程序运行客户端装置200中控制设备210中的全部或部分处理。因此,用于为CPU提供指令和连同OS(操作系统)执行各种处理的计算机程序被记录在ROM220或HD230中。计算机程序(其在被加载在RAM240中时被执行),构成了具有CPU的控制设备210。计算机程序可以存储在通过任何网络连接到客户端装置200的应用程序服务器中,客户端装置200可以根据需要下载它们的全部或部分。可以通过硬件例如有线逻辑电路(wired-logic)实现控制设备210的处理的全部或任何部分。
【0158】后面,参考图4和5描述本发明的系统中的网络300。网络300具有互相连接相互通信连接的癌症评估装置100、客户端装置200和数据库装置400的功能,例如是英特网、内联网(intranet)或LAN(局域网(有线/无线))。网络300可以是VAN(增值网络)、个人电脑通信网络、公共电话网络(包括模拟和数字二者)、租用专线通信网(包括模拟和数字二者)、CATV(社区接入电视)网络、便携式交换网络或便携式数据包交换网络(包括IMT2000(国际移动通信2000)系统、GSM(全球移动通信系统)系统或PDC(个人数字手机)/PDC-P系统)、无线呼叫网络、局域无线网络例如蓝牙(注册商标)、PHS网络、卫星通信网络(包括CS(通信卫星)、BS(广播卫星)和ISDB(集成服务数字广播))等。
【0159】后面,参考图20描述本发明的系统中数据库400的配置。图20是显示本发明的系统中数据库装置400的配置的实例的方块图,其仅仅大概显示了配置中与本发明相关的部分。
【0160】数据库装置400具有存储功能,例如,用于生成癌症评估装置100或数据库装置400中的多变量判别式的癌症状态信息,在在癌症评估装置中生成的多变量判别式和癌症评估装置100中的评估结果。正如图20中所显示的,数据库装置400包括控制设备402例如CPU,其集成地控制整个数据库装置400;通信界面404,其通过通信装置例如路由器并通过有限或无线通信电路例如专用线路将数据库装置连接到网络300;存储器设备406,其存储各种数据、表和档案(例如网页的档案);和输入/输出界面408,其连接到输入设备412和输出设备414,这些部分通过任意通信通道相互连接。
【0161】存储器设备406是存储手段,并可以是例如存储器装置例如RAM或ROM、硬盘驱动器例如硬盘、软盘、光盘等。在各种处理中使用的各种程序被存储在存储器设备406中。通信界面404允许数据库装置400和网络300(或通信装置例如路由器)之间的通信。因此,通信界面404具有与其他终端通过通信线路通信数据的功能。输入/输出界面408链接到输入设备412和输出设备414。显示器(包括家用电视)、扬声器或打印机可以作为输出设备414(后面,输出设备414可以被描述为显示器414)。鼠标、麦克风或发挥指示设备功能的显示器连同鼠标也可以用作输入设备412。
【0162】控制设备402具有内部存储器存储控制程序例如OS(操作系统)、用于各种处理程序的程序和其他需要的数据,并且根据这些程序进行各种信息处理。正如在图中显示的,控制设备402主要包括请求解释部分402a、浏览处理部分402b、鉴定处理部分402c、电子邮件产生部分402d、网页产生部分402e和发送部分402f。
【0163】请求解释部分402a解释来自癌症评估装置100的请求,并根据分析结果将请求发送到控制设备402的其他部分。在从癌症评估装置100接收到各种屏幕浏览请求后,浏览处理部分402b产生并传输用于这些屏幕的网页数据。在从癌症评估装置100接收鉴定请求之后,鉴定处理部分402c进行鉴定。电子邮件产生部分402d产生电子邮件,其包含各种信息。网页产生部分402e为用户产生网页以利用客户端装置200进行浏览。发送部分402f为癌症评估装置100发送信息例如癌症状态信息和多变量判别式。
【0164】2-3.在本发明的系统中的处理
这里,参考图21对如上构成的本发明的系统中进行的癌症评估服务处理方法的实例进行描述。图21是显示在本发明的系统中进行的癌症评估服务处理的实例的流程图。
【0165】在本发明处理中所使用的氨基酸浓度数据涉及通过分析之前从个体收集的血液而获得的氨基酸浓度值。后面,将简要描述分析血液氨基酸的方法。首先,在肝素处理的试管中收集血液样品,接着通过对试管进行离心而分离血浆。将所分离的所有血浆样品冷冻,在测量氨基酸浓度之前储存在-70℃。在测量氨基酸浓度之前,通过加入硫代水杨酸达到浓度3%而对血浆样品进行除去蛋白质。使用通过在后柱中使用茚三酮反应的高效液相色谱(HPLC)的氨基酸分析仪用于测量氨基酸浓度。
【0166】首先,当用户指定从癌症评估装置100提供的网站地址(例如URL)时,客户端装置200通过显示网页浏览器211的屏幕上的输入设备250进入癌症评估装置100。具体的,当用户指示更新客户端装置200上的网页浏览器211屏幕更新时,网页浏览器211通过特定的鞋业发送从癌症评估装置100提供的网站地址,进而将求求传输对应氨基酸浓度数据传输屏幕的网页的请求传输到癌症评估装置100,这基于地址的路由。
【0167】接着,在从客户端装置200接收请求之后,癌症评估装置100中的请求解释部分102a分析所传输的请求,并根据分析结果将请求发送到控制设备102中的其他部分。具体的,当传输的请求是发送对应氨基酸浓度数据传输屏幕的网页时,癌症评估装置100中的浏览处理部分102b获得了网页数据用于展示在存储器设备106中预定区域存储的网页,并将所获得的网页数据发送到客户端装置200。更具体的,在接收对应用户氨基酸浓度数据传输屏幕的网页传输请求后,癌症评估装置100中的控制设备102要求用户输入用户ID和用户密码。如果输入用户ID和密码,则癌症评估装置100中的鉴定处理部分102c检验输入的用户ID和密码,其通过将他们与在用户信息档案106a中存储的用户ID和密码进行比较用于鉴定。只有当用户通过鉴定时,癌症评估装置100中的浏览处理部分102b才为客户端装置200发送网页信息用于展示对应氨基酸浓度数据传输屏幕的网页。利用从客户端200连同传输请求发送的IP(英特网协议)对客户端装置200进行鉴定。
【0168】接着,客户端装置200在接收部分213接收从癌症评估装置100传输的网页数据(用于展示对应氨基酸浓度数据传输屏幕的网页),利用网页浏览器211解释所接受网页数据,并在显示器261上展示氨基酸浓度数据传输屏幕。
【0169】当用户通过输入设备250输入和选择时,例如在显示器261上展示的氨基酸浓度数据传输屏幕上的个体的氨基酸浓度数据,客户端装置200的发送部分241为癌症评估装置100发送识别信号(identifier)用于鉴定所输入的信息和所选择的项目,进而将作为待评估个体的氨基酸浓度数据传输到癌症评估装置100(步骤SA-21)。在步骤SA-21中,氨基酸浓度数据的传输可以例如通过使用现有的档案传输技术例如FTP(档案转移协议)来实现。
【0170】接着,癌症评估装置100的请求解释部分102a解释从客户端装置200传输的识别信号,进而分析来自客户端装置200传输的请求,并请求数据库装置400发送多变量判别式用户癌症评估(具体的,用于鉴别2组癌症和非癌症)。
【0171】接着,数据库装置400的请求解释部分402a解释来自癌症评估装置100的传输请求,并为癌症评估装置100传输存储在存储器设备106的预定区域的多变量判别式(例如,更新的最新多变量判别式),其含有Cys、Gin、Trp、Orn、Arg、Glu、His、Ser和ABA中的至少一个的浓度作为解释变量。
【0172】在步骤SA-22中,传输到癌症评估装置100的多变量判别式可以表达为一个分数式,或者多个分数式的总和,并且在构成多变量判别式的分数式的分子和分母的任一个或二者中包含Cys、Gln、Trp、Orn、Arg、Glu、His、Ser和ABA中的至少一个作为解释变量。具体的,传输到癌症评估装置100的多变量判别式可以是式1或式2:
a1×Orn/(Trp+Arg)+b1×(Cys+Ile)/Leu+c1              (式1)
a2×Glu/His+b2×Ser/Trp+c2×Val/Lys+d2×Pro/Arg+e2  (式2)
其中式1中的a1和b1是任意非零实数,式1中的c1是任意实数,式2中的a2、b2、c2和d2是任意非零实数,式2中的e2是任意实数。
【0173】在步骤SA-22中,传输到癌症评估装置100的多变量判别式可以是Logistic回归方程、线性判别式、多重回归方程、通过支持向量机(Support Vector Machine)所生成的判别式、通过Mahalanobis广义距离方法所生成的判别式、通过典型判别式分析所生成的判别式和通过决策树所生成的判别式的任意一种。具体的,传输到癌症评估装置100的多变量判别式可以是利用Orn、Cys、Tau、Trp、Gln、和Cit作为解释变量的Logistic回归方程,利用Orn、Cys、Arg、Tau、Trp和Gln作为解释变量的线性判别式,利用Glu、Gly、ABA、Val、His和Lys作为解释变量的Logistic回归方程,或者利用Glu、Ala、ABA、Val、His和Orn作为解释变量的线性判别式。
【0174】在接收部分102f中,癌症评估装置11接受从客户端装置200传输的个体的氨基酸浓度数据以及从数据库装置400传输的多变量判别式,并将接收的氨基酸浓度数据储存在氨基酸浓度数据档案106b的预定存储器区域中,并将接收的多变量判别式存储在多变量判别式档案106e4的预定存储器区域中(步骤SA-23)。
【0175】在癌症评估装置100的控制设备102中,数据例如有缺陷的数据和五官的数据接着被从步骤SA-23接受的个体的氨基酸浓度数据中移出(步骤SA-24)。
【0176】接着,癌症评估装置100在判别式值计算部分102i中计算判别式值,这基于在步骤SA-23接收的多变量判别式,以及已经在步骤SA-24移出有缺陷的数据和五官数据的氨基酸浓度数据(步骤SA-25)。
【0177】接着,癌症评估装置100的判别式值标准鉴别部分102j1将在步骤SA-25中计算的判别式值与之前建立的阙值(截止值(cutoffvalue))进行比较,这样鉴别个体中的癌症和非癌症;并将鉴别结果存储在评估结果档案106g的预定存储器区域中(步骤SA-26)。
【0178】接着,癌症评估装置100的发送部分102m将步骤SA-26中获得的鉴别结果(关于鉴别癌症和非癌症的鉴别结果)发送到客户端装置200(其已经发送了氨基酸浓度数据)和发送到数据库装置400(步骤SA-27)。具体的,癌症评估装置100首先产生网页用于在网页产生部分102e中展示鉴别结果,并在存储器设备106的预定存储器区域中存储对应所产生网页的网页数据。接着,如上对用户进行鉴定,其通过经输入设备250输入预定的URL(统一资源定位符)到客户端装置200的网页浏览器中;客户端装置200将网页浏览请求发送到癌症评估装置100。接着,癌症评估装置100在浏览处理部分102b中检验从客户端装置200传输的浏览请求,并从存储器设备106的预定存储器区域读取对应网页的网页数据用于展示鉴别结果。接着,癌症评估装置100的发送部分102m将读出的网页数据发送到客户端装置200,并同时将网页数据或鉴别结果发送到数据库装置400。
【0179】在步骤SA-27中,癌症评估装置100的控制设备102可以将鉴别结果通过电子邮件通知用户客户端装置200。具体的,首先癌症评估装置100在传输时机在电子邮件产生部分102d中获取电子邮件地址,例如基于用户ID,参考在用户信息档案106a中存储的用户信息。接着,癌症评估装置100产生电子邮件数据包括用户姓名和鉴别结果,其中所获得的电子邮件地址作为其在电子邮件产生部分102d中的邮件地址。接着,癌症评估装置100的发送部分102m将所产生的数据发送到客户端装置200。
【0180】同样在步骤SA-27,癌症评估装置100可以将鉴别结果发送到用户客户端装置200,其通过使用现有的档案转移技术例如FTP。
【0181】返回到图21,数据库装置400中的控制设备402接收从癌症评估装置100传输的鉴别结果或者网页数据,并将接收的鉴别结果或网页数据存储(积累)在存储器设备406的预定存储器区域中(步骤SA-28)。
【0182】客户端装置的接收部分213接收从癌症评估装置100传输的网页数据,使用网页浏览器211解释所接收的网页数据,以在显示器261上展示网页屏幕,其显示个体的鉴别结果(步骤SA-29)。当通过电子邮件从癌症评估装置100发送鉴别结果时,在任何时机接收从癌症评估装置100传输的电子邮件,并利用客户端装置200的电子邮件器212的已知功能将所接收的电子邮件展示在显示器261上。
【0183】以这种方式,用户知道关于鉴别个体中2组癌症和非癌症的鉴别结果,其通过浏览在显示器261上展示的网页。用户可以通过打印机262打印在显示器261上所展示的网页内容。
【0184】如果通过电子邮件从癌症评估装置100传输鉴别结果,则用户读取在显示器261上展示的电子邮件,进而用户能够确认关于鉴别个体中2组癌症和非癌症的鉴别结果。用户可以通过打印机262打印在显示器261上所展示的网页内容。
【0185】根据前面的描述,完成了对癌症评估服务的解释。
【0186】2-4.第二实施方式和其他实施方式的概述
根据上面详细描述的癌症评估装置,客户端装置200将个体的氨基酸浓度数据发送到癌症评估装置,在从癌症评估装置接收请求之后,数据库装置400将用于判别2组癌症和非癌症的多变量判别式传输到癌症评估装置100.通过癌症评估装置100,从客户端装置200接收氨基酸浓度数据,并同时从数据库装置400接收多变量判别式,基于所接收的氨基酸浓度数据和所接收的多变量判别式计算判别式值,并将所计算的判别式值与之前建立的阙值比较,进而鉴别个体中的癌症和非癌症,将该结果传输到客户端装置200和数据库装置400.接着,客户端装置200接收并展示从癌症评估装置100传输的鉴别结果,数据库装置400接收并存储从癌症评估装置100传输的鉴别结果。因此,可以用于鉴别2组癌症和非癌症的多变量判别式中所获得的判别式值可以用于达到实现精确鉴别2组癌症和非癌症的效果。
【0187】根据癌症评估系统,多变量判别式可以表达为一个分数式,或者多个分数式的总和,并且在构成多变量判别式的分数式的分子和分母的任一个或二者中包含Cys、Gln、Trp、Orn、Arg、Glu、His、Ser和ABA中的至少一个作为解释变量。具体的,多变量判别式可以是式1或式2:
a1×Orn/(Trp+Arg)+b1×(Cys+Ile)/Leu+c1            (式1)
a2×Glu/His+b2×Ser/Trp+c2×Val/Lys+d2×Pro/Arg+e2  (式2)
其中式1中的a1和b1是任意非零实数,式1中的c1是任意实数,式2中的a2、b2、c2和d2是任意非零实数,式2中的e2是任意实数。因此,在特别地可以用于鉴别2组癌症和非癌症的多变量判别式中获得的判别式值可以用于达到实现更精确鉴别2组癌症和非癌症的效果。。可以通过在国际申请WO 2006/098192中所描述的方法(在后面所描述的第二实施方式中所描述的多变量判别式生成处理)生成上述的多变量判别式,其中,国际申请WO 2006/098192是由本发明的申请人提交的国际申请。优选使用通过这些方法获得的所有多变量判别式用于评估癌症状态,而与在作为输入数据的氨基酸浓度数据中氨基酸浓度的单位无关。
【0188】根据癌症评估系统,多变量判别式可以是Logistic回归方程、线性判别式、多重回归方程、通过支持向量机(Support VectorMachine)所生成的判别式、通过Mahalanobis广义距离方法所生成的判别式、通过典型判别式分析所生成的判别式和通过决策树所生成的判别式的任意一种。具体的,多变量判别式可以是利用Orn、Cys、Tau、Trp、Gln、和Cit作为解释变量的Logistic回归方程,利用Orn、Cys、Arg、Tau、Trp和Gln作为解释变量的线性判别式,利用Glu、Gly、ABA、Val、His和Lys作为解释变量的Logistic回归方程,或者利用Glu、Ala、ABA、Val、His和Orn作为解释变量的线性判别式。因此,在特别地可以用于鉴别2组癌症和非癌症的多变量判别式中获得的判别式值可以用于达到实现更精确鉴别2组癌症和非癌症的效果。可以通过在国际申请WO 2006/098192中所描述的方法(在后面所描述的第二实施方式中所描述的多变量判别式生成处理)生成上述的多变量判别式,其中,国际申请WO 2006/098192是由本发明的申请人提交的国际申请。
【0189】除了上面描述的第二实施方式外,在权利要求的技术范围内,还可以以各种不同的实施方式本发明的癌症评估系统、癌症评估程序产品和记录介质。例如,在上述第二实施方式中所描述的处理中,上述作为自动进行的处理的全部或一部分可以人工进行,人工进行的处理的全部或一部分可以通过已知的方法自动进行。另外,上面的说明书或附图中显示的处理程序、控制程序、具体的姓名、各种注册信息、包括如提取条件(retrieval condition)的参数、屏幕和数据库配置可以被任意修改,除非有特别说明。例如,图中所显示的癌症评估装置100的组建是大概的和功能性的,而可以与图中所显示的实体上不相同的。此外,癌症评估装置100中每个组件和每个设备的操作功能的全部或一部分(特别的,在控制设备102中的处理)可以由CPU(中央处理器)或CPU执行的程序执行,并可以由有线逻辑电路(wired-logic)实现。
【0190】“程序”是以任意语言书写的或由任意描述方法书写的数据处理方法,并可以是任意格式的,例如源代码或二进制码。“程序”可以不仅仅是配置的那样,还可以连同许多模块和文库(library)或联通不同的程序例如OS(操作程序)运行以达到其功能。程序被储存在记录介质上,并根据需要由癌症评估装置100机械读取。任何公知的配置或程序都可以用于读取记录在每个装置中记录介质上的程序,并用于读取程序以及读取后程序的安装。
【0191】“记录介质”包括任何“可移动物理介质”、“固定的物理介质”和“通信介质”。“可移动物理介质”的例子包括软盘、磁性光盘、ROM、EPROM(可擦除可编程只读存储器)、EEPROM(电可擦写可编程只读存储器)、CD-ROM(致密光碟只读存储器)、MO(磁-光盘)、DVD(多功能数码光盘)等。“固定物理介质”的例子包括各种安装在计算机系统中的介质,例如ROM、RAM和HD。例如当程序通过网络例如LAN(局域网)、WAN(广域网)或英特网传输时,“通信介质”短时间存储程序,例如通信线路和载波。
【0192】最后,参考图21详细描述癌症评估装置100中进行的多变量判别式处理的例子。图22是显示多变量判别式生成处理的实例的流程图。多变量判别式生成处理可以在处理癌症状态信息的数据库装置400中运行。
【0193】在本文中,癌症评估装置100将之前从数据库装置400获得癌症状态信息存储在癌症状态信息档案106c的预定存储器区域中。癌症评估装置100需要在指定的癌症状态信息档案106c的预定存储器区域中存储之前在癌症状态信息指定部分102g中指定的癌症状态信息包括癌症状态指数数据和氨基酸浓度数据。
【0194】根据预定的判别式生成方法,多变量判别式生成部分102h中的候选多变量判别式生成部分102h1从存储在指定的癌症状态信息档案106d的预定存储器区域中存储的癌症状态信息生成候选多变量判别式,并将生成的候选多变量判别式存储在候选多变量判别式档案106e 1的预定存储器区域中(步骤SB-21)。具体的,首先,多变量判别式生成部分102h中的候选多变量判别式生成部分102h1从许多不同的判别式生成方法(包括多变量分析方法例如主成分分析、判别式分析、支持向量机、多重回归分析、Logistic回归分析、K-均值法、聚类分析(Cluster Analysis)和决定树等)选出期望的方法,并基于所选择的判别式生成方法确定需要生成的候选多变量判别式的形式。接着,多变量判别式生成部分102h中的候选多变量判别式生成部分102h 1基于癌症状态信息进行各种对应所选择的函数选择方法的计算(例如平均值或偏差)。接着,多变量判别式生成部分102h中的候选多变量判别式生成部分102h1确定用于计算结果和所确定候选多变量判别式的参数。以这种方式,产生候选多变量判别式,其基于所选择的判别式生成方法。如果同时和并行地(平行的)通过使用多种组合的不同判别式生成方法产生候选多变量判别式,则可以平行地对每种所选择的判别式生成方法进行上述处理。可替换的,例如,如果连续地通过组合多种不同的判别式生成方法产生候选多变量判别式,则通过用通过进行主成分分生成的候选多变量判别式转化癌症状态信息可以产生候选多变量判别式,并对转化的癌症状态信息进行判别式分析。
【0195】多变量判别式生成部分102h2中的候选多变量判别式校验部分102h2校验(相互校验)在步骤SB-21中生成的候选多变量判别式,其根据特定的校验方法,并将校验结果存储在校验结果档案106e2中的预定存储器区域中(步骤SB-22)。具体的,首先,多变量判别式生成部分102h2中的候选多变量判别式校验部分102h2产生用于校验候选多变量判别式的校验数据,这基于存储在指定的癌症状态信息档案106d的预定存储器区域中,并根据所产生的校验数据校验候选多变量判别式。如果在步骤SB-21通过使用多种不同的判别式生成方法产生多种候选多变量判别式,则在多变量判别式生成部分102h2中的候选多变量判别式校验部分102h2中校验对应每种判别式生成方法的每个候选多变量判别式,其根据特定的校验方法。本文中,在步骤SB-22中,通过Bootstrap方法、保持评判方法(holdout method)、留一方法(leave one out method)等的至少一种对候选多变量判别式的鉴别率、灵敏度、信息标准的至少一种进行校验。因此,可以选择一种可预测性和可靠性更高的候选多变量判别式,其基于癌症状态信息和诊断条件。
【0196】接着,多变量判别式生成部分102h2中的解释变量选择部分102h3选择用于生成候选多变量判别式的癌症状态信息中所包含的氨基酸浓度数据的组合,其通过根据特定的解释变量选择方法从步骤SB-22中的校验结果选择候选多变量判别式的解释变量,并将癌症状态信息包括选择的氨基酸浓度数据的组合存储在所选择癌症状态信息档案106e3的预定存储器区域中(步骤SB-23)。当在步骤SB-21中通过使用多种不同的判别式生成方法产生多种候选多变量判别式时,在步骤SB-22中根据特定的校验方法校验对应每种判别式生成方法的每一个候选多变量判别式;多变量判别式生成部分102h中的解释变量选择部分102h选择对应步骤SB-22中获得的娇艳结果的每种候选多变量判别式的候选多变量判别式的解释变量,其根据在步骤SB-23中的特定解释变量选择方法。这里,在步骤SB-23中,可以根据逐步方法、最佳路径方法(best path method)、局部检索方法和遗传运算法则的至少一种从校验结果选择候选多变量判别式的解释变量。最佳路径方法是一种通过优化候选多变量判别式的评估指数,同时逐个消除候选多变量判别式中所包含的解释变量的方法。在步骤SB-23中,多变量判别式生成部分102h中的解释变量选择部分102h3可以选择氨基酸浓度数据的组合,这基于存储在指定癌症状态信息档案106d的预定存储器区域中的癌症状态信息。
【0197】接着,多变量判别式生成部分102h判断是否处理了在指定癌症状态信息档案106d的预定存储器区域中存储的癌症状态信息中所包含的氨基酸浓度数据的全部组合,如果判断结果是“结束”(步骤SB-24中的“是”),则处理进入下一步骤(SB-25),如果判断结果不是“结束”(步骤SB-24中的“否”),则返回到步骤SB-21。多变量判别式生成部分102h可以判断是否在步骤SB-23中选择的氨基酸浓度数据的组合与在指定癌症状态信息档案106d的预定存储器区域中存储的癌症状态信息中包含的氨基酸浓度的组合相同,如果判断结果是“相同”(步骤SB-24中的“是”),则处理进入下一步骤(SB-25),如果判断结果不是“相同”(步骤SB-24中的“否”),则可以返回到步骤SB-21。具体的,如果校验结果是每个多变量判别式的校验值,则多变量判别式生成部分102h可以进入步骤SB-25,或者返回到步骤SB-21,这基于将评估数值与对应每种判别式生成方法的特定阙值进行比较。
【0198】接着,多变量判别式生成部分102h基于校验结果确定多变量判别式,这通过从候选多变量判别式中选择用作多变量判别式的候选多变量判别式,并将确定的多变量判别式(选择的候选多变量判别式)存储在多变量判别式档案106e4的特定存储器区域中(步骤SB-25)。这里,在步骤SB-25中,例如,可以从通过相同判别式生成方法生成的候选多变量判别式,或者从所有候选多变量判别式中选择最佳多变量判别式。
【0199】这些是多变量判别式生成处理的描述。
实施例1
【0200】将一组确定诊断为癌症的癌症患者的血液样品和一组非癌症患者的血液样品通过氨基酸分析方法进行血液中氨基酸浓度的测量。氨基酸浓度的单位是nmol/ml。图23是显示非癌症和癌症之间氨基酸解释变量分布的箱线图(boxplot)。在图23中,水平轴表示非癌症组(对照)和癌症组,图中的ABA和Cys分别表示α-ABA(α-氨基丁酸)和半胱氨酸。为了鉴别癌症组和非癌症组的目的,在2组之间进行t-检验。
【0201】在癌症组中,与非癌症组相比,Tau、Glu、Pro、ABA、Cys、Phe、Orn和Lys显著升高(显著差异的概率,P<0.05),Gln、His、Trp和Arg显著降低。因此,清楚的是,氨基酸解释变量Tau、Glu、、Pro、ABA、Cys、Phe、Orn、Lys、Gln、His、Trp和Arg具有鉴别2组癌症组和非癌症组的能力。
【0202】此外,进行使用在ROC(接受者操作特征)曲线(图24)的曲线下面积(AUC)的评估用于鉴别2组癌症组和非癌症组,这基于各自的氨基酸解释变量,AUC显示氨基酸解释变量Tau、Glu、Gln、Cys、Trp、Lys和Arg的数值大于0.6。因此,清楚的是,氨基酸解释变量Tau、Glu、Gln、Cys、Trp、Lys和Arg具有鉴别2组癌症组和非癌症组的能力。
实施例2
【0203】使用在实施例1中所使用的样品数据。使用由本发明的申请人提交的国际公开No.2004/052191中所描述的方法,期望检索鉴别2组癌症组和非癌症组关于癌症鉴别的性能最大化的指数,并从多种具有等同性能的指数中获得指数式1。
指数式1:(Orn)/(Trp+Arg)+(Cys+Ile)/(Leu)
【0204】对基于指数式1的癌症诊断性能进行评估,其基于ROC曲线(图25)的AUC结合2组癌症组和非癌症组之间的鉴别,并获得了0.925±0.014的AUC(95%置信区间:0.897~0.953)。如果假定癌症组的症状发病率为0.011,截止值为1.41,通过确定指数式1鉴别2组癌症组和非癌症组的最佳截止值时,所获得的灵敏度为82%,特异性为89%,阳性预测值为48%,阴性预测值为98%,正确诊断率为88%。因此,发现指数式1是具有高诊断性能的可以使用的指数。除此之外,获得了多种分数式,其具有与指数式1具有等同鉴别性能。这些分数式表示在图26、27、28和29中。
实施例3
【0205】使用在实施例1中所使用的样品数据。通过Logistic分析(基于BIC(贝叶斯定理信息标准)最小标准的解释变量覆盖方法)检索关于癌症鉴别2组癌症和非癌症性能最大化的指数,并获得作为指数式2的Logistic回归方程,其由Orn、Cys、Tau、Trp、Gln和Cit构成(氨基酸解释变量Orn、Cys、Tau、Trp、Gln和Cit的数字系数以及常数在相同数量级上分别是0.144±0.014,0.085±0.021,0.051±0.011,-0.161±0.021,-0.016±0.003,-0.084±0.024,和0.967±1.613,)。
【0206】对基于指数式2的癌症诊断性能进行评估,其基于ROC曲线(图30)的AUC结合2组癌症组和非癌症组之间的鉴别,并获得了0.946±0.011的AUC(95%置信区间:0.925~0.968)。因此,发现指数式2是具有高诊断性能的可以使用的指数。如果假定癌症组的症状发病率为0.011,截止值为0.123,通过确定指数式2鉴别2组癌症组和非癌症组的最佳截止值时,所获得的灵敏度为88%,特异性为88%,阳性预测值为51%,阴性预测值为98%,正确诊断率为88%。因此,发现指数式2是具有高诊断性能的可以使用的指数。除此之外,获得了多种分数式,其具有与指数式1具有等同鉴别性能。这些分数式表示在图31、32、33和34中。图31、32、33和34中所呈现的方程的系数和其95%置信区间的各自数值可以是乘以实数的数值,并且其常数和95%置信区间的数值可以是通过加、减、乘或除以任意实数获得的数值。
实施例4
【0207】使用在实施例1中所使用的样品数据。通过线性判别式分析(解释变量覆盖方法)检索关于癌症鉴别2组癌症和非癌症性能最大化的指数,并获得作为指数式3的线性判别式,其由解释变量Orn、Cys、Arg、Tau、Trp和Gln构成(氨基酸解释变量Orn、Cys、Arg、Tau、Trp和Gln的数字系数在相同数量级上分别是10.683±1.134,6.461±2.416,-2.416±1.028,4.872±1.324,-8.048±1.887,和-1±0.259,)。
【0208】对基于指数式3的癌症诊断性能进行评估,其基于ROC曲线(图35)的AUC结合2组癌症组和非癌症组之间的鉴别,并获得了0.938±0.012的AUC(95%置信区间:0.915~0.962)。因此,发现指数式3是具有高诊断性能的可以使用的指数。如果假定癌症组的症状发病率为0.011,截止值为140.1,通过确定指数式3鉴别2组癌症组和非癌症组的最佳截止值时,所获得的灵敏度为86%,特异性为88%,阳性预测值为51%,阴性预测值为98%,正确诊断率为88%。因此,发现指数式3是具有高诊断性能的可以使用的指数。除此之外,获得了多种线性判别式,其具有与指数式3具有等同鉴别性能。这些线性判别式表示在图36、37、38和39中。图36、37、38和39中所呈现的方程的系数和其95%置信区间的各自数值可以是乘以实数的数值,并且其常数和95%置信区间的数值可以是通过加、减、乘或除以任意实数获得的数值。
实施例5
【0209】使用在实施例1中所使用的样品数据。通过解释变量覆盖方法提取所有用于进行鉴别关于癌症的2组癌症组和非癌症组的线性判别式。假定在每个判别式中出现的氨基酸解释变量的最大值是6,计算满足该条件的每个判别式的ROC曲线下的面积。这里,测量ROC曲线下的面积等于或大于某个阙值的判别式中出现的每种氨基酸的频率,结果是,当分别采用ROC曲线下的面积分别为0.75、0.8、0.85和0.9作为阙值时,在总是以高频率提取的头10个氨基酸中包括被校验的Cys、Gln、Trp、Orn和Arg。因此,清楚,使用这些氨基酸作为解释变量的多变量判别式具有鉴别2组癌症组和非癌症组的能力(图40)。
实施例6
【0210】
对通过活组织检查诊断的癌症患者组的血液样品和非癌症患者组的血液样品进行血液中的氨基酸浓度的测量。图41是显示癌症患者和非癌症患者的氨基酸解释变量的分布的箱线图。为了鉴别癌症组和非癌症组的目的,进行2组之间的t测试。
【0211】正如与非癌症组比较的,在癌症组中,Ser、Glu、Pro、ABA、Ile和Orn显著地提高,His和Trp显著地降低。因此,清楚的是氨基酸解释变量Ser、Glu、Pro、ABA、Ile、Orn、His和Trp具有鉴别2组癌症组和非癌症组的能力。
【0212】此外,进行使用在ROC曲线(图42)的曲线下面积(AUC)的评估用于鉴别2组癌症组和非癌症组,这基于各自的氨基酸解释变量,AUC显示氨基酸解释变量Ser、Glu、Pro、ABA、Ile和Orn的数值大于0.6.因此,清楚的是,氨基酸解释变量Ser、Glu、Pro、ABA、Ile和Orn具有鉴别2组癌症组和非癌症组的能力。
实施例7
【0213】使用在实施例6中使用的样品数据。期望检索鉴别2组癌症组和非癌症组关于癌症鉴别的性能最大化的指数,并从多种具有等同性能的指数中获得指数式4。
指数式4:Glu/His+0.14×Ser/Trp-0.38×Val/Lys+0.17×Pro/Arg
【0214】对基于指数式4的癌症诊断性能进行评估,其基于ROC曲线(图43)的AUC结合2组癌症组和非癌症组之间的鉴别,并获得了0.855±0.002的AUC(95%置信区间:0.816~0.895)。如果假定癌症组的症状发病率为0.8%,截止值为0.551,通过确定指数式1鉴别2组癌症组和非癌症组的最佳截止值时,所获得的灵敏度为78.72%,特异性为76.30%,阳性预测值为2.61%,阴性预测值为99.78%,正确诊断率为76.32%(图43)。因此,发现指数式4是具有高诊断性能的可以使用的指数。除此之外,获得了多种分数式,其具有与指数式4具有等同鉴别性能。这些分数式表示在图44和45中。图44和45中所呈现的判别式的系数的各自数值可以是通过乘以实数的数值,或者通过加上任意常数而获得的数值。
实施例8
【0215】使用在实施例6中使用的样品数据。通过Logistic分析(基于BIC最小标准的解释变量覆盖方法)检索关于癌症鉴别2组癌症和非癌症性能最大化的指数,并获得作为指数式5的Logistic回归方程,其由Glu、Gly、ABA、Val、His和Lys构成(氨基酸解释变量Glu、Gly、ABA、Val、His和Lys的数字系数以及常数在相同数量级上分别是0.0954±0.0012,0.0078±0.0002,0.1135±0.0024,-0.015±0.0004,-0.0715±0.0012,0.0158±0.0004,和-2.2783±0.1168,)。
【0216】对基于指数式5的癌症诊断性能进行评估,其基于ROC曲线(图46)的AUC结合2组癌症组和非癌症组之间的鉴别,并获得了0.865±0.020的AUC(95%置信区间:0.826~0.903)。因此,发现指数式5是具有高诊断性能的可以使用的指数。如果假定癌症组的症状发病率为0.8%,截止值为0.298,通过确定指数式4鉴别2组癌症组和非癌症组的最佳截止值时,所获得的灵敏度为81.6%,特异性为78.9%,阳性预测值为3.02%,阴性预测值为99.81%,正确诊断率为78.92%(图46)。因此,发现指数式5是具有高诊断性能的可以使用的指数。除此之外,获得了多种Logistic回归方程,其具有与指数式5具有等同鉴别性能。这些Logistic回归方程表示在图47和48中。图47和48中所呈现的方程的系数的各自数值可以是乘以实数的数值。
实施例9
【0217】使用在实施例6中所使用的样品数据。通过线性判别式分析(解释变量覆盖方法)检索关于癌症鉴别2组癌症和非癌症性能最大化的指数,并获得作为指数式6的线性判别式函数,其由解释变量Glu、Ala、ABA、Val、His和Orn构成(氨基酸解释变量Glu、Ala、ABA、Val、His和Orn的数字系数在相同数量级上分别是1±0.02,0.05±0.0018,1.4209±0.0352,-0.1966±0.0036,-0.7279±0.0133,和0.3416±0.0110,)。
【0218】对基于指数式6的癌症诊断性能进行评估,其基于ROC曲线(图49)的AUC结合2组癌症组和非癌症组之间的鉴别,并获得了0.854±0.021的AUC(95%置信区间:0.814~0.894)。因此,发现指数式6是具有高诊断性能的可以使用的指数。如果假定癌症组的症状发病率为0.8%,通过确定指数式6鉴别2组癌症组和非癌症组的最佳截止值时,所获得的截止值为-8.07,灵敏度为81.6%,特异性为74.0%,阳性预测值为2.47%,阴性预测值为99.80%,正确诊断率为74.1%(图49)。因此,发现指数式6是具有高诊断性能的可以使用的指数。除此之外,获得了多种线性判别式方程,其具有与指数式6具有等同鉴别性能。这些线性判别式方程表示在图50和51中。图50和51中所呈现的判别式的系数的各自数值可以是乘以实数的数值,或者通过加上任意常数获得的数值。
实施例10
【0219】使用在实施例6中所使用的样品数据。通过解释变量覆盖方法提取所有用于进行鉴别关于癌症的2组癌症组和非癌症组的线性判别式。假定在每个判别式中出现的氨基酸解释变量的最大值是4,计算满足该条件的每个判别式的ROC曲线下的面积。这里,在判别式中出现的测量ROC曲线下的面积是0.8、0.775、0.75、0.725和0.7或更大的氨基酸的频率,在总是以高频率提取的头10个氨基酸中包括被校验的Glu、His、Trp、Orn、Ser和ABA。因此,清楚,使用这些氨基酸作为解释变量的多变量判别式具有鉴别2组癌症组和非癌症组的能力(图52)。
工业实用性
【0220】正如上面所讨论的,根据本发明的评估癌症状态的方法、癌症评估装置、癌症评估方法、癌症评估系统、癌症评估程序和记录介质可以广泛用于许多工业领域,特别是医药、食品和医学领域,并在生物信息学中非常有用,例如进行癌症的疾病状态预测,疾病风险预测和蛋白质组学(proteome)和代谢物组学(metabolome)分析。

Claims (25)

1.评估癌症状态的方法,其包括:
测量步骤,其测量关于从待评估的个体收集的血液中氨基酸的浓度值的氨基酸浓度数据;以及
浓度值标准评估步骤,其基于在测量步骤所测量的个体的氨基酸浓度数据中所包含的Cys、Gln、Trp、Orn、Arg、Glu、His、Ser和ABA中的至少一个的浓度值,对个体中的癌症状态进行评估。
2.根据权利要求1的评估癌症状态的方法,其中浓度值标准评估步骤进一步包括浓度值标准鉴别步骤,其鉴别癌症患者和无癌症个体,这基于在测量步骤中所测量的个体的氨基酸浓度数据中所包含的Cys、Gln、Trp、Orn、Arg、Glu、His、Ser和ABA中的至少一个的浓度值。
3.根据权利要求1的评估癌症状态的方法,其中所述浓度标准评估步骤还包括:
判别式值计算步骤,其计算作为多变量判别式的值的判别式值,这基于在测量步骤测量的个体的氨基酸浓度数据中包含的Cys、Gln、Trp、Orn、Arg、Glu、His、Ser和ABA中的至少一个的浓度值与之前建立的利用氨基酸浓度作为解释变量的多变量判别式二者;和
判别式值标准评估步骤,其评估个体中的癌症状态,这基于在判别式值计算步骤中计算的判别式值,
其中多变量判别式含有Cys、Gln、Trp、Orn、Arg、Glu、His、Ser和ABA中的至少一个作为解释变量。
4.根据权利要求3的评估癌症状态的方法,其中判别式值标准评估步骤还包括判别式值标准鉴别步骤,其鉴别癌症患者和无癌症个体,这基于在判别式值计算步骤计算的判别式值。
5.根据权利要求4的评估癌症状态的方法,其中多变量判别式表达为一个分数式,或者多个分数式的总和,并且在构成多变量判别式的分数式的分子和分母的任一个或二者中包含Cys、Gln、Trp、Orn、Arg、Glu、His、Ser和ABA中的至少一个作为解释变量。
6.根据权利要求5的评估癌症状态的方法,其中多变量判别式是式1或式2:
a1×Orn/(Trp+Arg)+b1×(Cys+Ile)/Leu+c1    (式1)
a2×Glu/His+b2×Ser/Trp+c2×Val/Lys+d2×Pro/Arg+e2    (式2)
其中式1中的a1和b1是任意非零实数,式1中的c1是任意实数,式2中的a2、b2、c2和d2是任意非零实数,式2中的e2是任意实数。
7.根据权利要求4的评估癌症状态的方法,其中多变量判别式是Logistic回归方程、线性判别式、多重回归方程、通过支持向量机所生成的判别式、通过Mahalanobis广义距离方法所生成的判别式、通过典型判别式分析所生成的判别式和通过决策树所生成的判别式的任意一种。
8.根据权利要求7的评估癌症状态的方法,其中多变量判别式是利用Orn、Cys、Tau、Trp、Gln和Cit作为解释变量的Logistic回归方程,利用Orn、Cys、Arg、Tau、Trp和Gln作为解释变量的线性判别式,利用Glu、Gly、ABA、Val、His和Lys作为解释变量的Logistic回归方程,或者利用Glu、Ala、ABA、Val、His和Orn作为解释变量的线性判别式。
9.癌症评估装置,其包括控制单元和存储器单元用于评估待评估个体中的癌症状态,其中控制单元包括:
判别式值计算单元,其计算作为多变量判别式的值的判别式值,这基于在先前获得的关于个体中氨基酸浓度值的氨基酸浓度数据中所包含的Cys、Gln、Trp、Orn、Arg、Glu、His、Ser和ABA中的至少一个的浓度值,以及在存储器单元中所存储的利用氨基酸浓度作为解释变量的多变量判别式二者,其中含有Cys、Gln、Trp、Orn、Arg、Glu、His、Ser和ABA中的至少一个作为解释变量;和
判别式值标准评估单元,其评估个体中的癌症状态,这基于判别式值计算单元所计算的判别式值。
10.根据权利要求9的癌症评估装置,其中判别式值标准评估单元还包括判别式值标准鉴别单元,其鉴别癌症患者和无癌症个体,这基于判别式值计算单元所计算的判别式值。
11.根据权利要求10的癌症评估装置,其中多变量判别式表达为一个分数式,或者多个分数式的总和,并且在构成多变量判别式的分数式的分子和分母的任一个或二者中包含Cys、Gln、Trp、Orn、Arg、Glu、His、Ser和ABA中的至少一个作为解释变量。
12.根据权利要求11的癌症评估装置,其中多变量判别式是式1或式2:
a1×Orn/(Trp+Arg)+b1×(Cys+Ile)/Leu+c1    (式1)
a2×Glu/His+b2×Ser/Trp+c2×Val/Lys+d2×Pro/Arg+e2    (式2)
其中式1中的a1和b1是任意非零实数,式1中的c1是任意实数,式2中的a2、b2、c2和d2是任意非零实数,式2中的e2是任意实数。
13.根据权利要求10的癌症评估装置,其中多变量判别式是Logistic回归方程、线性判别式、多重回归方程、通过支持向量机所生成的判别式、通过Mahalanobis广义距离方法所生成的判别式、通过典型判别式分析所生成的判别式和通过决策树所生成的判别式的任意一种。
14.根据权利要求13的癌症评估装置,其中多变量判别式是利用Orn、Cys、Tau、Trp、Gln和Cit作为解释变量的Logistic回归方程,利用Orn、Cys、Arg、Tau、Trp和Gln作为解释变量的线性判别式,利用Glu、Gly、ABA、Val、His和Lys作为解释变量的Logistic回归方程,或者利用Glu、Ala、ABA、Val、His和Orn作为解释变量的线性判别式。
15.根据权利要求9~14任一项的癌症评估装置,其中控制单元还包括多变量判别式生成单元,其生成存储在存储器单元中的多变量判别式,这基于存储在存储器单元的癌症状态信息,其中癌症状态信息含有氨基酸浓度数据和关于指示癌症状态指数的癌症状态指数数据,
其中多变量判别式生成单元还包括:
候选多变量判别式生成单元,其从癌症状态信息生成作为多变量判别式候选的候选多变量判别式,这基于预定的生成判别式的方法;
候选多变量判别式校验单元,其校验由候选多变量判别式生成单元生成的候选多变量判别式,这基于预定的校验方法;以及
解释变量选择单元,其从通过候选多变量判别式校验单元所获得的校验结果选择候选多变量判别式的解释变量,这基于预定的解释变量选择方法,这样选择了用于生成候选多变量判别式中的癌症状态信息中所含有的氨基酸浓度数据的组合,以及
其中,多变量判别式生成单元生成了多变量判别式,其通过从多个候选多变量判别式选择用作多变量判别式的候选多变量判别式,这基于通过重复执行候选多变量判别式生成单元、候选多变量判别式校验单元和解释变量选择单元而积累的校验结果。
16.癌症评估方法,其评估待评估的个体中癌症状态,所述方法是利用信息处理装置进行的,其中所述信息处理装置包括控制单元和存储器单元,所述方法包括:
(i)判别式值计算步骤,其计算作为多变量判别式数值的判别式值,这基于在之前所获得的关于个体中氨基酸浓度值的氨基酸浓度数据中Cys、Gln、Trp、Orn、Arg、Glu、His、Ser和ABA中的至少一个的浓度值以及存储在存储器单元中利用氨基酸浓度作为解释变量的多变量判别式二者,其中含有Cys、Gln、Trp、Orn、Arg、Glu、His、Ser和ABA中的至少一个作为解释变量;以及
(ii)判别式值标准评估步骤,其评估个体中的癌症状态,这基于在判别式值计算步骤中所计算的判别式值,
其中步骤(i)和(ii)都是通过控制单元执行的。
17.根据权利要求16的癌症评估方法,其中判别式值标准评估步骤还包括判别式值标准鉴别步骤,其鉴别癌症患者和无癌症个体,这基于在判别式值计算步骤中所计算的判别式值。
18.根据权利要求17的癌症评估方法,其中多变量判别式表达为一个分数式,或者多个分数式的总和,并且在构成多变量判别式的分数式的分子和分母的任一个或二者中包含Cys、Gln、Trp、Orn、Arg、Glu、His、Ser和ABA中的至少一个作为解释变量。
19.根据权利要求18的癌症评估方法,其中多变量判别式是式1或式2:
a1×Orn/(Trp+Arg)+b1×(Cys+Ile)/Leu+c1    (式1)
a2×Glu/His+b2×Ser/Trp+c2×Val/Lys+d2×Pro/Arg+e2    (式2)
其中式1中的a1和b1是任意非零实数,式1中的c1是任意实数,式2中的a2、b2、c2和d2是任意非零实数,式2中的e2是任意实数。
20.根据权利要求17的癌症评估方法,其中多变量判别式是Logistic回归方程、线性判别式、多重回归方程、通过支持向量机所生成的判别式、通过Mahalanobis广义距离方法所生成的判别式、通过典型判别式分析所生成的判别式和通过决策树所生成的判别式的任意一种。
21.根据权利要求20的癌症评估方法,其中多变量判别式是利用Orn、Cys、Tau、Trp、Gln和Cit作为解释变量的Logistic回归方程,利用Orn、Cys、Arg、Tau、Trp和Gln作为解释变量的线性判别式,利用Glu、Gly、ABA、Val、His和Lys作为解释变量的Logistic回归方程,或者利用Glu、Ala、ABA、Val、His和Orn作为解释变量的线性判别式。
22.根据权利要求16~21任一项的癌症评估方法,其中所述方法还包括控制单元执行的多变量判别式生成步骤,其生成存储在存储器单元中的多变量判别式,这基于存储在存储器单元的癌症状态信息,其中癌症状态信息含有氨基酸浓度数据和关于指示癌症状态指数的癌症状态指数数据,
其中多变量判别式生成步骤还包括:
候选多变量判别式生成步骤,其从癌症状态信息生成作为多变量判别式候选的候选多变量判别式,这基于预定的生成判别式的方法;
候选多变量判别式校验步骤,其校验在候选多变量判别式生成步骤生成的候选多变量判别式,这基于预定的校验方法;以及
解释变量选择步骤,其从在候选多变量判别式校验步骤中所获得的校验结果选择候选多变量判别式的解释变量,这基于预定的解释变量选择方法,这样选择了用于生成候选多变量判别式中的癌症状态信息中所含有的氨基酸浓度数据的组合,以及
其中在多变量判别式生成步骤,生成了多变量判别式,其通过从多个候选多变量判别式选择用作多变量判别式的候选多变量判别式,这基于通过重复执行候选多变量判别式生成步骤、候选多变量判别式校验步骤和解释变量选择步骤而积累的校验结果。
23.癌症评估系统,其包括癌症评估装置,该装置包括控制单元和存储器单元以评估待评估个体中的癌症状态;以及信息通信终端装置,其提供关于通过网络为相互通信连接的个体中氨基酸浓度值的氨基酸浓度数据,
其中,信息通信终端装置包括:
氨基酸浓度数据发送单元,其将个体的氨基酸浓度数据传输到癌症评估装置;以及
评估结果接收单元,其接收从癌症评估装置传输的个体的癌症状态的评估结果,
其中,癌症评估装置的控制单元包括:
氨基酸浓度数据接收单元,其接受从信息通信终端装置传输的个体的氨基酸浓度数据;
判别式值计算单元,其计算作为多变量判别式的数值的判别式值,这基于氨基酸浓度数据接收单元所接受的个体的氨基酸浓度数据中所包含的Cys、Gln、Trp、Orn、Arg、Glu、His、Ser和ABA中的至少一个的浓度值以及存储在存储器单元中的利用氨基酸浓度作为解释变量的多变量判别式二者,其中含有Cys、Gln、Trp、Orn、Arg、Glu、His、Ser和ABA中的至少一个作为解释变量;
判别式值标准评估单元,其评估个体中的癌症状态,这基于判别式值计算单元所计算的判别式值;以及
评估结果发送单元,其将通过判别式值标准评估单元所获得的个体的评估结果传输到信息通信终端装置。
24.癌症评估程序产品,其使得包括控制单元和存储器单元的信息处理装置执行评估待评估的个体中癌症状态的方法,该方法包括:
(i)判别式值计算步骤,其计算作为多变量判别式数值的判别式值,这基于在之前所获得的关于个体中氨基酸浓度值的氨基酸浓度数据中所包含Cys、Gln、Trp、Orn、Arg、Glu、His、Ser和ABA中的至少一个的浓度值以及存储在存储器单元中利用氨基酸浓度作为解释变量的多变量判别式二者,其中含有Cys、Gln、Trp、Orn、Arg、Glu、His、Ser和ABA中的至少一个作为解释变量,以及
(ii)判别式值标准评估步骤,其评估个体中的癌症状态,这基于在判别式值计算步骤中所计算的判别式值,
其中,步骤(i)和(ii)都是通过控制单元执行的。
25.计算机可读记录介质,其包含记录在其上的根据权利要求24的癌症评估程序产品。
CNA2007800476016A 2006-12-21 2007-12-18 评估癌症状态的方法、癌症评估装置、癌症评估方法、癌症评估系统、癌症评估程序和记录介质 Pending CN101568838A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410049717.5A CN103760367B (zh) 2006-12-21 2007-12-18 评估癌症状态的方法、癌症评估装置、癌症评估方法、癌症评估系统、癌症评估程序和记录介质

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP344936/2006 2006-12-21
JP2006344936 2006-12-21

Related Child Applications (1)

Application Number Title Priority Date Filing Date
CN201410049717.5A Division CN103760367B (zh) 2006-12-21 2007-12-18 评估癌症状态的方法、癌症评估装置、癌症评估方法、癌症评估系统、癌症评估程序和记录介质

Publications (1)

Publication Number Publication Date
CN101568838A true CN101568838A (zh) 2009-10-28

Family

ID=39536294

Family Applications (2)

Application Number Title Priority Date Filing Date
CN201410049717.5A Active CN103760367B (zh) 2006-12-21 2007-12-18 评估癌症状态的方法、癌症评估装置、癌症评估方法、癌症评估系统、癌症评估程序和记录介质
CNA2007800476016A Pending CN101568838A (zh) 2006-12-21 2007-12-18 评估癌症状态的方法、癌症评估装置、癌症评估方法、癌症评估系统、癌症评估程序和记录介质

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CN201410049717.5A Active CN103760367B (zh) 2006-12-21 2007-12-18 评估癌症状态的方法、癌症评估装置、癌症评估方法、癌症评估系统、癌症评估程序和记录介质

Country Status (6)

Country Link
US (1) US20100017145A1 (zh)
EP (1) EP2103941A4 (zh)
JP (2) JPWO2008075664A1 (zh)
KR (1) KR101542037B1 (zh)
CN (2) CN103760367B (zh)
WO (1) WO2008075664A1 (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101939652B (zh) * 2008-02-06 2015-01-07 味之素株式会社 胃癌的评价方法、以及胃癌评价装置、胃癌评价方法、胃癌评价系统、胃癌评价程序和记录介质
WO2021238085A1 (zh) * 2020-05-29 2021-12-02 杭州广科安德生物科技有限公司 构建体外检测癌症的数学模型的方法及其应用
CN114279911A (zh) * 2021-11-12 2022-04-05 万贝医疗健康科技(上海)有限公司 放化疗术后卵巢、宫颈癌细胞活动状态评估设备

Families Citing this family (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008016111A1 (en) 2006-08-04 2008-02-07 Ajinomoto Co., Inc. Method for evaluation of lung cancer, lung cancer evaluation apparatus, lung cancer evaluation method, lung cancer evaluation system, lung cancer evaluation program, and recording medium
EP2096439A4 (en) 2006-12-21 2011-01-05 Ajinomoto Kk METHOD, APPARATUS, METHOD, SYSTEM AND SOFTWARE FOR EVALUATING COLORECTAL CANCER, AND RECORDING MEDIUM
EP2103940A4 (en) 2006-12-21 2013-04-24 Ajinomoto Kk METHOD, APPARATUS, METHOD, SYSTEM AND SOFTWARE FOR ASSESSING BREAST CANCER, AND RECORDING MEDIUM
EP2172775A4 (en) 2007-06-25 2010-12-01 Ajinomoto Kk METHOD OF EVALUATING VISCERAL GREASE ACCUMULATION
KR101361601B1 (ko) * 2008-03-04 2014-02-12 아지노모토 가부시키가이샤 암종의 평가 방법
WO2009154296A1 (ja) * 2008-06-20 2009-12-23 味の素株式会社 女性生殖器癌の評価方法
JP5754137B2 (ja) * 2008-06-20 2015-07-29 味の素株式会社 前立腺癌の評価方法、前立腺癌評価装置、前立腺癌評価方法、前立腺癌評価プログラム、記録媒体、前立腺癌評価システム、および情報通信端末装置
JP5817527B2 (ja) * 2009-02-19 2015-11-18 味の素株式会社 肥満の評価方法、肥満評価装置、肥満評価方法、肥満評価システム、肥満評価プログラム、記録媒体、および情報通信端末装置
JP2011247869A (ja) * 2010-04-27 2011-12-08 Kobe Univ メタボローム解析手法を用いた特定疾患の検査方法
BR112012030587A2 (pt) * 2010-06-01 2017-01-24 Ernst Moritz Arndt Universität métodos para diagnóstico de câncer pancreático, para identificar se um indivíduo precisa ou não de uma terapia contra câncer pancreático e para determinar se uma terapia contra câncer pancreático obtém sucesso, dispositivo para diagnóstico de câncer pancreático e uso de pelo menos um biomarcador
WO2013168550A1 (ja) * 2012-05-11 2013-11-14 味の素株式会社 癌免疫療法の評価方法、癌免疫療法評価装置、癌免疫療法評価プログラム、癌免疫療法評価システムおよび情報通信端末装置
JP6299063B2 (ja) * 2012-11-27 2018-03-28 味の素株式会社 膵臓癌リスク疾患の評価のための方法、膵臓癌リスク疾患評価装置、膵臓癌リスク疾患評価方法、膵臓癌リスク疾患評価プログラムおよび膵臓癌リスク疾患評価システム
JP6269502B2 (ja) * 2012-11-27 2018-01-31 味の素株式会社 膵臓癌の評価方法、膵臓癌評価装置、膵臓癌評価方法、膵臓癌評価プログラム、膵臓癌評価システムおよび端末装置
US20160370379A1 (en) * 2014-12-22 2016-12-22 J-Pharma Co., Ltd. Blood-based biomarker for cancer
WO2017213246A1 (ja) 2016-06-10 2017-12-14 株式会社日立製作所 尿中代謝物による疾病診断法
JP6927212B2 (ja) 2016-07-08 2021-08-25 味の素株式会社 軽度認知障害又はアルツハイマー型認知症の評価方法
JP6870679B2 (ja) 2016-07-08 2021-05-12 味の素株式会社 アルツハイマー型認知症の将来の発症リスクの評価方法
KR102427923B1 (ko) 2016-10-04 2022-08-02 아지노모토 가부시키가이샤 대장암의 평가 방법, 평가 장치, 평가 프로그램, 평가 시스템, 및 단말 장치
JPWO2018066620A1 (ja) * 2016-10-04 2019-07-18 味の素株式会社 膵臓癌の評価方法、評価装置、評価プログラム、評価システム、及び端末装置
WO2018101450A1 (ja) 2016-12-01 2018-06-07 味の素株式会社 癌モニタリングの方法、算出方法、評価装置、算出装置、評価プログラム、算出プログラム、評価システム、及び端末装置
JP7120027B2 (ja) * 2017-02-02 2022-08-17 味の素株式会社 取得方法、算出方法、評価装置、算出装置、評価プログラム、算出プログラム、および評価システム
EP3646328A4 (en) * 2017-06-29 2021-04-21 Quanticision Diagnostics Inc. APPARATUS AND METHOD FOR ABSOLUTE QUANTIFICATION OF BIOMARKERS ALLOWING A DIAGNOSIS OF SOLID TUMOR
WO2019194144A1 (ja) * 2018-04-02 2019-10-10 味の素株式会社 乳癌の評価方法、算出方法、評価装置、算出装置、評価プログラム、算出プログラム、記録媒体、評価システム、及び端末装置
CN109916849A (zh) * 2019-04-04 2019-06-21 新疆大学 基于近红外光谱相关性分析检测样品理化性质的方法

Family Cites Families (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS61126472A (ja) * 1984-11-24 1986-06-13 Advance Res & Dev Co Ltd 診断方法
US6059724A (en) * 1997-02-14 2000-05-09 Biosignal, Inc. System for predicting future health
US6300136B1 (en) * 1997-09-03 2001-10-09 The Trustees Of The University Of Pennsylvania Methods for diagnosis and treatment of tumors in humans
CA2371385A1 (en) * 1999-04-26 2000-11-02 Surromed, Inc. Phenotype and biological marker identification system
ATE319093T1 (de) * 2000-08-21 2006-03-15 Assist Publ Hopitaux De Paris Verfahren zur diagnose von leberkrankheit unter verwendung von biochemischen merkmalen
US6631330B1 (en) * 2000-08-21 2003-10-07 Assistance Publique-Hopitaux De Paris (Ap-Hp) Diagnosis method of inflammatory, fibrotic or cancerous disease using biochemical markers
JP5236856B2 (ja) * 2001-11-09 2013-07-17 ライフ テクノロジーズ コーポレーション 遺伝子発現プロファイルを用いる病気の同定、観測及び治療及び生物学的状態の同定
EP1570779A4 (en) 2002-12-09 2008-03-12 Ajinomoto Kk PROCESSOR FOR INFORMATION ON THE CONDITION OF AN ORGANISM, METHOD FOR PROCESSING INFORMATION ON THE CONDITION OF AN ORGANISM, SYSTEM FOR MANAGING INFORMATION ON THE CONDITION OF AN ORGANISM, PROGRAM AND RECORDING MEDIUM
US7869033B2 (en) * 2003-12-24 2011-01-11 Vadivel Masilamani Cancer detection by optical analysis of body fluids
US20060170928A1 (en) * 2003-12-24 2006-08-03 Vadivel Masilamani Masila's cancer detector based on optical analysis of body fluids
WO2006098192A1 (ja) * 2005-03-16 2006-09-21 Ajinomoto Co., Inc. 生体状態評価装置、生体状態評価方法、生体状態評価システム、生体状態評価プログラム、評価関数作成装置、評価関数作成方法、評価関数作成プログラムおよび記録媒体
US20080305962A1 (en) * 2005-07-29 2008-12-11 Ralph Markus Wirtz Methods and Kits for the Prediction of Therapeutic Success, Recurrence Free and Overall Survival in Cancer Therapies
US20100004871A1 (en) * 2005-12-27 2010-01-07 Power3 Medical Products, Inc. Identities, specificities, and use of twenty two (22) differentially expressed protein biomarkers for blood based diagnosis of breast cancer
US8409794B2 (en) * 2006-03-24 2013-04-02 Phenomenome Discoveries Inc. Biomarkers useful for diagnosing prostate cancer, and methods thereof
WO2008016111A1 (en) * 2006-08-04 2008-02-07 Ajinomoto Co., Inc. Method for evaluation of lung cancer, lung cancer evaluation apparatus, lung cancer evaluation method, lung cancer evaluation system, lung cancer evaluation program, and recording medium
US20090075284A1 (en) * 2006-09-19 2009-03-19 The Regents Of The University Of Michigan Metabolomic profiling of prostate cancer
EP2103940A4 (en) * 2006-12-21 2013-04-24 Ajinomoto Kk METHOD, APPARATUS, METHOD, SYSTEM AND SOFTWARE FOR ASSESSING BREAST CANCER, AND RECORDING MEDIUM
EP2096439A4 (en) * 2006-12-21 2011-01-05 Ajinomoto Kk METHOD, APPARATUS, METHOD, SYSTEM AND SOFTWARE FOR EVALUATING COLORECTAL CANCER, AND RECORDING MEDIUM
CN101932934A (zh) * 2007-02-01 2010-12-29 菲诺梅诺米发现公司 诊断卵巢癌健康状况和卵巢癌健康状况危险的方法
KR101272207B1 (ko) * 2008-02-06 2013-06-07 아지노모토 가부시키가이샤 위암의 평가 방법, 및 위암 평가 장치, 위암 평가 방법, 위암 평가 시스템, 위암 평가 프로그램 및 기록 매체
KR101361601B1 (ko) * 2008-03-04 2014-02-12 아지노모토 가부시키가이샤 암종의 평가 방법
WO2009154296A1 (ja) * 2008-06-20 2009-12-23 味の素株式会社 女性生殖器癌の評価方法
JP5754137B2 (ja) * 2008-06-20 2015-07-29 味の素株式会社 前立腺癌の評価方法、前立腺癌評価装置、前立腺癌評価方法、前立腺癌評価プログラム、記録媒体、前立腺癌評価システム、および情報通信端末装置

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101939652B (zh) * 2008-02-06 2015-01-07 味之素株式会社 胃癌的评价方法、以及胃癌评价装置、胃癌评价方法、胃癌评价系统、胃癌评价程序和记录介质
WO2021238085A1 (zh) * 2020-05-29 2021-12-02 杭州广科安德生物科技有限公司 构建体外检测癌症的数学模型的方法及其应用
CN114279911A (zh) * 2021-11-12 2022-04-05 万贝医疗健康科技(上海)有限公司 放化疗术后卵巢、宫颈癌细胞活动状态评估设备

Also Published As

Publication number Publication date
CN103760367A (zh) 2014-04-30
EP2103941A1 (en) 2009-09-23
JPWO2008075664A1 (ja) 2010-04-15
WO2008075664A1 (ja) 2008-06-26
US20100017145A1 (en) 2010-01-21
EP2103941A4 (en) 2010-10-20
KR20090091301A (ko) 2009-08-27
JP2014025946A (ja) 2014-02-06
KR101542037B1 (ko) 2015-08-05
CN103760367B (zh) 2017-03-01

Similar Documents

Publication Publication Date Title
CN101568838A (zh) 评估癌症状态的方法、癌症评估装置、癌症评估方法、癌症评估系统、癌症评估程序和记录介质
JP7193020B2 (ja) 取得方法、算出方法、胃癌評価装置、算出装置、胃癌評価プログラム、算出プログラムおよび胃癌評価システム
JP6551484B2 (ja) 取得方法、算出方法、前立腺疾患評価装置、算出装置、前立腺疾患評価プログラム、算出プログラム及び前立腺疾患評価システム
JP6586980B2 (ja) 取得方法、算出方法、女性生殖器癌評価装置、算出装置、女性生殖器癌評価プログラム、算出プログラム及び女性生殖器癌評価システム
US9664681B2 (en) Lung cancer evaluating apparatus, method, system, and program and recording medium therefor
US20110091924A1 (en) Method of evaluating cancer type
US9459255B2 (en) Method of evaluating breast cancer, breast cancer-evaluating apparatus, breast cancer-evaluating method, breast cancer-evaluating system, breast cancer-evaluating program and recording medium

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C12 Rejection of a patent application after its publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20091028