CN101960310A - 癌症种类的评价方法 - Google Patents

癌症种类的评价方法 Download PDF

Info

Publication number
CN101960310A
CN101960310A CN2009801083545A CN200980108354A CN101960310A CN 101960310 A CN101960310 A CN 101960310A CN 2009801083545 A CN2009801083545 A CN 2009801083545A CN 200980108354 A CN200980108354 A CN 200980108354A CN 101960310 A CN101960310 A CN 101960310A
Authority
CN
China
Prior art keywords
cancer
discriminant
group
mentioned
formula
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2009801083545A
Other languages
English (en)
Inventor
今泉明
安东敏彥
冈本直幸
今村文生
东山圣彦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ajinomoto Co Inc
Original Assignee
Ajinomoto Co Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ajinomoto Co Inc filed Critical Ajinomoto Co Inc
Publication of CN101960310A publication Critical patent/CN101960310A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/53Immunoassay; Biospecific binding assay; Materials therefor
    • G01N33/574Immunoassay; Biospecific binding assay; Materials therefor for cancer
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/68Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
    • G01N33/6803General methods of protein analysis not limited to specific proteins or families of proteins
    • G01N33/6806Determination of free amino acids

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Immunology (AREA)
  • Urology & Nephrology (AREA)
  • Chemical & Material Sciences (AREA)
  • Biomedical Technology (AREA)
  • Hematology (AREA)
  • Physics & Mathematics (AREA)
  • Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biotechnology (AREA)
  • Microbiology (AREA)
  • Food Science & Technology (AREA)
  • Medicinal Chemistry (AREA)
  • Cell Biology (AREA)
  • Analytical Chemistry (AREA)
  • Biochemistry (AREA)
  • General Physics & Mathematics (AREA)
  • Oncology (AREA)
  • Hospice & Palliative Care (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Biophysics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Investigating Or Analysing Biological Materials (AREA)

Abstract

本发明的课题在于提供:利用血液中的氨基酸浓度中与各种癌症的状态相关的氨基酸浓度,可以高精度地评价癌症的种类的癌症种类的评价方法。本发明所述的癌症种类的评价方法是针对从评价对象采集到的血液测定关于氨基酸浓度值的氨基酸浓度数据,根据测定的评价对象的氨基酸浓度数据中所含的Glu、ABA、Val、Met、Pro、Phe、Thr、Ile、Leu、His中的至少一种氨基酸的浓度值,对于评价对象评价癌症的种类。

Description

癌症种类的评价方法
技术领域
本发明涉及利用血液(血浆)中的氨基酸浓度的癌症种类的评价方法。
背景技术
在2004年中,日本因癌症而死亡的人数中,男性为193075人,女性为127259人,为死亡总人数的第1位。早期癌症的5年存活率为80%以上,而进展的癌症的5年存活率为10%左右,极低,当然这也根据癌症的种类而不同。因此,早期发现对于癌症治愈来说是很重要的。
这里,例如大肠癌的诊断有:通过免疫学大便潜血反应进行的诊断、通过大肠内窥镜进行的大肠活检等。
但是,通过便潜血进行的诊断并不能确诊,发现者几乎都为假阳性。另外,在早期大肠癌中,通过便潜血进行的诊断中,有检出灵敏度和检出特异度均更为降低的担忧。特别是右侧结肠的早期癌症在通过便潜血进行的诊断中有很多漏检。另外,CT、MRI、PET等的图像诊断对于大肠癌的诊断不适用。
而经大肠内窥镜的大肠活检可以确诊,但是是侵袭度高的检查,在筛查阶段进行内窥镜检查是不现实的。并且,在象大肠活检这样的侵袭性诊断中,患者有伴随痛苦等的负担,也可能发生检查导致的出血等的风险。
因此,从对患者的身体负担以及费用与效果的角度考虑,优选缩小筛选范围至大肠癌发病可能性高的被验者,以这些人作为治疗的对象。具体来说,优选用侵袭少的方法选择被验者,通过对选择的被验者实施大肠内窥镜来缩小被验者范围,以确诊为大肠癌的被验者作为治疗的对象。
例如肺癌的诊断有:X射线照相、CT、MRI、PET等的图像诊断、痰细胞诊断、经支气管镜的肺活检、经皮穿刺的肺活检、试验开胸或经胸腔镜的肺活检等。
但是,图像诊断并不能确诊。例如,进行胸部X射线检查(间接拍摄)时,发现率为20%,而特异度为0.1%,发现者几乎均为假阳性。进行胸部X射线检查时,检出灵敏度也低,厚生劳动省的研究结果报告称:约80%的肺癌发病者被漏检。特别是在早期肺癌中,图像诊断有检出灵敏度和检出特异度均更为降低的担忧。胸部X射线检查还有被验者暴露于放射线的问题。在设备或成本方面,CT、MRI、PET等的图像诊断在团体体检中实施时会有问题。进行痰细胞诊断时,只有2~3成的患者可以确诊。
另一方面,支气管镜、经皮穿刺、试验开胸和经胸腔镜肺活检可以确诊,但这是侵袭度高的检查,对图像诊断怀疑有肺癌的患者全体实行并不现实。并且,在这样的侵袭性诊断中,患者有伴随痛苦等的负担,也可能发生检查导致的出血等的风险。
因此,从对患者的身体负担以及费用与效果的角度考虑,优选缩小筛选范围至肺癌发病可能性高的被验者,以这些人作为治疗的对象。具体来说,优选用侵袭少的方法选择被验者,通过对选择的被验者实施肺活检来缩小被验者范围,以确诊为肺癌的被验者作为治疗的对象。
例如乳癌的诊断有:自检、乳房触视诊、乳房X线照相术、CT、MRI、PET等的图像诊断、穿刺活检等。
但是自检或触视诊、图像诊断并不能确诊。特别是自检并没有使乳癌死亡率降低这样的效果。另外,自检并不像乳房X线照相术检查这样的定期性筛查那样可以发现很多早期癌症。早期的乳癌中,自检或触视诊、图像诊断有检出灵敏度和检出特异度均更为降低的担忧。通过乳房X线照相术进行的图像诊断也有被验者暴露于放射线或过剩诊断(過剰診断)的问题。在设备或成本方面,CT、MRI、PET等的图像诊断在团体体检中实施会有问题。
另一方面,穿刺活检可以确诊,但这是侵袭度高的检查,对图像诊断怀疑有乳癌的患者全体实行并不现实。并且,在穿刺活检这样的侵袭性诊断中,患者有伴随痛苦等的负担,也可能发生检查导致的出血等的风险。
通常乳癌的检查除自检外在很多的情况下都会使被验者感到精神上的痛苦。
因此,从对患者的身体负担·精神负担以及费用与效果的角度考虑,优选缩小筛选范围至乳癌发病可能性高的被验者,以这些人作为治疗的对象。具体来说,优选用精神痛苦少或侵袭少的方法选择被验者,通过对选择的被验者实施穿刺活检来缩小被验者范围,以确诊为乳癌的被验者作为治疗的对象。
例如胃癌的诊断有:胃蛋白酶原检查、X射线检查(间接拍摄)、胃内窥镜检查、肿瘤标志物诊断等。
但是,胃蛋白酶原检查、X射线检查、肿瘤标志物诊断并不能确诊。例如采用胃蛋白酶原检查时,虽然侵袭性低,但关于灵敏度则是各有不同的报告,大约为40~85%,特异度为70~85%。但是,采用胃蛋白酶原检查时,要精密检查率为20%,可以认为漏检多。另外,采用X射线检查时,关于灵敏度各有不同的报告,大约为70~80%,特异度为85~90%。但是,采用X射线检查时,可能有钡餐带来的副作用或暴露于放射线的可能性。采取肿瘤标志物诊断时,目前尚未存在对胃癌的存在诊断有效的肿瘤标志物。
而胃内窥镜检查可以确诊,但这是侵袭度高的检查,在筛查阶段进行胃内窥镜检查是不现实的。并且,在象胃内窥镜检查这样的侵袭性诊断中,患者有伴随痛苦等的负担,也可能发生检查导致的出血等的风险。
因此,从对患者的身体负担以及费用与效果的角度考虑,优选缩小筛选范围至胃癌发病可能性高的被验者,以这些人作为治疗的对象。具体来说,优选用灵敏度和特异度高的方法选择被验者,通过对选择的被验者实施胃内窥镜检查来缩小被验者范围,以确诊为胃癌的被验者作为治疗的对象。
另外,还有例如象胰腺癌等难以早期发现的癌症。
胰腺癌的情形,多是主述自觉症状后经精密检查确诊为胰腺癌,很多情况成为进展期的癌症。
因此,从对患者的身体负担以及费用与效果的角度考虑,优选通过适当的筛查缩小筛选范围至胰腺癌发病可能性高的被验者,以这些人作为治疗的对象。具体来说,优选用灵敏度和特异度高的方法选择被验者,通过对选择的被验者实施精密检查来缩小被验者范围,以确诊为胰腺癌的被验者作为治疗的对象。
另外,在实施上述癌症患者的筛查时,目前是针对每种的癌症采用特异性的诊断方法来进行。
已知血液中的氨基酸浓度根据癌症发病而变化。例如根据Cynober的报道(非专利文献1),例如由于谷氨酰胺主要作为氧化能量源、精氨酸作为氮氧化物或多胺的前体,它们激活癌细胞摄入甲硫氨酸的能力,甲硫氨酸在各种癌细胞中的消耗量增加。根据Vissers等人(非专利文献2)或Park(非专利文献3)的报道,大肠癌患者的血浆中氨基酸组成与健康人不同,根据Proenza等人(非专利文献4)或Cascino(非专利文献5)的报道,乳癌患者的血浆中氨基酸组成与健康人不同。另外,专利文献1中公开了:通过以血液中氨基酸浓度为变数的多变量判别式来评价有否肺癌的方法。由此,可以判别肺癌和非肺癌的状态。专利文献2或专利文献3公开了:氨基酸浓度与生物状态(biologicalstate)相关联的方法。
专利文献1:国际公开第2008/016111号
专利文献2:国际公开第2004/052191号
专利文献3:国际公开第2006/098192号
非专利文献1:Cynober,L.ed.,Metabolic and therapeutic aspects ofamino acids in clinical nutrition.2nd ed.,CRC Press
非专利文献2:Vissers,Y.LJ.等人,Plasma arginine concentrationare reduced in cancer patients:evidence for arginine deficiency?,TheAmerican Journal of Clinical Nutrition,2005 81,1142-1146页
非专利文献3:Park,K.G.等人,Arginine metabolism in benign andmaglinant disease of breast and colon:evidence for possible inhibition oftumor-infiltrating macropharges.,Nutrition,19917,185-188页
非专利文献4:Proenza,A.M.,J.Oliver,A.Palou and P.Roca,Breast and lung cancer are associated with a decrease in blood cell aminoacid content.,J Nutr Biochem,2003.14(3),133-8页
非专利文献5:Cascino,A.,M.Muscaritoli,C.Cangiano,L.Conversano,A.Laviano,S.Ariemma,M.M.Meguid and F.Rossi Fanelli,Plasma amino acid imbalance in patients with lung and breastcancer.,Anticancer Res,1995.15(2),507-10页
发明内容
发明所要解决的课题
但是,目前为止存在的问题是,以多种氨基酸为变数来诊断癌症种类的技术的开发从时间和利益的角度考虑并未得到进行,未得到实际应用。具体来说,存在以下的问题:癌症患者的筛查中,同时实施多种检查时,检查成本增高,根据实施内容,有被验者受到限制的时间或需要饮食限制等的时间较长等。另外,具体来说,存在以下的问题:专利文献1中可以判别肺癌和非肺癌的状态,但对于“非肺癌的状态就是没有罹患癌症吗”或“是否有另一种癌症发病”无法进行评价。另外,还有以下的问题:专利文献2或专利文献3中公开的指标式无法对于“没有罹患癌症吗”或“是否有另一种癌症发病”进行评价。
本发明针对上述问题而设,其目的在于提供利用血液中的氨基酸浓度中与各种癌症的状态相关的氨基酸浓度可以高精度地评价癌症的种类的癌症种类的评价方法。具体来说,其目的在于提供以1种检体且短时间内即可缩小筛选范围至多种癌症中罹患的可能性高的被验者,结果可以减轻被验者的时间、身体以及金钱方面上的负担的癌症种类的评价方法。具体来说,其目的在于,根据多种氨基酸的浓度或以该氨基酸的浓度为变数的含有1个或多个判别式的判别式组,可以高精度地评价某个检体是否有癌症发病,或者有癌症发病时,该发病部位在哪里,结果,提供可实现检查的高效化或高精度化的癌症种类的评价方法。
解决课题的手段
本发明人等为解决上述课题进行了深入的研究,结果发现:鉴定对于各种癌症和非癌症的多组判别有用的氨基酸,同时进一步以含有所鉴定的氨基酸浓度为变数的由1个或多个多变量判别式构成的多变量判别式组(指标式组、相关式组)与癌症的状态(具体来说,是癌症的发病部位)具有显著相关,从而完成了本发明。
即,为解决上述课题并达到目的,本发明所述的癌症种类的评价方法的特征在于,该方法包括下述步骤:测定步骤,针对从评价对象采集到的血液测定关于氨基酸浓度值的氨基酸浓度数据;浓度值基准评价步骤,根据在上述测定步骤中测定的上述评价对象的上述氨基酸浓度数据中所含的Glu、ABA、Val、Met、Pro、Phe、Thr、Ile、Leu、His中的至少一种氨基酸的上述浓度值,对于上述评价对象评价癌症的种类。
本发明所述的癌症种类的评价方法的特征还在于,在上述记载的癌症种类的评价方法中,上述浓度值基准评价步骤进一步包括下述浓度值基准判别步骤:根据在上述测定步骤中测定的上述评价对象的上述氨基酸浓度数据中所含的Glu、ABA、Val、Met、Pro、Phe、Thr、Ile、Leu、His中的至少一种氨基酸的上述浓度值,对于上述评价对象,从大肠癌、乳癌、前列腺癌、甲状腺癌、肺癌、胃癌、子宫癌中的至少2种上述癌症中判别其是哪一种上述癌症。
本发明所述的癌症种类的评价方法的特征还在于,在上述记载的癌症种类的评价方法中,上述浓度值基准判别步骤是对于上述评价对象,从大肠癌、乳癌、前列腺癌、甲状腺癌、肺癌中的至少3种上述癌症中判别其是哪一种上述癌症。
本发明所述的癌症种类的评价方法的特征还在于,在上述记载的癌症种类的评价方法中,上述浓度值基准评价步骤进一步包括下述步骤:判别值计算步骤,根据在上述测定步骤中测定的上述评价对象的上述氨基酸浓度数据中所含的Glu、ABA、Val、Met、Pro、Phe、Thr、Ile、Leu、His中的至少一种氨基酸的上述浓度值以及以上述氨基酸的浓度为变数的预先设定的由1个或多个多变量判别式构成的多变量判别式组,通过构成该多变量判别式组的每个上述多变量判别式,计算该多变量判别式的值即判别值;判别值基准评价步骤,根据在上述判别值计算步骤中算出的由1个或多个上述判别值构成的判别值组,对于上述评价对象评价上述癌症的种类,构成上述多变量判别式组的各上述多变量判别式含有Glu、ABA、Val、Met、Pro、Phe、Thr、Ile、Leu、His中的至少一种氨基酸作为上述变数。
本发明所述的癌症种类的评价方法的特征还在于,在上述记载的癌症种类的评价方法中,上述判别值基准评价步骤进一步包括下述判别值基准判别步骤:根据上述判别值组,对于上述评价对象,从大肠癌、乳癌、前列腺癌、甲状腺癌、肺癌、胃癌、子宫癌中的至少2种上述癌症中判别其是哪一种上述癌症。
本发明所述的癌症种类的评价方法的特征还在于,在上述记载的癌症种类的评价方法中,上述判别值基准判别步骤是对于上述评价对象,从大肠癌、乳癌、前列腺癌、甲状腺癌、肺癌中的至少3种上述癌症中判别其是哪一种上述癌症。
本发明所述的癌症种类的评价方法的特征还在于,在上述记载的癌症种类的评价方法中,构成上述多变量判别式组的各上述多变量判别式为:分数式、逻辑回归式、线性判别式、多重回归式、由支持向量机制作的公式、由马氏距离法制作的公式、由典型判别分析(Canonical Discriminant Analysis)制作的公式、由决策树制作的公式的任意一种。
本发明所述的癌症种类的评价方法的特征还在于,在上述记载的癌症种类的评价方法中,上述多变量判别式组为下述的判别式组1~16的任意一组:
[判别式组1]以年龄、性别、Thr、Glu、Gln、Pro、Cit、ABA、Val、Met、Ile、Leu、Tyr、Phe、His、Orn、Lys、Arg作为上述变数的5个线性1次式;
[判别式组2]以年龄、Glu、Pro、Cit、ABA、Met、Ile、Leu、Phe、His、Trp、Orn、Lys作为上述变数的4个线性1次式;
[判别式组3]以年龄、Thr、Glu、Gln、Pro、ABA、Val、Met、Ile、Leu、Phe、His、Arg作为上述变数的4个线性1次式;
[判别式组4]以年龄、性别、Thr、Glu、Pro、ABA、Val、Met、Ile、Leu、Phe、His作为上述变数的4个线性1次式;
[判别式组5]以年龄、Asn、Glu、ABA、Val、Phe、His、Trp作为上述变数的3个线性1次式;
[判别式组6]以年龄、Thr、Glu、Pro、Val、Met、Ile、Leu、His、Arg作为上述变数的3个线性1次式;
[判别式组7]以年龄、性别、Thr、Glu、Gln、Pro、Cit、ABA、Val、Met、Ile、Leu、Tyr、Phe、Orn、Arg作为上述变数的4个线性1次式;
[判别式组8]以年龄、Asn、Glu、ABA、Val、Phe、His、Trp作为上述变数的3个线性1次式;
[判别式组9]以年龄、Thr、Glu、Gln、Pro、ABA、Val、Met、Ile、Phe、Arg作为上述变数的3个线性1次式;
[判别式组10]以年龄、性别、Thr、Glu、Pro、ABA、Val、Met作为上述变数的3个线性1次式;
[判别式组11]以年龄、Cit、ABA、Val、Met作为上述变数的2个线性1次式;
[判别式组12]以年龄、Thr、Glu、Pro、Met、Phe作为上述变数的2个线性1次式;
[判别式组13]以Thr、Ser、Asn、Glu、Gln、Gly、Ala、Cit、ABA、Val、Met、Ile、Leu、Tyr、Phe、His、Trp、Orn、Lys、Arg作为上述变数的2个线性1次式;
[判别式组14]以Glu、Gln、ABA、Val、Ile、Phe、Arg作为上述变数的2个线性1次式;
[判别式组15]以Thr、Glu、Gln、ABA、Ile、Leu、Arg作为上述变数的2个线性1次式;
[判别式组16]以Thr、Gln、Ala、Cit、ABA、Ile、His、Orn、Arg作为上述变数的2个分数式。
本发明所述的癌症种类评价装置是具备控制装置和存储装置且对于评价对象评价其癌症的种类的癌症种类评价装置,其特征在于,上述控制装置具备下述装置:判别值计算装置,根据以氨基酸的浓度为变数、在上述存储装置中存储的由1个或多个多变量判别式构成的多变量判别式组以及预先取得的与上述氨基酸的浓度值相关的上述评价对象的氨基酸浓度数据中所含的Glu、ABA、Val、Met、Pro、Phe、Thr、Ile、Leu、His中的至少一种氨基酸的上述浓度值,通过构成该多变量判别式组的每个上述多变量判别式,计算该多变量判别式的值即判别值;判别值基准评价装置,根据在上述判别值计算装置中算出的由1个或多个上述判别值构成的判别值组,对于上述评价对象评价上述癌症的种类,构成上述多变量判别式组的各上述多变量判别式含有Glu、ABA、Val、Met、Pro、Phe、Thr、Ile、Leu、His中的至少一种氨基酸作为上述变数。
本发明所述的癌症种类评价装置的特征还在于,在上述记载的癌症种类评价装置中,上述判别值基准评价装置进一步具备下述判别值基准判别装置:根据上述判别值组,对于上述评价对象,从大肠癌、乳癌、前列腺癌、甲状腺癌、肺癌、胃癌、子宫癌中的至少2种上述癌症中判别其是哪一种上述癌症。
本发明所述的癌症种类评价装置的特征还在于,在上述记载的癌症种类评价装置中,上述判别值基准判别装置是对于上述评价对象,从大肠癌、乳癌、前列腺癌、甲状腺癌、肺癌中的至少3种上述癌症中判别其是哪一种上述癌症。
本发明所述的癌症种类评价装置的特征还在于,在上述记载的癌症种类评价装置中,构成上述多变量判别式组的各上述多变量判别式为分数式、逻辑回归式、线性判别式、多重回归式、由支持向量机制作的公式、由马氏距离法制作的公式、由典型判别分析制作的公式、由决策树制作的公式的任意一种。
本发明所述的癌症种类评价装置的特征还在于,在上述记载的癌症种类评价装置中,上述多变量判别式组为下述的判别式组1~16的任意一组:
[判别式组1]以年龄、性别、Thr、Glu、Gln、Pro、Cit、ABA、Val、Met、Ile、Leu、Tyr、Phe、His、Orn、Lys、Arg作为上述变数的5个线性1次式;
[判别式组2]以年龄、Glu、Pro、Cit、ABA、Met、Ile、Leu、Phe、His、Trp、Orn、Lys作为上述变数的4个线性1次式;
[判别式组3]以年龄、Thr、Glu、Gln、Pro、ABA、Val、Met、Ile、Leu、Phe、His、Arg作为上述变数的4个线性1次式;
[判别式组4]以年龄、性别、Thr、Glu、Pro、ABA、Val、Met、Ile、Leu、Phe、His作为上述变数的4个线性1次式;
[判别式组5]以年龄、Asn、Glu、ABA、Val、Phe、His、Trp作为上述变数的3个线性1次式;
[判别式组6]以年龄、Thr、Glu、Pro、Val、Met、Ile、Leu、His、Arg作为上述变数的3个线性1次式;
[判别式组7]以年龄、性别、Thr、Glu、Gln、Pro、Cit、ABA、Val、Met、Ile、Leu、Tyr、Phe、Orn、Arg作为上述变数的4个线性1次式;
[判别式组8]以年龄、Asn、Glu、ABA、Val、Phe、His、Trp作为上述变数的3个线性1次式;
[判别式组9]以年龄、Thr、Glu、Gln、Pro、ABA、Val、Met、Ile、Phe、Arg作为上述变数的3个线性1次式;
[判别式组10]以年龄、性别、Thr、Glu、Pro、ABA、Val、Met作为上述变数的3个线性1次式;
[判别式组11]以年龄、Cit、ABA、Val、Met作为上述变数的2个线性1次式;
[判别式组12]以年龄、Thr、Glu、Pro、Met、Phe作为上述变数的2个线性1次式;
[判别式组13]以Thr、Ser、Asn、Glu、Gln、Gly、Ala、Cit、ABA、Val、Met、Ile、Leu、Tyr、Phe、His、Trp、Orn、Lys、Arg作为上述变数的2个线性1次式;
[判别式组14]以Glu、Gln、ABA、Val、Ile、Phe、Arg作为上述变数的2个线性1次式;
[判别式组15]以Thr、Glu、Gln、ABA、Ile、Leu、Arg作为上述变数的2个线性1次式;
[判别式组16]以Thr、Gln、Ala、Cit、ABA、Ile、His、Orn、Arg作为上述变数的2个分数式。
本发明所述的癌症种类评价装置的特征还在于,在上述记载的癌症种类评价装置中,上述控制装置进一步具备下述多变量判别式组制作装置:根据含有上述氨基酸浓度数据和与表示上述癌症的上述状态的指标相关的癌症状态指标数据、在上述存储装置中存储的癌症状态信息,制作在上述存储装置中存储的上述多变量判别式;上述多变量判别式组制作装置进一步具备下述装置:候选多变量判别式组制作装置,根据规定的公式制作方法,由上述癌症状态信息制作上述多变量判别式组的候选即候选多变量判别式组;候选多变量判别式组验证装置,根据规定的验证方法,验证在上述候选多变量判别式组制作装置中制作的上述候选多变量判别式组;变数选择装置,根据规定的变数选择方法,从上述候选多变量判别式组验证装置的验证结果中选择上述候选多变量判别式组的变数,来选择在制作上述候选多变量判别式组时使用的上述癌症状态信息中所含的上述氨基酸浓度数据的组合,根据反复运行上述候选多变量判别式组制作装置、上述候选多变量判别式组验证装置以及上述变数选择装置而累积的上述验证结果,从多个上述候选多变量判别式组中选出用作上述多变量判别式组的上述候选多变量判别式组,来制作上述多变量判别式组。
本发明所述的癌症种类评价方法是在具备控制装置和存储装置的信息处理装置中实行的对于评价对象评价癌症的种类的癌症种类评价方法,其特征在于,在上述控制装置中实行以下步骤:判别值计算步骤,根据由以氨基酸的浓度为变数、在上述存储装置中存储的由1个或多个多变量判别式构成的多变量判别式组以及关于上述氨基酸的浓度值的预先取得的上述评价对象的氨基酸浓度数据中所含的Glu、ABA、Val、Met、Pro、Phe、Thr、Ile、Leu、His中的至少一种氨基酸的上述浓度值,通过构成该多变量判别式组的每个上述多变量判别式,计算该多变量判别式的值即判别值;判别值基准评价步骤,根据在上述判别值计算步骤中算出的由1个或多个上述判别值构成的判别值组,对于上述评价对象评价上述癌症的种类,构成上述多变量判别式组的各上述多变量判别式含有Glu、ABA、Val、Met、Pro、Phe、Thr、Ile、Leu、His中的至少一种氨基酸作为上述变数。
本发明所述的癌症种类评价方法的特征还在于,在上述记载的癌症种类评价方法中,上述判别值基准评价步骤进一步包括下述判别值基准判别步骤:根据上述判别值组,对于上述评价对象,从大肠癌、乳癌、前列腺癌、甲状腺癌、肺癌、胃癌、子宫癌中的至少2种上述癌中判别其是哪一种上述癌症。
本发明所述的癌症种类评价方法的特征还在于,在上述记载的癌症种类评价方法中,上述判别值基准判别步骤是对于上述评价对象,从大肠癌、乳癌、前列腺癌、甲状腺癌、肺癌中的至少3种上述癌中判别其是哪一种上述癌症。
本发明所述的癌症种类评价方法的特征还在于,在上述记载的癌症种类评价方法中,构成上述多变量判别式组的各上述多变量判别式为分数式、逻辑回归式、线性判别式、多重回归式、由支持向量机制作的公式、由马氏距离法制作的公式、由典型判别分析制作的公式、由决策树制作的公式的任意一种。
本发明所述的癌症种类评价方法的特征还在于,在上述记载的癌症种类评价方法中,上述多变量判别式组为下述的判别式组1~16的任意一组:
[判别式组1]以年龄、性别、Thr、Glu、Gln、Pro、Cit、ABA、Val、Met、Ile、Leu、Tyr、Phe、His、Orn、Lys、Arg作为上述变数的5个线性1次式;
[判别式组2]以年龄、Glu、Pro、Cit、ABA、Met、Ile、Leu、Phe、His、Trp、Orn、Lys作为上述变数的4个线性1次式;
[判别式组3]以年龄、Thr、Glu、Gln、Pro、ABA、Val、Met、Ile、Leu、Phe、His、Arg作为上述变数的4个线性1次式;
[判别式组4]以年龄、性别、Thr、Glu、Pro、ABA、Val、Met、Ile、Leu、Phe、His作为上述变数的4个线性1次式;
[判别式组5]以年龄、Asn、Glu、ABA、Val、Phe、His、Trp作为上述变数的3个线性1次式;
[判别式组6]以年龄、Thr、Glu、Pro、Val、Met、Ile、Leu、His、Arg作为上述变数的3个线性1次式;
[判别式组7]以年龄、性别、Thr、Glu、Gln、Pro、Cit、ABA、Val、Met、Ile、Leu、Tyr、Phe、Orn、Arg作为上述变数的4个线性1次式;
[判别式组8]以年龄、Asn、Glu、ABA、Val、Phe、His、Trp作为上述变数的3个线性1次式;
[判别式组9]以年龄、Thr、Glu、Gln、Pro、ABA、Val、Met、Ile、Phe、Arg作为上述变数的3个线性1次式;
[判别式组10]以年龄、性别、Thr、Glu、Pro、ABA、Val、Met作为上述变数的3个线性1次式;
[判别式组11]以年龄、Cit、ABA、Val、Met作为上述变数的2个线性1次式;
[判别式组12]以年龄、Thr、Glu、Pro、Met、Phe作为上述变数的2个线性1次式;
[判别式组13]以Thr、Ser、Asn、Glu、Gln、Gly、Ala、Cit、ABA、Val、Met、Ile、Leu、Tyr、Phe、His、Trp、Orn、Lys、Arg作为上述变数的2个线性1次式;
[判别式组14]以Glu、Gln、ABA、Val、Ile、Phe、Arg作为上述变数的2个线性1次式;
[判别式组15]以Thr、Glu、Gln、ABA、Ile、Leu、Arg作为上述变数的2个线性1次式;
[判别式组16]以Thr、Gln、Ala、Cit、ABA、Ile、His、Orn、Arg作为上述变数的2个分数式。
本发明所述的癌症种类评价方法的特征还在于,在上述记载的癌症种类评价方法中,在上述控制装置进一步实行下述多变量判别式制作步骤:根据包含上述氨基酸浓度数据和与表示上述癌症的上述状态的指标相关的癌症状态指标数据、在上述存储装置中存储的癌症状态信息,制作在上述存储装置中存储的上述多变量判别式,上述多变量判别式制作步骤进一步包括下述步骤:候选多变量判别式制作步骤,根据规定的公式制作方法,由上述癌症状态信息制作上述多变量判别式的候选即候选多变量判别式;候选多变量判别式验证步骤,根据规定的验证方法,验证在上述候选多变量判别式制作步骤中制作的上述候选多变量判别式;变数选择步骤,根据规定的变数选择方法,从上述候选多变量判别式验证步骤的验证结果中选择上述候选多变量判别式的变数,来选择在制作上述候选多变量判别式时使用的上述癌症状态信息中所含的上述氨基酸浓度数据的组合,根据反复运行上述候选多变量判别式制作步骤、上述候选多变量判别式验证步骤以及上述变数选择步骤而累积的上述验证结果,从多个上述候选多变量判别式中选出用作上述多变量判别式的上述候选多变量判别式,来制作上述多变量判别式。
本发明所述的癌症种类评价系统是经由网络以可通信的方式将具备控制装置和存储装置且对于评价对象评价癌症的种类的癌症种类评价装置,以及提供上述评价对象的关于氨基酸浓度值的氨基酸浓度数据的信息通信终端装置连接在一起而构成的癌症种类评价系统,其特征在于:上述信息通信终端装置具备下述装置:氨基酸浓度数据发送装置,将上述评价对象的上述氨基酸浓度数据发送至上述癌症种类评价装置;评价结果接收装置,接收由上述癌症种类评价装置发送的针对上述评价对象作出的与上述癌症的种类相关的评价结果,上述癌症种类评价装置的上述控制装置具备下述装置:氨基酸浓度数据接收装置,接收由上述信息通信终端装置发送的上述评价对象的上述氨基酸浓度数据;判别值计算装置,根据以上述氨基酸的浓度为变数、在上述存储装置中存储的由1个或多个多变量判别式构成的多变量判别式组以及在上述氨基酸浓度数据接收装置中接收的上述评价对象的上述氨基酸浓度数据中所含的Glu、ABA、Val、Met、Pro、Phe、Thr、Ile、Leu、His中的至少一种氨基酸的上述浓度值,通过构成该多变量判别式组的每个上述多变量判别式,计算该多变量判别式的值即判别值;判别值组基准评价装置,根据在上述判别值组计算装置中算出的由1个或多个上述判别值构成的判别值组,对于上述评价对象评价上述癌症的种类;评价结果发送装置,将上述判别值基准评价装置中作出的对上述评价对象的上述评价结果发送至上述信息通信终端装置,构成上述多变量判别式组的各上述多变量判别式含有Glu、ABA、Val、Met、Pro、Phe、Thr、Ile、Leu、His中的至少一种氨基酸作为上述变数。
本发明所述的癌症种类评价程序是在具备控制装置和存储装置的信息处理装置中实行的对于评价对象评价癌症的种类的癌症评价程序,其特征在于,在上述控制装置中实行下述步骤:判别值组计算步骤,根据以氨基酸的浓度为变数、在上述存储装置中存储的由1个或多个多变量判别式构成的多变量判别式组以及关于上述氨基酸的浓度值的预先取得的上述评价对象的上述氨基酸浓度数据中所含的Glu、ABA、Val、Met、Pro、Phe、Thr、Ile、Leu、His中的至少一种氨基酸的上述浓度值,通过构成该多变量判别式组的每个上述多变量判别式,计算该多变量判别式的值即判别值;判别值组基准评价步骤,根据在上述判别值组计算步骤中算出的由1个或多个上述判别值构成的判别值组,对于上述评价对象评价上述癌症的种类,构成上述多变量判别式组的各上述多变量判别式含有Glu、ABA、Val、Met、Pro、Phe、Thr、Ile、Leu、His中的至少一种氨基酸作为上述变数。
本发明所述的记录介质是计算机可读取的记录介质,其特征在于,该记录介质记录有上述记载的癌症种类评价程序。
发明效果
根据本发明,针对从评价对象采集到的血液测定关于氨基酸浓度值的氨基酸浓度数据,根据测定的评价对象的氨基酸浓度数据中所含的Glu、ABA、Val、Met、Pro、Phe、Thr、Ile、Leu、His中的至少一种氨基酸的浓度值,对于评价对象评价癌症的种类,因此,利用血液中的氨基酸浓度中与各种癌症的状态相关的氨基酸的浓度,发挥可高精度地评价癌症的种类的效果。具体来说,可以以1种检体且短时间内即可缩小筛选范围至多种癌症中罹患的可能性高的被验者,结果发挥可以减轻被验者的时间、身体以及金钱方面上的负担的效果。具体来说,根据多种氨基酸浓度或以该氨基酸浓度为变数的含有1个或多个判别式的判别式组,可以高精度地评价某个检体是否有癌症发病,有癌症发病时,该发病部位在哪里,结果发挥可以实现检查的高效化或高精度化的效果。
根据本发明,根据测定的评价对象的氨基酸浓度数据中所含的Glu、ABA、Val、Met、Pro、Phe、Thr、Ile、Leu、His中的至少一种氨基酸的浓度值,对于评价对象,从大肠癌、乳癌、前列腺癌、甲状腺癌、肺癌、胃癌、子宫癌中的至少2种癌症中判别其是哪一种癌症,因此,利用血液中的氨基酸浓度中对于癌症的多组判别有用的氨基酸的浓度,发挥可以高精度地进行癌症的多组判别的效果。
根据本发明,根据测定的评价对象的氨基酸浓度数据中所含的Glu、ABA、Val、Met、Pro、Phe、Thr、Ile、Leu、His中的至少一种氨基酸的浓度值,对于评价对象,从大肠癌、乳癌、前列腺癌、甲状腺癌、肺癌中的至少3种癌症中判别其是哪一种癌症,因此,利用血液中的氨基酸浓度中对于癌症的多组判别有用的氨基酸的浓度,发挥可以高精度地进行癌症的多组判别的效果。
根据本发明,根据测定的评价对象的氨基酸浓度数据中所含的Glu、ABA、Val、Met、Pro、Phe、Thr、Ile、Leu、His中的至少一种氨基酸的浓度值以及以氨基酸的浓度为变数、含有Glu、ABA、Val、Met、Pro、Phe、Thr、Ile、Leu、His中的至少一种氨基酸作为变数的预先设定的由1个或多个多变量判别式构成的多变量判别式组,通过构成该多变量判别式组的每个多变量判别式,计算该多变量判别式的值即判别值,根据由算出的1个或多个判别值构成的判别值组,对于评价对象评价癌症的种类,因此,利用由与各种癌症的状态具有显著相关的多变量判别式组得到的判别值组,发挥可以高精度地评价癌症种类的效果。具体来说,可以以1种检体且短时间内即可缩小筛选范围至多种癌症中罹患的可能性高的被验者,结果发挥可以减轻被验者的时间、身体以及金钱方面上的负担的效果。具体来说,根据多种氨基酸的浓度或以该氨基酸浓度为变数的含有1个或多个判别式的判别式组,可以高精度地评价某个检体是否有癌症发病,有癌症发病时,该发病部位在哪里,结果发挥可以实现检查的高效化或高精度化的效果。
根据本发明,根据算出的判别值组,对于评价对象,从大肠癌、乳癌、前列腺癌、甲状腺癌、肺癌、胃癌、子宫癌中的至少2种癌症中判别其是哪一种癌症,因此,利用由对于癌症的多组判别有用的多变量判别式组得到的判别值组,发挥可以高精度地进行癌症的多组判别的效果。
根据本发明,根据算出的判别值组,对于评价对象,从大肠癌、乳癌、前列腺癌、甲状腺癌、肺癌中的至少3种癌症中判别其是哪一种癌症,因此,利用由对于癌症的多组判别有用的多变量判别式组得到的判别值组,发挥可以高精度地进行癌症的多组判别的效果。
根据本发明,构成多变量判别式组的各多变量判别式为分数式、逻辑回归式、线性判别式、多重回归式、由支持向量机制作的公式、由马氏距离法制作的公式、由典型判别分析制作的公式、由决策树制作的公式的任意一种,因此,利用由对于癌症的多组判别特别有用的多变量判别式组得到的判别值组,发挥可以高精度地进行癌症的多组判别的效果。
根据本发明,多变量判别式组为下述的判别式组1~16的任意一组,因此,利用由对于癌症的多组判别特别有用的多变量判别式组得到的判别值组,发挥可以高精度地进行癌症的多组判别的效果。
[判别式组1]以年龄、性别、Thr、Glu、Gln、Pro、Cit、ABA、Val、Met、Ile、Leu、Tyr、Phe、His、Orn、Lys、Arg作为变数的5个线性1次式;
[判别式组2]以年龄、Glu、Pro、Cit、ABA、Met、Ile、Leu、Phe、His、Trp、Orn、Lys作为变数的4个线性1次式;
[判别式组3]以年龄、Thr、Glu、Gln、Pro、ABA、Val、Met、Ile、Leu、Phe、His、Arg作为变数的4个线性1次式;
[判别式组4]以年龄、性别、Thr、Glu、Pro、ABA、Val、Met、Ile、Leu、Phe、His作为上述变数的4个线性1次式;
[判别式组5]以年龄、Asn、Glu、ABA、Val、Phe、His、Trp作为变数的3个线性1次式;
[判别式组6]以年龄、Thr、Glu、Pro、Val、Met、Ile、Leu、His、Arg作为变数的3个线性1次式;
[判别式组7]以年龄、性别、Thr、Glu、Gln、Pro、Cit、ABA、Val、Met、Ile、Leu、Tyr、Phe、Orn、Arg作为变数的4个线性1次式;
[判别式组8]以年龄、Asn、Glu、ABA、Val、Phe、His、Trp作为变数的3个线性1次式;
[判别式组9]以年龄、Thr、Glu、Gln、Pro、ABA、Val、Met、Ile、Phe、Arg作为变数的3个线性1次式;
[判别式组10]以年龄、性别、Thr、Glu、Pro、ABA、Val、Met作为变数的3个线性1次式;
[判别式组11]以年龄、Cit、ABA、Val、Met作为变数的2个线性1次式;
[判别式组12]以年龄、Thr、Glu、Pro、Met、Phe作为变数的2个线性1次式;
[判别式组13]以Thr、Ser、Asn、Glu、Gln、Gly、Ala、Cit、ABA、Val、Met、Ile、Leu、Tyr、Phe、His、Trp、Orn、Lys、Arg作为变数的2个线性1次式;
[判别式组14]以Glu、Gln、ABA、Val、Ile、Phe、Arg作为变数的2个线性1次式;
[判别式组15]以Thr、Glu、Gln、ABA、Ile、Leu、Arg作为变数的2个线性1次式;
[判别式组16]以Thr、Gln、Ala、Cit、ABA、Ile、His、Orn、Arg作为变数的2个分数式。
根据本发明,根据含有氨基酸浓度数据和与表示癌症的状态的指标相关的癌症状态指标数据、在上述存储装置中存储的癌症状态信息,制作在存储装置中存储的多变量判别式。具体来说,(1)根据规定的公式制作方法,由癌症状态信息制作候选多变量判别式;(2)根据规定的验证方法,验证制作的候选多变量判别式;(3)根据规定的变数选择方法,从该验证结果中选择候选多变量判别式的变数,来选择在制作候选多变量判别式时使用的癌症状态信息中所含的氨基酸浓度数据的组合,(4)根据反复运行(1)、(2)和(3)而累积的验证结果,从多个候选多变量判别式中选出用作多变量判别式的候选多变量判别式,来制作多变量判别式。由此,可以制作最适合每种癌症的状态评价的多变量判别式,结果,发挥可以得到最适合癌症的种类评价的多变量判别式组(具体来说,是对癌症的多组判别有用的多变量判别式组)的效果。
根据本发明,通过计算机读取并实行记录在该记录介质上的癌症种类评价程序,在计算机上实行癌症种类评价程序,因此,发挥可以获得与癌症种类评价程序同样的效果的效果。
本发明中,在评价癌症的种类时(具体来说,在判别其是哪一种癌症时),除氨基酸的浓度以外,可进一步使用其它的代谢物的浓度或基因的表达量、蛋白质的表达量、被验者的年龄和性别、是否吸烟、心电图的波形数值化所得的数据等。另外,本发明中,在评价癌症的种类时(具体来说,在判别其是哪一种癌症时),作为多变量判别式中的变数,除氨基酸的浓度之外,还可以进一步使用其它的代谢物的浓度或基因的表达量、蛋白质的表达量、被验者的年龄和性别、是否吸烟、心电图的波形数值化所得的数据等。
附图简述
图1是表示本发明的基本原理的原理构成图。
图2是表示实施方案1所述的癌症种类的评价方法的一个例子的流程图。
图3是表示本发明的基本原理的原理构成图。
图4是表示本系统的全体构成的一个例子的图。
图5是表示本系统的全体构成的又一个例子的图。
图6是表示本系统的癌症种类评价装置100的构成的一个例子的框图。
图7是表示保存在利用者信息文件106a中的信息的一个例子的图。
图8是表示保存在氨基酸浓度数据文件106b中的信息的一个例子的图。
图9是表示保存在癌症状态信息文件106c中的信息的一个例子的图。
图10是表示保存在指定癌症状态信息文件106d中的信息的一个例子的图。
图11是表示保存在候选多变量判别式文件106e1中的信息的一个例子的图。
图12是表示保存在验证结果文件106e2中的信息的一个例子的图。
图13是表示保存在选择癌症状态信息文件106e3中的信息的一个例子的图。
图14是表示保存在多变量判别式文件106e4中的信息的一个例子的图。
图15是表示保存在判别值文件106f中的信息的一个例子的图。
图16是表示保存在评价结果文件106g中的信息的一个例子的图。
图17是表示多变量判别式制作部102h的构成的框图。
图18是表示判别值基准评价部102j的构成的框图。
图19是表示本系统的客户端装置200的构成的一个例子的框图。
图20是表示本系统的数据库装置400的构成的一个例子的框图。
图21是表示在本系统中进行的癌症种类评价服务处理的一个例子的流程图。
图22是表示在本系统的癌症种类评价装置100中进行的多变量判别式制作处理的一个例子的流程图。
图23是与男性的各种癌症患者和非癌症患者的氨基酸变数的分布相关的箱线图。
图24是与女性的各种癌症患者和非癌症患者的氨基酸变数的分布相关的箱线图。
图25是表示一元配置分散分析中的p值的图。
图26是表示指标式组1的变数及其系数的图。
图27是表示各种癌症和非癌症的准确率(正答率)的图。
图28是表示与指标式组1具有同等的判别能力的判别式组的一览图。
图29是表示与指标式组1具有同等的判别能力的判别式组的一览图。
图30是表示指标式组2的变数及其系数的图。
图31是表示各种癌症和非癌症的准确率的图。
图32是表示与指标式组2具有同等的判别能力的判别式组的一览图。
图33是表示与指标式组2具有同等的判别能力的判别式组的一览图。
图34是表示指标式组3的变数及其系数的图。
图35是表示各种癌症和非癌症的准确率的图。
图36是表示与指标式组3具有同等的判别能力的判别式组的一览图。
图37是表示与指标式组3具有同等的判别能力的判别式组的一览图。
图38是表示指标式组4的变数及其系数的图。
图39是表示各种癌症的准确率的图。
图40是表示与指标式组4具有同等的判别能力的判别式组的一览图。
图41是表示与指标式组4具有同等的判别能力的判别式组的一览图。
图42是表示指标式组5的变数及其系数的图。
图43是表示各种癌症的准确率的图。
图44是表示与指标式组5具有同等的判别能力的判别式组的一览图。
图45是表示与指标式组5具有同等的判别能力的判别式组的一览图。
图46是表示指标式组6的变数及其系数的图。
图47是表示各种癌症的准确率的图。
图48是表示与指标式组6具有同等的判别能力的判别式组的一览图。
图49是表示与指标式组6具有同等的判别能力的判别式组的一览图。
图50是表示指标式组7的变数及其系数的图。
图51是表示各种癌症和非癌症的准确率的图。
图52是表示与指标式组7具有同等的判别能力的判别式组的一览图。
图53是表示与指标式组7具有同等的判别能力的判别式组的一览图。
图54是表示指标式组8的变数及其系数的图。
图55是表示各种癌症和非癌症的准确率的图。
图56是表示与指标式组8具有同等的判别能力的判别式组的一览图。
图57是表示与指标式组8具有同等的判别能力的判别式组的一览图。
图58是表示指标式组9的变数及其系数的图。
图59是表示各种癌症和非癌症的准确率的图。
图60是表示与指标式组9具有同等的判别能力的判别式组的一览图。
图61是表示与指标式组9具有同等的判别能力的判别式组的一览图。
图62是表示指标式组10的变数及其系数的图。
图63是表示各种癌症的准确率的图。
图64是表示与指标式组10具有同等的判别能力的判别式组的一览图。
图65是表示与指标式组10具有同等的判别能力的判别式组的一览图。
图66是表示指标式组11的变数及其系数的图。
图67是表示各种癌症的准确率的图。
图68是表示与指标式组11具有同等的判别能力的判别式组的一览图。
图69是表示与指标式组11具有同等的判别能力的判别式组的一览图。
图70是表示指标式组12的变数及其系数的图。
图71是表示各种癌症的准确率的图。
图72是表示与指标式组12具有同等的判别能力的判别式组的一览图。
图73是表示与指标式组12具有同等的判别能力的判别式组的一览图。
图74是与各种癌症患者和非癌症患者的氨基酸变数的分布相关的箱线图。
图75是表示一元配置分散分析中的p值的图。
图76是通过主成分分析得到的主成分3和主成分4的标图。
图77是表示指标式组13的变数及其系数的图。
图78是表示各种癌症和非癌症的准确率的图。
图79是表示指标式组14的变数及其系数的图。
图80是表示各种癌症和非癌症的准确率的图。
图81是表示与指标式组14具有同等的判别能力的判别式组的一览图。
图82是表示与指标式组14具有同等的判别能力的判别式组的一览图。
图83是表示指标式组15的变数及其系数的图。
图84是表示各种癌症和非癌症的准确率的图。
图85是表示与指标式组15具有同等的判别能力的判别式组的一览图。
图86是表示与指标式组15具有同等的判别能力的判别式组的一览图。
图87是表示指标式组16的变数及其系数的图。
图88是表示各种癌症和非癌症的准确率的图。
符号说明
100   癌症种类评价装置
102   控制部
102a  要求解释部
102b  阅览处理部
102c  认证处理部
102d  电子邮件生成部
102e  网页生成部
102f  接收部
102g  癌症状态信息指定部
102h  多变量判别式制作部
102h1 候选多变量判别式制作部
102h2 候选多变量判别式验证部
102h3 变数选择部
102i  判别值计算部
102j  判别值基准评价部
102j1 判别值基准判别部
102k  结果输出部
102m  发送部
104   通信接口部
106   存储部
106a  利用者信息文件
106b  氨基酸浓度数据文件
106c  癌症状态信息文件
106d  指定癌症状态信息文件
106e  多变量判别式相关信息数据库
106e1 候选多变量判别式文件
106e2 验证结果文件
106e3 选择癌症状态信息文件
106e4 多变量判别式文件
106f  判别值文件
106g  评价结果文件
108   输入输出接口部
112  输入装置
114  输出装置
200  客户端装置(信息通信终端装置)
300  网络
400  数据库装置
具体实施方式
以下,根据附图详细说明本发明所述的癌症种类的评价方法的实施方案(实施方案1)以及本发明所述的癌症种类评价装置、癌症种类评价方法、癌症种类评价系统、癌症种类评价程序和记录介质的实施方案(实施方案2)。需要说明的是,本发明并不受本实施方案限定。
[实施方案1]
[1-1.本发明的概要]
这里,参照图1对本发明所述的癌症种类的评价方法的概要进行说明。图1是表示本发明的基本原理的原理构成图。
首先,本发明中,针对从评价对象(例如动物或人等个体)采集到的血液测定关于氨基酸浓度值的氨基酸浓度数据(步骤S-11)。这里,血液中氨基酸浓度的分析如下进行。将采血得到的血样采集到经肝素处理的管中,将采集的血样通过离心从血液中分离血浆。全部的血浆样品在-70℃下冷冻保存至氨基酸浓度的测定之前。在氨基酸浓度测定时,添加硫代水杨酸,调节为3%浓度,由此进行除蛋白处理,测定使用氨基酸分析仪,该氨基酸分析仪是以采用了柱后茚三酮反应的高效液相色谱(HPLC)为原理。氨基酸浓度的单位可以是例如摩尔浓度或重量浓度、对这些浓度加减乘除任意的常数而得到的浓度。
接着,本发明中,根据在步骤S-11中测定的评价对象的氨基酸浓度数据中所含的Glu、ABA、Val、Met、Pro、Phe、Thr、Ile、Leu、His中的至少一种氨基酸的浓度值,对于评价对象评价癌症的种类(步骤S-12)。
以上,根据本发明,针对从评价对象采集到的血液测定关于氨基酸浓度值的氨基酸浓度数据,根据测定的评价对象的氨基酸浓度数据中所含的Glu、ABA、Val、Met、Pro、Phe、Thr、Ile、Leu、His中的至少一种氨基酸的浓度值,对于评价对象评价癌症的种类。由此,利用血液中的氨基酸浓度中与各种癌症的状态相关的氨基酸的浓度,可以高精度地评价癌症的种类。具体来说,可以以1种检体且短时间内即可缩小筛选范围至多种癌症中罹患的可能性高的被验者,结果可以减轻被验者的时间、身体以及金钱方面上的负担。具体来说,根据多种氨基酸的浓度或以该氨基酸浓度为变数的含有1个或多个判别式的判别式组,可以高精度地评价某个检体是否有癌症发病,有癌症发病时,该发病部位在哪里,结果可以实现检查的高效化或高精度化。
这里,在实行步骤S-12之前,可以从步骤S-11中测定的评价对象的氨基酸浓度数据中除去缺失值或偏离值等数据。由此,可以进一步高精度地评价癌症的种类。
步骤S-12中,根据在步骤S-11中测定的评价对象的氨基酸浓度数据中所含的Glu、ABA、Val、Met、Pro、Phe、Thr、Ile、Leu、His中的至少一种氨基酸的浓度值,对于评价对象,可以从大肠癌、乳癌、前列腺癌、甲状腺癌、肺癌、胃癌、子宫癌中的至少2种癌症(具体来说,是大肠癌、乳癌、前列腺癌、甲状腺癌、肺癌中的至少3种癌症)中判别其是哪一种癌症。具体来说,通过对Glu、ABA、Val、Met、Pro、Phe、Thr、Ile、Leu、His中的至少一种氨基酸的浓度值和预先设定的阀值进行比较,对于评价对象,可以从大肠癌、乳癌、前列腺癌、甲状腺癌、肺癌、胃癌、子宫癌中的至少2种癌症(具体来说,是大肠癌、乳癌、前列腺癌、甲状腺癌、肺癌中的至少3种癌症)中判别其是哪一种癌症。由此,利用血液中的氨基酸浓度中对癌症的多组判别有用的氨基酸的浓度,可以高精度地进行癌症的多组判别。
步骤S-12中,根据在步骤S-11中测定的评价对象的氨基酸浓度数据中所含的Glu、ABA、Val、Met、Pro、Phe、Thr、Ile、Leu、His中的至少一种氨基酸的浓度值以及以氨基酸的浓度为变数、含有Glu、ABA、Val、Met、Pro、Phe、Thr、Ile、Leu、His中的至少一种氨基酸作为变数的预先设定的由1个或多个多变量判别式构成的多变量判别式组,通过构成该多变量判别式组的每个多变量判别式,计算该多变量判别式的值即判别值,可以根据由算出的1个或多个判别值构成的判别值组,对于评价对象评价癌症的种类。由此,利用由与各种癌症的状态具有显著相关的多变量判别式组得到的判别值组,可以高精度地评价癌症的种类。具体来说,可以以1种检体且短时间内即可缩小筛选范围至多种癌症中罹患的可能性高的被验者,结果可以减轻被验者的时间、身体以及金钱方面上的负担。具体来说,根据多种氨基酸的浓度或以该氨基酸的浓度为变数的含有1个或多个判别式的判别式组,可以高精度地评价某个检体是否有癌症发病,有癌症发病时,该发病部位在哪里,结果可以实现检查的高效化或高精度化。
步骤S-12中,根据计算的判别值组,对于评价对象,可以从大肠癌、乳癌、前列腺癌、甲状腺癌、肺癌、胃癌、子宫癌中的至少2种癌症(具体来说,是大肠癌、乳癌、前列腺癌、甲状腺癌、肺癌中的至少3种癌症)中判别其是哪一种癌症。具体来说,可通过对判别值和预先设定的阀值进行比较,对于评价对象,从大肠癌、乳癌、前列腺癌、甲状腺癌、肺癌、胃癌、子宫癌中的至少2种癌症(具体来说,是大肠癌、乳癌、前列腺癌、甲状腺癌、肺癌中的至少3种癌症)中判别其是哪一种癌症。由此,利用由对于癌症的多组判别有用的多变量判别式组得到的判别值组,可以高精度地进行癌症的多组判别。
构成多变量判别式组的各多变量判别式可以是分数式、逻辑回归式、线性判别式、多重回归式、由支持向量机制作的公式、由马氏距离法制作的公式、由典型判别分析制作的公式、由决策树制作的公式的任意一种。具体来说,多变量判别式组可以是以下的判别式组1~16的任意一组。由此,利用由对于癌症的多组判别特别有用的多变量判别式组得到的判别值组,可以进一步高精度地进行癌症的多组判别。
[判别式组1]以年龄、性别、Thr、Glu、Gln、Pro、Cit、ABA、Val、Met、Ile、Leu、Tyr、Phe、His、Orn、Lys、Arg作为变数的5个线性1次式;
[判别式组2]以年龄、Glu、Pro、Cit、ABA、Met、Ile、Leu、Phe、His、Trp、Orn、Lys作为变数的4个线性1次式;
[判别式组3]以年龄、Thr、Glu、Gln、Pro、ABA、Val、Met、Ile、Leu、Phe、His、Arg作为变数的4个线性1次式;
[判别式组4]以年龄、性别、Thr、Glu、Pro、ABA、Val、Met、Ile、Leu、Phe、His作为变数的4个线性1次式;
[判别式组5]以年龄、Asn、Glu、ABA、Val、Phe、His、Trp作为变数的3个线性1次式;
[判别式组6]以年龄、Thr、Glu、Pro、Val、Met、Ile、Leu、His、Arg作为变数的3个线性1次式;
[判别式组7]以年龄、性别、Thr、Glu、Gln、Pro、Cit、ABA、Val、Met、Ile、Leu、Tyr、Phe、Orn、Arg作为变数的4个线性1次式;
[判别式组8]以年龄、Asn、Glu、ABA、Val、Phe、His、Trp作为变数的3个线性1次式;
[判别式组9]以年龄、Thr、Glu、Gln、Pro、ABA、Val、Met、Ile、Phe、Arg作为变数的3个线性1次式;
[判别式组10]以年龄、性别、Thr、Glu、Pro、ABA、Val、Met作为变数的3个线性1次式;
[判别式组11]以年龄、Cit、ABA、Val、Met作为变数的2个线性1次式;
[判别式组12]以年龄、Thr、Glu、Pro、Met、Phe作为变数的2个线性1次式;
[判别式组13]以Thr、Ser、Asn、Glu、Gln、Gly、Ala、Cit、ABA、Val、Met、Ile、Leu、Tyr、Phe、His、Trp、Orn、Lys、Arg作为变数的2个线性1次式;
[判别式组14]以Glu、Gln、ABA、Val、Ile、Phe、Arg作为变数的2个线性1次式;
[判别式组15]以Thr、Glu、Gln、ABA、Ile、Leu、Arg作为变数的2个线性1次式;
[判别式组16]以Thr、Gln、Ala、Cit、ABA、Ile、His、Orn、Arg作为变数的2个分数式。
这些构成多变量判别式组的各多变量判别式可以按照本申请人的国际申请即国际公开第2004/052191号中所述的方法、或本申请人的国际申请即国际公开第2006/098192号中所述的方法(后述的实施方案2中记载的多变量判别式制作处理)制作。如果是由这些方法得到的多变量判别式,则不管作为输入数据的氨基酸浓度数据中的氨基酸浓度的单位,该多变量判别式均可适用于癌症的种类的评价。
这里,多变量判别式是指通常在多变量分析中使用的公式的形式,包含例如分数式、多重回归式、多重逻辑回归式、线性判别函数、马氏距离、典型判别函数、支持向量机、决策树等。还包含由不同形式的多变量判别式之和表示的公式。多重回归式、多重逻辑回归式、典型判别函数中,各变数可以附加系数和常数项,此时的系数和常数项优选为实数,更优选为了由数据进行判别而得到的系数和常数项的99%可靠区间的范围的值,还可进一步优选为了由数据进行判别而得到的系数和常数项的95%可靠区间的范围的值。各系数的值及其可靠区间可以是将其实数倍所得的值,常数项的值及其可靠区间可以是对其加减乘除任意的实常数所得的值。
分数式是指:该分数式的分子由氨基酸A、B、C等的之和表示,且该分数式的分母由氨基酸a、b、c等的之和表示。分数式也包含上述构成的分数式α、β、γ等的之和(例如α+β等)。分数式也包含分割的分数式。分子或分母中使用的氨基酸可以分别具有适当的系数。分子或分母中使用的氨基酸可以重复。各分数式可以具有适当的系数。另外,各变数的系数的值或常数项的值只要是实数即可。分数式中,将分子的变数和分母的变数互换的组合中,与目标变数相关的正负符号均颠倒,但它们仍保持相关性,因此,在判别性中视为同等,因此,分数式也包含将分子的变数与分母的变数互换的组合。
本发明中,在评价癌症的种类时(具体来说,在判别其是哪一种癌症时),除氨基酸的浓度以外,可进一步使用其它的代谢物的浓度或基因的表达量、蛋白质的表达量、被验者的年龄和性别、是否吸烟、心电图的波形数值化所得的数据等。本发明中,在评价癌症的种类时(具体来说,在判别其是哪一种癌症时),作为多变量判别式中的变数,除氨基酸的浓度以外,可以进一步使用其它的代谢物的浓度或基因的表达量、蛋白质的表达量、被验者的年龄和性别、是否吸烟、心电图的波形数值化所得的数据等。
[1-2.实施方案1所述的癌症种类的评价方法]
这里,参照图2对实施方案1所述的癌症种类的评价方法进行说明。图2是表示实施方案1所述的癌症种类的评价方法的一个例子的流程图。
首先,针对从动物或人等个体采集到的血液测定关于氨基酸浓度值的氨基酸浓度数据(步骤SA-11)。氨基酸浓度值的测定按照上述的方法进行。
接着,从在步骤SA-11中测定的个体的氨基酸浓度数据中除去缺失值或偏离值等的数据(步骤SA-12)。
接着,对步骤SA-12中除去了缺失值或偏离值等数据的个体的氨基酸浓度数据中所含的Glu、ABA、Val、Met、Pro、Phe、Thr、Ile、Leu、His中的至少一种氨基酸的浓度值和预先设定的阀值进行比较,对于个体,从大肠癌、乳癌、前列腺癌、甲状腺癌、肺癌、胃癌、子宫癌中的至少2种癌症(具体来说,是大肠癌、乳癌、前列腺癌、甲状腺癌、肺癌中的至少3种癌症)中判别其是哪一种癌症,或者,根据步骤SA-12中除去了缺失值或偏离值等的数据的个体的氨基酸浓度数据中所含的Glu、ABA、Val、Met、Pro、Phe、Thr、Ile、Leu、His中的至少一种氨基酸的浓度值以及以氨基酸的浓度为变数、含有Glu、ABA、Val、Met、Pro、Phe、Thr、Ile、Leu、His中的至少一种氨基酸作为变数的预先设定的由1个或多个多变量判别式构成的多变量判别式组,通过构成该多变量判别式组的每个多变量判别式,计算该多变量判别式的值即判别值,通过对由算出的1个或多个判别值构成的判别值组和预先设定的阀值进行比较,对于个体,从大肠癌、乳癌、前列腺癌、甲状腺癌、肺癌、胃癌、子宫癌中的至少2种癌症(具体来说,是大肠癌、乳癌、前列腺癌、甲状腺癌、肺癌中的至少3种癌症)中判别其是哪一种癌症(步骤SA-13)。
[1-3.实施方案1的总结、以及其它实施方案]
如以上的详细说明,根据实施方案1所述的癌症的评价方法,(1)针对从个体采集到的血液测定氨基酸浓度数据,(2)从测定的个体的氨基酸浓度数据中除去缺失值或偏离值等的数据,(3)通过对除去了缺失值或偏离值等数据的个体的氨基酸浓度数据中所含的Glu、ABA、Val、Met、Pro、Phe、Thr、Ile、Leu、His中的至少一种氨基酸的浓度值和预先设定的阀值进行比较,对于个体,从大肠癌、乳癌、前列腺癌、甲状腺癌、肺癌、胃癌、子宫癌中的至少2种癌症(具体来说,是大肠癌、乳癌、前列腺癌、甲状腺癌、肺癌中的至少3种癌症)中判别其是哪一种癌症,或者,根据除去了缺失值或偏离值等的数据的个体的氨基酸浓度数据中所含的Glu、ABA、Val、Met、Pro、Phe、Thr、Ile、Leu、His中的至少一种氨基酸的浓度值以及以氨基酸的浓度为变数、含有Glu、ABA、Val、Met、Pro、Phe、Thr、Ile、Leu、His中的至少一种氨基酸作为变数的预先设定的由1个或多个多变量判别式构成的多变量判别式组,通过构成该多变量判别式组的每个多变量判别式,计算该多变量判别式的值即判别值,通过对由算出的1个或多个判别值构成的判别值组和预先设定的阀值进行比较,对于个体,从大肠癌、乳癌、前列腺癌、甲状腺癌、肺癌、胃癌、子宫癌中的至少2种癌症(具体来说,是大肠癌、乳癌、前列腺癌、甲状腺癌、肺癌中的至少3种癌症)中判别其是哪一种癌症。由此,利用血液中的氨基酸浓度中对于癌症的多组判别有用的氨基酸的浓度、或者利用由对于癌症的多组判别有用的多变量判别式组得到的判别值组,可以高精度地进行癌症的多组判别。
步骤SA-13中,构成多变量判别式组的各多变量判别式可以是分数式、逻辑回归式、线性判别式、多重回归式、由支持向量机制作的公式、由马氏距离法制作的公式、由典型判别分析制作的公式、由决策树制作的公式的任意一种。具体来说,多变量判别式组可以是以下的判别式组1~16的任意一组。由此,利用由对于癌症的多组判别特别有用的多变量判别式组得到的判别值组,可以进一步高精度地进行癌症的多组判别。
[判别式组1]以年龄、性别、Thr、Glu、Gln、Pro、Cit、ABA、Val、Met、Ile、Leu、Tyr、Phe、His、Orn、Lys、Arg作为变数的5个线性1次式;
[判别式组2]以年龄、Glu、Pro、Cit、ABA、Met、Ile、Leu、Phe、His、Trp、Orn、Lys作为变数的4个线性1次式;
[判别式组3]以年龄、Thr、Glu、Gln、Pro、ABA、Val、Met、Ile、Leu、Phe、His、Arg作为变数的4个线性1次式;
[判别式组4]以年龄、性别、Thr、Glu、Pro、ABA、Val、Met、Ile、Leu、Phe、His作为变数的4个线性1次式;
[判别式组5]以年龄、Asn、Glu、ABA、Val、Phe、His、Trp作为变数的3个线性1次式;
[判别式组6]以年龄、Thr、Glu、Pro、Val、Met、Ile、Leu、His、Arg作为变数的3个线性1次式;
[判别式组7]以年龄、性别、Thr、Glu、Gln、Pro、Cit、ABA、Val、Met、Ile、Leu、Tyr、Phe、Orn、Arg作为变数的4个线性1次式;
[判别式组8]以年龄、Asn、Glu、ABA、Val、Phe、His、Trp作为变数的3个线性1次式;
[判别式组9]以年龄、Thr、Glu、Gln、Pro、ABA、Val、Met、Ile、Phe、Arg作为变数的3个线性1次式;
[判别式组10]以年龄、性别、Thr、Glu、Pro、ABA、Val、Met作为变数的3个线性1次式;
[判别式组11]以年龄、Cit、ABA、Val、Met作为变数的2个线性1次式;
[判别式组12]以年龄、Thr、Glu、Pro、Met、Phe作为变数的2个线性1次式;
[判别式组13]以Thr、Ser、Asn、Glu、Gln、Gly、Ala、Cit、ABA、Val、Met、Ile、Leu、Tyr、Phe、His、Trp、Orn、Lys、Arg作为变数的2个线性1次式;
[判别式组14]以Glu、Gln、ABA、Val、Ile、Phe、Arg作为变数的2个线性1次式;
[判别式组15]以Thr、Glu、Gln、ABA、Ile、Leu、Arg作为变数的2个线性1次式;
[判别式组16]以Thr、Gln、Ala、Cit、ABA、Ile、His、Orn、Arg作为变数的2个分数式。
这些构成多变量判别式组的各多变量判别式可根据本申请人的国际申请即国际公开第2004/052191号中所述的方法、或本申请人的国际申请即国际公开第2006/098192号中所述的方法(后述的实施方案2中记载的多变量判别式制作处理)制作。如果是由这些方法得到的多变量判别式,则不管作为输入数据的氨基酸浓度数据中的氨基酸浓度的单位,该多变量判别式均可适用于癌症的种类的评价。
[实施方案2]
[2-1.本发明的概要]
这里,参照图3对本发明所述的癌症种类评价装置、癌症种类评价方法、癌症种类评价系统、癌症种类评价程序和记录介质的概要进行说明。图3是表示本发明的基本原理的原理构成图。
首先,本发明是在控制部,根据以氨基酸的浓度为变数、含有Glu、ABA、Val、Met、Pro、Phe、Thr、Ile、Leu、His中的至少一种氨基酸作为变数、在存储部存储的由1个或多个多变量判别式构成的多变量判别式组以及预先取得的与氨基酸的浓度值相关的评价对象(例如动物或人等个体)的氨基酸浓度数据中所含的Glu、ABA、Val、Met、Pro、Phe、Thr、Ile、Leu、His中的至少一种氨基酸的浓度值,通过构成该多变量判别式组的每个多变量判别式,计算该多变量判别式的值即判别值(步骤S-21)。
接着,本发明是在控制部,根据由在步骤S-21中算出的1个或多个判别值构成的判别值组,对于评价对象评价癌症的种类(步骤S-22)。
以上,根据本发明,根据以氨基酸的浓度为变数、含有Glu、ABA、Val、Met、Pro、Phe、Thr、Ile、Leu、His中的至少一种氨基酸作为变数、在存储部存储的由1个或多个多变量判别式构成的多变量判别式组以及预先取得的与氨基酸的浓度值相关的评价对象的氨基酸浓度数据中所含的Glu、ABA、Val、Met、Pro、Phe、Thr、Ile、Leu、His中的至少一种氨基酸的浓度值,通过构成该多变量判别式组的每个多变量判别式,计算该多变量判别式的值即判别值,根据由算出的1个或多个判别值构成的判别值组,对于评价对象评价癌症的种类。由此,利用由与各种癌症的状态具有显著相关的多变量判别式组得到的判别值组,可以高精度地评价癌症的种类。具体来说,可以以1种检体且短时间内即可缩小筛选范围至多种癌症中罹患的可能性高的被验者,结果可以减轻被验者的时间、身体以及金钱方面上的负担。具体来说,根据多种氨基酸的浓度、或以该氨基酸浓度为变数的含有1个或多个判别式的判别式组,可以高精度地评价某个检体是否有癌症发病,有癌症发病时,该发病部位在哪里,结果可以实现检查的高效化或高精度化。
这里,在步骤S-22中,根据在步骤S-21中算出的判别值组,对于评价对象,可以从预先设定的多个种类的癌症(具体来说,是大肠癌、乳癌、前列腺癌、甲状腺癌、肺癌、胃癌、子宫癌中的至少2种癌症(更具体来说,是大肠癌、乳癌、前列腺癌、甲状腺癌、肺癌中的至少3种癌症))中判别其是哪一种癌症。具体来说,通过对判别值组和预先设定的阀值进行比较,对于评价对象,可以从预先设定的多个种类的癌症(具体来说,是大肠癌、乳癌、前列腺癌、甲状腺癌、肺癌、胃癌、子宫癌中的至少2种癌症(更具体来说,是大肠癌、乳癌、前列腺癌、甲状腺癌、肺癌中的至少3种癌症))中判别其是哪一种癌症。由此,利用由对于癌症的多组判别有用的多变量判别式组得到的判别值组,可以高精度地进行癌症的多组判别。
构成多变量判别式组的各多变量判别式可以是分数式、逻辑回归式、线性判别式、多重回归式、由支持向量机制作的公式、由马氏距离法制作的公式、由典型判别分析制作的公式、由决策树制作的公式的任意一种。具体来说,多变量判别式组可以使以下的判别式组1~16的任意一组。由此,利用由对于癌症的多组判别特别有用的多变量判别式组得到的判别值组,可以进一步高精度地进行癌症的多组判别。
[判别式组1]以年龄、性别、Thr、Glu、Gln、Pro、Cit、ABA、Val、Met、Ile、Leu、Tyr、Phe、His、Orn、Lys、Arg作为变数的5个线性1次式;
[判别式组2]以年龄、Glu、Pro、Cit、ABA、Met、Ile、Leu、Phe、His、Trp、Orn、Lys作为变数的4个线性1次式;
[判别式组3]以年龄、Thr、Glu、Gln、Pro、ABA、Val、Met、Ile、Leu、Phe、His、Arg作为变数的4个线性1次式;
[判别式组4]以年龄、性别、Thr、Glu、Pro、ABA、Val、Met、Ile、Leu、Phe、His作为变数的4个线性1次式;
[判别式组5]以年龄、Asn、Glu、ABA、Val、Phe、His、Trp作为变数的3个线性1次式;
[判别式组6]以年龄、Thr、Glu、Pro、Val、Met、Ile、Leu、His、Arg作为变数的3个线性1次式;
[判别式组7]以年龄、性别、Thr、Glu、Gln、Pro、Cit、ABA、Val、Met、Ile、Leu、Tyr、Phe、Orn、Arg作为变数的4个线性1次式;
[判别式组8]以年龄、Asn、Glu、ABA、Val、Phe、His、Trp作为变数的3个线性1次式;
[判别式组9]以年龄、Thr、Glu、Gln、Pro、ABA、Val、Met、Ile、Phe、Arg作为变数的3个线性1次式;
[判别式组10]以年龄、性别、Thr、Glu、Pro、ABA、Val、Met作为变数的3个线性1次式;
[判别式组11]以年龄、Cit、ABA、Val、Met作为变数的2个线性1次式;
[判别式组12]以年龄、Thr、Glu、Pro、Met、Phe作为变数的2个线性1次式;
[判别式组13]以Thr、Ser、Asn、Glu、Gln、Gly、Ala、Cit、ABA、Val、Met、Ile、Leu、Tyr、Phe、His、Trp、Orn、Lys、Arg作为变数的2个线性1次式;
[判别式组14]以Glu、Gln、ABA、Val、Ile、Phe、Arg作为变数的2个线性1次式;
[判别式组15]以Thr、Glu、Gln、ABA、Ile、Leu、Arg作为变数的2个线性1次式;
[判别式组16]以Thr、Gln、Ala、Cit、ABA、Ile、His、Orn、Arg作为变数的2个分数式。
这些构成多变量判别式组的各多变量判别式可按照本申请人的国际申请即国际公开第2004/052191号中所述的方法、或本申请人的国际申请即国际公开第2006/098192号中所述的方法(后述的多变量判别式制作处理)制作。如果是由这些方法得到的多变量判别式,则不管作为输入数据的氨基酸浓度数据中的氨基酸浓度的单位,该多变量判别式均可适用于癌症的种类的评价。
这里,多变量判别式是指通常在多变量分析中使用的公式的形式,包含例如分数式、多重回归式、多重逻辑回归式、线性判别函数、马氏距离、典型判别函数、支持向量机、决策树等。还包含由不同形式的多变量判别式之和表示的公式。多重回归式、多重逻辑回归式、典型判别函数中,各变数可以附加系数和常数项,此时的系数和常数项优选为实数,更优选为了由数据进行判别而得到的系数和常数项的99%可靠区间的范围的值,还可进一步优选为了由数据进行判别而得到的系数和常数项的95%可靠区间范围的值。各系数的值及其可靠区间可以是将其实数倍所得的值,常数项的值及其可靠区间可以是对其加减乘除任意的实常数而得到的值。
分数式是指:该分数式的分子由氨基酸A、B、C等的之和表示,且该分数式的分母由氨基酸a、b、c等的之和表示。分数式也包含上述构成的分数式α、β、γ等的之和(例如α+β等)。分数式也包含分割的分数式。分子或分母中使用的氨基酸可以分别具有适当的系数。分子或分母中使用的氨基酸可以重复。各分数式可以具有适当的系数。另外,各变数的系数的值或常数项的值只要是实数即可。分数式中,将分子的变数和分母的变数互换的组合中,与目标变数相关的正负符号均颠倒,但它们仍保持相关性,因此在判别性中视为同等,因此,分数式也包含将分子的变数与分母的变数互换的组合。
本发明中,在评价癌症的种类时(具体来说,在判别其是哪一种癌症时),除氨基酸的浓度以外,可进一步使用其它的代谢物的浓度或基因的表达量、蛋白质的表达量、被验者的年龄和性别、是否吸烟、心电图的波形数值化所得的数据等。本发明中,在评价癌症的种类时(具体来说,在判别其是哪一种癌症时),作为多变量判别式的变数,除氨基酸的浓度以外,可以进一步使用其它的代谢物的浓度或基因的表达量、蛋白质的表达量、被验者的年龄和性别、是否吸烟、心电图的波形数值化所得的数据等。
这里,对多变量判别式制作处理(步骤1~步骤4)的概要进行详细说明。该多变量判别式制作处理是对将评价癌症的种类时的对象癌症(具体来说,是上述的大肠癌、乳癌、前列腺癌、甲状腺癌、肺癌、胃癌、子宫癌等)汇总的数据一并实行。
首先,本发明是在控制部,根据规定的公式制作方法,由含有氨基酸浓度数据和与表示癌症的状态的指标相关的癌症状态指标数据、在存储部存储的癌症状态信息制作多变量判别式组的候选即候选多变量判别式组(例如、y=a1x1+a2x2+...+anxn,y:癌症状态指标数据,xi:氨基酸浓度数据,ai:常数,i=1,2,...,n)(步骤1)。可以事先从癌症状态信息中除去具有缺失值或偏离值等的数据。
步骤1中,可以结合使用多个不同的公式制作方法(包括与主成分分析或判别分析、支持向量机、多重回归分析、逻辑回归分析、k-means法、聚类分析、决策树等的多变量分析相关的方法),由癌症状态信息制作多个候选的多变量判别式组。具体来说,可以利用多种不同的算法,对于癌症状态信息同时并行地制作多个候选多变量判别式组,其中,所述癌症状态信息是由通过分析从许多的健康人和癌症患者获取的血液而得到的氨基酸浓度数据和癌症状态指标数据构成的多变量数据。例如,可以利用不同的算法,同时进行判别分析和逻辑回归分析,制作两种不同的候选多变量判别式。还可以利用进行主成分分析来制作的候选多变量判别式组,变换癌症状态信息,对变换的癌症状态信息进行判别分析,从而制作候选多变量判别式组。由此,最终可以制作符合诊断条件的适当的变量判别式组。
这里,使用主成分分析制作的候选多变量判别式组是含有使全部的氨基酸浓度数据的离散为最大的各氨基酸变数的一次式。使用判别分析制作的候选多变量判别式组是含有使各组内离散之和相对于全部氨基酸浓度数据的离散的比为最小的各氨基酸变数的高次式(包括指数或对数)。另外,使用支持向量机制作的候选多变量判别式组是含有使组间的分界为最大的各氨基酸变数的高次式(包括核函数)。使用多重回归分析制作的候选多变量判别式是含有使自全部的氨基酸浓度数据的距离之和为最小的各氨基酸变数的高次式。使用逻辑回归分析制作的候选多变量判别式是含有使似然率为最大的各氨基酸变数、项中具有以一次式作为指数的自然对数的分数式。k-means法是探索k个各氨基酸浓度数据聚类(近傍),在聚类点(近傍点)所属的组中,将最多的数据定义为该数据的所属组,选择使输入的氨基酸浓度数据所属的组与定义的组最一致的氨基酸变数的方法。聚类分析是将全部氨基酸浓度数据中位于最近距离的点之间进行聚类(群化)的方法。决策树是给氨基酸变数排序,由序列上位的氨基酸变数可取得的图案来预测氨基酸浓度数据的组的方法。
返回多变量判别式制作处理的说明,本发明是在控制部,根据规定的验证方法,验证(相互验证)步骤1中制作的候选多变量判别式组(步骤2)。候选多变量判别式组的验证是对步骤1中制作的各候选多变量判别式组进行。
步骤2中,可以根据自举(bootstrap)法或保持(hold out)法、留一(leave-one-out)法等中的至少一种,验证候选多变量判别式组的判别率或灵敏度、特异性、信息量基准等中的至少一种。由此,可以制作考虑了癌症状态信息或诊断条件的、预测性或可靠性高的候选多变量判别式组。
这里,判别率是在全部输入数据中,本发明所评价的癌症的状态正确的比例。灵敏度是在输入数据所记载的癌症的状态为患病的数据中,本发明所评价的癌症的状态正确的比例。特异性是在输入数据所记载的癌症的状态为正常的数据中,本发明所评价的癌症的状态正确的比例。信息量基准是将步骤1中制作的候选多变量判别式组的氨基酸变数的数目、和本发明所评价的癌症的状态以及输入数据所记载的癌症的状态的差异加在一起所得。预测性是将反复进行候选多变量判别式组的验证得到的判别率或灵敏度、特异性的平均。可靠性是反复进行候选多变量判别式组的验证得到的判别率或灵敏度、特异性的离散。
返回多变量判别式制作处理的说明,本发明是在控制部,根据规定的变数选择方法,从步骤2的验证结果中选择候选多变量判别式组的变数,来选择在制作候选多变量判别式组时使用的癌症状态信息中所含的氨基酸浓度数据的组合(步骤3)。氨基酸变数的选择是对步骤1中制作的各候选多变量判别式组进行。由此可以适当选择候选多变量判别式组的氨基酸变数。使用包含步骤3中选择的氨基酸浓度数据的癌症状态信息,再次运行步骤1。
步骤3中,可以根据逐步法、最优路径法(best path method)、聚类探索法(近傍探索法,local search method)、遗传算法中的至少一种,从步骤2的验证结果中选择候选多变量判别式组的氨基酸变数。
这里,最优路径法是将候选多变量判别式组中所含的氨基酸变数一个个依次减少,使候选多变量判别式组带来的评价指标最优化,由此选择氨基酸变数的方法。
回到多变量判别式制作处理的说明中,本发明是在控制部,根据反复运行上述的步骤1、步骤2和步骤3而累积的验证结果,从多个候选多变量判别式组中选出用作多变量判别式组的候选多变量判别式组,由此制作多变量判别式组(步骤4)。候选多变量判别式组的选出,例如有从按照相同的公式制作方法制作的候选多变量判别式组中选出最佳的情况,也有从所有的候选多变量判别式组中选出最佳的情况。
如上述说明,在多变量判别式制作处理中,根据癌症状态信息,通过一系列的流程使与候选多变量判别式组的制作、候选多变量判别式组的验证和候选多变量判别式组的变数的选择相关的处理体系化(系统化)并运行,由此可以制作最适合评价各癌症的状态的多变量判别式,结果可以得到最适合评价癌症的种类的多变量判别式组(具体来说,是癌症的多组判别用的多变量判别式组)。
[2-2.系统构成]
这里,参照图4~图20对实施方案2所述的癌症种类评价系统(以下可以称为本系统)的构成进行说明。本系统只是一个举例,本发明并不限于此。
首先,参照图4和图5对本系统的全体构成进行说明。图4是表示本系统的全体构成的一个例子的图。图5是表示本系统的全体构成的又一例子的图。本系统如图4所示,是经由网络300以可通信的方式将对于评价对象评价癌症的种类的癌症种类评价装置100和提供评价对象的关于氨基酸浓度值的氨基酸浓度数据的信息通信终端装置即客户端装置200连接在一起而构成。
本系统如图5所示,除癌症种类评价装置100或客户端装置200之外,还可以将保存了在癌症种类评价装置100中制作多变量判别式时使用的癌症状态信息或用于评价癌症状态的多变量判别式等的数据库装置400经由网络300以可通信的方式连接在一起而构成。由此,经由网络300可以自癌症种类评价装置100向客户端装置200或数据库装置400、或者自客户端装置200或数据库装置400向癌症种类评价装置100提供与癌症状态相关的信息等。这里,与癌症状态相关的信息是对与包括人的生物的癌症状态相关的特定项目进行测定所得的值的相关信息。与癌症状态相关的信息是在癌症种类评价装置100或客户端装置200或其它装置(例如,各种计测装置等)中生成,主要积累在数据库装置400中。
接着,参照图6~图18对本系统的癌症种类评价装置100的构成进行说明。图6是表示本系统的癌症种类评价装置100的构成的一个例子的框图,只概念性表示了该构成中与本发明有关的部分。
癌症种类评价装置100由下述部分构成:综合地控制该癌症种类评价装置100的CPU(中央处理装置,Central Processing Unit)等的控制部102;经由路由器等的通信装置和专用线等的有线或无线的通信线路,将该癌症种类评价装置与网络300以可通信的方式连接在一起的通信接口部104;保存各种的数据库或表格或文件等的存储部106;与输入装置112或输出装置114连接的输入输出接口部108,这些部分可以经由任意的通信线路以可通信的方式连接。这里,癌症种类评价装置100可以与各种的分析装置(例如氨基酸分析仪等)在同一框体中构成。癌症种类评价装置100的分散、综合的具体的形态并不限于图示,可以将其全部或部分以对应各种负荷等的任意单元进行功能性或物理性地分散、综合来构成。例如,可以使用CGI(公共网关接口,Common Gateway Interface)实现处理的一部分。
存储部106是存储装置,可以使用例如RAM和ROM等的存储装置、硬盘等的固定盘装置、软盘、光盘等。存储部106中记录计算机程序,该计算机程序与OS(操作系统,Operating System)协同,对CPU发出指令,进行各种处理。存储部106如图所示,保存利用者信息文件106a、氨基酸浓度数据文件106b、癌症状态信息文件106c、指定癌症状态信息文件106d、多变量判别式关联信息数据库106e、判别值文件106f和评价结果文件106g。
利用者信息文件106a中保存与利用者相关的利用者信息。图7是表示保存在利用者信息文件106a中的信息的一个例子的图。保存在利用者信息文件106a中的信息如图7所示,由用于专门识别利用者利用者ID、用于认证利用者是否为正当的利用者的利用者密码、利用者姓名、用于专门识别利用者的所属机构的所属机构ID、用于专门识别利用者的所属机构的部门的部门ID、部门名称和利用者的电子邮件地址相互关联地构成。
返回图6,氨基酸浓度数据文件106b中保存关于氨基酸浓度值的氨基酸浓度数据。图8是表示保存在氨基酸浓度数据文件106b中的信息的一个例子的图。保存在氨基酸浓度数据文件106b中的信息如图8所示,由用于专门识别评价对象个体(样品)的个体编号和氨基酸浓度数据相互关联地构成。这里,图8中,将氨基酸浓度数据作为数值即连续尺度应用,氨基酸浓度数据也可以是名义尺度或顺序尺度。为名义尺度或顺序尺度时,可通过对各状态赋予任意的数值进行分析。氨基酸浓度数据中还可以组合其它的生物信息(氨基酸以外的代谢物的浓度或基因表达量、蛋白质表达量、被验者的年龄和性别、有无吸烟、心电图的波形数值化所得的数据等)。
返回图6,癌症状态信息文件106c中保存制作多变量判别式时使用的癌症状态信息。图9是表示保存在癌症状态信息文件106c中的信息的一个例子的图。保存在癌症状态信息文件106c中的信息如图9所示,由个体编号、与表示癌症的状态的指标(指标T1、指标T2、指标T3...)相关的癌症状态指标数据(T)和氨基酸浓度数据相互关联地构成。这里,图9中,癌症状态指标数据和氨基酸浓度数据以数值(即连续尺度)的形式应用,癌症状态指标数据和氨基酸浓度数据也可以是名义尺度或顺序尺度。为名义尺度或顺序尺度时,可通过对各状态赋予任意的数值进行分析。癌症状态指标数据是作为癌症的状态的标志物的已知的单一的状态指标,可以使用数值数据。
返回图6,指定癌症状态信息文件106d中保存在后述的癌症状态信息指定部102g中指定的癌症状态信息。图10是表示保存在指定癌症状态信息文件106d中的信息的一个例子。保存在指定癌症状态信息文件106d中的信息如图10所示,由个体编号、指定的癌症状态指标数据和指定的氨基酸浓度数据相互关联地构成。
返回图6,多变量判别式关联信息数据库106e由以下文件构成:候选多变量判别式文件106e1,保存在后述的候选多变量判别式制作部102h1中制作的候选多变量判别式组;验证结果文件106e2,保存后述的候选多变量判别式验证部102h2中的验证结果;选择癌症状态信息文件106e3,保存包括在后述的变数选择部102h3中选择的氨基酸浓度数据的组合的癌症状态信息;多变量判别式文件106e4,保存在后述的多变量判别式制作部102h中制作的多变量判别式组。
候选多变量判别式文件106e1中保存在后述的候选多变量判别式制作部102h1中制作的候选多变量判别式组。图11是表示保存在候选多变量判别式文件106e1中的信息的一个例子的图。保存在候选多变量判别式文件106e1中的信息如图11所示,由顺序(rank)和候选多变量判别式(图11中的F1(Gly,Leu,Phe,...)或F2(Gly,Leu,Phe,...)、F3(Gly,Leu,Phe,...)等)相互关联地构成。
返回图6,验证结果文件106e2中保存后述的候选多变量判别式验证部102h2中的验证结果。图12是表示保存在验证结果文件106e2中的信息的一个例子的图。保存在验证结果文件106e2中的信息如图12所示,由顺序、候选多变量判别式(图12中的Fk(Gly,Leu,Phe,...)或Fm(Gly,Leu,Phe,...)、Fl(Gly,Leu,Phe,...)等)和各候选多变量判别式的验证结果(例如各候选多变量判别式的评价值)相互关联地构成。
返回图6,选择癌症状态信息文件106e3中保存癌症状态信息,该癌症状态信息包括与在后述的变数选择部102h3中选择的变数对应的氨基酸浓度数据的组合。图13是表示保存在选择癌症状态信息文件106e3中的信息的一个例子的图。保存在选择癌症状态信息文件106e3中的信息如图13所示,由个体编号、在后述的癌症状态信息指定部102g中指定的癌症状态指标数据和在后述的变数选择部102h3中选择的氨基酸浓度数据相互关联地构成。
返回图6,多变量判别式文件106e4中保存在后述的多变量判别式制作部102h中制作的多变量判别式组。图14是表示保存在多变量判别式文件106e4中的信息的一个例子的图。保存在多变量判别式文件106e4中的信息如图14所示,由顺序、多变量判别式(图14中的Fp(Phe,...)或Fp(Gly,Leu,Phe)、Fk(Gly,Leu,Phe,...)等)、与各公式制作方法对应的阀值和各多变量判别式的验证结果(例如,各多变量判别式的评价值)相互关联地构成。
返回图6,判别值文件106f中保存在后述的判别值计算部102i中计算的判别值。图15是表示保存在判别值文件106f中的信息的一个例子的图。保存在判别值文件106f中的信息如图15所示,是用于专门识别评价对象个体(样品)的个体编号、顺序(用于专门识别多变量判别式的编号)和判别值相互关联地构成。
返回图6,评价结果文件106g中保存在后述的判别值基准评价部102j中的评价结果(具体来说,在后述的判别值基准判别部102j1中的判别结果)。图16是表示保存在评价结果文件106g中的信息的一个例子的图。保存在评价结果文件106g中的信息由用于专门识别评价对象个体(样品)的个体编号、预先取得的评价对象的氨基酸浓度数据、由各多变量判别式计算的1个或多个的判别值和关于癌症的种类的评价结果(具体来说,是关于是哪一种癌症的判别结果)相互关联地构成。
返回图6,在存储部106中,除上述信息之外,作为其它信息,还记录有用于将网站提供给客户端装置200的各种网站数据、CGI程序等。网站数据有用于表示后述的各种网页的数据等,这些数据以例如用HTML或XML记述的文本文件的形式形成。用于制作网站数据的部件用的文件(部品用のフアイル)或操作用的文件(作業用のフアイル)或其它临时性的文件等也存储于存储部106中。在存储部106中,根据需要可以将发送给客户端装置200的声音以如WAVE形式或AIFF形式的声音文件保存,或者将静止图像或动态图像以如JPEG形式或MPEG2形式的图像文件的形式保存。
通信接口部104连通癌症种类评价装置100和网络300(或路由器等的通信装置)之间的通信。即,通信接口部104具有经由通信线路与其它终端进行数据通信的功能。
输入输出接口部108与输入装置112或输出装置114连接。这里,输出装置114除了使用监视器(包括家庭用电视)之外,也可以使用扩音器或打印机(以下可以将输出装置114称为监视器114)。输入装置112除了使用键盘或鼠标或麦克风之外,还可以使用与鼠标协同、实现指点器(pointing device)功能的监视器。
控制部102具有用于保存OS(操作系统)等的控制程序、规定各种处理顺序等的程序和所需要的数据等的内存,根据这些程序运行各种信息处理。控制部102如图所示,大致具备要求解释部102a、阅览处理部102b、认证处理部102c、电子邮件生成部102d、网页生成部102e、接收部102f、癌症状态信息指定部102g、多变量判别式制作部102h、判别值计算部102i、判别值基准评价部102j、结果输出部102k和发送部102m。控制部102对于由数据库装置400发送的癌症状态信息或由客户端装置200发送的氨基酸浓度数据进行有缺失值的数据的除去、偏离值大的数据的除去、除去有缺失值的数据的多个变数等的数据处理。
要求解释部102a是解释来自客户端装置200或数据库装置400的要求内容,根据该解释结果,将处理交付控制部102的各部。阅览处理部102b接受来自客户端装置200的各种画面的阅览要求,进行这些画面的网站数据的生成或发送。认证处理部102c接受来自客户端装置200或数据库装置400的认证要求,进行认证判断。电子邮件生成部102d生成包含各种信息的电子邮件。网页生成部102e生成利用者可在客户端装置200阅览的网页。
接收部102f经由网络300,接收由客户端装置200或数据库装置400发送的信息(具体来说,氨基酸浓度数据或癌症状态信息、多变量判别式组等)。癌症状态信息指定部102g在制作多变量判别式组时,指定作为对象的癌症状态指标数据和氨基酸浓度数据。
多变量判别式制作部102h根据在接收部102f中接收的癌症状态信息、或在癌症状态信息指定部102g中指定的癌症状态信息来制作多变量判别式组。具体来说,多变量判别式制作部102h是根据反复运行候选多变量判别式制作部102h1、候选多变量判别式验证部102h2和变数选择部102h3而累积的验证结果,根据癌症状态信息,从多个候选多变量判别式组中选出用作多变量判别式组的候选多变量判别式组,来制作多变量判别式组。
多变量判别式组预先保存在存储部106的规定的存储区域时,多变量判别式制作部102h可以通过从存储部106中选择所需要的多变量判别式组来制作多变量判别式组。多变量判别式制作部102h通过从预先保存了多变量判别式组的其它的计算机装置(例如数据库装置400)中选择所需要的多变量判别式组并下载,可以制作多变量判别式组。
这里,参照图17对多变量判别式制作部102h的构成进行说明。图17是表示多变量判别式制作部102h的构成的框图,该构成中只概念性地表示了与本发明有关的部分。多变量判别式制作部102h进一步具备候选多变量判别式制作部102h1、候选多变量判别式验证部102h2和变数选择部102h3。候选多变量判别式制作部102h1是根据规定的公式制作方法,由癌症状态信息制作多变量判别式组的候选即候选多变量判别式组。候选多变量判别式制作部102h1可以将多种不同的公式制作方法结合使用,根据癌症状态信息制作多个候选多变量判别式组。候选多变量判别式验证部102h2根据规定的验证方法,验证在候选多变量判别式制作部102h1中制作的候选多变量判别式组。候选多变量判别式验证部102h2还可以根据自举法、保持法、留一法中的至少一种,对于候选多变量判别式的判别率、灵敏度、特异性、信息量基准中的至少一种进行验证。变数选择部102h3根据规定的变数选择方法,从候选多变量判别式验证部102h2的验证结果中选择候选多变量判别式组的变数,来选择在制作候选多变量判别式组时使用的癌症状态信息中所含的氨基酸浓度数据的组合。变数选择部102h3还可根据逐步法、最优路径法、聚类探索法、遗传算法中的至少一种,从验证结果中选择候选多变量判别式组的变数。
返回图6,判别值计算部102i根据在多变量判别式制作部102h中制作的含有Glu、ABA、Val、Met、Pro、Phe、Thr、Ile、Leu、His中的至少一种氨基酸作为变数、由1个或多个多变量判别式构成的多变量判别式组以及在接收部102f中接收的评价对象的氨基酸浓度数据中所含的Glu、ABA、Val、Met、Pro、Phe、Thr、Ile、Leu、His中的至少一种氨基酸的浓度值,通过构成该多变量判别式组的每个多变量判别式,计算该多变量判别式的值即判别值。
这里,构成多变量判别式组的各多变量判别式可以是分数式、逻辑回归式、线性判别式、多重回归式、由支持向量机制作的公式、由马氏距离法制作的公式、由典型判别分析制作的公式、由决策树制作的公式的任意一种。具体来说,多变量判别式组可以是以下的判别式组1~16的任意一组。
[判别式组1]以年龄、性别、Thr、Glu、Gln、Pro、Cit、ABA、Val、Met、Ile、Leu、Tyr、Phe、His、Orn、Lys、Arg作为变数的5个线性1次式;
[判别式组2]以年龄、Glu、Pro、Cit、ABA、Met、Ile、Leu、Phe、His、Trp、Orn、Lys作为变数的4个线性1次式;
[判别式组3]以年龄、Thr、Glu、Gln、Pro、ABA、Val、Met、Ile、Leu、Phe、His、Arg作为变数的4个线性1次式;
[判别式组4]以年龄、性别、Thr、Glu、Pro、ABA、Val、Met、Ile、Leu、Phe、His作为变数的4个线性1次式;
[判别式组5]以年龄、Asn、Glu、ABA、Val、Phe、His、Trp作为变数的3个线性1次式;
[判别式组6]以年龄、Thr、Glu、Pro、Val、Met、Ile、Leu、His、Arg作为变数的3个线性1次式;
[判别式组7]以年龄、性别、Thr、Glu、Gln、Pro、Cit、ABA、Val、Met、Ile、Leu、Tyr、Phe、Orn、Arg作为变数的4个线性1次式;
[判别式组8]以年龄、Asn、Glu、ABA、Val、Phe、His、Trp作为变数的3个线性1次式;
[判别式组9]以年龄、Thr、Glu、Gln、Pro、ABA、Val、Met、Ile、Phe、Arg作为变数的3个线性1次式;
[判别式组10]以年龄、性别、Thr、Glu、Pro、ABA、Val、Met作为变数的3个线性1次式;
[判别式组11]以年龄、Cit、ABA、Val、Met作为变数的2个线性1次式;
[判别式组12]以年龄、Thr、Glu、Pro、Met、Phe作为变数的2个线性1次式;
[判别式组13]以Thr、Ser、Asn、Glu、Gln、Gly、Ala、Cit、ABA、Val、Met、Ile、Leu、Tyr、Phe、His、Trp、Orn、Lys、Arg作为变数的2个线性1次式;
[判别式组14]以Glu、Gln、ABA、Val、Ile、Phe、Arg作为变数的2个线性1次式;
[判别式组15]以Thr、Glu、Gln、ABA、Ile、Leu、Arg作为变数的2个线性1次式;
[判别式组16]以Thr、Gln、Ala、Cit、ABA、Ile、His、Orn、Arg作为变数的2个分数式。
判别值基准评价部102j根据由在判别值计算部102i计算的1个或多个判别值构成的判别值组,对于评价对象评价癌症的种类。判别值基准评价部102j进一步具备判别值基准判别部102j1。这里,参照图18对判别值基准评价部102j的构成进行说明。图18是表示判别值基准评价部102j的构成的框图,只概念性地表示了该构成中与本发明有关的部分。判别值基准判别部102j1根据判别值组,对于评价对象,从预先设定的多个种类的癌症(具体来说,是大肠癌、乳癌、前列腺癌、甲状腺癌、肺癌、胃癌、子宫癌中的至少2种癌症(更具体来说,是大肠癌、乳癌、前列腺癌、甲状腺癌、肺癌中的至少3种癌症))中判别其是哪一种癌症。具体来说,判别值基准判别部102j1通过对判别值组和预先设定的阀值进行比较,对于评价对象,从预先设定的多个种类的癌症(具体来说,是大肠癌、乳癌、前列腺癌、甲状腺癌、肺癌、胃癌、子宫癌中的至少2种癌症(更具体来说,是大肠癌、乳癌、前列腺癌、甲状腺癌、肺癌中的至少3种癌症))中判别其是哪一种癌症。
返回图6,结果输出部102k将控制部102的各处理部中的处理结果(包括在判别值基准评价部102j中的评价结果(具体来说,是在判别值基准判别部102j1中的判别结果))等输出到输出装置114中。
发送部102m对评价对象的氨基酸浓度数据的发送源头的客户端装置200发送评价结果,或对数据库装置400发送在癌症种类评价装置100中制作的多变量判别式或评价结果。
接着,参照图19对本系统的客户端装置200的构成进行说明。图19是表示本系统的客户端装置200的构成的一个例子的框图,只概念性地表示该构成中与本发明有关的部分。
客户端装置200由控制部210、ROM220、HD230、RAM240、输入装置250、输出装置260、输入输出IF270和通信IF280构成,这些各部经由任意的通信线路以可通信的方式连接。
控制部210具备网页浏览器211、电子邮箱212、接收部213、发送部214。网页浏览器211进行解释网站数据、将解释的网站数据显示在后述的监视器261上的浏览处理。可以在网页浏览器211中插入具备进行影像流的接收、显示、反馈等的功能的流式播放器等的各种软件。电子邮箱212按照规定的通信协议(例如,SMTP(简单邮件传输协议)或POP3(邮局协议的第3个版本)等)进行电子邮件的发送接收。接收部213经由通信IF280,接收由癌症种类评价装置100发送的评价结果等的各种信息。发送部214经由通信IF280,将评价对象的氨基酸浓度数据等的各种信息发送至癌症种类评价装置100。
输入装置250是键盘或鼠标或麦克风等。后述的监视器261也与鼠标协同,实现指点器功能。输出装置260是将经由通信IF280接收的信息进行输出的输出装置,包含监视器(包括家庭用电视机)261和打印机262。除此之外还可以在输出装置260中设置扩音器等。输入输出IF270与输入装置250或输出装置260连接。
通信IF280将客户端装置200与网络300(或路由器等的通信装置)以可通信的方式连接。换言之,客户端装置200经由调制解调器或TA或路由器等的通信装置以及电话线路,或者经由专用线,与网络300连接。由此,客户端装置200按照规定的通信协议与癌症评价装置100连通(access)。
这里,通过在根据需要连接了打印机、监视器、图像扫描仪等的外围装置的信息处理装置(例如,已知的个人计算机、工作站、家庭用游戏装置、互联网TV、PHS终端、便携终端、移动通信终端、PDA等的信息处理终端等)上安装可实现网站数据的浏览功能或电子邮件功能的软件(程序、数据等),也可以实现客户端装置200。
客户端装置200的控制部210中,通过CPU和由该CPU解释并运行的程序,也可实现在控制部210中进行的处理的全部或任意的一部分。ROM220或HD230中记录与OS(操作系统)协同、对CPU发出指令、用于进行各种处理的计算机程序。该计算机程序通过装载在RAM240中来运行,与CPU协同,构成控制部210。该计算机程序可以记录在经由任意的网络与客户端装置200连接的应用程序服务器中,客户端装置200可以根据需要下载其全部或部分。还可通过布线逻辑等的硬件实现在控制部210中进行的处理的全部或任意的一部分。
接着,参照图4、图5对本系统的网络300进行说明。网络300具有以可通信的方式将癌症种类评价装置100和客户端装置200和数据库装置400相互连接在一起的功能,例如互联网或内联网或LAN(包括有线/无线两者)等。网络300可以是VAN、个人计算机通信网、公众电话网(包括模拟/数字两者)、专用线路网(包括模拟/数字两者)、CATV网、便携线路交换网或便携网络包交换网(包括IMT2000方式、GSM方式或PDC/PDC-P方式等)、无线呼出网、Bluetooth(蓝牙)(注册商标)等的局域无线网、PHS网或卫星通信网(包括CS、BS或ISDB等)等。
接着,参照图20对本系统的数据库装置400的构成进行说明。图20是表示本系统的数据库装置400的构成的一个例子的框图,只概念性地表示了该构成中与本发明有关的部分。
数据库装置400具有保存在癌症种类评价装置100或该数据库装置400中制作多变量判别式组时使用的癌症状态信息、在癌症种类评价装置100中制作的多变量判别式组、癌症种类评价装置100中的评价结果等的功能。如图20所示,数据库装置400由综合控制该数据库装置400的CPU等的控制部402、经由路由器等的通信装置以及专用线等的有线或无线通信线路将该数据库装置400与网络300以可通信的方式连接的通信接口部404、保存各种的数据库或表格或文件(例如网页用文件)等的存储部406、与输入装置412或输出装置414连接的输入输出接口部408构成,这些各部经由任意的通信线路以可通信的方式连接。
存储部406是存储装置,例如可使用RAM、ROM等的存储装置、或硬盘等的固定盘装置、或软盘、或光盘等。存储部406中保存各种处理中所使用的各种程序等。通信接口部404连通数据库装置400与网络300(或路由器等的通信装置)之间的通信。即,通信接口部404具有经由通信线路与其它终端进行数据通信的功能。输入输出接口部408与输入装置412或输出装置414连接。这里,输出装置414除使用监视器(包括家庭用电视机)之外,还可以使用扩音器或打印机(以下,有时将输出装置414记为监视器414)。输入装置412除键盘或鼠标或麦克风之外,还可以使用与鼠标协同、实现指点器功能的监视器。
控制部402具有用于保存OS(操作系统)等的控制程序、对各种处理顺序等进行规定的程序、所需数据等的内存,根据这些程序运行各种信息处理。控制部402如图所示,大体具备要求解释部402a、阅览处理部402b、认证处理部402c、电子邮件生成部402d、网页生成部402e和发送部402f。
要求解释部402a解释来自癌症种类评价装置100的要求内容,根据该解释结果,将处理交付给控制部402的各部。阅览处理部402b接受来自癌症种类评价装置100的各种画面的阅览要求,进行这些画面的网站数据的生成或发送。认证处理部402c接受来自癌症种类评价装置100的认证要求,进行认证判断。电子邮件生成部402d生成包含各种信息的电子邮件。网页生成部402e生成利用者通过客户端装置200阅览的网页。发送部402f将癌症状态信息或多变量判别式组等的各种信息发送给癌症种类评价装置100。
[2-3.本系统的处理]
这里,参照图21对由如上构成的本系统进行的癌症种类评价服务处理的一个例子进行说明。图21是表示癌症种类评价服务处理的一个例子的流程图。
本处理中使用的氨基酸浓度数据是针对从个体预先采集到的血液进行分析而得到的与氨基酸的浓度值相关的数据。这里,对血液中的氨基酸的分析方法进行简单说明。首先,将采血得到的血样采集到经肝素处理的管中,然后对该管进行离心,分离血浆。分离的全部的血浆样品在-70℃下冷冻保存至氨基酸浓度测定之前。测定氨基酸浓度时,在血浆样品中添加硫代水杨酸调节为3%浓度,由此进行除蛋白处理。氨基酸浓度的测定采用氨基酸分析仪,该氨基酸分析仪以使用柱后茚三酮反应的高效液相色谱(HPLC)为原理。
首先,在显示了网页浏览器211的画面上,利用者经由输入装置250来指定癌症种类评价装置100所提供的网站的地址(URL等),客户端装置200与癌症种类评价装置100连通。具体来说,利用者指示客户端装置200的网页浏览器211的画面更新,则网页浏览器211通过规定的通信协议,将癌症种类评价装置100所提供的网站的地址发送给癌症种类评价装置100,通过基于该地址的路由,对癌症种类评价装置100提出发送与氨基酸浓度数据发送画面对应的网页的要求。
接着,癌症种类评价装置100在要求解释部102a接受来自客户端装置200的发送,分析该发送的内容,根据分析结果将处理转移至控制部102的各部。具体来说,发送的内容是要求发送与氨基酸浓度数据发送画面对应的网页时,癌症种类评价装置100主要是在阅览处理部102b取得保存在存储部106的规定的存储区域、用于显示该网页的网站数据,将取得的网站数据发送给客户端装置200。更具体地说,利用者要求发送与氨基酸浓度数据发送画面对应的网页时,癌症种类评价装置100首先在控制部102要求利用者输入利用者ID或利用者密码。输入利用者ID或密码后,癌症种类评价装置100在认证处理部102c对输入的利用者ID或密码、和保存在利用者信息文件106a中的利用者ID或利用者密码进行认证判断。只在可以认证时,癌症种类评价装置100在阅览处理部102b将用于显示与氨基酸浓度数据发送画面对应的网页的网站数据发送至客户端装置200。客户端装置200的特定是通过在来自客户端装置200的发送要求的同时发送的IP地址进行。
接着,客户端装置200在接收部213接收由癌症种类评价装置100发送的网站数据(用于显示与氨基酸浓度数据发送画面对应的网页),在网页浏览器211解释所接收的网站数据,将氨基酸浓度数据发送画面显示在监视器261上。
接着,利用者经由输入装置250,对于显示在监视器261上的氨基酸浓度数据发送画面进行个体的氨基酸浓度数据等的输入、选择,则客户端装置200在发送部214将用于特定输入信息或选择事项的标识符发送至癌症种类评价装置100,由此将评价对象个体的氨基酸浓度数据发送至癌症种类评价装置100(步骤SA-21)。步骤SA-21中的氨基酸浓度数据的发送可通过FTP等的现有的文件传输技术等来实现。
接着,癌症种类评价装置100在要求解释部102a解释由客户端装置200发送的标识符,由此解释客户端装置200的要求内容,将癌症的种类评价用(具体来说,是多组判别用,判别是预先设定的多个种类的癌症中的哪一种癌症)的多变量判别式组的发送要求发送至数据库装置400。
接着,数据库装置400在要求解释部402a解释来自癌症种类评价装置100的发送要求,将保存在存储部406的规定的存储区域的、含有Glu、ABA、Val、Met、Pro、Phe、Thr、Ile、Leu、His中的至少一种氨基酸作为变数、由1个或多个多变量判别式(例如,更新的最新的多变量判别式)构成的多变量判别式组发送至癌症种类评价装置100(步骤SA-22)。
这里,步骤SA-22中,发送至癌症种类评价装置100的构成多变量判别式组的各多变量判别式可以是分数式、逻辑回归式、线性判别式、多重回归式、由支持向量机制作的公式、由马氏距离法制作的公式、由典型判别分析制作的公式、由决策树制作的公式的任意一种。具体来说,多变量判别式组可以是以下的判别式组1~16的任意一组。
[判别式组1]以年龄、性别、Thr、Glu、Gln、Pro、Cit、ABA、Val、Met、Ile、Leu、Tyr、Phe、His、Orn、Lys、Arg作为变数的5个线性1次式;
[判别式组2]以年龄、Glu、Pro、Cit、ABA、Met、Ile、Leu、Phe、His、Trp、Orn、Lys作为变数的4个线性1次式;
[判别式组3]以年龄、Thr、Glu、Gln、Pro、ABA、Val、Met、Ile、Leu、Phe、His、Arg作为变数的4个线性1次式;
[判别式组4]以年龄、性别、Thr、Glu、Pro、ABA、Val、Met、Ile、Leu、Phe、His作为变数的4个线性1次式;
[判别式组5]以年龄、Asn、Glu、ABA、Val、Phe、His、Trp作为变数的3个线性1次式;
[判别式组6]以年龄、Thr、Glu、Pro、Val、Met、Ile、Leu、His、Arg作为变数的3个线性1次式;
[判别式组7]以年龄、性别、Thr、Glu、Gln、Pro、Cit、ABA、Val、Met、Ile、Leu、Tyr、Phe、Orn、Arg作为变数的4个线性1次式;
[判别式组8]以年龄、Asn、Glu、ABA、Val、Phe、His、Trp作为变数的3个线性1次式;
[判别式组9]以年龄、Thr、Glu、Gln、Pro、ABA、Val、Met、Ile、Phe、Arg作为变数的3个线性1次式;
[判别式组10]以年龄、性别、Thr、Glu、Pro、ABA、Val、Met作为变数的3个线性1次式;
[判别式组11]以年龄、Cit、ABA、Val、Met作为变数的2个线性1次式;
[判别式组12]以年龄、Thr、Glu、Pro、Met、Phe作为变数的2个线性1次式;
[判别式组13]以Thr、Ser、Asn、Glu、Gln、Gly、Ala、Cit、ABA、Val、Met、Ile、Leu、Tyr、Phe、His、Trp、Orn、Lys、Arg作为变数的2个线性1次式;
[判别式组14]以Glu、Gln、ABA、Val、Ile、Phe、Arg作为变数的2个线性1次式;
[判别式组15]以Thr、Glu、Gln、ABA、Ile、Leu、Arg作为变数的2个线性1次式;
[判别式组16]以Thr、Gln、Ala、Cit、ABA、Ile、His、Orn、Arg作为变数的2个分数式。
接着,癌症种类评价装置100在接收部102f接收由客户端装置200发送的个体的氨基酸浓度数据和由数据库装置400发送的多变量判别式组,将接收的氨基酸浓度数据保存在氨基酸浓度数据文件106b的规定的存储区域,同时将构成接收的多变量判别式组的各多变量判别式保存在多变量判别式文件106e4的规定的存储区域(步骤SA-23)。
接着,癌症种类评价装置100在控制部102,从在步骤SA-23接收的个体的氨基酸浓度数据中除去缺失值或偏离值等的数据(步骤SA-24)。
接着,癌症种类评价装置100在判别值计算部102i,根据在步骤SA-24中除去了缺失值或偏离值等数据的个体的氨基酸浓度数据中所含的Glu、ABA、Val、Met、Pro、Phe、Thr、Ile、Leu、His中的至少一种氨基酸的浓度值以及在步骤SA-23接收的多变量判别式组,通过构成该多变量判别式组的每个多变量判别式,计算该多变量判别式的值即判别值(步骤SA-25)。
接着,癌症种类评价装置100在判别值基准判别部102j1对由在步骤SA-25中计算的1个或多个判别值构成的判别值组和预先设定的阀值进行比较,对于个体,从预先设定的多个种类的癌症(具体来说,是大肠癌、乳癌、前列腺癌、甲状腺癌、肺癌、胃癌、子宫癌中的至少2种癌症(更具体来说,是大肠癌、乳癌、前列腺癌、甲状腺癌、肺癌中的至少3种癌症))中判别其是哪一种癌症,将该判别结果保存在评价结果文件106g的规定的存储区域(步骤SA-26)。
接着,癌症种类评价装置100在发送部102m将在步骤SA-26中得到的判别结果(关于是哪一种癌症的判别结果)发送至氨基酸浓度数据的发送源头的客户端装置200和数据库装置400(步骤SA-27)。具体来说,首先,癌症种类评价装置100在网页生成部102e中制作用于显示判别结果的网页,将与制作的网页对应的网站数据保存在存储部106的规定存储区域。接着,利用者经由输入装置250,向客户端装置200的网页浏览器211输入规定的URL,通过了上述认证后,客户端装置200将阅览该网页的要求发送给癌症种类评价装置100。接着,癌症种类评价装置100在阅览处理部102b解释由客户端装置200发送的阅览要求,由存储部106的规定的存储区域读取与用于显示判别结果的网页对应的网站数据。癌症种类评价装置100在发送部102m将读取的网站数据发送至客户端装置200,同时将该网站数据或判别结果发送至数据库装置400。
这里,在步骤SA-27中,癌症种类评价装置100可以在控制部102通过电子邮件将判别结果通知利用者的客户端装置200。具体来说,首先,癌症种类评价装置100在电子邮件生成部102d,基于利用者ID等,按照发送时间,参照保存在利用者信息文件106a中的利用者信息,取得利用者的电子邮件地址。接着,癌症种类评价装置100在电子邮件生成部102d,以获得的电子邮件地址为发送地址,生成包含利用者的姓名和判别结果的电子邮件相关的数据。接着,癌症种类评价装置100在发送部102m将生成的该数据发送至利用者的客户端装置200。
步骤SA-27中,癌症种类评价装置100可通过FTP等的已有的文件传输技术等,将判别结果发送至利用者的客户端装置200。
返回图21的说明,数据库装置400在控制部402接收由癌症种类评价装置100发送的判别结果或网站数据,将接收的判别结果或网站数据保存(积累)在存储部406的规定的存储区域(步骤SA-28)。
客户端装置200在接收部213接收由癌症种类评价装置100发送的网站数据,在网页浏览器211中解释接收的网站数据,将记录有个体的判别结果的网页的画面显示在监视器261上(步骤SA-29)。判别结果通过电子邮件由癌症种类评价装置100发送时,由于电子邮箱212的公知的功能,客户端装置200可以在任意的时间接收由癌症种类评价装置100发送的电子邮件,并将接收的电子邮件显示在监视器261上。
以上,利用者通过阅览在监视器261上显示的网页,可以确认关于癌症的多组判别的个体的判别结果。利用者可以通过打印机262打印显示在监视器261上的网页的显示内容。
判别结果通过电子邮件由癌症种类评价装置100发送时,利用者通过阅览在监视器261上显示的电子邮件,可以确认关于癌症的多组判别的个体的判别结果。利用者可以通过打印机262打印显示在监视器261上的电子邮件的显示内容。
至此,癌症评价服务处理的说明结束。
[2-4.实施方案2的总结、以及其它的实施方案]
如上述详细说明,根据癌症种类评价系统,客户端装置200将个体的氨基酸浓度数据发送至癌症种类评价装置100,数据库装置400接受来自癌症种类评价装置100的要求,将癌症的多组判别用的多变量判别式组(含有Glu、ABA、Val、Met、Pro、Phe、Thr、Ile、Leu、His中的至少一种氨基酸作为变数的由1个或多个多变量判别式构成的多变量判别式组)发送至癌症种类评价装置100。癌症种类评价装置100运行以下步骤:(1)接收来自客户端装置200的氨基酸浓度数据,同时由数据库装置400接收多变量判别式组;(2)根据接收的氨基酸浓度数据中所含的Glu、ABA、Val、Met、Pro、Phe、Thr、Ile、Leu、His中的至少一种氨基酸的浓度值和多变量判别式组,通过构成该多变量判别式组的每个多变量判别式,计算该多变量判别式的值即判别值;(3)通过对算出的由1个或多个的判别值构成的判别值组和预先设定的阀值进行比较,对于个体,由预先设定的多个种类的癌症中判别其是哪一种癌症;(4)将该判别结果发送至客户端装置200或数据库装置400。客户端装置200接收由癌症种类评价装置100发送的判别结果并显示,数据库装置400接收由癌症种类评价装置100发送的判别结果并保存。由此,利用由对于癌症的多组判别有用的多变量判别式组得到的判别值组,可以高精度地进行癌症的多组判别。
这里,根据癌症评价系统,构成多变量判别式组的各多变量判别式可以是分数式、逻辑回归式、线性判别式、多重回归式、由支持向量机制作的公式、由马氏距离法制作的公式、由典型判别分析制作的公式、由决策树制作的公式的任意一种。具体来说,多变量判别式组可以是以下的判别式组1~16的任意一组。由此,利用由对于癌症的多组判别特别有用的多变量判别式组得到的判别值组,可以进一步高精度地进行癌症的多组判别。
[判别式组1]以年龄、性别、Thr、Glu、Gln、Pro、Cit、ABA、Val、Met、Ile、Leu、Tyr、Phe、His、Orn、Lys、Arg作为变数的5个线性1次式;
[判别式组2]以年龄、Glu、Pro、Cit、ABA、Met、Ile、Leu、Phe、His、Trp、Orn、Lys作为变数的4个线性1次式;
[判别式组3]以年龄、Thr、Glu、Gln、Pro、ABA、Val、Met、Ile、Leu、Phe、His、Arg作为变数的4个线性1次式;
[判别式组4]以年龄、性别、Thr、Glu、Pro、ABA、Val、Met、Ile、Leu、Phe、His作为变数的4个线性1次式;
[判别式组5]以年龄、Asn、Glu、ABA、Val、Phe、His、Trp作为变数的3个线性1次式;
[判别式组6]以年龄、Thr、Glu、Pro、Val、Met、Ile、Leu、His、Arg作为变数的3个线性1次式;
[判别式组7]以年龄、性别、Thr、Glu、Gln、Pro、Cit、ABA、Val、Met、Ile、Leu、Tyr、Phe、Orn、Arg作为变数的4个线性1次式;
[判别式组8]以年龄、Asn、Glu、ABA、Val、Phe、His、Trp作为变数的3个线性1次式;
[判别式组9]以年龄、Thr、Glu、Gln、Pro、ABA、Val、Met、Ile、Phe、Arg作为变数的3个线性1次式;
[判别式组10]以年龄、性别、Thr、Glu、Pro、ABA、Val、Met作为变数的3个线性1次式;
[判别式组11]以年龄、Cit、ABA、Val、Met作为变数的2个线性1次式;
[判别式组12]以年龄、Thr、Glu、Pro、Met、Phe作为变数的2个线性1次式;
[判别式组13]以Thr、Ser、Asn、Glu、Gln、Gly、Ala、Cit、ABA、Val、Met、Ile、Leu、Tyr、Phe、His、Trp、Orn、Lys、Arg作为变数的2个线性1次式;
[判别式组14]以Glu、Gln、ABA、Val、Ile、Phe、Arg作为变数的2个线性1次式;
[判别式组15]以Thr、Glu、Gln、ABA、Ile、Leu、Arg作为变数的2个线性1次式;
[判别式组16]以Thr、Gln、Ala、Cit、ABA、Ile、His、Orn、Arg作为变数的2个分数式。
构成这些多变量判别式组的各多变量判别式可按照本申请人的国际申请即国际公开第2004/052191号中所述的方法、或本申请人的国际申请即国际公开第2006/098192号中所述的方法(后述的多变量判别式制作处理)制作。如果是由这些方法得到的多变量判别式,则不管作为输入数据的氨基酸浓度数据中的氨基酸浓度的单位,该多变量判别式均可适用于癌症的种类的评价。
本发明所述的癌症种类评价装置、癌症评价方法、癌症评价系统、癌症评价程序和记录介质除了上述的实施方案2以外,可以以各种不同的实施方案实施。例如,在上述的实施方案2中说明的各处理中,以自动进行的形式说明的处理的全部或一部分可以是手动进行,以手动进行的形式说明的处理的全部或一部分可以按照公知的方法自动进行。除此之外,除了特别说明的之外,上述文章中或附图中表示的处理顺序、控制顺序、具体名称、各种登录数据以及包括检索条件等的参数的信息、画面例、数据库构成均可任意变更。例如关于癌症种类评价装置100,图示的各构成要素是功能概念性的,物理学上未必是如图示的构成。另外,关于癌症种类评价装置100的各部或各装置所具备的处理功能(特别是通过控制部102进行的各处理功能),可通过CPU(中央处理单元)以及由该CPU解释并运行的程序来实现其全部或任意的一部分,也可以以接线逻辑的硬件的形式实现。
这里,“程序”是通过任意的语言或记述方法记述的数据处理方法,不管其源代码或二进制代码等的形式。“程序”并不限于单一构成,包含多种模块或以库的形式分散构成的程序、或与以OS(操作系统)为代表的个别程序协同来实现其功能的程序。程序记录在记录介质上,根据需要,可以机械读取到癌症种类评价装置100中。关于在各装置中读取记录在记录介质上的程序的具体的构成或读取程序或读取后的安装程序等,可以采用周知的构成或程序。
“记录介质”包含任意的“可移动的物理介质”或任意的“固定的物理介质”或“通信介质”。“可移动的物理介质”是软盘、光磁盘、ROM、EPROM、EEPROM、CD-ROM、MO或DVD等。“固定的物理介质”是内置于各种计算机系统的ROM、RAM或HD等。“通信介质”如经由LAN或WAN或互联网等网络发送程序时的通信线路或载波,是短期保有程序的介质。
最后,参照图22对于在癌症种类评价装置100中进行的多变量判别式制作处理的一个例子进行详细说明。图22是表示多变量判别式制作处理的一个例子的流程图。该多变量判别式制作处理是对于将评价癌症的种类时作为对象的癌症(具体来说,是上述的大肠癌、乳癌、前列腺癌、甲状腺癌、肺癌、胃癌、子宫癌等)汇总得到的数据一并实行。该多变量判别式制作处理可以在管理癌症状态信息的数据库装置400中进行。
本说明中,癌症种类评价装置100是将事先由数据库装置400取得的癌症状态信息保存在癌症状态信息文件106c的规定的存储区域。癌症种类评价装置100是将事先在癌症状态信息指定部102g中指定的包含癌症状态指标数据和氨基酸浓度数据的癌症状态信息保存在指定癌症状态信息文件106d的规定的存储区域。
首先,多变量判别式制作部102h是在候选多变量判别式制作部102h1中,根据规定的公式制作方法,由保存在指定癌症状态信息文件106d的规定的存储区域的癌症状态信息制作候选多变量判别式组,将制作的候选多变量判别式组保存在候选多变量判别式文件106e1的规定的存储区域(步骤SB-21)。具体来说,首先,多变量判别式制作部102h是在候选多变量判别式制作部102h1中,从多种不同的公式制作方法(包含关于主成分分析或判别分析、支持向量机、多重回归分析、逻辑回归分析、k-means法、聚类分析、决策树等的多变量分析的方法)中选择所需的一种,根据所选择的公式制作方法,确定制作的候选多变量判别式组的形式(公式的形式)。接着,多变量判别式制作部102h是在候选多变量判别式制作部102h1中,根据癌症状态信息,运行与所选择的公式选择方法对应的各种(例如平均或分散等)的计算。接着,多变量判别式制作部102h是在候选多变量判别式制作部102h1中,确定计算结果和所确定的候选多变量判别式组的参数。由此,根据所选择的公式制作方法来制作候选多变量判别式组。将多种不同的公式制作方法结合使用、同时并行(并列)地制作候选多变量判别式组时,可以根据每种所选择的公式制作方法,将上述处理并行运行。另外,将多种不同的公式制作方法结合使用、依次制作候选多变量判别式组时,例如可以利用进行主成分分析制作的候选多变量判别式组,变换癌症状态信息,对变换的癌症状态信息进行判别分析,由此制作候选多变量判别式组。
接着,多变量判别式制作部102h是在候选多变量判别式验证部102h2中,根据规定的验证方法,对在步骤SB-21中制作的候选多变量判别式组进行验证(相互验证),将验证结果保存在验证结果文件106e2的规定的存储区域(步骤SB-22)。具体来说,多变量判别式制作部102h是在候选多变量判别式验证部102h2中,根据保存在指定癌症状态信息文件106d的规定的存储区域的癌症状态信息,制作验证候选多变量判别式组时使用的验证用数据,根据制作的验证用数据来验证候选多变量判别式组。在步骤SB-21中结合使用多种不同的公式制作方法,制作多种候选多变量判别式组时,多变量判别式制作部102h是在候选多变量判别式验证部102h2中,对于每种与各公式制作方法对应的候选多变量判别式组,按照规定的验证方法进行验证。这里,在步骤SB-22中,可以根据自举法或保持法、留一法等中的至少一种,对候选多变量判别式组的判别率或灵敏度、特异性、信息量基准等中的至少一种进行验证。由此,可以选择考虑了癌症状态信息或诊断条件的、预测性或可靠性高的候选指标式组。
接着,多变量判别式制作部102h是在变数选择部102h3中,根据规定的变数选择方法,由步骤SB-22中的验证结果选择候选多变量判别式组的变数,由此选择在制作候选多变量判别式组时使用的癌症状态信息中所含的氨基酸浓度数据的组合,将包含所选择的氨基酸浓度数据的组合的癌症状态信息保存在选择癌症状态信息文件106e3的规定的存储区域(步骤SB-23)。在步骤SB-21中,结合使用多种不同的公式制作方法,制作多种候选多变量判别式组,在步骤SB-22中,根据规定的验证方法,对于每种与各公式制作方法对应的候选多变量判别式组进行验证时,在步骤SB-23中,多变量判别式制作部102h是在变数选择部102h3中,对每种与步骤SB-22的验证结果对应的候选多变量判别式组,根据规定的变数选择方法选择候选多变量判别式组的变数。这里,步骤SB-23中,可以根据逐步法、最优路径法、聚类探索法、遗传算法中的至少一种,由验证结果选择候选多变量判别式组的变数。最优路径法是将候选多变量判别式组中所含的变数一个个依次减少,使候选多变量判别式组所赋予的评价指标最佳化,由此选择变数的方法。步骤SB-23中,多变量判别式制作部102h可以是在变数选择部102h3中,根据保存在指定癌症状态信息文件106d的规定的存储区域的癌症状态信息,选择氨基酸浓度数据的组合。
接着,多变量判别式制作部102h判定保存在指定癌症状态信息文件106d的规定的存储区域的癌症状态信息中所含的全部氨基酸浓度数据的组合是否结束,判定结果为“结束”时(步骤SB-24:是),进入下一步骤(步骤SB-25),判定结果为未“结束”时(步骤SB-24:否),返回步骤SB-21。多变量判别式制作部102h判定预先设定的次数是否结束,判定结果为“结束”时(步骤SB-24:是),进入下一步骤(步骤SB-25),判定结果为未“结束”时(步骤SB-24:否),可以返回步骤SB-21。多变量判别式制作部102h判定在步骤SB-23中选择的氨基酸浓度数据的组合与保存在指定癌症状态信息文件106d的规定的存储区域的癌症状态信息中所含的氨基酸浓度数据的组合或在上一步骤SB-23中选择的氨基酸浓度数据的组合是否相同,判定结果为“相同”时(步骤SB-24:是),进入下一步骤(步骤SB-25),判定结果为不“相同”时(步骤SB-24:否),可以返回步骤SB-21。具体来说,验证结果为关于各候选多变量判别式组的评价值时,多变量判别式制作部102h可根据该评价值和与各公式制作方法对应的规定的阀值的比较结果,判定是进入步骤SB-25还是返回步骤SB-21。
接着,多变量判别式制作部102h根据验证结果,从多种候选多变量判别式组中选出用作多变量判别式组的候选多变量判别式组,由此确定多变量判别式组,将确定的多变量判别式组(选出的候选多变量判别式组)保存在多变量判别式文件106e4的规定的存储区域(步骤SB-25)。这里,在步骤SB-25中,例如有从按照相同的公式制作方法制作的候选多变量判别式组中选出最佳的情况,也有从全部的候选多变量判别式组中选出最佳的情况。
至此,对多变量判别式制作处理的说明结束。
实施例1
通过上述的氨基酸分析法,针对确诊为各种癌症患者组的血样以及非癌症组的血样测定血液中氨基酸浓度。氨基酸浓度的单位是nmol/ml。与各种癌症患者和非癌症患者的氨基酸变数的分布相关的箱线图如图23、图24所示。图23表示与男性的各种癌症患者和非癌症患者的氨基酸变数的分布相关的箱线图,图24表示与女性的各种癌症患者和非癌症患者的氨基酸变数的分布相关的箱线图。图23、图24中,横轴表示非癌症组和各种癌症组,图中的ABA表示α-ABA(α-氨基丁酸)。并且,为了进行各种癌症组和非癌症组的判别,对于通过各氨基酸变数进行的各种癌症组和非癌症组的判别,通过一元配置分散分析来进行评价,男性数据中,氨基酸变数Glu、Pro、Val、Leu、Phe、His、Trp、Orn、Lys的p值显示出小于0.05的值,女性数据中,氨基酸变数Asn、Glu、Pro、Cit、ABA、Met、Ile、Leu、Tyr、Phe、His、Arg的p值显示出小于0.05的值(图25)。由此表明,氨基酸变数Asn、Glu、Pro、Cit、ABA、Val、Met、Ile、Leu、Tyr、Phe、His、Trp、Orn、Lys、Arg具有各种癌症组和非癌症组的多组间的判别能力。
实施例2
使用实施例1中使用的样品数据。关于癌症,通过逐步变数选择法的线性判别分析,探索使各种癌症组(大肠癌、乳癌、前列腺癌、甲状腺癌、肺癌)和非癌症组的6组判别性能最大化的指标,以指标式组1的形式得到由年龄、性别(男性=1、女性=2)、Thr、Glu、Gln、Pro、Cit、ABA、Val、Met、Ile、Leu、Tyr、Phe、His、Orn、Lys、Arg构成的线性判别式组(各判别式的年龄、性别、氨基酸变数Thr、Glu、Gln、Pro、Cit、ABA、Val、Met、Ile、Leu、Tyr、Phe、His、Orn、Lys、Arg的系数如图26所示)。
通过判别结果的准确率来评价指标式组1对各种癌症和非癌症(大肠癌、乳癌、前列腺癌、甲状腺癌、肺癌)的诊断性能,结果,非癌症的准确率为64.6%,大肠癌的准确率为44.6%,乳癌的准确率为76.3%,前列腺癌的准确率为80.0%,甲状腺癌的准确率为50.0%,肺癌的准确率为51.6%,关于全体准确率,验前概率分别为16.7%时,显示58.6%的高的判别能力(图27)。图26所示的公式中的各系数的值可以是将其实数倍所得的值,常数项的值可以是对其加减乘除任意的实常数而得到的值。除此之外,还可以得到多个与图26所示的判别式组显示同等的判别能力的判别式组。这些判别式组中所含的变数一览如图28和图29所示。
实施例3
在实施例1中使用的样品数据中,使用了男性数据。关于癌症,通过逐步变数选择法的线性判别分析,探索使各种癌症组(大肠癌、前列腺癌、甲状腺癌、肺癌)和非癌症组的5组判别性能最大化的指标,以指标式组2的形式得到由年龄、Glu、Pro、Cit、ABA、Met、Ile、Leu、Phe、His、Trp、Orn、Lys构成的线性判别式组(各判别式的年龄、氨基酸变数Glu、Pro、Cit、ABA、Met、Ile、Leu、Phe、His、Trp、Orn、Lys的系数如图30所示)。
通过判别结果的准确率来评价指标式组2对各种癌症(大肠癌、前列腺癌、甲状腺癌、肺癌)和非癌症的诊断性能,结果,非癌症的准确率为69.2%,大肠癌的准确率为52.3%,前列腺癌的准确率为50.0%,甲状腺癌的准确率为75.0%,肺癌的准确率为55.7%,关于全体准确率,验前概率分别为20.0%时,显示60.4%的高的判别能力(图31)。图30所示的公式中的各系数的值可以是将其实数倍所得的值,常数项的值可以是对其加减乘除任意的实常数而得到的值。除此之外,还可以得到多个与图30所示的判别式组显示同等的判别能力的判别式组。这些判别式组中所含的变数一览如图32和图33所示。
实施例4
在实施例1中使用的样品数据中,使用了女性数据。关于癌症,通过逐步变数选择法的线性判别分析,探索使各种癌症组(大肠癌、乳癌、甲状腺癌、肺癌)和非癌症组的5组判别性能最大化的指标,以指标式组3的形式得到由年龄、Thr、Glu、Gln、Pro、ABA、Val、Met、Ile、Leu、Phe、His、Arg构成的线性判别式组(各判别式的年龄、氨基酸变数Thr、Glu、Gln、Pro、ABA、Val、Met、Ile、Leu、Phe、His、Arg的系数如图34所示)。
通过判别结果的准确率来评价指标式组3对各种癌症(大肠癌、乳癌、甲状腺癌、肺癌)和非癌症的诊断性能,结果,非癌症的准确率为61.8%,大肠癌的准确率为66.7%,乳癌的准确率为52.6%,甲状腺癌的准确率为66.7%,肺癌的准确率为65.3%,关于全体准确率,验前概率分别为20.0%时,显示61.7%的高的判别能力(图35)。图34所示的公式中的各系数的值可以是将其实数倍所得的值,常数项的值可以是对其加减乘除任意的实常数而得到的值。除此之外,还可以得到多个与图34所示的判别式组显示同等的判别能力的判别式组。这些判别式组中所含的变数一览如图36和图37所示。
实施例5
在实施例1中使用的样品数据中,使用了大肠癌、乳癌、前列腺癌、甲状腺癌、肺癌组的数据。关于癌症,通过逐步变数选择法的线性判别分析,探索使各种癌症组(大肠癌、乳癌、前列腺癌、甲状腺癌、肺癌)的5组判别性能最大化的指标,以指标式组4的形式得到由年龄、性别(男性=1、女性=2)、Thr、Glu、Pro、ABA、Val、Met、Ile、Leu、Phe、His构成的线性判别式组(各判别式的年龄、性别、氨基酸变数Thr、Glu、Pro、ABA、Val、Met、Ile、Leu、Phe、His的系数如图38所示)。
通过判别结果的准确率来评价指标式组4对各种癌症(大肠癌、乳癌、前列腺癌、甲状腺癌、肺癌)的诊断性能,结果,大肠癌的准确率为46.2%,乳癌的准确率为73.7%,前列腺癌的准确率为80.0%,甲状腺癌的准确率为68.8%,肺癌的准确率为45.8%,关于全体准确率,验前概率分别为20.0%时,显示52.1%的高的判别能力(图39)。图38所示的公式中的各系数的值可以是将其实数倍所得的值,常数项的值可以是对其加减乘除任意的实常数而得到的值。除此之外,还可以得到多个与图38所示的判别式组显示同等的判别能力的判别式组。这些判别式组中所含的变数一览如图340和图41所示。
实施例6
在实施例1中使用的样品数据中,使用了男性的大肠癌、前列腺癌、甲状腺癌、肺癌组的数据。关于癌症,通过逐步变数选择法的线性判别分析,探索使各种癌症组(大肠癌、前列腺癌、甲状腺癌、肺癌)的4组判别性能最大化的指标,以指标式组5的形式得到由年龄、Asn、Glu、ABA、Val、Phe、His、Trp构成的线性判别式组(各判别式的年龄、氨基酸变数Asn、Glu、ABA、Val、Phe、His、Trp的系数如图42所示)。
通过判别结果的准确率来评价指标式组5对各种癌症(大肠癌、前列腺癌、甲状腺癌、肺癌)的诊断性能,结果,大肠癌的准确率为52.3%,前列腺癌的准确率为50.0%,甲状腺癌的准确率为75.0%,肺癌的准确率为55.7%,关于全体准确率,验前概率分别为25.0%时,显示51.8%的高的判别能力(图43)。图42所示的公式中的各系数的值可以是将其实数倍所得的值,常数项的值可以是对其加减乘除任意的实常数而得到的值。除此之外,还可以得到多个与图42所示的判别式组显示同等的判别能力的判别式组。这些判别式组中所含的变数一览如图44和图45所示。
实施例7
在实施例1中使用的样品数据中,使用了女性的大肠癌、乳癌、甲状腺癌、肺癌组的数据。关于癌症,通过逐步变数选择法的线性判别分析,探索使各种癌症组(大肠癌、乳癌、甲状腺癌、肺癌)的4组判别性能最大化的指标,以指标式组6的形式得到由年龄、Thr、Glu、Pro、Val、Met、Ile、Leu、His、Arg构成的线性判别式组(各判别式的年龄、氨基酸变数Thr、Glu、Pro、Val、Met、Ile、Leu、His、Arg的系数如图46所示)。
通过判别结果的准确率来评价指标式组6对各种癌症(大肠癌、乳癌、甲状腺癌、肺癌)的诊断性能,结果,大肠癌的准确率为71.4%,乳癌的准确率为52.6%,甲状腺癌的准确率为66.7%,肺癌的准确率为63.3%,关于全体准确率,验前概率分别为25.0%时,显示61.7%的高的判别能力(图47)。图46所示的公式中的各系数的值可以是将其实数倍所得的值,常数项的值可以是对其加减乘除任意的实常数而得到的值。除此之外,还可以得到多个与图46所示的判别式组显示同等的判别能力的判别式组。这些判别式组中所含的变数一览如图48和图49所示。
实施例8
在实施例1中使用的样品数据中,使用了非癌症组、大肠癌、乳癌、前列腺、甲状腺癌组的数据。关于癌症,通过逐步变数选择法的线性判别分析,探索使各种癌症组(大肠癌、乳癌、前列腺癌、甲状腺癌)和非癌症组的5组判别性能最大化的指标,以指标式组7的形式得到由年龄、性别(男性=1、女性=2)、Thr、Glu、Gln、Pro、Cit、ABA、Val、Met、Ile、Leu、Tyr、Phe、Orn、Arg构成的线性判别式组(各判别式的年龄、性别、氨基酸变数Thr、Glu、Gln、Pro、Cit、ABA、Val、Met、Ile、Leu、Tyr、Phe、Orn、Arg的系数如图50所示)。
通过判别结果的准确率来评价指标式组7对各种癌症(大肠癌、乳癌、前列腺癌、甲状腺癌)和非癌症组的诊断性能,结果,非癌症的准确率为67.0%,大肠癌的准确率为58.5%,乳癌的准确率为73.7%,前列腺癌的准确率为80.0%,甲状腺癌的准确率为62.5%,关于全体准确率,验前概率分别为20.0%时,显示66.3%的高的判别能力(图51)。图50所示的公式中的各系数的值可以是将其实数倍所得的值,常数项的值可以是对其加减乘除任意的实常数而得到的值。除此之外,还可以得到多个与图50所示的判别式组显示同等的判别能力的判别式组。这些判别式组中所含的变数一览如图52和图53所示。
实施例9
在实施例1中使用的样品数据中,使用了男性的非癌症组、大肠癌、前列腺癌、甲状腺癌组的数据。关于癌症,通过逐步变数选择法的线性判别分析,探索使各种癌症组(大肠癌、前列腺癌、甲状腺癌)和非癌症组的4组判别性能最大化的指标,以指标式组8的形式得到由年龄、Asn、Glu、ABA、Val、Phe、His、Trp构成的线性判别式组(各判别式的年龄、氨基酸变数Asn、Glu、ABA、Val、Phe、His、Trp的系数如图54所示)。
通过判别结果的准确率来评价指标式组8对各种癌症(大肠癌、前列腺癌、甲状腺癌)和非癌症组的诊断性能,结果,非癌症组的准确率为75.0%,大肠癌的准确率为68.2%,前列腺癌的准确率为70.0%,甲状腺癌的准确率为75.0%,关于全体准确率,验前概率分别为25.0%时,显示72.8%的高的判别能力(图55)。图54所示的公式中的各系数的值可以是将其实数倍所得的值,常数项的值可以是对其加减乘除任意的实常数而得到的值。除此之外,还可以得到多个与图54所示的判别式组显示同等的判别能力的判别式组。这些判别式组中所含的变数一览如图56和图57所示。
实施例10
在实施例1中使用的样品数据中,使用了女性的非癌症组、大肠癌、乳癌、甲状腺癌组的数据。关于癌症,通过逐步变数选择法的线性判别分析,探索使各种癌症组(大肠癌、乳癌、甲状腺癌)和非癌症的4组判别性能最大化的指标,以指标式组9的形式得到由年龄、Thr、Glu、Gln、Pro、ABA、Val、Met、Ile、Phe、Arg构成的线性判别式组(各判别式的年龄、氨基酸变数Thr、Glu、Gln、Pro、ABA、Val、Met、Ile、Phe、Arg的系数如图58所示)。
通过判别结果的准确率来评价指标式组9对各种癌症(大肠癌、乳癌、甲状腺癌)和非癌症组的诊断性能,结果,非癌症组的准确率为68.6%,大肠癌的准确率为71.4%,乳癌的准确率为57.9%,甲状腺癌的准确率为75.0%,关于全体准确率,验前概率分别为25.0%时,显示61.7%的高的判别能力(图59)。图58所示的公式中的各系数的值可以是将其实数倍所得的值,常数项的值可以是对其加减乘除任意的实常数而得到的值。除此之外,还可以得到多个与图58所示的判别式组显示同等的判别能力的判别式组。这些判别式组中所含的变数一览如图60和图61所示。
实施例11
在实施例1中使用的样品数据中,使用了大肠癌、乳癌、前列腺、甲状腺癌组的数据。关于癌症,通过逐步变数选择法的线性判别分析,探索使各种癌症组(大肠癌、乳癌、前列腺癌、甲状腺癌)的4组判别性能最大化的指标,以指标式组10的形式得到由年龄、性别(男性=1、女性=2)、Thr、Glu、Pro、ABA、Val、Met构成的线性判别式组(各判别式的年龄、性别、氨基酸变数TThr、Glu、Pro、ABA、Val、Met的系数如图62所示)。
通过判别结果的准确率来评价指标式组10对各种癌症(大肠癌、乳癌、前列腺癌、甲状腺癌)的诊断性能,结果,大肠癌的准确率为56.9%,乳癌的准确率为71.1%,前列腺癌的准确率为80.0%,甲状腺癌的准确率为75.0%,关于全体准确率,验前概率分别为25.0%时,显示65.1%的高的判别能力(图63)。图62所示的公式中的各系数的值可以是将其实数倍所得的值,常数项的值可以是对其加减乘除任意的实常数而得到的值。除此之外,还可以得到多个与图62所示的判别式组显示同等的判别能力的判别式组。这些判别式组中所含的变数一览如图64和图65所示。
实施例12
在实施例1中使用的样品数据中,使用了男性的大肠癌、前列腺癌、甲状腺癌组的数据。关于癌症,通过逐步变数选择法的线性判别分析,探索使各种癌症组(大肠癌、前列腺癌、甲状腺癌)的3组判别性能最大化的指标,以指标式组11的形式得到由年龄、Cit、ABA、Val、Met构成的线性判别式组(各判别式的年龄、氨基酸变数Cit、ABA、Val、Met的系数如图66所示)。
通过判别结果的准确率来评价指标式组11对各种癌症(大肠癌、前列腺癌、甲状腺癌)的诊断性能,结果,大肠癌的准确率为75.0%,前列腺癌的准确率为80.0%,甲状腺癌的准确率为75.0%,关于全体准确率,验前概率分别为33.3%时,显示75.9%的高的判别能力(图67)。图66所示的公式中的各系数的值可以是将其实数倍所得的值,常数项的值可以是对其加减乘除任意的实常数而得到的值。除此之外,还可以得到多个与图66所示的判别式组显示同等的判别能力的判别式组。这些判别式组中所含的变数一览如图68和图69所示。
实施例13
在实施例1中使用的样品数据中,使用了女性的大肠癌、乳癌、甲状腺癌组的数据。关于癌症,通过逐步变数选择法的线性判别分析,探索使各种癌症组(大肠癌、乳癌、甲状腺癌)的3组判别性能最大化的指标,以指标式组12的形式得到由年龄、Thr、Glu、Pro、Met、Phe构成的线性判别式组(各判别式的年龄、氨基酸变数Thr、Glu、Pro、Met、Phe的系数如图70所示)。
通过判别结果的准确率来评价指标式组12对各种癌症(大肠癌、乳癌、甲状腺癌)的诊断性能,结果,大肠癌的准确率为71.4%,乳癌的准确率为60.5%,甲状腺癌的准确率为83.3%,关于全体准确率,验前概率分别为33.3%时,显示67.6%的高的判别能力(图71)。图70所示的公式中的各系数的值可以是将其实数倍所得的值,常数项的值可以是对其加减乘除任意的实常数而得到的值。除此之外,还可以得到多个与图70所示的判别式组显示同等的判别能力的判别式组。这些判别式组中所含的变数一览如图72和图73所示。
实施例14
通过上述的氨基酸分析法,针对确诊为大肠癌、乳癌的各种癌症患者组的血样、以及非癌症组的血样测定血液中氨基酸浓度。氨基酸浓度的单位是nmol/ml。与各种癌症患者和非癌症患者的氨基酸变数的分布相关的箱线图如图74所示。图74中,横轴表示非癌症组和各种癌症组,图中的ABA表示α-ABA(α-氨基丁酸)。并且,对于通过各氨基酸变数进行的各种癌症组和非癌症组的判别,通过一元配置分散分析进行评价,氨基酸变数Thr、Glu、Cit、Val、Met、Ile、Leu、Phe的p值显示出小于0.05的值(图75),由此表明,氨基酸变数Thr、Glu、Cit、Val、Met、Ile、Leu、Phe具有大肠癌组、乳癌组和非癌症组的3组间的判别能力。
实施例15
使用实施例14中使用的样品数据。进行氨基酸变数的浓度数据基准化。即,得到了实施下述变换:“(各氨基酸变数的浓度数据-各氨基酸变数的浓度平均值)/各氨基酸变数的浓度标准偏差”后的值。使用所得的基准化数据进行主成分分析,在提取各主成分的特性值超过1的主成分时,得到了主成分1至主成分5。其中,以主成分3作为x轴、以主成分4作为y轴制成标图,结果表明,非癌症组和大肠癌组、非癌症组和乳癌组、非癌症组和(大肠癌+乳癌组)、大肠癌和乳癌组分别分离(图76),表明使用氨基酸变数可以相互判别大肠癌组、乳癌组和非癌症组。
实施例16
使用实施例14中使用的样品数据。对氨基酸变数的全部浓度数据、各病例的数值化的分类数据(大肠癌=1、乳癌和非癌症=0,以及乳癌=1、大肠癌和非癌症=0)进行典型相关分析,结果得到了由氨基酸变数的浓度数据的合成变数构成的2组指标式组13。得到的构成典型变数组的各氨基酸变数的系数如图77所示。并且,使用得到的指标式组13进行马氏距离的判别分析,通过判别结果的准确率对大肠癌、乳癌、和非癌症组的诊断性能进行评价,结果,非癌症的准确率为71.4%,大肠癌的准确率为70.0%,乳癌的准确率为80.0%,关于全体准确率,验前概率分别为33.3%时,显示72.6%的高的判别能力(图78)。图77所示的公式中的各系数的值可以是将其实数倍所得的值,常数项的值可以是对其加减乘除任意的实常数而得到的值。
实施例17
使用实施例14中使用的样品数据。关于癌症,通过逐步变数选择法的线性判别分析,探索使大肠癌、乳癌、非癌症组的3组判别性能最大化的指标,以指标式组14的形式得到由Thr、Glu、Gln、a-ABA、Val、Met、Ile、Phe构成的线性判别式组(各判别式的氨基酸变数Thr、Glu、Gln、a-ABA、Val、Met、Ile、Phe的系数如图79所示)。
通过判别结果的准确率来评价指标式组14对大肠癌、乳癌、非癌症组的诊断性能,结果,非癌症组的准确率为69.0%,大肠癌的准确率为72.0%,乳癌的准确率为70.0%,关于全体准确率,验前概率分别为33.3%时,显示70.1%的高的判别能力(图80)。图79所示的公式中的各系数的值可以是将其实数倍所得的值,常数项的值可以是对其加减乘除任意的实常数而得到的值。除此之外,还可以得到多个与图79所示的判别式组显示同等的判别能力的判别式组。这些判别式组中所含的变数一览如图81和图82所示。
实施例18
在实施例14中使用的样品数据中,只使用了女性数据。关于癌症,通过逐步变数选择法的线性判别分析,探索使大肠癌、乳癌、非癌症组的3组判别性能最大化的指标,以指标式组15的形式得到由Thr、Glu、Gln、ABA、Ile、Leu、Arg构成的线性判别式组(各判别式的氨基酸变数Thr、Glu、Gln、ABA、Ile、Leu、Arg的系数如图83所示)。
通过判别结果的准确率来评价指标式组15对大肠癌、乳癌、非癌症组的诊断性能,结果,非癌症组的准确率为69.6%,大肠癌的准确率为80.0%,乳癌的准确率为68.4%,关于全体准确率,验前概率分别为33.3%时,显示70.6%的高的判别能力(图84)。图83所示的公式中的各系数的值可以是将其实数倍所得的值,常数项的值可以是对其加减乘除任意的实常数而得到的值。除此之外,还可以得到多个与图83所示的判别式组显示同等的判别能力的判别式组。这些判别式组中所含的变数一览如图85和图86所示。
实施例19
在实施例14中使用的样品数据中,只使用了女性数据。采用本申请人的国际申请即国际公开第2004/052191号中所述的方法深入研究使大肠癌、乳癌、非癌症组的3组判别性能最大化的指标,在具有同等性能的多个指标当中,得到了由氨基酸变数Thr、Gln、Ala、Cit、ABA、Ile、His、Orn、Arg构成的指标式组16(图87)。
通过判别结果的准确率来评价指标式组16对大肠癌、乳癌、非癌症组的诊断性能,结果,非癌症组的准确率为79.4%,大肠癌的准确率为70.0%,乳癌的准确率为57.4%,关于全体准确率,验前概率分别为33.3%时,显示73.1%的高的判别能力(图88)。图87所示的公式中的各系数的值可以是将其实数倍所得的值,常数项的值可以是对其加减乘除任意的实常数而得到的值。
产业实用性
如上所述,本发明所述的癌症种类的评价方法可在工业上的众多领域、特别是药物或食品、医疗等的领域广泛实施,特别是在进行癌症的病态预测或疾病风险预测等的领域极为有用。

Claims (8)

1.癌症种类的评价方法,其特征在于,该方法包括下述步骤:测定步骤,针对从评价对象采集到的血液测定关于氨基酸浓度值的氨基酸浓度数据;
浓度值基准评价步骤,根据在上述测定步骤中测定的上述评价对象的上述氨基酸浓度数据中所含的Glu、ABA、Val、Met、Pro、Phe、Thr、Ile、Leu、His中的至少一种氨基酸的上述浓度值,对于上述评价对象评价癌症的种类。
2.权利要求1所述的癌症种类的评价方法,其特征在于,上述浓度值基准评价步骤进一步包括下述浓度值基准判别步骤:根据在上述测定步骤中测定的上述评价对象的上述氨基酸浓度数据中所含的Glu、ABA、Val、Met、Pro、Phe、Thr、Ile、Leu、His中的至少一种氨基酸的上述浓度值,对于上述评价对象,从大肠癌、乳癌、前列腺癌、甲状腺癌、肺癌、胃癌、子宫癌中的至少2种上述癌症中判别其是哪一种上述癌症。
3.权利要求2所述的癌症种类的评价方法,其特征在于,上述浓度值基准判别步骤是对于上述评价对象,从大肠癌、乳癌、前列腺癌、甲状腺癌、肺癌中的至少3种上述癌症中判别其是哪一种上述癌症。
4.权利要求1所述的癌症种类的评价方法,其特征在于,上述浓度值基准评价步骤进一步包括下述步骤:
判别值计算步骤,根据在上述测定步骤中测定的上述评价对象的上述氨基酸浓度数据中所含的Glu、ABA、Val、Met、Pro、Phe、Thr、Ile、Leu、His中的至少一种氨基酸的上述浓度值以及以上述氨基酸的浓度为变数的预先设定的由1个或多个多变量判别式构成的多变量判别式组,通过构成该多变量判别式组的每个上述多变量判别式,计算该多变量判别式的值即判别值;
判别值基准评价步骤,根据由在上述判别值计算步骤中算出的1个或多个上述判别值构成的判别值组,对于上述评价对象评价上述癌症的种类,
构成上述多变量判别式组的各上述多变量判别式含有Glu、ABA、Val、Met、Pro、Phe、Thr、Ile、Leu、His中的至少一种氨基酸作为上述变数。
5.权利要求4所述的癌症种类的评价方法,其特征在于,上述判别值基准评价步骤进一步包括下述判别值基准判别步骤:根据上述判别值组,对于上述评价对象,从大肠癌、乳癌、前列腺癌、甲状腺癌、肺癌、胃癌、子宫癌中的至少2种上述癌症中判别其是哪一种上述癌症。
6.权利要求5所述的癌症种类的评价方法,其特征在于,上述判别值基准判别步骤是对于上述评价对象,从大肠癌、乳癌、前列腺癌、甲状腺癌、肺癌中的至少3种上述癌症中判别其是哪一种上述癌症。
7.权利要求6所述的癌症种类的评价方法,其特征在于,构成上述多变量判别式组的各上述多变量判别式为:分数式、逻辑回归式、线性判别式、多重回归式、由支持向量机制作的公式、由马氏距离法制作的公式、由典型判别分析制作的公式、由决策树制作的公式的任意一种。
8.权利要求7所述的癌症种类的评价方法,其特征在于,上述多变量判别式组为下述的判别式组1~16的任意一组:
判别式组1:以年龄、性别、Thr、Glu、Gln、Pro、Cit、ABA、Val、Met、Ile、Leu、Tyr、Phe、His、Orn、Lys、Arg作为上述变数的5个线性1次式;
判别式组2:以年龄、Glu、Pro、Cit、ABA、Met、Ile、Leu、Phe、His、Trp、Orn、Lys作为上述变数的4个线性1次式;
判别式组3:以年龄、Thr、Glu、Gln、Pro、ABA、Val、Met、Ile、Leu、Phe、His、Arg作为上述变数的4个线性1次式;
判别式组4:以年龄、性别、Thr、Glu、Pro、ABA、Val、Met、Ile、Leu、Phe、His作为上述变数的4个线性1次式;
判别式组5:以年龄、Asn、Glu、ABA、Val、Phe、His、Trp作为上述变数的3个线性1次式;
判别式组6:以年龄、Thr、Glu、Pro、Val、Met、Ile、Leu、His、Arg作为上述变数的3个线性1次式;
判别式组7:以年龄、性别、Thr、Glu、Gln、Pro、Cit、ABA、Val、Met、Ile、Leu、Tyr、Phe、Orn、Arg作为上述变数的4个线性1次式;
判别式组8:以年龄、Asn、Glu、ABA、Val、Phe、His、Trp作为上述变数的3个线性1次式;
判别式组9:以年龄、Thr、Glu、Gln、Pro、ABA、Val、Met、Ile、Phe、Arg作为上述变数的3个线性1次式;
判别式组10:以年龄、性别、Thr、Glu、Pro、ABA、Val、Met作为上述变数的3个线性1次式;
判别式组11:以年龄、Cit、ABA、Val、Met作为上述变数的2个线性1次式;
判别式组12:以年龄、Thr、Glu、Pro、Met、Phe作为上述变数的2个线性1次式;
判别式组13:以Thr、Ser、Asn、Glu、Gln、Gly、Ala、Cit、ABA、Val、Met、Ile、Leu、Tyr、Phe、His、Trp、Orn、Lys、Arg作为上述变数的2个线性1次式;
判别式组14:以Glu、Gln、ABA、Val、Ile、Phe、Arg作为上述变数的2个线性1次式;
判别式组15:以Thr、Glu、Gln、ABA、Ile、Leu、Arg作为上述变数的2个线性1次式;
判别式组16:以Thr、Gln、Ala、Cit、ABA、Ile、His、Orn、Arg作为上述变数的2个分数式。
CN2009801083545A 2008-03-04 2009-03-04 癌症种类的评价方法 Pending CN101960310A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2008054114 2008-03-04
JP2008-054114 2008-03-04
PCT/JP2009/054091 WO2009110517A1 (ja) 2008-03-04 2009-03-04 癌種の評価方法

Publications (1)

Publication Number Publication Date
CN101960310A true CN101960310A (zh) 2011-01-26

Family

ID=41056070

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2009801083545A Pending CN101960310A (zh) 2008-03-04 2009-03-04 癌症种类的评价方法

Country Status (5)

Country Link
US (1) US20110091924A1 (zh)
JP (1) JPWO2009110517A1 (zh)
KR (1) KR101361601B1 (zh)
CN (1) CN101960310A (zh)
WO (1) WO2009110517A1 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107884491A (zh) * 2017-11-07 2018-04-06 苏州纳葛诺斯生物科技有限公司 胃癌氨基酸标志物组合、筛选方法及其在胃癌诊断中的应用
CN109307774A (zh) * 2018-10-31 2019-02-05 中国药科大学 一种氨基酸、二肽或其组合物在大肠癌早期诊断方面的应用

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008016111A1 (en) 2006-08-04 2008-02-07 Ajinomoto Co., Inc. Method for evaluation of lung cancer, lung cancer evaluation apparatus, lung cancer evaluation method, lung cancer evaluation system, lung cancer evaluation program, and recording medium
EP2103940A4 (en) 2006-12-21 2013-04-24 Ajinomoto Kk METHOD, APPARATUS, METHOD, SYSTEM AND SOFTWARE FOR ASSESSING BREAST CANCER, AND RECORDING MEDIUM
JP5746811B2 (ja) 2006-12-21 2015-07-08 味の素株式会社 大腸癌の評価方法、ならびに大腸癌評価装置、大腸癌評価方法、大腸癌評価システム、大腸癌評価プログラムおよび記録媒体
CN103760367B (zh) * 2006-12-21 2017-03-01 味之素株式会社 评估癌症状态的方法、癌症评估装置、癌症评估方法、癌症评估系统、癌症评估程序和记录介质
JP5976987B2 (ja) * 2008-02-06 2016-08-24 味の素株式会社 胃癌の評価方法、ならびに胃癌評価装置、胃癌評価方法、胃癌評価システム、胃癌評価プログラム、記録媒体および情報通信端末装置
CN104330571B (zh) 2008-06-20 2017-09-08 味之素株式会社 前列腺疾病的评价方法
CN102057276B (zh) * 2008-06-20 2016-04-06 味之素株式会社 女性生殖器癌症的评价方法
CN108872579A (zh) * 2010-06-01 2018-11-23 梅坦诺米克斯保健有限公司 用于在受试者中诊断胰腺癌的工具和方法
WO2014084290A1 (ja) * 2012-11-27 2014-06-05 味の素株式会社 膵臓癌の評価方法、膵臓癌評価装置、膵臓癌評価方法、膵臓癌評価プログラム、膵臓癌評価システムおよび情報通信端末装置
KR101462206B1 (ko) 2013-06-26 2014-11-20 한국과학기술연구원 트립토판 대사 변화를 이용한 위암 진단용 기초 정보 제공 방법
JPWO2018066621A1 (ja) 2016-10-04 2019-07-18 味の素株式会社 大腸癌の評価方法、評価装置、評価プログラム、評価システム、及び端末装置
JPWO2018066620A1 (ja) * 2016-10-04 2019-07-18 味の素株式会社 膵臓癌の評価方法、評価装置、評価プログラム、評価システム、及び端末装置
WO2018101450A1 (ja) 2016-12-01 2018-06-07 味の素株式会社 癌モニタリングの方法、算出方法、評価装置、算出装置、評価プログラム、算出プログラム、評価システム、及び端末装置

Family Cites Families (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06105257B2 (ja) * 1984-08-07 1994-12-21 協和メデックス株式会社 癌の測定用キット
US6059724A (en) * 1997-02-14 2000-05-09 Biosignal, Inc. System for predicting future health
US6300136B1 (en) * 1997-09-03 2001-10-09 The Trustees Of The University Of Pennsylvania Methods for diagnosis and treatment of tumors in humans
JP2001004632A (ja) * 1999-06-18 2001-01-12 Wako Pure Chem Ind Ltd 糖鎖構造の変異した癌胎児性抗原類の検出方法
KR100686910B1 (ko) * 2002-12-09 2007-02-26 아지노모토 가부시키가이샤 생체 상태 정보 처리 장치, 생체 상태 정보 처리 방법, 생체 상태 정보 관리 시스템 및 기록 매체
US7869033B2 (en) * 2003-12-24 2011-01-11 Vadivel Masilamani Cancer detection by optical analysis of body fluids
US20060170928A1 (en) * 2003-12-24 2006-08-03 Vadivel Masilamani Masila's cancer detector based on optical analysis of body fluids
US8173433B2 (en) * 2004-08-02 2012-05-08 Vermillion, Inc. Platelet biomarkers for cancer
EP1862797A4 (en) * 2005-03-16 2009-09-16 Ajinomoto Kk DEVICE, METHOD, SYSTEM AND PROGRAM FOR EVALUATING BIOLOGICAL STATES, DEVICE, METHOD AND PROGRAM FOR GENERATING AN EVALUATION FUNCTION AND RECORDING MEDIUM
EP1937837A2 (en) * 2005-07-29 2008-07-02 Siemens Healthcare Diagnostics Inc. Methods and kits for the prediction of therapeutic success, recurrence free and overall survival in cancer therapies
US20100004871A1 (en) * 2005-12-27 2010-01-07 Power3 Medical Products, Inc. Identities, specificities, and use of twenty two (22) differentially expressed protein biomarkers for blood based diagnosis of breast cancer
JP5612303B2 (ja) * 2006-03-24 2014-10-22 フェノメノーム ディスカバリーズ インク 患者における前立腺癌の健康状態等を判定するためにデータを得る方法
WO2008016111A1 (en) * 2006-08-04 2008-02-07 Ajinomoto Co., Inc. Method for evaluation of lung cancer, lung cancer evaluation apparatus, lung cancer evaluation method, lung cancer evaluation system, lung cancer evaluation program, and recording medium
US20090075284A1 (en) * 2006-09-19 2009-03-19 The Regents Of The University Of Michigan Metabolomic profiling of prostate cancer
JP5746811B2 (ja) * 2006-12-21 2015-07-08 味の素株式会社 大腸癌の評価方法、ならびに大腸癌評価装置、大腸癌評価方法、大腸癌評価システム、大腸癌評価プログラムおよび記録媒体
CN103760367B (zh) * 2006-12-21 2017-03-01 味之素株式会社 评估癌症状态的方法、癌症评估装置、癌症评估方法、癌症评估系统、癌症评估程序和记录介质
EP2103940A4 (en) * 2006-12-21 2013-04-24 Ajinomoto Kk METHOD, APPARATUS, METHOD, SYSTEM AND SOFTWARE FOR ASSESSING BREAST CANCER, AND RECORDING MEDIUM
AU2008210207B2 (en) * 2007-02-01 2014-05-15 Med-Life Discoveries Lp Methods for the diagnosis of ovarian cancer health states and risk of ovarian cancer health states
JP5976987B2 (ja) * 2008-02-06 2016-08-24 味の素株式会社 胃癌の評価方法、ならびに胃癌評価装置、胃癌評価方法、胃癌評価システム、胃癌評価プログラム、記録媒体および情報通信端末装置
CN102057276B (zh) * 2008-06-20 2016-04-06 味之素株式会社 女性生殖器癌症的评价方法
CN104330571B (zh) * 2008-06-20 2017-09-08 味之素株式会社 前列腺疾病的评价方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107884491A (zh) * 2017-11-07 2018-04-06 苏州纳葛诺斯生物科技有限公司 胃癌氨基酸标志物组合、筛选方法及其在胃癌诊断中的应用
CN109307774A (zh) * 2018-10-31 2019-02-05 中国药科大学 一种氨基酸、二肽或其组合物在大肠癌早期诊断方面的应用

Also Published As

Publication number Publication date
KR20110079870A (ko) 2011-07-11
JPWO2009110517A1 (ja) 2011-07-14
KR101361601B1 (ko) 2014-02-12
US20110091924A1 (en) 2011-04-21
WO2009110517A1 (ja) 2009-09-11

Similar Documents

Publication Publication Date Title
CN101939652B (zh) 胃癌的评价方法、以及胃癌评价装置、胃癌评价方法、胃癌评价系统、胃癌评价程序和记录介质
CN101960310A (zh) 癌症种类的评价方法
CN102057276B (zh) 女性生殖器癌症的评价方法
CN103760367B (zh) 评估癌症状态的方法、癌症评估装置、癌症评估方法、癌症评估系统、癌症评估程序和记录介质
CN102066946A (zh) 前列腺疾病的评价方法
JP5470848B2 (ja) 肺癌の評価方法、肺癌評価装置、肺癌評価方法、肺癌評価システム、肺癌評価プログラム、記録媒体、および、情報通信端末装置
JP2013257350A (ja) 大腸癌の評価方法、ならびに大腸癌評価装置、大腸癌評価方法、大腸癌評価システム、大腸癌評価プログラムおよび記録媒体
JP5746810B2 (ja) 乳癌の評価方法、ならびに乳癌評価装置、乳癌評価方法、乳癌評価システム、乳癌評価プログラムおよび記録媒体
CN102326084A (zh) 肥胖的评价方法
KR20170132303A (ko) 평가 방법, 평가 장치, 평가 프로그램 제품, 평가 시스템, 및 단말 장치
WO2016148155A1 (ja) 評価方法、評価装置、評価プログラム、評価システム、及び端末装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20110126