CN102171697A - 用于个性化行动计划的方法和系统 - Google Patents

用于个性化行动计划的方法和系统 Download PDF

Info

Publication number
CN102171697A
CN102171697A CN2009801371928A CN200980137192A CN102171697A CN 102171697 A CN102171697 A CN 102171697A CN 2009801371928 A CN2009801371928 A CN 2009801371928A CN 200980137192 A CN200980137192 A CN 200980137192A CN 102171697 A CN102171697 A CN 102171697A
Authority
CN
China
Prior art keywords
individuality
individual
gci
grade
risk
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2009801371928A
Other languages
English (en)
Inventor
S·M·穆尔
M·A·尼伦伯格
S·E·乔治
L·A·戈默
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Navigenics Inc
Original Assignee
Navigenics Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Navigenics Inc filed Critical Navigenics Inc
Publication of CN102171697A publication Critical patent/CN102171697A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/10Ploidy or copy number detection
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/20Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H70/00ICT specially adapted for the handling or processing of medical references
    • G16H70/20ICT specially adapted for the handling or processing of medical references relating to practices or guidelines
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H20/00ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance
    • G16H20/10ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance relating to drugs or medications, e.g. for ensuring correct administration to patients
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H20/00ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance
    • G16H20/30ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance relating to physical therapies or activities, e.g. physiotherapy, acupressure or exercising
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H20/00ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance
    • G16H20/60ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance relating to nutrition control, e.g. diets
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Medical Informatics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Analytical Chemistry (AREA)
  • Molecular Biology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Biotechnology (AREA)
  • Evolutionary Biology (AREA)
  • Public Health (AREA)
  • Chemical & Material Sciences (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Epidemiology (AREA)
  • Primary Health Care (AREA)
  • Biomedical Technology (AREA)
  • Bioethics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Pathology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Medical Treatment And Welfare Office Work (AREA)

Abstract

本发明提供了基于个体基因组谱生成个性化行动计划的方法和系统。所述方法包括评价个体基因型与至少一种疾病或病症间的关联,以及提供对于个体的行动计划的分级系统。本文也公开了促进和鼓励人们改善其健康的激励。

Description

用于个性化行动计划的方法和系统
相关申请的交叉引用
本申请要求于2008年8月8日提交的美国临时申请No.61/087,586的优先权,将该申请的全部内容引入本文作为参考。
技术背景
基因组的遗传变异,例如单核苷酸多态性(SNPs)、突变、缺失、插入、重复、微卫星等,与多种表型例如疾病或病症有关。可识别和关联个体的遗传变异来确定个体对不同表型的倾向,形成个性化的表型谱。
个体表型谱能够个性化地评估个体具有某种表型的几率或可能性,并且个体为了减少或提高特定病症的风险,可能对医疗以及生活方式的选择感兴趣。个体可受益于整合了个体基因组谱的个性化行动计划,该个性化行动计划还可包括非遗传因素(例如过去和当前的环境)及生活方式因素。
因此,个性化的行动计划为个体或其保健管理者提供了定制的方法,使其在促进其健康方面做出明智和合适的选择。因此,需要为个体及其保健管理者提供整合了个体基因组谱的系统,使他们将合适的医疗和生活方式上的选择做成易于遵循的行动计划,并且该系统可任选地包括促使个体遵循其个性化的行动计划的激励。本文公开的实施方式满足这些需求并且也具有相关的优势。
发明概述
本发明提供了基于个体基因组谱生成个性化行动计划的方法和系统。本文还提供了促使个体采取更加健康的生活方式的方法和系统,包括促进个体执行其行动计划的方法。
本文说明了对个性化行动计划中的各种建议进行分级的分级系统。等级可由计算机生成或确定。各等级相应于给予个体的等级,其中给予个体的等级基于个体的基因组谱。给予个体的等级可基于个体的遗传综合指数(Genetic Composite Index,GCI))或GCI Plus评分。在一些实施方式中,等级根据计算机确定的GCI或GCI Plus评分,由计算机生成。然后计算机给个体或个体的保健管理者输出该等级。基因组谱可通过使用高密度DNA微阵列、基于PCR的方法(例如实时PCR)或其组合扩增个体的遗传样品而获得。
等级可以是数字、颜色、字母或其组合,也可以是各种建议,例如但不局限于一种或多种非药物建议。非药物建议可以是锻炼方案、锻炼活动、饮食计划或其组合。非药物建议也可以是营养物,例如食物、维生素的种类等。另外,等级可以是由二元系统代表的分级系统的一部分,例如等级可以是两个代号(designation)中的其中之一。
本文还公开了给个体提供个性化行动计划中的建议的等级的方法,包括获得个体的基因组谱,确定个体的至少一个等级,其中该等级基于基因组谱。在一些实施方式中,给个体提供个性化行动计划中的建议的等级的方法包括生成个体的GCI或GCI Plus评分,确定个体的至少一个等级,其中该等级基于GCI或GCI Plus评分。
本文还提供了促使个体改善其健康的方法,包括获得所述个体的基因组谱,形成个体的个性化行动计划,关联对个体的至少一项激励与个性化行动计划中建议的完成,以及当完成该建议时给予个体该项激励。在一些实施方式中,促使个体改善其健康的方法包括:获得所述个体的基因组谱,形成个体的至少一个GCI或GCI Plus评分,关联对个体的至少一项激励与至少一个GCI或GCI Plus评分的改善,以及当出现改善时给予个体该项激励。在一些实施方式中,个性化行动计划由计算机生成或确定。例如,计算机可生成个体的GCI或GCI Plus评分,然后用该GCI或GCI Plus评分生成个性化行动计划。然后可由计算机输出个性化行动计划给个体或个体的保健管理者。
在一些实施方式中,激励由雇主、朋友或家庭成员提供。因此,在一些实施方式中,个体是雇员,激励可以是所述个体的雇主对其健康储蓄账户的捐助、额外的假期或提高雇主对所述个体的医疗计划的津贴。
激励也可以是现金、药品、保健品、健身俱乐部会员资格、医疗随访、医疗器械、更新的GCI或GCI Plus评分、更新的个性化行动计划或在线社区会员资格。在一些实施方式中,激励可以是对药品、保健品、健身俱乐部会员资格、医疗随访、医疗器械、更新的GCI或GCI Plus评分、更新的个性化行动计划或在线社区会员资格的折扣、津贴或报销。在其它实施方式中,激励是经在线社区获得的支持。
引入的参考内容
在说明书中提及的所有出版物、专利和专利申请在此引入作为参考,正如各单个出版物、专利或专利申请特别地和单独地引入作为参考一样。
附图说明
本文公开的实施方式的新颖的特征在权利要求中详细说明。参照下列利用了本发明原理的示例性实施方式的详细说明和附图可以更好地理解本发明的特征和优势,在附图中:
图1是克罗恩氏病的接受者操作特征(ROC)曲线的曲线图。下面的线对应于随机期望值,上面的线对应于当已知遗传变异时的理论期望值。第一中间线对应于GCI,第二中间线对应于通过逻辑回归获得的曲线。
图2是II型糖尿病的ROC曲线图。下面的线对应于随机期望值,上面的线对应于当已知遗传变异时的理论期望值。第一中间线对应于GCI,第二中间线对应于通过逻辑回归获得的曲线。
图3是类风湿性关节炎的ROC曲线图。下面的线对应于随机期望值,上面的线对应于当已知遗传变异时的理论期望值。第一中间线对应于GCI,第二中间线对应于通过逻辑回归获得的曲线。
图4表示根据个体基因组谱的个体分级系统。A)表示易患结肠癌和糖尿病的个体的个性化行动计划中的食物等级;B)表示使用该分级系统的没有小圆面包(bun)的普通汉堡(plain burger);C)表示使用了该分级系统的西兰花;D)表示使用了该分级系统的苹果。
图5为用于分析和通过网络传输基因组谱和表型谱以及个性化行动计划的系统的图解。
具体实施方式
本发明公开了基于个体基因组谱生成个性化行动计划的方法和系统。本发明还提供了促使个体采取更加健康的生活方式的方法和系统,包括促进个体执行其行动计划的方法。
基因组谱
个体基因组谱包括有关基于遗传变异或遗传标记的个体基因的信息。遗传变异可形成基因型,基因型组成基因组谱。这些遗传变异或者遗传标记包括,但不限于单核苷酸多态性、单和/或多核苷酸重复、单和/或多核苷酸缺失、微卫星重复(通常具有5~1000个重复单元的小量核苷酸重复)、二核苷酸重复、三核苷酸重复、序列重排(包括易位和复制)、拷贝数变异(在特定基因座上的缺失和增加)等。其它遗传变异包括染色体复制和易位以及着丝粒重复和端粒重复。
基因型也可以包括单体型和二倍体型。在一些实施方式中,基因组谱可以具有至少100000、300000、500000或者1000000个基因型。在一些实施方式中,基因组谱基本上可以是个体的完整基因组序列。在其它实施方式中,基因组谱为个体完整基因组序列的至少60%、80%或者95%。基因组谱可以为接近100%的个体完整基因组序列。包含靶标的遗传样品包括,但不限于未扩增的基因组DNA或RNA样品或者扩增的DNA(或cDNA)。靶标可以为包含特别感兴趣的遗传标记的基因组DNA的特定区域。
为获得基因组谱,可从个体的生物样品中分离个体遗传样品。生物样品包括可从中分离遗传物质例如RNA和/或DNA的样品。这些生物样品包括,但不限于血液、头发、皮肤、唾液、精液、尿、粪便物质、汗液、面颊(buccal)和各种身体组织。组织样品可以由个体直接采集,例如,面颊样品可以由个体用拭子拭抹其颊部内侧而获得。例如唾液、精液、尿、粪便物质或者汗液的其它样品也可以由个体本人提供。其它生物样品可以由医护人员(例如静脉切开医师、护士或者医生)提取。例如,血液样品可以由护士从个体抽取。组织活检可以由医护人员进行,并且医护人员也易于得到商业化套装(kit)以有效地获得样品。可以移取小的柱面皮肤样品或者可以使用针移取小的组织或流体样品。
也可给个体提供样品收集套装。套装可含有用于收集个体生物样品的样品收集容器。套装也可以提供个体直接采集其自身样品的说明书,例如需提供多少头发、尿、汗液或者唾液。套装也可以包括个体要求由医护人员采集组织样品的说明书。套装可以包括可由第三方采集样品的场所,例如可以将套装提供给随后从个体采集样品的医疗机构。套装还可以提供用于将样品递送至样品处理机构的返回包装,在该机构中从生物样品中分离遗传物质。
可以按照一些公知生物化学和分子生物学方法中的任何一种方法从生物样品中分离DNA或RNA的遗传样品,参见例如Sambrook等人,分子克隆:实验室手册(Molecular Cloning:A Laboratory Manual)(冷泉港实验室,纽约)(1989)。也有一些用于从生物样品中分离DNA或RNA的市售的试剂盒和试剂,例如但不限于从DNAGenotek、Gentra Systems、Qiagen、Ambion和其它供应商获得的试剂盒和试剂。面颊样品试剂盒是很容易商购获得的,例如得自Epicentre Biotechnologies的MasterAmpTM Buccal Swab DNA提取试剂盒,同样还有从血液样品中提取DNA的试剂盒,例如得自Sigma Aldrich的Extract-N-AmpTM。源自其它组织的DNA可以通过用蛋白酶和热消化组织、离心样品和使用苯酚-氯仿萃取不需要的物质、将DNA留在水相中而获得。然后可以用乙醇沉淀法进一步分离DNA。
例如,基因组DNA可使用购自DNA Genotek的DNA自收集试剂盒从唾液中分离。个体可以使用该试剂盒收集用于临床处理的唾液标本,样品可以方便地在室温下存储和运输。在将样品运送至适当的进行处理的实验室之后,通过样品的热变性和蛋白酶消化(通常使用由采集试剂盒供应商提供的试剂在50℃下处理至少一小时)分离DNA。随后,对样品进行离心,并且对上清液进行乙醇沉淀。将DNA沉淀物悬浮在适合用于后续分析的缓冲液中。
RNA可用作遗传样品,例如可从mRNA确定表达的遗传变异。mRNA包括但不限于前mRNA转录物、转录物加工中间体、准备用于一个或多个基因的翻译和转录的成熟mRNA或者源自mRNA转录物的核酸。转录物加工可以包括剪接、编辑和降解。当用于本文时,源自mRNA转录物的核酸是指mRNA转录物或其子序列最终充当其合成模板的核酸。因此,由mRNA反转录的cDNA、从cDNA扩增的DNA、从扩增的DNA转录的RNA等都源自mRNA转录物。可以使用本领域已知的方法从几种身体组织中的任意一种分离RNA,例如使用从PreAnalytiX获得的PAXgeneTM血液RNA系统从未分级的(unfractionated)全血中分离RNA。典型地,mRNA用于逆转录cDNA,cDNA随后被使用或进行扩增以用于基因变异分析。
在基因组谱分析之前,可以由DNA或由RNA逆转录得到的cDNA扩增遗传样品。可以通过多种方法扩增DNA,这些方法中的许多使用了PCR。参见例如,PCR Technology:Principles and Applications for DNA Amplification(Ed.H.A.Erlich,Freeman Press,NY,N.Y.,1992);PCR Protocols:A Guide to Methods and Applications(Eds.Innis等人,Academic Press,San Diego,Calif.,1990);Mattila等人,Nucleic Acids Res.19,4967(1991);Eckert等人,PCR Methods and Applications 1,17(1991);PCR(Eds.McPherson等人,IRL Press,Oxford);和美国专利第4,683,202、4,683,195、4,800,159、4,965,188和5,333,675号,上述各文献在此以其全部内容并入作为参考。
其它适合的扩增方法包括连接酶链反应(LCR)(例如,Wu和Wallace,Genomics,4,560(1989),Landegren等人,Science,241,1077(1988)以及Barringer等人,Gene,89:117(1990))、转录扩增(Kwoh等人,Proc.Natl.Acad.Sci.USA 86:1173-1177(1989)和WO88/10315)、自主序列复制(Guatelli等人,Proc.Nat.Acad.Sci.USA,87:1874-1878(1990)和WO90/06995)、靶多核苷酸序列的选择性扩增(美国专利第6,410,276号)、共有序列引物聚合酶链式反应(CP-PCR)(美国专利第4,437,975号)、任意引物聚合酶链式反应(AP-PCR)(美国专利第5,413,909、5,861,245号)、基于核酸序列的扩增(NABSA)、滚环扩增(RCA)、多重置换扩增(MDA)(美国专利第6,124,120和6,323,009号)和环至环扩增(circle-to-circle amplification)(C2CA)(Dahl等人,Proc.Natl.Acad.Sci 101:4548-4553(2004))。(参见美国专利第5,409,818、5,554,517和6,063,603号,上述各文献在此并入作为参考)。在美国专利第5,242,794、5,494,810、5,409,818、4,988,617、6,063,603和5,554,517号以及美国专利申请第09/854,317号中描述了可以使用的其它扩增方法,上述各文献在此并入作为参考。
基因组谱可使用这些方法中的任意一种生成。本领域已知用以鉴定遗传变异的几种方法,并且这些方法包括,但不限于通过几种方法中的任意一种进行的DNA测序、基于PCR的方法、片断长度多态性分析(限制片段长度多态性(RFLP)、裂解片段长度多态性(CFLP))、使用等位基因特异性寡核苷酸作为模板的杂交方法(例如,在本文中进一步说明的TaqMan测试法和微阵列)、使用引物延伸反应的方法、质谱分析法(例如MALDI-TOF/MS法)等,例如在Kwok,Pharmocogenomics 1:95-100(2000)中所述的方法。其它方法包括侵入物方法(invader method),例如单丛(monoplex)和双丛(biplex)侵入分析方法(例如可得自Third Wave Technologies,Madison,WI,并在Nucl.Acids Res.30:e53(Olivier等人,2002)中有说明)
例如,高密度DNA阵列可用于生成基因组谱。这些阵列可从Affymetrix和Illumina购得(参见Affymetrix
Figure BPA00001331512900071
500K AssayManual,Affymetrix,Santa Clara,CA(并入作为参考);
Figure BPA00001331512900072
humanHap650Y基因分型微珠芯片(genotyping beadchip),Illumina,San Diego,CA)。高密度阵列可用于生成包含SNPs遗传变异的基因组谱。例如,可以使用Affymetrix Genome Wide Human SNP Array 6.0通过对超过900,000个SNP进行基因分型以生成SNP分布图。或者,可以通过使用Affymetrix GeneChip Human Mapping 500K Array Set确定经过全基因组采样分析的超过500,000个SNP。在这些分析方法中,人类基因组的子集使用限制性内切酶消化的、接头连接的人基因组DNA通过单引物扩增反应进行扩增。典型地,然后断裂扩增的DNA,测定样品质量,之后变性和标记样品以用于在涂覆的石英表面上特定位置与包含DNA探针的微阵列进行杂交。监测随扩增的DNA序列变化的与各探针杂交的标记物的量,从而产生序列信息和最终的SNP基因分型。
本领域已知高密度阵列的使用,如果商购获得,可根据制造商的指导进行。例如,使用Affymetrix GeneChip可涉及用NspI或StyI限制性内切酶消化分离的基因组DNA。然后消化的DNA与分别与NspI或StyI限制酶切的DNA退火的NspI或StyI接头寡核苷酸连接。然后连接后的包含接头的DNA通过PCR进行扩增以产生在约200至1100个碱基对之间的扩增DNA片段,这由凝胶电泳所证实。符合扩增标准的PCR产物进行纯化和定量以进行片段化。PCR产物用DNase I进行断裂以达到最佳的DNA芯片杂交。断裂之后,DNA片段应小于250个碱基对,并且平均为约180个碱基对,这通过凝胶电泳证实。然后使用末端脱氧核苷酰转移酶以生物素化合物标记符合片段化标准的样品。接着将标记的片段变性,而后杂交到GeneChip250K阵列中。杂交之后,在扫描前按三步法对阵列进行染色,所述的三步法由下列步骤组成:链霉抗生物素蛋白藻红蛋白(SAPE)染色,随后是利用生物素化的抗链霉抗生物素蛋白抗体(山羊)的抗体扩增步骤,和用链霉抗生物素蛋白藻红蛋白(SAPE)的最终染色。在标记之后,阵列用阵列保持缓冲液覆盖,然后用例如Affymetrix GeneChipScanner 3000的扫描仪进行扫描。
在扫描高密度阵列后,可根据制造商的指导进行数据分析。例如,使用Affymetrix GeneChip时,可使用GeneChip操作软件(GCOS)或Affymetrix GeneChip Command ConsoleTM获得原始数据。获得初始数据后用GeneChip基因分型分析软件(GTYPE)进行分析。可排除GTYPE检出率(call rate)小于某个百分比的样品。例如,可排除小于约70、75、80、85、90或95%的检出率。然后用BRLMM和/或SNiPer算法分析对样品进行检验。排除BRLMM检出率小于95%或者SNiPer检出率小于98%的样品。最终,进行关联分析,并且排除SNiPer质量指数小于0.45和/或哈迪-温伯格p-值小于0.00001的样品。
作为DNA微阵列分析的替代或者除了DNA微阵列分析外,可以通过其它基于杂交的方法,例如使用TaqMan方法及其变型来检测遗传变异,例如SNPs和突变。TaqMan PCR、反复TaqMan和实时PCR(RT-PCR)的其它变型,例如Livak等人,Nature Genet.,9,341-32(1995)和Ranade等人Genome Res.,11,1262-1268(2001)中描述的那些,也可用于在此公开的方法中。在一些实施方式中,特定遗传变异(例如SNP)的探针被标记形成TaqMan探针。该探针通常为大约至少12、15、18或20个碱基对长度。它们可为大约10-70、15-60、20-60或18-22个碱基对长度。探针在5’末端标记有报告标记物,例如荧光团,和在3’末端具有该标记物的猝灭剂。报告标记物可为当紧密邻近(例如探针的长度)猝灭剂时其荧光被抑制或猝灭的任何荧光分子。例如,报告标记物可为荧光团例如6-羧基荧光素(FAM)、四氯荧光素(TET)或其衍生物,和猝灭剂四甲基若丹明(TAMRA)、二氢环吡咯并吲哚三肽(MGB)或其衍生物。
当报告荧光团和猝灭剂处于邻近位置(相隔探针长度)时,荧光被猝灭。当探针与目标序列(例如样品中包含SNP的序列)退火时,具有5’到3’核酸外切酶活性的DNA聚合酶(例如Taq聚合物)可延长引物,核外切酶活性切除探针,从而将猝灭剂与报告荧光团分离,因而报告荧光团可发荧光。该过程可以重复,例如在RT-PCR中。TaqMan探针通常与位于被设计用于扩增序列的两个引物之间的目标序列互补。因此,PCR产物的聚积可与释放的荧光团的聚积相关,这是因为各探针可与新产生的PCR产物进行杂交。释放的荧光团可被测定,因而存在的目标序列的量可被确定。用于高通量基因分型的RT-PCR方法,例如
遗传变异也可通过DNA测序进行识别。可以使用DNA测序对个体基因组序列的主要部分或者全部进行测序。通常,常用的DNA测序是基于聚丙烯酰胺凝胶分级分离以解析链终止的片段群(Sanger等人,Proc.Natl.Acad.Sci.USA 74:5463-5467(1977))。已经开发了和继续开发替代方法来提高DNA测序的速度和简便性。例如,高通量和单分子测序平台可从454 Life Sciences(Branford,CT)(Margulies等人,Nature 437:376-380(2005))、Solexa(Hayward,CA)、Helicos BioSciences Corporation(Cambridge,MA)(美国申请序列号No.11/167046,于2005年6月23日提交)和Li-Cor Biosciences(Lincoln,NE)(美国申请序列号No.11/118031,于2005年4月29日提交)商购得到,或者正由它们进行开发。
在生成个体基因组谱后,将该谱以数字化形式存储。该谱可以以加密的数字化形式存储。基因组谱被编码成计算机可读形式,例如在计算机可读介质上,以作为数据集的部分进行存储,并可作为数据库进行存储,其中基因组谱可“储蓄(banked)”,并且之后可以获取。数据集包括多个数据点,其中各数据点涉及个体。各数据点可以具有多个数据元素。一个数据元素为一独特的标识符,用于识别个体的基因组谱。独特的标识符可以是条形码。另一数据元素为基因型信息,例如个体基因组的SNP或核苷酸序列。对应基因型信息的数据元素也可包括在数据点中。例如,如果基因型信息包括通过微阵列分析识别的SNP,那么其它的数据元素可包括微阵列SNP识别号。或者,如果基因型信息通过其它方法识别,例如RT-PCR方法(例如TaqMan测试),数据元素可包括荧光水平、引物信息和探针序列。其它的数据元素可包括但不限于:SNP rs数、多形态核苷酸、基因型信息的染色体位置、数据的质量量度、原始数据文档、数据的图像和提取强度得分。
个体的特定因素,例如身体数据、医学数据、种族、家系、地理、性别、年龄、家族史、已知表型、人口数据、暴露数据(exposure data)、生活方式数据、行为数据和其它已知表型,也可以被引入作为数据元素。例如,因素可包括但不限于个体的出生地、父母和/或祖父母、亲缘家系、居住地、祖先的居住地、环境条件、已知的健康状况、已知的药物相互作用、家庭健康状况、生活方式条件、饮食、运动习惯、婚姻状况和身体测量数据(例如体重、身高、胆固醇水平、心率、血压、葡萄糖水平和本领域已知的其它测量)。个体的亲戚或者祖先(例如,父母和祖父母)的上述因素也可以加入作为数据元素,和用于确定个体的表型或症状的风险。
特定因素可以从调查表或者从个体的保健管理者处获得。然后,可以访问来自储蓄的谱的信息并且按所需要进行使用。例如,在个体的基因型相关性的初始评估中,将分析个体的全部信息(通常在整个基因组上的或者从整个基因组取得的SNP或其它基因组序列)用于确定基因型相关性。在后续的分析中,可以按需要或适当地从存储的或储蓄的基因组谱中获取全部信息或者其一部分。
相关性和表型谱
基因组谱用于生成表型谱。基因组谱通常以数字化形式存储,并且在任何时间点都易于访问产生表型谱。通过应用使基因型与表型相关或关联的规则来产生表型谱。可以基于表明基因型与表型之间的相关性的科学研究来制定规则。该相关性可由一个或多个专家组成的委员会评议(curated)或确定。通过将规则应用于个体的基因组谱,可以确定个体的基因型与表型之间的相关性。个体的表型谱将具有这一确定。该确定可为个体的基因型与给定的表型之间的正相关性,从而个体具有给定的表型或将会产生该表型。或者,也可确定个体不会具有或不会产生给定的表型。在其它的实施方式中,该确定可以是危险因子、估计值或者个体具有或将产生表型的概率。
可以基于多种规则进行确定,例如,可以将多种规则应用于基因组谱以确定个体基因型与特定表型的关联。确定过程也可以结合个体特有的因素,例如种族、性别、生活方式(例如,饮食和锻炼习惯)、年龄、环境(例如,居住位置)、家族病史、个人病史和其它已知表型。特定因素的结合可以通过修改现有的规则来包括这些因素。或者,可由这些因素产生单独的规则,且在已应用现有的规则之后应用到个体的表型确定中。
表型可以包括任何可测定的性状或者特性,例如对于某种疾病的易感性或者对于药物治疗的反应。可以包括的其它表型是躯体和精神性状,例如,身高、体重、头发颜色、眼睛颜色、晒斑敏感性、尺码、记忆力、智力、乐观程度、整体性情。表型也可以包括与其他个体或生物体的遗传比较。例如,个体可能对他们的基因组谱与名人的基因组谱之间的相似性感兴趣。他们也可能使他们的基因组谱与其它生物体(例如细菌、植物或其它动物)进行比较。总之,对于个体所确定的相关表型的集合组成该个体的表型谱。
遗传变异和表型之间的关系可从科学文献中获知。遗传变异的相关性由已经对是否存在一种或多种感兴趣的表型性状和对其基因型谱进行了测试的个体的群体所进行的分析确定。对基因型谱中各遗传变异或多态性的等位基因进行检测以确定是否特定的等位基因的存在与否与感兴趣的性状相关联。可以通过标准统计方法进行相关性分析,并记录遗传变异与表型特征之间的统计学显著的相关性。比如,可能确定,多态性A的等位基因A1的存在与心脏病相关。作为进一步的例子,可能发现多态性A的等位基因A 1和多态性B的等位基因B1的组合存在与癌症风险的增大相关。分析的结果可以在同行评议的文献中公布,由其它研究组进行确认,和/或由专家委员会(例如,遗传学家、统计学家、流行病学家和医生)进行分析,并且也可以进行验证。例如,在美国公开20080131887和PCT公开WO/2008/067551中所记载的相关性可用于本文所述的实施方式中。
可选地,可从存储的基因组谱中产生相关性。例如,具有存储的基因组谱的个体可同时具有存储的已知的表型信息。存储的基因组谱和已知的表型的分析可产生基因型相关性。作为一个例子,具有储存的基因组谱的250位个体还具有之前他们被诊断为患有糖尿病的存储信息。进行他们的基因组谱的分析,并与未患有糖尿病的个体对照组进行比较。然后确定出:之前被诊断为患有糖尿病的个体比对照组具有更高的带有特定遗传变体的比率,且可在该特定的遗传变体和糖尿病之间进行基因型关联。
基于遗传变体与特定的表型之间的确立的相关性来形成规则。规则可以根据在美国公开2008013188和PCT公开WO/2008/067551中所记载的基因型和相关的表型生成,一些规则可结合例如性别和种族的其它因素来生成效应评价。由规则产生的其它量度可以评估相对风险增加。效应评价和估计的相对风险增加可以来自公开的文献,或者由公开的文献进行计算。或者,规则可以基于由存储的基因组谱和先前已知的表型产生的相关性。
遗传变异可包括SNPs。尽管SNP出现在单个位点处,但在某一位点处携带特定SNP等位基因的个体通常可预测地在其它的位点处携带特定的SNP等位基因。SNP与使个体易发疾病或病症的等位基因的相关性通过连锁不平衡产生,其中在群体中两个或多个基因座上的等位基因发生非随机关联的频率大于或者小于由通过重组的随机形成而预期的频率。
其它的遗传标记或变异(例如核苷酸重复或插入)也可以与已经显示为与特定的表型相关的遗传标记发生连锁不平衡。例如,核苷酸插入与表型相关,并且SNP与核苷酸插入发生连锁不平衡。基于SNP与表型之间的相关性形成规则。也可以形成基于核苷酸插入与表型之间的相关性的规则。可以将任一规则或者两个规则应用于基因组谱,因为一个SNP的存在可以给出某一危险因子,另一规则可以给出另一危险因子,并且当它们结合时可以增大风险。
通过连锁不平衡,易发疾病的等位基因与SNP的特定等位基因或者SNP的特定等位基因的组合共分离。沿着染色体的SNP等位基因的特定组合被称为单倍体型,它们组合出现的DNA区域被称为单体型区块。尽管单体型区块可由一个SNP组成,但是单体型区块一般代表在个体之间表现出低的单体型多样性且通常具有低重组频率的一串连续2个或多个SNP。可以通过鉴定位于单体型区块中的一个或多个SNP进行单体型的鉴定。因此,SNP谱通常可用于识别单体型区块,而不是必须识别在特定的单体型区块中的所有SNP。
SNP单体型模式和疾病、病症或身体状态之间的基因型相关性逐渐成为已知。对于特定的疾病而言,将已知具有该疾病的一组人的单体型模式与无该疾病的一组人相比较。通过分析许多个体,可以确定在群体中多态性的频率,并且随后这些频率或基因型可以与特定的表型(例如疾病或者病症)相关联。已知的SNP-疾病相关性的实例包括在与年龄相关的黄斑变性中补体因子H的多态性(Klein等人,Science:308:385-389,(2005))和邻近与肥胖相关的INSIG2基因的变异(Herbert等人,Science:312:279-283(2006))。其它已知的SNP相关性包括含CDKN2A和B的9p21区中的多态性,例如与心肌梗塞相关的rs10757274、rs2383206、rs13333040、rs2383207和rs10116277(Helgadottir等人,Science 316:1491-1493(2007);McPherson等人,Science 316:1488-1491(2007))。
SNP可为功能性的或非功能性的。例如,功能性的SNP对细胞功能有效,因此会产生表型,而非功能性的SNP不具有功能,但可以与功能性SNP发生连锁不平衡。SNP也可以是同义的或者非同义的。同义的SNP是其中不同形式导致相同多肽序列的SNP,且为非功能性SNP。如果SNP导致不同多肽,那么SNP是非同义的并且可以是或不是功能性的。用于识别二倍体型(其为2个或多个单体型)中的单体型的SNP或其它的遗传标记可用于使表型和二倍体型相关。有关个体的单体型、二倍体型和SNP谱的信息可存在于个体的基因组谱中。
典型地,对于基于与表型关联的另一遗传标记形成连锁不平衡的遗传标记产生的规则,该遗传标记具有大于0.5的r2或D’得分(该得分通常在本领域中用于确定连锁不平衡)。该得分可大于约0.5、0.6、0.7、0.8、0.90、0.95或0.99。结果,用于将表型与个体的基因组谱关联的遗传标记可以相同或者不同于与表型相关的功能性的或公开的SNP。在一些实施方式中,也可以不鉴定测试SNP,而是使用公开的SNP信息,可以基于另一分析方法(例如TaqMan)鉴定等位基因差异或SNP。例如,公开的SNP是rs1061170,但测试SNP尚未鉴定。可以通过公开的SNP的LD分析鉴定测试SNP。或者,可以不使用测试SNP,而是用TaqMan或其它相当的分析方法评价具有该测试SNP的个体基因组。
测试SNP可以是“直接(DIRECT)”或“标签(TAG)”SNP。直接SNP是与公开的或功能性SNP相同的测试SNP。例如,使用欧洲人和亚洲人的SNP rs1073640,直接SNP也可以用于FGFR2与乳腺癌的相关性,其中次要等位基因为A且另一等位基因为G(Easton等人,Nature 447:1087-1093(2007))。rs1219648是另一可以是直接SNP的公开的或功能性的SNP,也可以用于欧洲人和亚洲人中FGFR2与乳腺癌的相关性(Hunter等人,Nat.Genet.39:870-874(2007))。标签SNP为测试SNP不同于功能性的或公开的SNP的情况。标签SNP也可以用于其它遗传变体,例如,用于CAMTA1(rs4908449)、9p21(rs10757274、rs2383206、rs13333040、rs2383207、rs10116277)、COL1A1(rs1800012)、FVL(rs6025)、HLA-DQA1(rs4988889、rs2588331)、eNOS(rs1799983)、MTHFR(rs1801133)和APC(rs28933380)的SNP。
SNP的数据库可从例如International HapMap Project(参见www.hapmap.org,The International HapMap Consortium,Nature426:789-796(2003),和The International HapMap Consortium,Nature437:1299-1320(2005))、Human Gene Mutation Database(HGMD)公开数据库(参见www.hgmd.org)和单核苷酸多态性数据库(dbSNP)(参见www.ncbi.nlm.nih.gov/SNP/)中公开获得。这些数据库提供了SNP单体型,或使得能够确定SNP单体型模式。因此,这些SNP数据库使得能够检测作为大范围的疾病和病症(例如癌症、炎性疾病、心血管病、神经变性疾病和传染病)的基础的遗传危险因素。这些疾病或病症可以是可处置的,其中当前存在其处理和治疗方法。处理可以包括预防处理和改善症状和病症的处理,包括改变生活方式。
还可以研究许多其它的表型,例如身体性状、生理性状、精神性状、情绪性状、种族、家系和年龄。身体性状可以包括身高、发色、眼睛颜色、躯体或者例如精力、耐力和敏捷性的性状。精神性状可以包括智力、记忆能力或者学习能力。种族和家系可以包括祖先或种族的鉴定,或者个体的祖先源于哪里。年龄可以是确定个体的实际年龄,或者是个体的遗传学特征使其相对于总的群体所处的年龄。例如,个体的实际年龄为38岁,但是其遗传学特征可以确定其记忆能力或身体健康可能为平均28岁。另一年龄性状可以是个体的预计寿命。
其它的表型还可包括非医学状况,例如“娱乐”表型。这些表型可以包括与知名个体例如外国贵族、政治家、名人、发明家、运动员、音乐家、艺术家、商业人士和声名狼藉的个体(例如罪犯)的对比。其它“娱乐”表型可以包括与其它生物体例如细菌、昆虫、植物或者非人类的动物的对比。例如,个体可能感兴趣看看其基因组谱与其宠物狗或前任总统的基因组谱对比会如何。
对存储的基因组谱应用规则以生成表型谱。例如,来自公开资源或存储的基因组谱的相关性数据可形成规则或测试的基础,以应用于个体的基因组谱。规则可以包括关于测试SNP和等位基因以及效应评价的信息,例如OR,或优势比(95%置信区间)或者平均值。效应评价可以是基因型风险,例如对于纯合子的风险(homoz或RR)、风险杂合子(heteroz或RN)和非风险纯合子(homoz或NN)。效应评价也可以是携带者风险,其为RR或RN对NN。效应评价可以基于等位基因,例如等位基因风险,例如R对N。这里也存在2、3、4或更多个基因座的基因型效应评价(例如,对于两个基因座效应评价的9种可能的基因型组合:RRRR、RRNN等)。
对于病症的估计风险可基于美国专利公布No.20080131887和PCT公布No.WO2008/067551中列举的SNP。在一些实施方式中,对于病症的风险可基于至少1个SNP。例如,对个体患阿尔茨海默病(AD)、结肠直肠癌(CRC)、骨关节炎(OA)或皮脱落性青光眼(XFG)的风险的评估可基于1个SNP(例如rs4420638用于AD,rs6983267用于CRC,rs4911178用于OA和rs2165241用于XFG)。对于其它的病症而言,例如肥胖(BMIOB)、格雷夫斯病(GD)或血色素沉着症(HEM),个体的估计风险可以基于至少1或2个SNP(例如rs9939609和/或rs9291171用于BMIOB;DRB1*0301DQA1*0501和/或rs3087243用于GD;rs1800562和/或rs129128用于HEM)。对于例如但不限于心肌梗塞(MI)、多发性硬化(MS)或牛皮癣(PS)的病症,1、2或3个SNP可用于评估个体患该病症的风险(例如rs1866389、rs1333049和/或rs6922269用于MI;rs6897932、rs12722489和/或DRB1*1501用于MS;rs6859018、rs11209026和/或HLAC*0602用于PS)。对于评估个体患不宁腿综合征(RLS)或乳糜泻(CelD)的风险,可使用1、2、3或4个SNP(例如rs6904723、rs2300478、rs1026732和/或rs9296249用于RLS;rs6840978、rs11571315、rs2187668和/或DQA1*0301DQB1*0302用于CelD)。对于前列腺癌(PC)或狼疮(SLE)而言,可使用1、2、3、4或5个SNP来评估个体患PC或SLE的风险(例如rs4242384、rs6983267、rs16901979、rs17765344和/或rs4430796用于PC;rs12531711、rs10954213、rs2004640、DRB1*0301和/或DRB1*1501用于SLE)。为了评估个体患黄斑变性(AMD)或类风湿性关节炎(RA)的终生风险,可使用1、2、3、4、5或6个SNP(例如rs 10737680、rs10490924、rs541862、rs2230199、rs1061170和/或rs9332739用于AMD;rs6679677、rs11203367、rs6457617、DRB*0101、DRB1*0401和/或DRB 1*0404用于RA)。为了估计个体患乳腺癌(BC)的个体终生风险,可使用1、2、3、4、5、6或7个SNP(例如rs3803662、rs2981582、rs4700485、rs3817198、rs17468277、rs6721996和/或rs3803662)。为了估计个体患克罗恩氏病(CD)或2型糖尿病(T2D)的终生风险,可使用1、2、3、4、5、6、7、8、9、10或11个SNP(例如rs2066845、rs5743293、rs10883365、rs17234657、rs10210302、rs9858542、rs11805303、rs1000113、rs17221417、rs2542151和/或rs10761659用于CD;rs13266634、rs4506565、rs10012946、rs7756992、rs10811661、rs12288738、rs8050136、rs1111875、rs4402960、rs5215和/或rs1801282用于T2D)。在一些实施方式中,作为用于确定风险的基础的SNP可与上述SNP或其它SNP(例如美国专利公布No.20080131887和PCT公布No.WO2008/067551中的)发生连锁不平衡。
个体的表型谱可包括多种表型。特别地,无论在有症状、症状前或无症状的个体(包括一种或多种疾病/病症的易感等位基因的携带者)中,通过本文公开的方法评估病人患疾病或其它病症(例如,可能的药物反应,包括代谢、功效和/或安全性)的风险使得能够对多种不相关的疾病和病症的易感性进行预后或者诊断分析。因此,这些方法提供了对于疾病或病症的个体易感性的总体评价,而不需要预先设想任何特定疾病或病症的测试。例如,本发明的方法使得能够基于个体基因组谱对美国专利公布No.20080131887和PCT公布No.WO2008/067551中所列的多种病症中的任何一种的个体易感性进行评价。而且,这些方法允许评价一种或多种表型或病症的个体估计终生风险或相对风险。
该评估提供了关于2种或更多种这些病症的信息,并且包括3种、4种、5种、10种、15种、18种、20种、25种、30种、35种、40种、45种、50种、100种或更多种这些病症。表型的单一的规则可以应用于单基因的表型。多于一条的规则也可以用于单一表型,例如多基因表型或单一基因中的多个遗传变异会影响具有表型的概率的单基因表型。
个体患者的基因组谱的最初筛选之后,当知道另外的遗传变异时,可以通过与这些另外的遗传变异(例如,SNP)的比较进行(或可以获得)个体基因型相关性的更新。例如,更新可以由搜索科学文献以寻找新基因型相关性的遗传学领域的一名或多名普通技术人员定期地进行,如,每天、每周或每月进行。然后,新基因型相关性可以进一步由本领域中的一位或多位专家的委员会确认。
新规则可以包括在现有规则之外的基因型或者表型。例如,未与任何表型关联的基因型被发现与新的或现有的表型相关。新规则也可以用于先前无基因型与其关联的表型间的相关性。也可以确定用于已具有现有规则的基因型和表型的新规则。例如,存在基于基因型A与表型A之间的相关性的规则。新的研究揭示了基因型B与表型A相关,因而产生基于这一相关性的新规则。另一个实例为发现表型B与基因型A相关,并因此制定新规则。
规则也可以根据基于已知的相关性的发现制定,但没有在公开的科学文献中进行初始确认。例如,可能有人报道,基因型C与表型C相关。另外的出版物报道,基因型D与表型D相关。表型C和D是相关的症状,例如表型C可以是呼吸急促,而表型D是较小的肺容量。利用现有存储的具有基因型C和D以及表型C和D的个体的基因组谱通过统计学方法,或者通过进一步的研究,可以发现和确认基因型C与表型D或者基因型D与表型C之间的相关性。然后,可以基于新发现的和确认的相关性生成新规则。在另一实施方式中,可以研究存储的具有特定或相关表型的多个个体的基因型谱来确定这些个体共有的基因型,并且可以确定相关性。基于这一相关性可以生成新规则。
也可以制定规则以修改现有规则。例如,基因型与表型之间的相关性可能部分地由已知个体特征确定,例如,种族、家系、地理、性别、年龄、家族史或者个体的任何其它已知表型。可以制定基于这些已知个体特征的规则并且引入现有规则中以提供修改的规则。选择应用修改的规则将取决于个体的特定个体因素。例如,规则可能基于当个体具有基因型E时个体具有表型E的概率为35%。但是,如果个体为特定的种族,所述概率是5%。新规则可以基于这一结果制定并且应用于具有该特定种族特性的个体。或者,可以应用确定值为35%的现有规则,然后应用基于该表型的种族特征的另一规则。基于已知个体特征的规则可以由科技文献确定或者基于对存储的基因组谱的研究确定。在产生了新规则时,可添加新的规则并将其应用于基因组谱,或者可以定期地应用它们,例如一年至少一次。
疾病的个体风险的信息也可以随着允许更高分辨率SNP基因组谱的技术进步得到扩展。如上所述,使用用于扫描500000个SNP的微阵列技术可以很容易地生成初始SNP基因组谱。考虑到单体型区块的特性,这一数字可用于个体基因组中所有SNP的典型谱。但是,在人类基因组中估计通常发生大约1000万个SNP(International HapMap Project;www.hapmap.org)。随着能够以更高细节水平对SNP进行实用和经济的解析(例如1,000,000、1,500,000、2,000,000、3,000,000或更多SNP的微阵列)的或者全基因组测序方面的技术进步,可以生成更详细的SNP基因组谱。同样,计算机分析方法学方面的进展使得能够获得更精细的SNP基因组谱的经济分析和SNP-疾病相关性主数据库的更新。
在一些实施方式中,可以从个体综合得出“区域部署(field-deployed)”机制,并插入个体的表型谱中。例如,个体可以具有基于遗传信息生成的初始表型谱。生成的初始表型谱包括不同表型的危险因子,以及个性化行动计划中报告的建议的治疗或预防措施。表型谱可以包括对于关于某一病症的可利用的药物治疗的信息和/或对于饮食变化或锻炼方案的建议。个体可以选择去看医生或遗传顾问或者通过网络入口或电话接触医生或遗传顾问以讨论他们的表型谱。个体可以决定采取某种行动路线,例如,采用特定的药物治疗、改变他们的饮食,以及在其个性化行动计划中建议的其它可能的行动。而后,个体可以随后提交生物样品以评估其身体状况的变化和危险因子的可能变化。
个体可以通过直接将生物样品提交给生成基因组谱和表型谱的机构(或者相关机构,例如由生成遗传谱和表型谱的实体签约的机构)确定该变化。或者,个体可以利用“区域部署”机制,其中个体可以将他们的唾液、血液或者其它生物样品提交到其家庭处的检测装置中,由第三方进行分析,且数据经传输以包括在另一表型谱中。例如,个体可以接收基于其遗传数据的初始表型报告从而向具有增大的心肌梗死(MI)终生风险的个体报告。该报告也可以具有预防措施的建议以降低MI的风险,例如降胆固醇药物和饮食改变。个体可以选择接触遗传顾问或医生以讨论该报告和预防措施并且决定改变他们的饮食。在采用新的饮食一段时间之后,个体可以去看他们的个人医生以检测其胆固醇水平。可以将新的信息(胆固醇水平)传送(例如,通过互联网)给具有基因组信息的实体,并且新的信息用于生成具有心肌梗死和/或其它病症的新的危险因子的该个体的新表型谱。
个体也可以使用“区域部署”机制或者直接机制以确定其对于具体药物治疗的个体反应。例如,个体可以测定其对药物的反应,并且该信息可以用于确定更有效的治疗。可测定的信息包括,但不限于代谢物水平、葡萄糖水平、离子水平(例如,钙、钠、钾、铁)、维生素、血细胞计数、体重指数(BMI)、蛋白质水平、转录物水平、心率等,这些信息能够通过容易利用的方法确定并且能够包括在算法中以与初始基因组谱结合来确定修正的整体风险评估评分。风险评估评分可以是GCI评分。
遗传综合指数(GCI)
在一些实施方式中,组合并分析了关于多种遗传标记或变异与一种或多种疾病或病症的关联的信息以获得遗传综合指数(Genetic Composite Index)(GCI)评分。这一评分包括了已知的危险因子以及其它信息和假设,例如,等位基因频率和疾病的流行度。GCI可以用于定量评估疾病或者病症与一系列遗传标记的综合效应的关联。GCI评分可以用于基于现有科学研究向未受过遗传学训练的人提供有关与相关群体相比其个体患病风险的可靠的(例如,稳固的)、可理解的和/或直观的认识。
GCI评分可以用于生成GCI Plus评分。本文公开的方法包括使用此处描述的GCI评分,本领域普通技术人员将会容易地认识到使用GCI评分或其变化来代替在此描述的GCI评分。GCI plus评分可包括所有的GCI假设,包括病症的风险(例如,终生风险)、年龄限定的流行度和/或年龄限定的发病率。然后个体的终生风险可以计算为与个体GCI评分除以平均GCI评分成比例的GCI Plus评分。平均GCI评分可以由具有相似家系背景的一组个体确定,例如一组高加索人、亚洲人、东印度人或者其他具有共同家系背景的组。所述组可以由至少5、10、15、20、25、30、35、40、45、50、55或60个个体组成。在某些实施方式中,平均值可以由至少75、80、95或100个个体确定。GCI Plus评分可以通过确定个体的GCI评分,将该GCI评分除以平均相对风险,并乘以病症或表型的终生风险来确定。例如,可使用来自美国专利公布No.20080131887和PCT公布No.WO/2008/067551的数据来确定个体的GCI或GCI Plus评分。评分可以用于生成在个体的表型谱中关于一种或多种病症的遗传风险(例如估计的终生风险)的信息。该方法允许计算一个或多个表型或者病症的估计终生风险或者相对风险。单个病症的风险可以基于一个或者多个SNP。例如,对于表型或病症的估计风险可以基于至少2、3、4、5、6、7、8、9、10、11或12个SNP,其中用于估计风险的SNP可以为公开的SNP、测试SNP或以上两者。
可对各种感兴趣的疾病或者病症生成GCI评分。可以集中这些GCI评分以形成个体的风险谱。GCI评分可被数字化存储,从而在任何时间点均可容易地获取它们来产生风险谱。风险谱可以按照大的疾病分类进行分解,例如,癌症、心脏病、代谢紊乱、精神紊乱、骨病或者老年病(age on-set disorder)。大的疾病分类可以进一步被分解成子类。例如,对于如癌症的大的分类,可以例如按类型(肉瘤、癌瘤或者白血病等)或者按组织特异性(神经、乳腺、卵巢、睾丸、前列腺、骨、淋巴结、胰腺、食道、胃、肝、脑、肺、肾等)列出癌症的子类。进一步,风险谱还可以显示如何随个体年龄或者多种危险因子的调整而预测GCI评分的变化的信息。例如,对于特定疾病的GCI评分可以考虑饮食变化或者采取的预防措施(停止吸烟、服药、双侧根治性乳房切除术、子宫切除术等)的效应。
可对个体产生GCI评分,向他们提供容易理解的关于个体获得至少一种疾病或病症的风险或对于至少一种疾病或病症的易感性的信息。对单种疾病或病症或多种疾病或病症可生成一项或多项GCI评分。一项或多项GCI评分可以通过在线入口访问。或者,可以以纸件形式提供一项或多项GCI评分,后续的更新也以纸件形式提供。纸件可邮寄至个体或其保健管理者或面交。
生成不同基因座的组合效应的可靠GCI评分的方法可以是基于各已研究的基因座的已报告的个体危险。例如,鉴定感兴趣的疾病或病症,然后查询信息来源(包括,但不限于数据库、专利出版物和科学文献)以寻找有关疾病或病症与一个或多个基因座的关联的信息。这些信息来源经过验证并使用质量标准进行评估。在一些实施方式中,评估过程包括多个步骤。在其它实施方式中,以多个质量标准评估信息来源。源自信息资源的信息用于对于感兴趣的各疾病或病症鉴定一个或多个基因座的优势比或者相对风险。
在替代的实施方式中,对于至少一个基因座的优势比(OR)或相对风险(RR)不能从信息来源中获得,或不能访问这些信息源。然后使用(1)相同基因座的多个等位基因的报告OR、(2)来自数据集(例如HapMap数据集)的等位基因频率和/或(3)来自可利用资源(例如,CDC、National Center for Health Statistics等)的疾病/病症流行度计算RR以得出所有感兴趣的等位基因的RR。在一个实施方式中,分别或独立地评估相同基因座的多个等位基因的OR。在优选实施方式中,结合相同基因座的多个等位基因的OR以说明在不同等位基因的OR之间的相依性(dependency)。在一些实施方式中,建立的疾病模型(包括,但不限于如积性(multiplicative)、加性(additive)、Harvard改良的、显性效应的模型)用于生成按照所选模型表示个体风险的中间评分。
可以使用的方法用来分析感兴趣的疾病或病症的多个模型,并且将由这些不同模型得到的结果相互关联;这使得可能通过选择特定疾病模型而引入的可能误差最小化。这一方法使得由信息来源得到的流行度、等位基因频率和OR评估中的合理误差对相对风险的计算的影响最小化。不受到理论的限制,由于流行度评估对RR的影响的“线性”或单调性特征,不正确地估计流行度对最终评分只有很少或没有影响;条件是相同的模型一致地应用于生成报告的所有个体。
本文所述的方法也可考虑将环境/行为/人口数据作为附加的“基因座”。在相关的方法中,这些数据可以获自信息来源,例如医学或科学文献或数据库(例如,吸烟与肺癌的关联或者来自保险业健康风险评估)。本文也公开了对一种或多种复杂疾病产生的GCI评分。复杂疾病可以被多个基因、环境因素及它们的相互作用影响。当研究复杂疾病时,需要分析大量可能的相互作用。用于校正多重比较的方法,例如Bonferroni校正,可用于生成GCI评分。或者,当测试是独立的或者显示特别类型的相依性时,可以使用Simes检验控制整体显著性水平(也称为“族误差率”(Sarkar S.,Ann Stat 26:494-504(1998))。如果在1,...,K中对于任何k,p(k)≤αk/K,那么Simes检验拒绝所有K检验特异性零假设为真的全局零假设(Simes,R.J.,Biometrika 73:751-754(1986))。
可在多基因和多环境因素分析的情况中使用的其它实施方式控制错误发现率(false-discovery rate),即错误拒绝的拒绝零假设的预计比例。正如在微阵列研究中,当零假设的一部分可以假定为错误时,这一方法是特别有用的。Devlin等人(Genet.Epidemiol.25:36-47(2003))提出了当在多基因座关联研究中测试大量可能的基因×基因相互作用时控制错误发现率的Benjamini和Hochberg(J.R.Stat.Soc.Ser.B 57:289-300(1995))递增程序的变型。Benjamini和Hochberg程序与Simes检验有关;设定k*=maxk以致p(k)≤αk/K,其拒绝所有对应于p(1),...,
Figure BPA00001331512900241
的k*零假设。事实上,当所有零假设为真时,Benjamini和Hochberg程序简化为Simes检验(Benjamini and Yekutieli,Ann.Stat.29:1165-1188(2001))。
本文还提供了对个体的排位,其中个体基于其中间评分与个体的群体比较进行排位以产生最终评分,这可以表示为在群体中的排位,例如第99百分位或第99、98、97、96、95、94、93、92、91、90、89、88、87、86、85、84、83、82、81、80、79、78、77、76、75、74、73、72、71、70、69、65、60、55、50、45、40、40、35、30、25、20、15、10、5或0百分位。评分可以显示为范围,例如第100至95百分位、第95至85百分位、第85至60百分位或者在第100至0百分位之间的任何子范围。个体也可按四分位进行排位,例如最高的第75四分位或者最低的第25四分位。个体也可与群体中的平均或中位评分比较进行排位。
在一个实施方式中,与个体相比较的群体包括大量来自不同地理和种族背景的人,例如全球性群体。或者,与个体相比较的群体限于特定地理、家系、种族、性别、年龄(例如,胎儿、新生儿、儿童、少年、青年、成年人、老年人个体)、或疾病状态(例如,有症状的、无症状的、携带者、早发、迟发)。在一些实施方式中,与个体相比较的群体源自公开和/或私人信息来源报道的信息。
GCI评分可使用多步法生成。例如,开始时,对于要研究的各病症,计算源自各遗传标记的优势比的相对风险。对于p=0.01、0.02、...、0.5的每个流行度值,HapMap CEU群体的GCI评分基于流行度和HapMap等位基因频率计算。如果在变化的流行度下GCI评分不变,则考虑的唯一假设为存在积性模型。否则,可以确定该模型对流行度敏感。对于未检出值(no-call value)的任何组合,获得相对风险和评分在HapMap群体中的分布。对于各新个体,个体得分与HapMap分布比较并且所得评分为个体在这一群体中的排位。由于过程中所作的假设的原因,报告的评分的分辨率可能较低。群体将划分成分位点(3-6个箱元),并且报告的箱元将是其中个体排位落入的一个。基于例如对于各疾病的评分的分辨率的考虑,箱元的数量对不同疾病可以是不同的。在不同HapMap个体的评分之间不相上下的情况下,将使用平均排位。
较高的GCI评分可以解释为指示获得或被诊断具有病症或疾病的增大的风险。通常使用数学模型推导出GCI评分。GCI评分可以基于说明作为关于群体和/或疾病或病症的基础信息的不完全特性的数学模型。数学模型可以包括作为计算GCI评分的基础的部分的至少一个假设,其中该假设包括,但不限于:给定优势比值的假设;病症的流行度已知的假设;群体中的基因型频率已知的假设;和/或消费者来自与研究所使用的群体和与HapMap相同的家系背景的假设;合并风险为个体遗传标记的不同危险因子的积的假设。GCI也可以包括基因型的多基因型频率为各SNP或个体遗传标记(例如,不同SNP或遗传标记在整个群体内是独立的)的等位基因频率的积的假设。
积性模型
在归因于遗传标记集合的风险是归因于个别遗传标记的风险的积的假设下计算GCI评分。因此,不同遗传标记与其它遗传标记无关地归因于疾病的风险。形式上,存在具有风险等位基因r1、...、rk和非风险等位基因n1、...、nk的k个遗传标记。在SNPi中,三个可能的基因型值表示为riri、niri和nini。个体的基因型信息可以通过向量(g1、...、gk)描述,其中根据i位置上风险等位基因的数目,gi可以是0、1或2。通过
Figure BPA00001331512900251
表示与i位置上纯合非风险等位基因相比的相同位置上杂合基因型的相对风险。换言之,
Figure BPA00001331512900252
相似地,riri遗传型的相对风险表示为
Figure BPA00001331512900261
在积性模型下,假定具有基因型(g1、...、gk)的个体的风险为
Figure BPA00001331512900262
评估相对风险
在另一实施方式中,对于不同遗传标记的相对风险是已知的,并且积性模型可以用于风险评价。但是,在一些包括关联研究的实施方式中,研究设计防止报告相对风险。在一些病例对照研究中,相对风险不能在没有进一步的假设的情况下直接由数据计算。代替报告相对风险,通常的方式是报告基因型的优势比(OR),其是携带给定风险基因型疾病(riri或niri)的机率对不携带给定风险基因型疾病的机率的比。形式上,
PR i 1 = P ( D | n i r i | ) P ( D | n i r i | ) · 1 - P ( D | n i n i | ) 1 - P ( D | n i r i | )
PR i 2 = P ( D | n i r i | ) P ( D | n i r i | ) · 1 - P ( D | n i n i | ) 1 - P ( D | n i r i | )
由优势比找到相对风险可能要求额外的假设。例如,假设整个种群中的等位基因频率
Figure BPA00001331512900265
Figure BPA00001331512900266
Figure BPA00001331512900267
已知或经过评估(这些可以由现有的数据集,例如包括120个染色体的HapMap数据集进行评估),和/或假设疾病的流行度p=p(D)是已知的。由前述三个等式可以得到:
p=a·P(D|nini)+b·P(D|niri)+c·P(D|riri)
PR i 1 = P ( D | n i r i | ) P ( D | n i r i | ) · 1 - P ( D | n i n i | ) 1 - P ( D | n i r i | )
PR i 2 = P ( D | n i r i | ) P ( D | n i r i | ) · 1 - P ( D | n i n i | ) 1 - P ( D | n i r i | )
通过相对风险的定义,在除以pP(D|nini)项后,第一等式可以改写为:
1 P ( D | n i n i ) = a + b λ 1 i + c λ 2 i p
并且因此,后两个等式可以改写为:
OR i 1 = λ 1 i · ( a - p ) + b λ 1 i + c λ 2 i a + ( b - p ) λ 1 i + c λ 2 i
(1)
OR i 2 = λ 2 i · ( a - p ) + b λ 1 i + c λ 2 i a + b λ 1 i + ( c - p ) λ 2 i
应注意到,当a=1(非风险等位基因频率为1)时,等式系统1等同于在Zhang和Yu(JAMA,280:1690-1691(1998))中的Zhang和Yu公式,将其全部内容引入作为参考。与Zhang和Yu公式相反,一些实施方式考虑到群体中的等位基因频率,其可能影响相对风险。另外,一些实施方式考虑到相对风险的相互依赖性,这与独立地计算各相对风险相反。
等式系统1可以改写为具有至多四个可能的解的两个二次方程。梯度下降算法(gradient descent algorithm)可以用于求解这些方程,其中起点设置为优势比,例如
Figure BPA00001331512900274
例如:
f 1 ( λ 1 , λ 2 ) = OR i 1 ( a + ( b - p ) λ 1 i + c λ 2 i ) - λ 1 i · ( ( a - p ) + b λ 1 i + c λ 2 i )
f 2 ( λ 1 , λ 2 ) = OR i 2 ( a + b λ 1 i + ( c - p ) λ 2 i ) - λ 2 i · ( ( a - p ) + b λ 1 i + c λ 2 i )
找到这些方程的解相当于找到函数g(λ1,λ2)=f11,λ2)2+f21,λ2)2的最小值。
因此,
dg d λ 1 = 2 f 1 ( λ 1 , λ 2 ) · b · ( λ 2 - OR 2 ) + 2 f 2 ( λ 1 , λ 2 ) ( 2 bλ 1 + c λ 2 + a - OR 1 b - p + OR 1 p )
dg d λ 2 = 2 f 2 ( λ 1 , λ 2 ) · c · ( λ 1 - OR 1 ) + 2 f 1 ( λ 1 , λ 2 ) ( 2 cλ 2 + b λ 1 + a - OR 2 c - p + OR 2 p )
在这一实例中,通过设定x0=OR1,y0=OR2,将值[ε]=10-10设定为整个算法的容差常数(tolerance constant)。在迭代i中,定义
Figure BPA00001331512900279
而后,设定
x i = x i - 1 - γ dg d λ 1 ( x i - 1 , y i - 1 )
y i = y i - 1 - γ dg d λ 2 ( x i - 1 , y i - 1 )
重复这些迭代直到g(xi,yi)<容差,其中在提供的代码中容差设定为10-7
在这一实施例中,这些方程给出了a、b、c、p、OR1和OR2的不同值的正解。
相对风险评估的稳定性
在一些实施方式中,测定了不同参数(流行度、等位基因频率和优势比误差)对相对风险的估计值的影响。为了测定等位基因频率和流行度估计值对相对风险值的影响,计算来自一组不同优势比和不同等位基因频率的值的相对风险(在HWE下),并且这些计算的结果对于在0至1范围内的流行度值绘图。另外,对于固定的流行度值,所得的相对风险可以作为风险等位基因频率的函数绘图。在p=0时,λ1=OR1,且λ2=OR2,并且当p=1时,λ1=λ2=0。这可以直接从所述等式计算。另外,在一些实施方式中,当风险等位基因频率高时,λ1更接近于线性函数,并且λ2更接近于具有有界二次导数的凹函数。在极限情况下,当c=1时,λ2=OR2+p(1-OR2),并且
Figure BPA00001331512900282
如果OR1≈OR2,后者同样接近于线性函数。当风险等位基因频率低时,λ1和λ2接近函数1/p的行为。在极限情况下,当c=0时,
Figure BPA00001331512900283
Figure BPA00001331512900284
这表明,对于高的风险等位基因频率,不正确的流行度估计值将不会显著地影响所得的相对风险。另外,对于低的风险等位基因频率,如果用流行度值p′=αp替代正确的流行度p,那么所得的相对风险将消除至多
Figure BPA00001331512900285
的系数。
计算GCI评分
在一个实施方式中,使用代表相关群体的参考集计算GCI。这一参考集可以为HapMap中的群体之一或者另一基因型数据集。
在该实施方式中,GCI按照如下计算:对于k个风险基因座中的每个,使用等式系统1由优势比计算相对风险。然后,计算参考集中各个个体的积性评分。具有积性评分s的个体的GCI是参考数据集中具有s′≤s的评分的所有个体的分数。例如,如果参考集中50%的个体具有小于s的积性评分,那么该个体的最终GCI评分将为0.5。如果已知不同的基因型或单体型组合的优势比或相对风险(在一些情况下可在文献中找到这些),可概括GCI来说明SNP-SNP相互作用。
如本文所述,积性模型可用于GCI评分中,但是其它模型也可用于确定GCI评分的目的。其它适当的模型包括,但不限于:
加性模型。在加性模型下,具有基因型(g1,...gk)的个体的风险假设为
Figure BPA00001331512900291
广义加性模型。在广义加性模型中,假设存在函数f以致具有基因型(g1,...gk)的个体的风险为
Figure BPA00001331512900292
Harvard改良评分(Het)。这一评分由G.A Colditz等人(Cancer Causes and Controls,11:477-488(2000))衍生,将其全部内容引入本文作为参考。虽然函数f以优势比值而不是相对风险进行运算,但是Het评分本质上是广义加性评分。这在相对风险难以评估的情况中是有用的。为了定义函数f,中间函数g定义为:
g ( x ) = 0 1 < x &le; 1.09 5 1.09 < x &le; 1.49 10 1.49 < x &le; 2.99 25 2.99 < x &le; 6.99 50 6.99 < x
接着计算的量,其中
Figure BPA00001331512900295
为整个参考群体中SNP i中杂合个体的频率。然后将函数f定义为f(x)=g(x)/het,并且Harvard改良评分(Het)简单地定义为
Figure BPA00001331512900296
Harvard改良评分(Hom)。除了值het被值
Figure BPA00001331512900297
所代替以外,这一评分与Het评分相似,其中,
Figure BPA00001331512900298
为具有纯合风险等位基因的个体的频率。
最大优势比。在这一模型中,假设遗传标记之一(具有最大优势比的一个)给出了整个对象组的组合风险的下界。形式上,具有基因型(g1,...gk)的个体的评分为
Figure BPA00001331512900301
在实施例1中说明了评分间的比较,在实施例2中说明了GCI评分的评估。
将模型扩展至任意数量的变异
模型可以扩展至发生任意数量的可能变异的情况。先前的考虑涉及存在三个可能的变异(nn、nr、rr)的情况。通常,当已知多SNP关联时,可以在群体中发现任意数量的变异。例如,当两个遗传标记之间的相互作用与病症相关联时,存在九种可能的变异。这导致了八个不同优势比值。
为了概括原始公式,可以假设存在k+1种可能的变异a0,...,ak,具有频率f0,f1,...,fk,测定的优势比为1,OR1,...,ORk以及未知的相对风险值为1,λ1,...,λk。可以进一步假设,相对于a0测定所有相对风险和优势比,并且因此,
Figure BPA00001331512900303
基于:
p = &Sigma; i = 0 k f i P ( D | a i ) ,
可以确定
OR i = &lambda; i = &Sigma; i = 0 k f i &lambda; i - p &Sigma; i = 0 k f i &lambda; i - &lambda; i p .
而且,如果设定
Figure BPA00001331512900306
这导致如下等式:
&lambda; i = C &CenterDot; OR i C - p + OR i p ,
并且因此,
C = &Sigma; i = 0 k f i &lambda; i = &Sigma; i = 0 k C &CenterDot; OR i f i C - p + OR i p ,
1 = &Sigma; i = 0 k OR i f i C - p + OR i p .
后者是具有一个变量(C)的方程。这一方程可以产生许多不同的解(基本上,最多k+1个不同的解)。标准优化工具(例如梯度下降)可以用于找到最接近C0=∑fiti的解。
本文也提供了用于危险因子定量的稳定的评分构架。虽然不同遗传模型可以导致不同的评分,但是结果通常是相关的。因此,危险因子的定量通常不依赖于所使用的模型。
评估相对风险病例对照研究
本文也提供了在病例对照研究中由多等位基因的优势比评价相对风险的方法。与先前的方法相反,该方法考虑了等位基因频率、疾病的流行度和在不同等位基因的相对风险间的相依性。测定了该方法对模拟的病例对照研究的表现,发现它是极准确的。
方法
在测试特定SNP与疾病D的关联性的情况下,R和N表示这一特定SNP的风险和非风险等位基因。P(RR|D)、P(RN|D)和P(NN|D)表示分别假设个人对于风险等位基因是纯合的、对于非风险等位基因是杂合的或纯合的情况下受到疾病影响的概率。fRR、fRN和FNN用于表示群体中三个基因型的频率。使用这些定义,相对风险定义为
&lambda; RR = P ( D | RR ) P ( D | NN )
&lambda; RN = P ( D | RN ) P ( D | NN )
在病例对照研究中,可以评估P(RR|D)、P(RR|~D)值(即病例和对照中RR的频率),以及P(RN|D)、P(RN|~D)、P(NN|D)和P(NN|~D),即病例和对照中RN和NN的频率。为了估计相对风险,可以使用贝叶斯(Bayes)定律以得到:
&lambda; RR = P ( RR | D ) f NN P ( NN | D ) f RR
&lambda; RN = P ( D | RN ) f NN P ( D | NN ) f RR
因此,如果已知基因型的频率,人们可以使用它们计算相对风险。群体中基因型的频率不能从病例-对照研究本身计算,因为它们取决于疾病在群体中的流行度。特别是,如果疾病的流行度为p(D),则:
fRR=P(RR|D)p(D)+P(RR|~D)(1-p(D))
fRN=P(RN|D)p(D)+P(RN|~D)(1-p(D))
fNN=P(NN|D)p(D)+P(NN|~D)(1-p(D))
当p(D)足够小时,基因型的频率可以接近对照群体中的基因型频率,但是当流行度高时,这将不会是准确的估计值。但是,如果给出参照数据集(例如,HapMap[cite]),人们可以基于参照数据集估计基因型频率。
大多数新近的研究不使用参照数据集估计相对风险,并且仅报告优势比。优势比可以写作
OR RR = P ( RR | D ) P ( NN | ~ D ) P ( NN | D ) P ( RR | ~ D )
OR RN = P ( RN | D ) P ( NN | ~ D ) P ( NN | D ) P ( RN | ~ D )
由于通常不需要具有群体中等位基因频率的估计值,所以优势比通常是有利的;为了计算优势比,通常所需要的是病例和对照中的基因型频率。
在一些情况中,基因型数据本身是不可得的,但是概括数据(例如优势比)是可得的。在基于来自先前的病例对照研究的结果进行后设分析(meta-analysis)时就是这样。在这一情况下,证实了如何从优势比得到相对风险。使用以下等式显示的事实:
p(D)=fRRP(D|RR)+fRNP(D|RN)+fNNP(D|NN)
如果这一等式除以P(D|NN),我们得到
p ( D ) p ( D | NN ) = f RR &lambda; RR + f RN &lambda; RN + f NN
这使得优势比能够写成以下形式:
OR RR = P ( D | RR ) ( 1 - P ( D | NN ) ) P ( D | NN ) ( 1 - P ( D | RR ) ) = &lambda; RR p ( D ) p ( D | NN ) - p ( D ) p ( D ) p ( D | NN ) - p ( D ) &lambda; RR =
&lambda; RR f RR &lambda; RR + f RN &lambda; RN + f NN - p ( D ) f RR &lambda; RR + f RN &lambda; RN + f NN - p ( D ) &lambda; RR
通过类似计算,得到以下等式系统:
OR RR = &lambda; RR f RR &lambda; RR + f RN &lambda; RN + f NN - p ( D ) f RR &lambda; RR + f RN &lambda; RN + f NN - p ( D ) &lambda; RR
OR RN = &lambda; RN f RR &lambda; RR + f RN &lambda; RN + f NN - p ( D ) f RR &lambda; RR + f RN &lambda; RN + f NN - p ( D ) &lambda; RN
等式1
如果已知优势比、群体中的基因型频率和疾病的流行度,则可以通过求解这一方程组得到相对风险。
应注意到,存在两个二次方程,因此它们具有最多四个解。但是,如以下所示,对于这一方程通常存在一个可能的解。
应注意到,当fNN=1时,等式系统1等同于Zhang和Yu公式;但是,这里考虑了群体中的等位基因频率。而且,我们的方法考虑了如下事实:两个相对风险彼此依赖,而先前的方法提出独立地计算各相对风险。
多等位基因基因座的相对风险。如果考虑多标记或其它多等位基因变异,计算略微复杂。a0、a1、...、ak表示可能的k+1个等位基因,其中a0为非风险等位基因。假设了对于k+1个可能的等位基因在群体中的等位基因频率f0、f1、f2、...、fk。对于等位基因i,相对风险和优势比定义为
&lambda; i = P ( D | a i ) P ( D | a 0 )
OR i = P ( D | a i ) ( 1 - P ( D | a 0 ) ) P ( D | a 0 ) ( 1 - P ( D | a i ) ) = &lambda; i 1 - P ( D | a 0 ) 1 - P ( D | a i )
以下等式适用于疾病的流行度:
p ( D ) = &Sigma; i = 0 k f i P ( D | a i )
因此,通过将等式两侧都除以p(D|a0),我们得到:
p ( D ) P ( D | a 0 ) = &Sigma; i = 0 k f i &lambda; i
得到:
OR i = &lambda; i &Sigma; i = 0 k f i &lambda; i - p ( D ) &Sigma; i = 0 k f i &lambda; i - &lambda; i p ( D ) ,
通过设定
Figure BPA00001331512900342
得到
Figure BPA00001331512900343
因此,通过C的定义,得出:
1 = &Sigma; i = 0 k f i &lambda; i C = &Sigma; i = 0 k f i OR i p ( D ) OR i + C - p ( D ) .
这是具有一个变量C的多项式方程。一旦确定了C,就确定了相对风险。多项式为k+1次,因此我们预计具有至多k+1个解。但是,由于方程的右侧严格地减化为C的函数,那么对于这一方程可能通常仅存在一个解。然后使用对半检索找到这个解,因为该解界于C=1和
Figure BPA00001331512900345
之间。
相对风险评估的稳定性。测定各不同参数(流行度、等位基因频率和优势比误差)对于相对风险的估计值的影响。为了测定等位基因频率和流行度估计值对相对风险值的影响,由一组不同优势比、不同等位基因频率的值(在HWE下)计算相对风险,并且对于在0至1范围内的流行度值对这些计算的结果进行绘图。
另外,对于固定的流行度值,所得的相对风险作为风险等位基因频率的函数绘图。很明显,在所有情况下当p(D)=0时,λRR=ORRR和λRN=ORRN,并且当p(D)=1时,λRR=λRN=0。这可以由等式1直接计算得到。另外,当风险等位基因频率高时,λRR接近于线性表现,并且λRN接近于具有有界二次导数的凹函数。当风险等位基因频率低时,λRR和λRN接近于函数1/p(D)的表现。这意味着对于高的风险等位基因频率,流行度的错误估计值通常不会很大地影响所得的相对风险。
优势比与相对风险。在流行病学文献中,相对风险常被认为是对风险直接的和富有信息的量度。但是在通常的病例对照研究和全基因组关联研究中,不能直接计算相对风险。相对风险通常可通过前瞻性研究来估计,在前瞻性研究中在较长的时间内对一组健康个体进行研究。相反,优势比常在病例对照研究中报告。优势比是病例与对照之间携带风险等位基因可能性的比值。对于罕见的疾病,优势比是相对风险的较好的近似值;但是对于常见的疾病,优势比可导致对风险的错误的估计,其中甚至当风险仅少量提高时优势比可能非常高。
相对终生风险与相对风险。相对风险隐含地假定了当前所有的对照都未患有疾病。当估计患病的可能性时,这是相关的。但是,如果需要对终生进行风险估计,或对个体终生患上某个病症的风险进行估计,则需要考虑一些对照最后会患上疾病的事实。相对终生风险被定义为携带有风险等位基因r的个体终生患上某病症的风险与携带非风险等位基因的个体终生患上某个病症的风险的比值。这不同于病例对照研究中相对风险的标准应用,后者基于流行性信息。
可能的k+1等位基因由a0、a1,...,ak表示,其中a0是非风险等位基因。假设了对于k+1个可能的等位基因在群体中的等位基因频率f0、f1、f2、...、fk。进一步假定研究个体可被分为三个组:CA、Y和Z。CA表示病例,Y和Z是对照。与Z组的个体相反,假定Y组的个体最终会患上某个病症。Y和Z的组合由CO表示,Y和CA的组合由D表示。假定|Y|=α|CO|=α(|Y|+|Z|),其中α是在其终生会患上某个病症的对照的分数。注意到α是平均终生风险的上限。取决于疾病发作的年龄以及对照的年龄,α可能小于平均寿命。
相对风险和优势比现在可表示为:
Figure BPA00001331512900351
OR i = P ( a i | CA ) P ( a 0 | CO ) P ( a 0 | CA ) P ( a i | CO )
优势比可以写作
OR i = P ( a i | CA ) P ( a 0 | CO ) P ( a 0 | CA ) P ( a i | CO ) = P ( a i | CA ) P ( a 0 | CA ) &CenterDot; &alpha;P ( a 0 | Y ) + ( 1 - &alpha; ) P ( a 0 | Z ) &alpha;P ( a 0 | Y ) + ( 1 - &alpha; ) P ( a 0 | Z ) =
= P ( CA | a i ) P ( CA | a 0 ) &CenterDot; &alpha;P ( Y | a 0 ) + ( 1 - &alpha; ) P ( Z | a 0 ) &alpha;P ( Y | a i ) + ( 1 - &alpha; ) P ( Z | a i ) =
= P ( CA | a i ) P ( CA | a 0 ) &CenterDot; &alpha;P ( CA | a 0 ) + ( 1 - &alpha; ) P ( Z | a 0 ) &alpha;P ( CA | a i ) + ( 1 - &alpha; ) P ( Z | a i )
第一行与第二行的偏差基于贝叶斯定律,第三行基于CA和Y人群基本相同,从而P(CA|ai)=P(Y|ai)的事实。现在使用P(Z|ai)=1-P(CA|ai)的事实得到:
OR i = P ( CA | a i ) P ( CA | a 0 ) &CenterDot; ( 2 &alpha; - 1 ) P ( CA | a 0 ) + 1 - &alpha; ( 2 &alpha; - 1 ) P ( CA | a i ) + 1 - &alpha; = &lambda; i &CenterDot; ( 2 &alpha; - 1 ) P ( CA | a 0 ) + 1 - &alpha; ( 2 &alpha; - 1 ) P ( CA | a i ) + 1 - &alpha;
如前所述,
Figure BPA00001331512900362
其中p(D)是平均终生风险。因此,使用等式优势比可改写为:
OR i = &lambda; i &CenterDot; ( 2 &alpha; - 1 ) P ( D ) + ( 1 - &alpha; ) C ( 2 &alpha; - 1 ) P ( D ) &lambda; i + ( 1 - &alpha; ) C .
因此,如果给定了C,通过指定
Figure BPA00001331512900365
可得出相对终生风险,
通过求解等式
Figure BPA00001331512900366
可得到C。
可以证明,通过定义C和优势比,C>(2α-1)p(D)(ORi-1)。因此,右侧是C的递减函数,其可通过应用对分检索得出。
基于GCI的终生风险估计。GCI大体上提供了所有相关SNP中,相比于具有非风险等位基因的个体,个体的相对风险。为计算个体的终生风险,个体终生风险与平均终生风险可以相乘,乘积除以人群的平均终生风险。该计算值与平均终生风险和相对风险的定义一致。为计算平均终生风险,列出所有可能的基因型,加和其相对风险,该相对风险计算为其在各单种SNP中的变异的相对风险的乘积。
个性化行动计划
本文公开的个性化行动计划基于个体的基因组谱,提供了有意义的、可操作的信息以改善个体的健康。行动计划提供了就特定基因型相关性而言可能有益于个体的行动方案,其可包括进行治疗处理、监测潜在的治疗需要或治疗效果或者在饮食、锻炼和其它个人习惯/活动等方面改变生活方式,这些可根据个体基因组谱定制入个性化行动计划中。或者,可以基于个体基因组谱给予其特定的等级,另外可任选地包括其它信息,例如家族史、现有的生活习惯和环境情况,例如但不限于工作条件、工作环境、个人关系、家庭环境等。也可引入其它信息,包括种族、性别和年龄。也可将各种饮食和锻炼预防策略的优势比及其与降低疾病或病症风险的相关性引入分级系统。
另外,个性化行动计划可对个体进行修改或更新。例如,如果个体或其保健管理者起初要求自动更新例如注册计划,可将修改或更新的个性化行动计划自动传送至个体或其保健管理者。或者,仅当个体或其保健管理者要求时,才传送更新的个性化行动计划。个性化行动计划也可基于许多因素进行修改和更新。例如,可以更多地分析个体的遗传相关性,所得的结果用于修改现有的建议、增加其它的建议或删除初始个性化行动计划中的建议。在一些实施方式中,个体可改变某些生活习惯/环境,或获知更多有关家族史、现有生活习惯和环境(例如但不局限于工作条件、工作环境、个人关系、家庭环境等)的信息,或希望包括更新的年龄,以获得引入了这些变化的个性化行动计划。例如,个体可遵循其初始的个性化行动计划,例如减少其饮食中的胆固醇或药物治疗,因此可以修改其个性化行动计划建议或降低其患心脏疾病的风险或倾向。
基于个体遵循了个性化行动计划中的建议或个体可作出的或想到的其它变化,个性化行动计划也可预测将来的建议。例如,个体年龄的增加导致骨质疏松风险增加,但是取决于钙的量或其它生活习惯,例如个性化行动计划中的习惯,可降低风险。
个性化行动计划可以单独的报告形式与个体的表型谱和/或基因组谱一起报告给个体或其保健管理者。或者,个性化行动计划也可分别报告。然后个体可以实施其个性化行动计划中的建议的行动。在实施其计划中的任何行动之前,个体可以选择先咨询其保健管理者。
提供的个性化行动计划也可将许多病症具体信息与一组合并的行动步骤联合起来。个性化行动计划也可合并因素,包括但不限于:各病症的流行度、与各病症相关的疼痛的相对量、以及各病症的治疗类型。例如,如果个体心肌梗塞的风险升高(例如,表示成更高的GCI或GCI Plus评分),个体可以让个性化行动计划中包括增加水果、蔬菜和谷物的食用。但是,个体也可易感乳糜泻,因此会存在对小麦麸质的过敏症。因此,增加小麦的食用可能是禁忌的,并可以在个性化行动计划中表明。
个性化行动计划可提供医药(包括处方药、营养品等)建议、非药物建议或两者。例如,个性化行动计划可包括咨询医生以及用于预防的建议药物,例如用于易感心肌梗塞个体的降胆固醇的药物。个性化行动计划也可提供非药物建议,例如遵循个性化生活方式计划,包括基于个体基因组谱的的锻炼方案和饮食计划。
个性化行动计划建议可以是特定的等级、标签或分类系统。各建议可由数字、颜色和/或字母方案或值进行分级或分类。可先对建议分类再分级。可使用多种变型,例如不同的分级方案(使用字母、数字或颜色;字母、数字和/或颜色的组合;在一个或多个分级方案中的不同类型的建议)。
例如,确定个体的基因组谱,基于该其基因组谱将个性化行动计划中对个体的建议分成3类:“A”表示不利或负面的作用;“N”表示中性或没有显著的作用,“B”表示有益的或正面的作用。将该系统作为一个实例,被分为A类的个体的治疗包括个体对其有不良反应的药物,分成N类的治疗对个体没有任何显著的正面或负面作用,分成B类的治疗有益于个体的健康。使用相同的分类系统,饮食计划也可被分成A、B和N类。例如,个体过敏的食物或应该特别避免的食物(例如,对于易感糖尿病或龋齿的个体应该避免的糖)将被分为A类。对个体健康没有显著作用的食物被分成N类。特别有益于个体健康的食物被分成B类,例如如果个体胆固醇过高,低胆固醇的食物将被分成B类。个体的锻炼方案也可基于这个相同的系统。例如,易感心脏病的个体应该避免剧烈的锻炼,因此跑步是A类活动,步行或一定节奏的慢跑是B类活动。对于某个个体,站立一段时间可能是N类活动,但是对于另一易感静脉曲张的个体是A类活动。
另外,在A、N或B的各个分类中,可以进一步进行分类,例如按照影响从低到高分成1至5类。例如,分成A1类的治疗表示有轻微的负面作用,例如轻微的恶心,A2类表示治疗引起了呕吐,A5治疗会引起严重的不良反应,例如过敏性休克。相反,B1类治疗对个体有轻微的正面作用,B5类对个体有显著的正面作用。例如,如果个体易感肺癌或成长时呼吸了二手烟,个体不吸烟可以是B5类,而不易感肺癌的个体可以是B4类。
也可通过不同的颜色表示不同的分类,例如,A可以是红色调,可以表示对个体健康从低到高的作用,其色度可以从淡红色至暗红色,淡红表示对个体健康负面影响较低,暗红色表示对个体健康有严重的不良作用。系统也可以是连续的颜色、数字或字母谱。例如,除了A、N和B和/或其子类,分类可以从A至G,其中A表示严重负面影响个体健康的事物、治疗、生活习惯、环境以及其它因素,D表示具有正面或负面的最小作用的因素,G表示非常有益于个体健康的因素。或者,除了从A至G,数字或颜色也可表示影响个体健康的食物、治疗、生活方式、环境和其它因素的连续的谱。
在一些实施方式中,可对个性化行动计划中特殊的治疗、药物或其它生活方式的元素进行分类、标记或分级。例如,个体可具有包括锻炼方案和饮食计划的个性化行动计划。锻炼计划可包含一种或多种等级或分类。例如,锻炼方案的等级可以是如表1中的A至E,其中各字母对应于一种或多种类型的锻炼,包括有关活动类型、时间长度、给定时间范围的次数等在各个水平下的信息,从而给个体推荐锻炼方案。
表1:锻炼方案:心血管活动
Figure BPA00001331512900391
Figure BPA00001331512900401
在一个实施方式中,基于个体的基因组谱,个体的个性化行动计划可具有A等级,因此推荐给个体的锻炼计划将选自表1中A栏的选择以进行其心血管锻炼。相似地,相似的负重训练系统也可以是个体锻炼方案中的一部分,并且会给个体推荐A等级的负重训练选项。在一些实施方式中,可引入因素与个体的基因组谱一起确定个体的锻炼方案等级,所述因素例如,但不限于个体现有的饮食、锻炼、其它个人习惯/活动、任选的其它信息,例如家族史、现有的生活习惯和环境,例如但不限于工作条件、工作环境、个人关系、家庭环境、种族、性别、年龄和其它因素。另外,随着个体生活习惯的改变,或知道和引入了更多的因素,个体的等级也可发生变化,例如,如果个体遵循个性化行动计划中的推荐的活动,开始等级为A,个体可要求更新个性化行动计划,评价和确定现在个体处于B等级。或者,个体的个性化行动计划可提供关于个体何时应该考虑从A等级更换至B等级以使其健康最大化的时间线。
个性化行动计划也可具有饮食计划的分级系统。例如,对饮食计划的分级可以是从1至5的体系,其中各个数字对应于脂肪、纤维、蛋白质、糖和其它建议个体在其饮食中添加的营养素、特定的比例大小、卡路里值的特定的分组、和/或与个体应该将其作为饮食的其它食物的分组。基于个体的基因组谱,个性化行动计划可给予个体等级2,因此个体推荐的饮食计划将是在等级2下的饮食选择。
在另一实施方式中,可以对个体食物进行分类。例如,给予等级2的个体应该选择分类也为2的特定食物。例如,特定的蔬菜、肉、水果、乳制品及其它分类为2的食物,不能选择其它分类的食物。例如,芦笋是分类为2的蔬菜,而甜菜分类为3,因此个体在其饮食中应该较多地包括芦笋,而不应是甜菜。
在另一实施方案中,基于个体基因组谱给予个体其应遵循的饮食类型等级的建议,该建议是个体在其饮食中应该具有的饮食类型中营养物类型的统计分析。等级可以是包括形状、颜色、数字和/或字母的可视化表示形式。等级可以是包括形状、颜色、数字和/或字母的可视化表示形式。例如,如图4A所示(也见实施例3),发现个体易患结肠癌和糖尿病,给予个体一个符号,该符号代表在个体饮食中应该具有的推荐的食物类型中的不同营养物的比例。不同类型的食物,例如,但不局限于具体的水果、蔬菜、碳水合物、肉类、乳制品等,以相同的方案表示,如图4B-4D中所示。以符号对食物进行分级,其中食物符号与给予个体的符号最接近的食物将是对个体推荐的食物。
在一些实施方式中,可引入因素与个体的基因组谱一起形成个性化行动计划,从而影响给予个体饮食计划的等级,所述因素例如,但不限于个体现有的饮食、锻炼、其它个人习惯/活动、任选的其它信息,例如家族史、现有的生活习惯和环境,例如但不限于工作条件、工作环境、个人关系、家庭环境、种族、性别、年龄和其它因素。另外,随着个体生活习惯的改变,或者知道或引入了更多的因素,个体的等级也可改变。例如,如果个体遵循了个性化行动计划中推荐的活动,其饮食计划起始等级为1,这是一种胆固醇极低的饮食计划,个体可以要求更新个性化行动计划,引入其生活习惯中已经发生的变化,以使得个体具有改善的胆固醇水平,更新的行动计划可显示个体现在更适合遵循等级2的饮食计划,或可以选择等级1和2的饮食计划。或者,个体的起始行动计划可提供个体何时应该考虑从等级1转换至等级2的时间线,或基于预定计划在不同等级的不同饮食计划之间改变其饮食计划,以使其健康最大化。
个性化行动计划中的等级可以用于不同分级系统的组合。例如,等级为从A到E的锻炼方案系统和等级为从1到5的饮食计划系统可用于给予个体其个性化行动计划中的A1等级。因此,推荐个体遵循等级A的锻炼方案和等级1的饮食计划。或者,锻炼和饮食方案可使用单个分级系统。例如,个体在个性化行动计划中可以给予特定的等级,例如等级C,以使得对个体推荐的锻炼和饮食方案都在C分类下。在其它实施方式中,也包括了其它类型的建议,例如其它生活方式活动和习惯。例如,除了锻炼和饮食方案,在单个分级系统下也可包括其它建议,例如治疗、工作环境类型、社会活动类型。或者,不同的分级系统也可用于其它建议。例如,字母可以用于推荐的锻炼方案,数字可用于饮食方案,颜色可用于药物建议。
在一些实施方案中,使用二元分级系统以使得建议类型成对分组。该系统类似于Myers Briggs Type Indicator(MBTI)系统。在MBTI系统中,有四对偏好或二分(dichotomies),个体被置于各对中的一个。个体的偏好是1)外向或内向,2)感觉或直觉,3)想法或感觉,及4)判断或感知。可使用系统中的变化,基于个体的基因组谱来确定对个体的建议,以改善其健康。
例如,个体的饮食可以是A或B,其中A表示某类型的营养物的混合物,B表示不同的混合物。或者,可将具体的食物类型分成A或B。个体的锻炼方案可具有另一二元分类,例如H或L,其中H表示个体应该参与高强度锻炼,L表示低强度运动。如此,个体可被分类为AH。另一二元分类可用于社会接触。例如,个体一般有合群(S)或不合群(U)的倾向,如此,建议可包括活动的类型或个体应该避免或寻找的人群,以减少压力和促进其健康。
个性化行动计划也可更新,以包括基于个体知晓的信息的因素,包括科学信息或来自个体的信息,例如“现场部署(field-deployed)”或直接机制,例如代谢物水平、葡糖糖水平、离子水平(例如钙、钠、钾、铁)、维生素、血细胞计数、体重指数(BMI)、蛋白质水平、转录物水平、心率等,这些信息可通过容易获得的方法确定,并且当其被知晓时,例如通过实施监测,可以在个性化行动计划中包括这些因素。个性化行动计划可以修改,例如,基于遵循计划的个体,该计划也可影响个体可具有的一种或多种病症的倾向。例如,可以更新个体的GCI评分。
社区和激励
本公开提供了基于个体的基因组谱的表型谱和个性化行动计划,使得个体能很好地了解其健康状况,以及促进个体健康的个体定制的选择。本文也提供了社区,例如在线社区,其能提供对个体的支持和激励以追求其个性化行动计划。对个体改善其健康的激励,例如,通过遵循其个性化行动计划,也可包括金钱奖励。
个体可参加到社区,例如在线社区,其中个体或其保健管理者有权访问个体的基因组谱、表型谱、和/或个性化行动计划。个体可以通过个人在线入口选择使基因组谱、表型谱、和/或个性化行动方案对所有社区、部分社区可以获得或所有社区均不可见。朋友、家人或同事可为在线社区的一部分。例如,在线社区例如https://changefire.com为本领域所熟知的激励个体达到其目标的社区。在本公开中,个体参与支持和激励个体改善其健康的在线社区,或是这些社区的成员,使用其表型谱例如GCI评分作为基线,或通过达到其个性化行动计划中的目标。在线社区可限于个体的朋友、家人或同事,或朋友、家人和同事的集合。个体也可包括其以前不知道的其它在线社区成员。在线社区也可以是雇主资助的社区。个体可与具有相似表型谱、行动计划的其它人组成小组,彼此激励以实现其目标。个体可与在线社区中的其他人建立竞争,以提高其GCI分数和/或实现其个性化行动计划的目标。
例如,个体的报告,例如其GCI分数和个性化行动计划,可对在线社区中个体的家人和朋友可见。个体可选择其报告对谁可见和/或可访问。在线版本可包括包含个性化行动计划项目的清单或里程碑措施,其中个体可区分其个性化行动计划的完成或进展。遗传信息改变时GCI分数可更新并反映在在线报告中。个体也可输入已经改变的因素,例如生活方式改变、锻炼方案的改变、饮食改变、药物治疗和可改变个体报告的其它因素,这些因素也可改变个体的报告。家人和朋友可看见个体的进步,以及个体生活的改变,和他们怎么反映或改变个体的风险或倾向。在线入口可允许个体查看初始和后续的报告。个体也可接受来自朋友和家人的反馈和评论。家人和朋友可留下支持性和激励性的评论。
在线社区也可通过推进个体个性化行动计划和/或降低其患疾病的风险或倾向,提供对个体的激励以改善其健康。激励也可提供给不在在线社区中的个体。例如,雇主资助的在线社区可提供健康计划,其中当个体达到某个目标,例如推进其个性化行动计划时,雇主给予更多的津贴、提供额外假期、或捐助个体的健康储蓄账户,从而降低其患疾病的风险和/或倾向。或者,社区不一定是在线的,通过个性化行动计划和/或降低的疾病倾向,个体向为雇主处理健康计划的指定人员提交其进展的证据。
也可用其它激励来激发个体通过降低其对疾病的倾向、和/或遵循其个性化行动计划来改善其健康。当达到某个目标时,例如降低疾病的风险某个百分比或数值,或从一个分类到另一分类(即,高风险到低风险),或通过实现个性化行动计划中的某一目标,个体可接受兑现奖励的积分。例如,个体可实现了某个数值的风险降低,在某一时间范围内实现对疾病风险的最大降低,完成个性化行动计划的目标,或完成个性化行动计划的大多数目标。
朋友、家人和/或雇主可提供积分和/或奖励,可能通过购买它们,将其作为对降低其患疾病的风险或倾向和/或实现其个性化行动计划的奖励给予个体。个体也可因为在他人,例如其它同事、朋友、家人、或具有同样目标的在线社区成员的人群之前达到目标而接受积分/奖励。例如,最先实现将风险降低某个数值,在某一时间范围内实现患疾病风险的最大降低,完成个性化行动计划的目标,或完成个性化行动计划的大多数目标。个体可接受现金、或兑现现金的积分作为奖励。其他奖励可包括药品、保健品、健康俱乐部成员资格、spa治疗、医疗程序、监测健康的设备、遗传测试、旅游等,例如本文描述的服务的注册、或上述项目的折扣、补助或补偿。
激励可由朋友、家人和雇主发起。医药公司、健康俱乐部、医疗设备公司、spas等也可发起激励。主办方可交换广告、或招聘,例如,医药公司可能意图获得个体的基因组谱以建立数据库或临床试验。另外,激励可用来鼓励个体参与到激发个体改善其健康的社区,例如本文描述的在线社区。
访问权限和个性化行动计划
可以向个体提供包含基因组谱、表型谱和其它与表型谱和基因组谱相关的信息(例如个性化行动计划)的报告。保健管理者和提供者,例如护理人员、医生和遗传顾问也可以具有报告的访问权。报告可以被打印、保存在计算机上或在线浏览。或者,谱和行动计划可以以纸件的形式提供。它们也可保存在纸上或计算机可读介质上,例如在某时的互联网,随后的更新通过纸件、计算机可读介质或网络提供。谱和行动计划可编码在计算机可读介质上。
基因组谱、表型谱以及个性化行动计划可通过在线入口访问,在线入口是一种信息来源,个体可使用计算机和互联网、电话或其它相似的信息访问方法容易地访问这些信息来源。该在线入口可以任选地为加密的在线入口或网站。该网站可以提供与其它加密和非加密网站的链接,例如连接具有个体的表型谱的加密网站的链接或者连接非加密网站(如共享特定表型的个体的留言板)的链接。
报告可以是个体的GCI评分或GCI Plus评分(如在本文中所述,报告GCI评分也包括报告GCI Plus评分或两者的方法)。例如,对于一种或多种病症,评分可使用显示器可视化。显示屏(例如,计算机监视器或电视屏)用于可视化显示,例如具有相关信息的个人入口。在另一实施方式中,显示装置是静态显示装置,例如打印页面。显示可以包括,但不限于一种或多种以下装置:箱元(bin)(例如,1-5、6-10、11-15、16-20、21-25、26-30、31-35、36-40、41-45、46-50、51-55、56-60、61-65、66-70、71-75、76-80、81-85、86-90、91-95、96-100)、彩色或灰度梯度、温度表、量表、饼图、柱形图或棒图。在另一实施方式中,温度表用于显示GCI评分和疾病/病症流行度。温度表显示随着报告的GCI评分变化的水平,例如,温度表可以显示随GCI评分增大的色度变化(例如,从较低GCI评分的蓝色逐渐变化至较高GCI评分的红色)。在相关实施方式中,温度表显示随报告的GCI评分变化的水平和随风险级别增大的色度变化。
也可使用听觉反馈向个体传递个体的GCI评分。例如,听觉反馈可以是危险等级是高或低的口头说明。听觉反馈也可以是特殊的GCI评分的叙述,例如数字、百分位、范围、四分位或者与群体GCI评分的平均数或中位数的比较。在一个实施方式中,有生命的人亲自或者通过通信装置,例如电话(陆上线路电话、便携式电话或卫星电话)传递听觉反馈,或者通过个人入口传递听觉反馈。听觉反馈也可以通过自动系统(例如计算机)传递。听觉反馈可以是互动声音反应(IVR)系统的部分传递,该系统是一种允许计算机使用正常电话呼叫检测语音和按键音的技术。个体可以通过IVR系统与中央服务器互动。IVR系统可以对事先录制或动态产生的音频作出反应以与个体互动并且向他们提供其风险等级的听觉反馈。个体可以呼叫由IVR系统回答的号码。在任选地输入认证码、安全码或经过语音识别程序后,IVR系统要求个体从菜单中选择选项,例如按键音或语音菜单。这些选项中的一个可以向个体提供他或她的风险等级。
个体的GCI评分使用显示装置可视化并且使用听觉反馈传递,例如通过个人入口。该组合可以包括GCI评分的可视显示和听觉反馈,其讨论GCI评分对个体的整体健康的相关性和可以提出的可能的预防措施,例如其个性化行动计划。
个体可访问不同的报告选项。例如,在线接入点,例如在线入口可使得个体基于其基因组谱显示单个或多个表型谱。注册用户也可以具有不同的察看选项,例如,“快速查看(Quick View)”选项,以获得单个或多个症状简单的概况。也可以选择“全局查看”选项,其中提供了各目录的详细信息。例如,可以存在关于个体出现表型的可能性的更详细的统计;关于典型症状或表型的更多信息,例如医学病症的代表症状或者身体非医学病症(如身高)的范围;或者关于基因和遗传变异的更多信息,例如群体流行度,如在世界上或者在不同国家中,或者在不同年龄范围或性别中的群体流行度。例如,许多病症的估计终生风险的概况可在“快速查看”选项中,有关特定病症例如前列腺癌或克罗恩氏病的更多的信息,可在其它查看选项中。对于不同的查看选项可存在不同的组合和变型。
个体选择的表型可以是医学病症,并且在报告中的不同治疗和症状可以链接至其它包含有关治疗的进一步信息的网页。例如,通过点击药物,会导向包括关于剂量、费用、副作用和功效的信息的网页。也可以将药物与其它治疗进行比较。网页也可以包括导向药物制造商的网站的链接。另一链接可以向注册用户提供生成药物基因组(pharmacogenomic)谱的选项,这将包括基于其基因组谱的信息如他们对于药物的可能反应。也可以提供对于药物的替代方案的链接,例如预防性行为(如康体和减轻体重);并且也可以提供对于饮食补充、饮食计划的链接及对于附近的健身俱乐部、健康诊所、保健及康复提供者、都市型spa(day spa)等的链接。也可以提供教育和情报视频、可利用的治疗的概要、可能的疗法和一般性建议。
在线报告也可以提供安排个人医生或遗传咨询预约的链接或者访问在线遗传顾问或医生的链接,从而为注册用户提供询问更多关于其表型谱的信息的机会。在线报告上也可以提供在线遗传咨询和医师询问的链接。
在另一实施方式中,报告可以是“娱乐”表型的报告,例如,个体基因组谱与知名个体(如阿尔伯特·爱因斯坦)的基因组谱的相似性。报告可以显示个体基因组谱与爱因斯坦的个体基因组谱之间的百分比相似性,并且可以进一步显示爱因斯坦的预测IQ和该个体的预测IQ。进一步的信息可以包括总群体的基因组谱和其IQ与该个体和爱因斯坦的基因组谱和IQ比较的情况。
在另一实施方式中,报告可以显示已与个体的基因组谱相关联的所有表型。在其它的实施方式中,报告可以仅显示确定与个体的基因组谱正相关的表型。在其它形式中,个体可以选择显示表型的特定亚类,例如仅医学表型或者仅可处置的医学表型。例如,可处置的表型及其相关的基因型可以包括克罗恩氏病(与IL23R和CARD15相关)、1型糖尿病(与HLA-DR/DQ相关)、狼疮(与HLA-DRB1相关)、牛皮癣(HLA-C)、多发性硬化症(HLA-DQA1)、格雷夫斯病(HLA-DRB1)、风湿性关节炎(HLA-DRB1)、2型糖尿病(TCF7L2)、乳腺癌(BRCA2)、结肠癌(APC)、情景记忆(KIBRA)和骨质疏松症(COL1A1)。个体还可选择在他们的报告中显示表型的子类,例如,仅医学病症的炎性疾病或仅非医学病症的身体性状。在一些实施方式中,个体可以选择通过突出显示计算了估计风险的那些病症、仅具有较高风险的病症或仅具有较低风险的病症而显示对该个体计算了估计风险的所有病症。
提交并传送至个体的信息可以是加密的和保密的,并且可以控制个体对这些信息的访问。由复杂基因组谱得到的信息可以作为管理部门批准的、可理解的、医疗相关的和/或具有高度影响的数据提供给个体。信息也可以是具有一般的意义,而与医疗无关。可以通过几种方式向个体加密地传送信息,所述方式包括,但不限于入口界面和/或邮寄。更优选地,信息通过入口界面加密地(如果个体如此选择)向个体提供,其中个体对该入口界面具有安全和保密的访问权限。这一界面优选通过在线的、互联网站入口提供,或者可选择地,通过电话或允许提供私密、安全和易于使用的访问的其它方式。基因组谱、表型谱和报告通过网络的数据传输向个体或其保健管理者提供。
因此,如图5所示(500),通过其生成报告的示例逻辑设备可包括计算机系统(或电子设备)。计算机系统可接受存储的基因组谱,分析基因型相关性,基于对基因型相关性的分析生成规则,将生成的规则应用于基因组谱,产生表型谱、个性化行动计划和报告。例如,个性化行动计划可从计算机系统获得和输出。计算机系统500可以理解为能够从介质511和/或网络端口505读取指令的逻辑设备,该网络端口505能够任选地与具有固定介质512的服务器501相连。例如如图5中所示的系统包括CPU 501、磁盘驱动器503、任选的输入设备(例如键盘515和/或鼠标516)以及任选的监视器807。数据通信可通过本地或远端的服务器与所示的通信媒介完成。通信媒介可以包括传送和/或接收数据的任何手段。例如,通信媒介可以是网络连接、无线连接或者互联网连接。该连接可在互联网中提供通讯。可以想到,与本发明相关的数据可在该网络或连接中传送以由某一方522接收和/或查看。接收方522可以为个体、医疗保健提供者或保健管理者,但不限于此。在一个实施方式中,计算机可读的介质包括适于传送生物样品或基因型相关性的分析结果的介质。所述介质可以包括关于个体表型谱和/或个体行动计划的结果,其中使用在本文所描述的方法得到这一结果。
个人入口可用作个体接收和评价基因组数据的基本界面。入口将使个体能够跟踪其样品从收集到测试的过程并能够跟踪结果。通过入口访问,基于其基因组谱向个体介绍常见遗传病的相对风险。个体可以通过入口选择将哪些规则应用于其基因组谱。
在一个实施方式中,一个或多个网页将具有表型的列表和靠近每个表型有一个方框,注册用户可以选择方框以将其包括在他们的表型谱中。表型可以链接至与该表型有关的信息,以帮助注册用户明智地选择关于他们希望包括在其表型谱中的表型。网页也可以具有按疾病分组(例如可处置的疾病或不可处置的疾病)组织的表型。例如,个体可以仅选择可处置的表型,例如HLA-DQA1和乳糜泻。注册用户也可以选择显示表型的症状前或症状后治疗。例如,个体可以选择具有症状前治疗的可处置表型(在进一步筛查以外),对于乳糜泻为无谷蛋白饮食的症状前治疗。另一实例可以是阿尔茨海默氏病,症状前治疗为他汀类药物、锻炼、维生素和精神作用。血栓形成是另一实例,症状前治疗是避免口服避孕药和避免长时间久坐。具有经批准的症状后治疗的表型的实例为与CFH有关的湿性AMD,其中个体可以进行对其病症的激光治疗。
表型也可以按疾病或病症的类型或种类进行组织,例如神经学、心血管、内分泌、免疫学等等。表型也可以分组为医学和非医学表型。在网页上的表型的其它分类可以按照身体性状、生理性状、精神性状或情绪性状进行。网页可以进一步提供通过选择一个方框而选择一组表型的分区。例如,选择所有表型、仅与医学相关的表型、仅非医学相关的表型、仅可处置的表型、仅不可处置的表型、不同的疾病组或者“娱乐”表型。“娱乐”表型可以包括与名人或其他知名个体的对比,或者与其它动物或甚至其它生物体的对比。可用于对比的基因组谱的列表也可以在网页上提供以用于由个体选择而与个体的基因组谱对比。
在线入口也可以提供搜索引擎,以帮助个体浏览入口、检索特定表型或者检索由其表型谱或报告所揭示的特定术语或信息。也可以由入口提供访问搭配的服务和提供的产品的链接。也可以提供连接到支持小组、留言板和具有共同或相似表型的个体的聊天室的另外的链接。在线入口也可以提供连接到具有更多与个体表型谱中的表型有关的信息的其它地址的链接。在线入口也可提供服务使个体与朋友、家人、合作者或保健管理者分享其表型谱或报告,使个体可选择哪些表型显示在其想与朋友、家人、合作者或保健管理者分享的表型谱中。
表型谱和报告向个体提供了个人化基因型相关性。用于生成个性化行动计划的基因型相关性给个体提供了更多的知识和机会来确定其个人健康和生活方式的选择。如果发现了在遗传变异与可进行治疗的疾病之间的强相关性,遗传变异的检查有助于确定开始治疗疾病和/或个体监测。在存在统计学上显著的相关性但不认为是强相关性的情况下,个体可以与个人医生讨论该信息并决定适当、有益的行动方案。就特定基因型相关性而言可能有益于个体的潜在行动方案包括进行治疗处理、监测潜在的治疗需要或治疗效果或者在饮食、锻炼和其它个人习惯/活动等方面改变生活方式,这些可根据个体基因组谱定制入个性化行动计划中。其它个人信息,例如现有的习惯和活动也可合并入个性化行动计划中。例如,可处置表型(如乳糜泻)可以进行无谷蛋白饮食的症状前治疗,这也可在个性化行动计划中提供。同样,通过药物基因组学,基因型相关性信息可应用于预测必须用特定药物或药物疗程进行治疗的个体的可能反应,例如特定药物治疗的可能的效力或安全性。
基因型相关性信息也可与遗传咨询结合以用于向考虑生育的夫妇提出建议,以及提出对于母亲、父亲和/或孩子的潜在遗传关注。遗传顾问可以向具有显示特定病症或疾病的较高风险的表型谱的个体提供信息和支持。他们可以解释关于该病症的信息、分析遗传模式和复发风险并与注册用户讨论可用选择。遗传顾问也可以提供支持性咨询以向注册用户推荐社区或国家支持服务。遗传咨询可以包括特定注册计划。遗传咨询选择也可以包括安排在所请求的24小时内的遗传咨询,且可在如晚上、星期六、星期日和/或假日的非传统时间内提供。
个体的入口也可便于传递初始筛查以外的附加信息。个体可被告知有关其个人遗传图谱的新的科学发现,例如关于其目前或潜在病症的新的治疗或预防对策的信息。新发现也可以传递给其保健管理者。新发现也可合并入更新的或修改的个性化行动计划。通过电子邮件向个体或其保健提供者通告关于个体的表型谱中的表型的新基因型相关性和新研究。例如,可将“娱乐”表型的电子邮件发送给个体,例如电子信件可以告知他们其基因组谱的77%与阿伯拉罕·林肯的基因组谱相同以及进一步的信息通过在线入口提供。
本文也提供了告知注册用户新的或者修正的相关性和新的或者修正的报告的计算机代码,例如具有新的预防和健康信息、关于开发中的新治疗方法的信息或可获得的新治疗的报告。本文也提供了一种用于生成新规则、修正规则、组合规则、定期用新规则更新规则集、安全地维持基因组谱数据库、将规则应用于基因组谱以确定表型谱、生成个性化行动计划和报告的计算机代码系统,包括对不同水平的奖励以及不同注册个体的选择实施奖励的计算机编码。
注册
基因组谱、表型谱和报告,包括个性化行动计划可以例如通过计算机用于人类或非人类个体。例如,个体可包括其它的哺乳动物,例如牛、马、羊、犬或猫。个体可以是个人的宠物,宠物的所有者可能需要个性化行动计划来增强其宠物的健康及延长其寿命。个体或其保健管理着可以是注册用户。当用于本文时,注册用户是通过购买或支付一项或多项服务而订制服务的人类个体。服务可以包括,但不限于以下一种或者多种:确定他们自己或另一个体(例如注册用户的孩子或宠物)的基因组谱;获得表型谱;更新表型谱和获得基于他们的基因组谱和表型谱的包括个性化行动计划的报告。
注册用户可以选择将基因组谱和表型谱或报告提供给其保健管理者,例如医生或遗传顾问。基因组谱和表型谱可以由保健管理者直接访问,由注册用户打印出一份以交给保健管理者,或者通过在线入口(例如通过在线报告上的链接)将其直接发送给保健管理者。
可以给注册用户和非注册用户生成基因组谱并以数字化形式存储,例如计算机可读介质,但是可以仅限注册用户访问表型谱和报告,例如通过计算机输出。例如,可以给注册用户提供由计算机生成和输出的至少一项GCI评分的访问权限,但是不提供给非注册用户。在另一变型中,注册用户和非注册用户都可以通过计算机访问其基因型谱和表型谱,但是非注册用户具有受限制的访问权限或者允许生成有限的报告,然而注册用户具有完整的访问权限并且可以允许生成完整报告。在另一实施方式中,注册用户和非注册用户最初可以具有完全的访问权限或者完整的初始报告,但仅注册用户可以访问基于其存储的基因组谱更新的报告。例如,向非注册用户提供访问权限,其中他们可以具有访问他们的GCI评分中的至少一项的受限的访问权限,或者他们可以允许生成他们的GCI评分中的至少一项的初始报告,但是仅通过付费订制才生成更新的报告。保健管理者和提供者,例如护理人员、医生和遗传顾问,也可以具有访问个体GCI评分中的至少一项的权限。
其它注册模型可以包括提供表型谱的注册模型,其中注册用户可以选择将所有现有规则应用于他们的基因组谱,或者将现有规则的子集应用于他们的基因组谱。例如,他们可以选择仅应用可处置(actionable)的疾病表型的规则。注册可以是等级的,使得在单个注册等级内具有不同的水平例如,不同的水平可以取决于注册用户想要与他们的基因组谱关联的表型数目,或者取决于可以访问他们的表型谱的人员的数目。
注册的另一水平可以将个体特有的因素,例如早已知道的表型(如年龄、性别或者病史)并入他们的表型谱。基本注册的再另一个水平可以允许个体生成对于疾病或病症的至少一项GCI评分。如果由于用于生成至少一项GCI评分的分析中的变化而导致至少一项GCI评分的任何变化,这一水平的变型形式可以进一步允许个体指定生成对于疾病或者病症的至少一项GCI评分的自动更新。在一些实施方式中,可以通过电子邮件、语音信息、文本信息、邮递或传真向个体通告自动更新。
注册用户也可以生成具有他们的表型谱以及关于表型的信息(例如关于表型的遗传和医疗信息)的报告。个体可访问的信息量可以不同,取决于个体具有的注册的水平。例如,个体可具有的不同的查看选项取决于个体的注册水平,例如未注册用于或更基本注册的快速查看选项,但是对于全局注册的个体其可访问全局查看选项。
例如,不同的注册水平具有不同的变型,对信息的访问权限的组合也可包含在报告中,这些信息包括,但不限于人群中表型的流行度、用于关联的遗传变异、引起表型的分子机制、对于表型的治疗方法、对于表型的治疗选择和预防性行动。在其它实施方式中,报告还可以包括例如个体的基因型与其他个体(如名人或者其他知名人士)的基因型之间的相似性的信息。关于相似性的信息可以是,但不限于同源性百分比、相同变异的数目和可能相似的表型。这些报告可以进一步包括至少一项GCI评分。
如果在线访问报告,则基于注册水平的其它选项也可以包括连接到具有关于表型的进一步信息的其他位置的链接、连接到具有相同表型或者一个或多个相似表型的人的在线支持小组和留言板的链接、联系在线遗传顾问或医生的链接或者连接到安排遗传顾问或医师的电话或现场预约的链接。如果报告是纸件形式,则信息可以是上述链接的站点位置或者遗传顾问或医生的电话号码和地址。注册用户也可以选择哪些表型包括在他们的表型谱中和哪些信息包括在他们的报告中。表型谱和报告也可以被个体的保健管理者或提供者取得,例如护理人员、医生、精神病医生、心理学家、治疗专家或者遗传顾问。注册用户也能够选择是否表型谱和报告或者其部分内容由个体的保健管理者或提供者得到。
另一注册水平可以是在生成初始表型谱和报告之后数字化地保持其基因组谱,并且注册用户能够利用由最近的研究得到的更新的相关性生成表型谱和报告。注册用户能够利用由最近的研究得到的更新的相关性生成风险谱和报告。由于研究揭示出基因型与表型、疾病或者病症之间的新的相关性,基于这些新的相关性将产生新的规则,并且新的规则能够应用于已经存储和保持的基因组谱。新的规则可以关联先前未与任何表型关联的基因型、使基因型与新的表型相关联、修正现有的相关性或者基于新发现的基因型与疾病或病症之间的关联提供调整GCI评分的基础。可以通过电子邮件或者其它电子方式告知注册用户新的相关性,并且如果是感兴趣的表型,他们可以选择用新的相关性更新他们的表型谱。注册用户可以选择为每次更新付费、为在指定时间期限(例如,3个月、6个月或者1年)内的多次更新或无限次更新付费的注册方式。另一注册水平可以是,无论何时基于新的相关性产生了新的规则,注册用户使他们的表型谱或者风险谱自动更新,而不是个体选择何时更新他们的表型谱或风险谱。
注册用户也可以向非注册用户介绍以下服务:生成表型与基因型之间的相关性规则,确定个体的基因组谱,将规则应用于基因组谱,并且生成个体的表型谱。注册用户通过介绍可以使注册用户得到优惠的服务订制价格或者使其现有的注册升级。被介绍的个体可以在有限时间内免费访问或者享受折扣注册价格。
以下实施例举例说明和解释了本文的实施方式。本发明的范围不受这些实施例的限制。
实施例
实施例1:GCI评分之间的比较
对于10个与T2D相关的SNP,在整个HapMap CEU群体上基于多个模型计算GCI评分。相关SNP为rs7754840、rs4506565、rs7756992、rs10811661、rs12804210、rs8050136、rs1111875、rs4402960、rs5215、rs1801282。对于这些SNP中的每个,三个可能的基因型的优势比在文献中进行了报道。CEU群体由三十个母亲-父亲-孩子的三人组组成。为了避免相依性,采用来自这一群体的六十位父母。排除在10个SNP之一中具有非检出的一个个体,得到一组59个个体。然后使用几种不同的模型计算各个个体的GCI等级。
不同的模型对此数据集产生了高度相关的结果。在各对模型之间计算Spearman相关性(表2),其显示出积性和加性模型具有0.97的相关系数,并且因此使用加性或积性模型时GCI评分是稳固的。相似地,Harvard改良评分和积性模型之间的相关性为0.83,并且Harvard评分和加性模型之间的相关系数为0.7。但是,使用最大优势比作为遗传得分产生由一个SNP定义的二分评分(dichotomous score)。总的说来,这些结果表明,评分排位提供了使模型依赖性最小化的稳定构架。
表2:模型对之间CEU数据的评分分布的Spearman相关性。
Figure BPA00001331512900551
测定T2D流行度的变化对所得分布的影响。流行度值在0.001~0.512之间变化(图14)。对于T2D的情况,可以看出,不同的流行度值导致个体的相同顺序(Spearman相关性>0.99),因此可以假设流行度的人工固定值0.001。
实施例2:GCI的评估
WTCCC(Wellcome Trust Case Control Consortium,Nature.447:661-678(2007))数据用于测试GCI构架。该数据集含有约14000个被划分为8组人群的个体的基因型。这8组人群由患有7种不同疾病的7组人群以及一组对照人群组成。使用Affymetrix 500kGeneChip检测所有个体的基因型。对于7种不同疾病中的3种,即II型糖尿病、克罗恩氏病、和类风湿性关节炎,通过Affymetrix 500kGeneChip在通过保藏(curation)标准集的SNP中寻找r2=1的SNP至原始公开的SNP。II型糖尿病找到了8种SNP,克罗恩氏病找到了9种SNP,风湿性关节炎找到了5种SNP。
接受者操作曲线(ROC)曲线图(The Statistical Evaluation of Medical Tests for Classification and Prediction,MS Pepe.Oxford Statistical Science Series,Oxford University Press(2003))用于评价GCI用于对病症进行分类测试的能力。优选地,应该存在阈值t,当个体的GCI评分高于t时,该个体必然是病例,当个体GCI评分低于t时,该个体必然是对照。计算在上述三种病例-对照集中的每个个体的GCI评分。然后基于由GCI评分阈值定义的二元测试绘制真阳性率与假阳性率的函数关系图。最后,计算所得图的曲线下面积(Area Under the Curve,AUC)。对于随机诊断测试,AUC为0.5,对于完善的测试(perfect test),AUC为1。
为了获得用于比较的基线,使用逻辑回归来计算最佳模型,所述最佳模型利用了SNP之间的相互作用来拟合数据。如果SNP是s1,s2,...,s,则模型假定对数(logit)是X=a1s1+a2s2+...+ansn+a12s12+...+an-1,nsn-1,n,其中sij是si和sj之间的相互作用。拟合概率用作风险的评估,并且形成用于这些风险评估的ROC曲线。注意到该模型考虑了SNP之间的配对的相互作用,因此其至少应该与GCI评分一样精确。
对于所有的三种疾病,GCI和逻辑回归的AUC都非常相似(表2),从而得出结论:至少对于这些疾病和这些SNP,SNP-SNP相互作用不会给风险评估增加实质性信息。因此,SNP-SNP相互作用可以忽略的假定是合理的,只要已有的研究中没有证据表明存在该相互作用。
将GCI ROC曲线与理论疾病模型相比较。该疾病模型假定疾病受到环境和遗传因素的影响,并且两个因素是独立的。P=G+E,其中G是遗传风险,E是环境风险。第一种模型假定G~N(0,σG),E~N(0,σE),并且对于固定的α,如果P>α,则个体在其终生中会出现该病症。使用遗传率为σG/(σGE)、平均终生风险为Pr(P>α)的限制来固定σG、σE和α。由于对于各测试病症而言,遗传率和平均终生风险是已知的,因此可以设置根据疾病的模型参数。基于该模型从分布P生成100000个随机样本。然后假定对于各个个体G是已知的(但E是未知的,因此疾病病症是未知的),生成基于G的ROC曲线。这代表了最佳的方案,其中完全理解了遗传风险,并且对于每个个体均可进行测量。
也生成了该模型的变型,其中G=λX+Y,Y~N(0,σY),X~B(2,p)。在这种情况下,X相应于一种作用较大的SNP,Y相应于许多其它作用较小的SNP。通过合适地设置参数λ、σY和p,可控制作用较大的SNP的风险。对于风险-风险基因型,这些相对风险为4,对于设置的杂合风险,这些相对风险为2。
从表3和图1-3中可以看出,逻辑回归和GCI的AUC非常接近,并且两者都不以随机测试为界。但是,明显的是理论最佳方案比本申请目前的估计更富有信息。基于这些图,当前的科学知识可以以信息的方式估计个体对疾病的风险;作为证据,GCI的AUC比未使用信息的随机测试高20%-40%。
表3:不同ROC曲线的曲线下面积(AUC)
Figure BPA00001331512900571
实施例3:个性化行动计划
从唾液标本获得基因组谱,生成表型谱与GCI评分。如表4所示,报告也包括个性化行动计划与建议。
表4:个性化行动计划
Figure BPA00001331512900581
尽管在此显示和描述了本发明的一些优选实施方式,本领域普通技术人员明白这些实施方式仅在于提供一些实例。在不偏离本发明的情况下,本领域技术人员可以做出一些变化、改变和替换。可以明白的是,对本发明实施方式的各种不同的替换可用于实施本发明的实施方案。下面的权利要求意图限定了本发明的范围,这些实施方式和它们的等同方式的范围内的方法和结构包括在此。

Claims (33)

1.对于个性化行动计划中的各种建议的分级系统,
其中对所述建议的每一种给予等级,
其中所述各等级对应于给予个体的等级,
其中所述给予所述个体的等级基于所述个体的基因组谱通过计算机确定。
2.对于个性化行动计划中的各种建议的分级系统,
其中对所述建议的每一种给予等级,
其中所述各等级对应于给予个体的等级,
其中所述给予所述个体的等级基于所述个体的遗传综合指数(GCI)或GCI Plus评分通过计算机确定。
3.根据权利要求1或2所述的分级系统,其中所述等级是数字、颜色、字母或其组合。
4.根据权利要求1或2所述的分级系统,其中建议包括药物建议。
5.根据权利要求1或2所述的分级系统,其中所述非药物建议是锻炼方案。
6.根据权利要求1或2所述的分级系统,其中所述非药物建议是锻炼活动。
7.根据权利要求1或2所述的分级系统,其中所述非药物建议是饮食计划。
8.根据权利要求1或2所述的分级系统,其中所述非药物建议是营养物。
9.根据权利要求1或2所述的分级系统,其中所述分级系统由二元系统代表。
10.根据权利要求1或2所述的分级系统,其中所述基因组谱使用高密度DNA微阵列或基于PCR的方法获得。
11.根据权利要求1或2所述的分级系统,其中所述基因组谱通过扩增来自所述个体的遗传样本获得。
12.向个体提供个性化行动计划中的建议的等级的方法,包括:
(a)获得所述个体的基因组谱;
(b)确定所述个体的至少一个等级,其中所述等级基于所述基因组谱通过计算机确定;及
(c)向所述个体或所述个体的保健管理者报告从所述计算机输出的所述等级。
13.向个体提供个性化行动计划中的建议的等级的方法,包括:
(a)使用计算机生成所述个体的GCI或GCI Plus评分;
(b)确定所述个体的至少一个等级,其中所述等级基于所述GCI或GCI Plus评分通过所述计算机确定;及
(c)向所述个体或所述个体的保健管理者报告从所述计算机输出的所述等级。
14.根据权利要求12或13所述的方法,其中所述等级由颜色、字母或数字表示。
15.根据权利要求12或13所述的方法,其中所述等级对应于个性化行动计划中的建议。
16.根据权利要求12或13所述的方法,其中建议包括药物建议。
17.根据权利要求12或13所述的方法,其中所述非药物建议是锻炼活动。
18.根据权利要求12或13所述的方法,其中所述非药物建议是饮食计划。
19.根据权利要求12或13所述的方法,其中所述非药物建议是营养物。
20.根据权利要求12或13所述的方法,其中所述等级基于二元系统。
21.权利要求12所述的方法,其中所述基因组谱使用高密度DNA微阵列或基于PCR的方法获得。
22.根据权利要求12所述的分级系统,其中所述基因组谱通过扩增来自所述个体的遗传样本获得。
23.促进个体改善其健康的方法,包括:
(a)获得所述个体的基因组谱;
(b)使用计算机生成所述个体的个性化行动计划;
(c)关联对所述个体的至少一项激励与步骤(b)中通过计算机生成的个性化行动计划的建议的完成;及
(d)当建议完成时,给予所述个体所述激励。
24.促进个体改善其健康的方法,包括:
(a)获得所述个体的基因组谱;
(b)使用计算机生成所述个体的至少一项GCI或GCI Plus评分;
(c)关联对所述个体的至少一项激励与步骤(b)中通过所述计算机生成的至少一项GCI或GCI Plus评分的改善;及
(d)当达到所述改善时,给予所述个体所述激励。
25.根据权利要求23或24所述的方法,其中所述激励由雇主、朋友或家庭成员提供。
26.根据权利要求23或24所述的方法,其中所述个体是雇员。
27.根据权利要求26所述的方法,其中所述激励是所述个体的雇主对其健康储蓄账户的捐助、额外的假期或提高雇主对所述个体的医疗计划的津贴。
28.根据权利要求23或24所述的方法,其中所述激励是现金。
29.根据权利要求23或24所述的方法,其中所述激励是药品、保健品、健身俱乐部会员资格、医疗随访、医疗器械、更新的GCI或GCI Plus评分、更新的个性化行动计划或在线社区会员资格。
30.根据权利要求23或24所述的方法,其中所述激励是对药品、保健品、健身俱乐部会员资格、医疗随访、医疗器械、更新的GCI或GCI Plus评分、更新的个性化行动计划或在线社区会员资格的折扣、津贴或报销。
31.根据权利要求23或24所述的方法,其中,所述激励通过在线社区提供支持。
32.根据权利要求23或24所述的方法,其中所述基因组谱使用高密度DNA微阵列或基于PCR的方法获得。
33.根据权利要求23或24所述的分级系统,其中所述基因组谱通过扩增来自所述个体的遗传样本获得。
CN2009801371928A 2008-08-08 2009-08-07 用于个性化行动计划的方法和系统 Pending CN102171697A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US8758608P 2008-08-08 2008-08-08
US61/087,586 2008-08-08
PCT/US2009/053216 WO2010017520A1 (en) 2008-08-08 2009-08-07 Methods and systems for personalized action plans

Publications (1)

Publication Number Publication Date
CN102171697A true CN102171697A (zh) 2011-08-31

Family

ID=41090390

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2009801371928A Pending CN102171697A (zh) 2008-08-08 2009-08-07 用于个性化行动计划的方法和系统

Country Status (11)

Country Link
US (2) US20100042438A1 (zh)
EP (1) EP2321753A1 (zh)
JP (2) JP2011530750A (zh)
KR (1) KR20110053995A (zh)
CN (1) CN102171697A (zh)
AU (1) AU2009279434A1 (zh)
BR (1) BRPI0917089A2 (zh)
GB (1) GB2478065A (zh)
IS (1) IS8948A (zh)
TW (2) TWI423063B (zh)
WO (1) WO2010017520A1 (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106611095A (zh) * 2015-10-16 2017-05-03 完全优诊所 可进行健康分类的装置
CN107273699A (zh) * 2017-07-07 2017-10-20 成都脉安科健生物科技有限公司 营养指导方案获取方法、装置及电子设备
CN109256213A (zh) * 2018-08-21 2019-01-22 四川靠谱健康管理有限公司 一种结合遗传风险与环境危险因素的健康管理方法
CN110494880A (zh) * 2017-01-27 2019-11-22 欧瑞3恩公司 基于个人基因轮廓来判定和展现购买建议的系统和方法
US11540879B2 (en) 2021-04-16 2023-01-03 Physcade, Inc. Personalized heart rhythm therapy

Families Citing this family (72)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103710430B (zh) 2005-11-29 2016-03-30 剑桥企业有限公司 乳腺癌标志物
US20080131887A1 (en) * 2006-11-30 2008-06-05 Stephan Dietrich A Genetic Analysis Systems and Methods
US20080228700A1 (en) 2007-03-16 2008-09-18 Expanse Networks, Inc. Attribute Combination Discovery
JP5491400B2 (ja) * 2007-09-26 2014-05-14 ナビジェニクス インコーポレイティド 祖先データを用いるゲノム解析の方法及びシステム
US10275569B2 (en) 2007-10-15 2019-04-30 22andMe, Inc. Family inheritance
US9336177B2 (en) * 2007-10-15 2016-05-10 23Andme, Inc. Genome sharing
US20090226912A1 (en) * 2007-12-21 2009-09-10 Wake Forest University Health Sciences Methods and compositions for correlating genetic markers with prostate cancer risk
KR20110074527A (ko) * 2008-09-12 2011-06-30 네이비제닉스 인크. 복수의 환경 및 유전 위험 인자를 통합하기 위한 방법 및 시스템
US8108406B2 (en) 2008-12-30 2012-01-31 Expanse Networks, Inc. Pangenetic web user behavior prediction system
US8463554B2 (en) 2008-12-31 2013-06-11 23Andme, Inc. Finding relatives in a database
EP2438193B1 (en) * 2009-06-01 2015-07-22 Genetic Technologies Limited Methods for breast cancer risk assessment
KR20110136638A (ko) * 2010-06-15 2011-12-21 재단법인 게놈연구재단 게놈정보를 이용하여 온라인 상의 사회적 네트워크를 형성하는 시스템 및 그 형성방법
US20130151270A1 (en) * 2011-12-12 2013-06-13 Pathway Genomics Genetic Based Health Management Systems for Weight and Nutrition Control
US9732389B2 (en) 2010-09-03 2017-08-15 Wake Forest University Health Sciences Methods and compositions for correlating genetic markers with prostate cancer risk
WO2012047933A2 (en) 2010-10-04 2012-04-12 Block Torin J Goal management method and system
US9534256B2 (en) 2011-01-06 2017-01-03 Wake Forest University Health Sciences Methods and compositions for correlating genetic markers with risk of aggressive prostate cancer
US9575616B2 (en) * 2011-08-12 2017-02-21 School Improvement Network, Llc Educator effectiveness
CN103959345B (zh) * 2011-09-30 2018-06-05 博医来股份公司 使用颜色的剂量分布显示方法
US8990250B1 (en) 2011-10-11 2015-03-24 23Andme, Inc. Cohort selection with privacy protection
US10437858B2 (en) 2011-11-23 2019-10-08 23Andme, Inc. Database and data processing system for use with a network-based personal genetics services platform
US8725590B2 (en) * 2012-02-12 2014-05-13 LookingNew, Inc. Methods and systems for generating customized user plans
JP6117774B2 (ja) * 2012-04-20 2017-04-19 パナソニックヘルスケアホールディングス株式会社 生活習慣病改善支援装置およびその制御方法
US10025877B2 (en) 2012-06-06 2018-07-17 23Andme, Inc. Determining family connections of individuals in a database
US20140004105A1 (en) * 2012-06-29 2014-01-02 Sequenom, Inc. Age-related macular degeneration diagnostics
US9213947B1 (en) 2012-11-08 2015-12-15 23Andme, Inc. Scalable pipeline for local ancestry inference
US9836576B1 (en) 2012-11-08 2017-12-05 23Andme, Inc. Phasing of unphased genotype data
US8690578B1 (en) 2013-01-03 2014-04-08 Mark E. Nusbaum Mobile computing weight, diet, nutrition, and exercise tracking system with enhanced feedback and data acquisition functionality
WO2014113204A1 (en) 2013-01-17 2014-07-24 Personalis, Inc. Methods and systems for genetic analysis
EP3965111A1 (en) 2013-08-30 2022-03-09 Personalis, Inc. Methods and systems for genomic analysis
WO2015051275A1 (en) 2013-10-03 2015-04-09 Personalis, Inc. Methods for analyzing genotypes
US20150327794A1 (en) * 2014-05-14 2015-11-19 Umm Al-Qura University System and method for detecting and visualizing live kinetic and kinematic data for the musculoskeletal system
US10223931B1 (en) * 2014-09-05 2019-03-05 Fusionetics, LLC Systems and methods for compensation analysis and targeted, corrective program generation
JP6411147B2 (ja) * 2014-09-22 2018-10-24 株式会社メディプリーム 発病予知ネットワークシステム
US10920279B2 (en) 2014-09-30 2021-02-16 Genetic Technologies Limited Method for modifying a treatment regimen of a human female subject
EP4026913A1 (en) 2014-10-30 2022-07-13 Personalis, Inc. Methods for using mosaicism in nucleic acids sampled distal to their origin
JP2017211886A (ja) * 2016-05-26 2017-11-30 株式会社ブラケアジェネティクス 女性の健康増進に有用なカスタマイズ情報の提供システム
US11299783B2 (en) 2016-05-27 2022-04-12 Personalis, Inc. Methods and systems for genetic analysis
TWI611315B (zh) * 2017-03-21 2018-01-11 基因檢測平台方法
CN108629149B (zh) * 2017-03-21 2023-04-07 达易特基因科技股份有限公司 基因检测平台方法
EP3642744A1 (en) * 2017-06-20 2020-04-29 Illumina, Inc. Methods for accurate computational decomposition of dna mixtures from contributors of unknown genotypes
TWI641963B (zh) * 2017-07-07 2018-11-21 長庚醫療財團法人林口長庚紀念醫院 Method for screening coronary heart disease by cardiovascular marker and mechanical learning algorithm
CN112639990A (zh) * 2018-04-30 2021-04-09 小利兰·斯坦福大学托管委员会 用于使用个人数字表型维持健康的系统和方法
US11814750B2 (en) 2018-05-31 2023-11-14 Personalis, Inc. Compositions, methods and systems for processing or analyzing multi-species nucleic acid samples
US10801064B2 (en) 2018-05-31 2020-10-13 Personalis, Inc. Compositions, methods and systems for processing or analyzing multi-species nucleic acid samples
US20200135314A1 (en) * 2018-10-29 2020-04-30 Pharmazam, LLC Personalized medication management and alert system and method
US10896742B2 (en) 2018-10-31 2021-01-19 Ancestry.Com Dna, Llc Estimation of phenotypes using DNA, pedigree, and historical data
CN111378733A (zh) * 2018-12-28 2020-07-07 康多富国际有限公司 神经退化疾病保健食品组合确定方法及其可机读存储介质
EP3935581A4 (en) 2019-03-04 2022-11-30 Iocurrents, Inc. DATA COMPRESSION AND COMMUNICATION USING MACHINE LEARNING
US11587651B2 (en) 2019-03-08 2023-02-21 Merative Us L.P. Person-centric genomic services framework and integrated genomics platform and systems
JP7137520B2 (ja) * 2019-04-23 2022-09-14 ジェネシスヘルスケア株式会社 膵炎のリスクを判定する方法
JP7137525B2 (ja) * 2019-04-24 2022-09-14 ジェネシスヘルスケア株式会社 接触性皮膚炎のリスクを判定する方法
JP7137523B2 (ja) * 2019-04-24 2022-09-14 ジェネシスヘルスケア株式会社 じんましんのリスクを判定する方法
JP7137521B2 (ja) * 2019-04-24 2022-09-14 ジェネシスヘルスケア株式会社 乾癬のリスクを判定する方法
JP7137522B2 (ja) * 2019-04-24 2022-09-14 ジェネシスヘルスケア株式会社 脊椎側弯症のリスクを判定する方法
JP7137526B2 (ja) * 2019-04-24 2022-09-14 ジェネシスヘルスケア株式会社 アトピー性皮膚炎のリスクを判定する方法
JP7137524B2 (ja) * 2019-04-24 2022-09-14 ジェネシスヘルスケア株式会社 変形性膝関節症のリスクを判定する方法
KR102091790B1 (ko) * 2019-09-02 2020-03-20 주식회사 클리노믹스 피검사자와 생물체 간의 유전자 정보를 이용한 유전적 띠 제공 시스템 및 그 방법
CA3154157A1 (en) 2019-09-13 2021-03-18 23Andme, Inc. Methods and systems for determining and displaying pedigrees
DE102020206269A1 (de) * 2020-05-19 2021-11-25 Forschungszentrum Jülich GmbH Betrieb einer Gasturbine bei hoher Temperatur und Gasturbinenanordnung
US11817176B2 (en) 2020-08-13 2023-11-14 23Andme, Inc. Ancestry composition determination
TWI788696B (zh) * 2020-08-27 2023-01-01 清源智慧健康醫學科技股份有限公司 導入個人診療暨健康管理資訊及健康促進以優化健保資源分配之系統
WO2022076909A1 (en) 2020-10-09 2022-04-14 23Andme, Inc. Formatting and storage of genetic markers
KR102258899B1 (ko) * 2020-11-24 2021-06-01 주식회사 엔젠바이오 통합적 건강 정보를 이용한 식단 및 운동 추천 방법 및 서비스 시스템
US11145401B1 (en) * 2020-12-29 2021-10-12 Kpn Innovations, Llc. Systems and methods for generating a sustenance plan for managing genetic disorders
US11049603B1 (en) 2020-12-29 2021-06-29 Kpn Innovations, Llc. System and method for generating a procreant nourishment program
US20220208337A1 (en) * 2020-12-29 2022-06-30 Kpn Innovations, Llc. Systems and methods for generating a cancer alleviation nourishment plan
US11355229B1 (en) 2020-12-29 2022-06-07 Kpn Innovations, Llc. System and method for generating an ocular dysfunction nourishment program
US11935642B2 (en) 2021-03-01 2024-03-19 Kpn Innovations, Llc System and method for generating a neonatal disorder nourishment program
US11854685B2 (en) 2021-03-01 2023-12-26 Kpn Innovations, Llc. System and method for generating a gestational disorder nourishment program
JP2024517135A (ja) * 2021-04-29 2024-04-19 エフ ホフマン-ラ ロッシュ アクチェン ゲゼルシャフト 糖尿病治療計画における自動化活動推奨のための方法およびシステム
US20230170073A1 (en) 2022-03-04 2023-06-01 Mohsin Mehdi Automated personalized nutrition and lifestyle recommendation system and associated method thereof
US11862324B1 (en) * 2023-01-23 2024-01-02 Kpn Innovations, Llc. Apparatus and method for outputting an alimentary program to a user

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006065658A2 (en) * 2004-12-14 2006-06-22 Genomas, Inc. A physiogenomic method for predicting clinical outcomes of treatments in patients
US20060184489A1 (en) * 2004-12-17 2006-08-17 General Electric Company Genetic knowledgebase creation for personalized analysis of medical conditions
CN101189514A (zh) * 2004-08-30 2008-05-28 希尔氏宠物营养品公司 基于基因组的饮食设计
WO2008067551A2 (en) * 2006-11-30 2008-06-05 Navigenics Inc. Genetic analysis systems and methods

Family Cites Families (36)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5192659A (en) * 1989-08-25 1993-03-09 Genetype Ag Intron sequence analysis method for detection of adjacent and remote locus alleles as haplotypes
US6640211B1 (en) * 1999-10-22 2003-10-28 First Genetic Trust Inc. Genetic profiling and banking system and method
US20020133495A1 (en) * 2000-03-16 2002-09-19 Rienhoff Hugh Y. Database system and method
US6660476B2 (en) * 2000-05-02 2003-12-09 City Of Hope Polymorphisms in the PNMT gene
US20080261220A1 (en) * 2000-11-30 2008-10-23 Third Wave Technologies, Inc. Nucleic Acid Detection Assays
CN1461215A (zh) * 2001-02-08 2003-12-10 因弗内斯医疗有限公司 个人身体状况管理系统
US20030054381A1 (en) * 2001-05-25 2003-03-20 Pfizer Inc. Genetic polymorphisms in the human neurokinin 1 receptor gene and their uses in diagnosis and treatment of diseases
JP2003067499A (ja) * 2001-08-22 2003-03-07 Mitsubishi Chemicals Corp 健康診断方法および健康診断システム、健康診断システム用サーバおよび端末、ならびに健康診断システム用プログラム
US7072794B2 (en) * 2001-08-28 2006-07-04 Rockefeller University Statistical methods for multivariate ordinal data which are used for data base driven decision support
US7461006B2 (en) * 2001-08-29 2008-12-02 Victor Gogolak Method and system for the analysis and association of patient-specific and population-based genomic data with drug safety adverse event data
US20030104453A1 (en) * 2001-11-06 2003-06-05 David Pickar System for pharmacogenetics of adverse drug events
US20030219776A1 (en) * 2001-12-18 2003-11-27 Jean-Marc Lalouel Molecular variants, haplotypes and linkage disequilibrium within the human angiotensinogen gene
US20040002818A1 (en) * 2001-12-21 2004-01-01 Affymetrix, Inc. Method, system and computer software for providing microarray probe data
US20060160074A1 (en) * 2001-12-27 2006-07-20 Third Wave Technologies, Inc. Pharmacogenetic DME detection assay methods and kits
JP2003271728A (ja) * 2002-03-19 2003-09-26 Shiseido Co Ltd 個人の皮膚、頭皮又は毛髪に関する遺伝子情報に基づいて化粧品、整髪料又はケア方法を選定する方法
JP2004005248A (ja) * 2002-05-31 2004-01-08 Advance Co Ltd 体内情報管理システム
US20040115701A1 (en) * 2002-08-30 2004-06-17 Comings David E Method for risk assessment for polygenic disorders
EP1585433A4 (en) * 2002-09-25 2008-01-23 Ge Healthcare Sv Corp DETECTION METHODS
AU2003291481A1 (en) * 2002-11-11 2004-06-03 Affymetrix, Inc. Methods for identifying dna copy number changes
WO2004072887A2 (en) * 2003-02-11 2004-08-26 Sciona Limited Computer-assisted means for assessing lifestyle risk factors of an individual
JP4237541B2 (ja) * 2003-05-13 2009-03-11 三菱電機株式会社 保険者情報システム
US20050214811A1 (en) * 2003-12-12 2005-09-29 Margulies David M Processing and managing genetic information
CN101010031A (zh) * 2004-02-17 2007-08-01 波蒂生物公司 用于整合个人化临床试验结果和营养治疗的网络和方法
US7127355B2 (en) * 2004-03-05 2006-10-24 Perlegen Sciences, Inc. Methods for genetic analysis
TWI364600B (en) * 2004-04-12 2012-05-21 Kuraray Co An illumination device an image display device using the illumination device and a light diffusing board used by the devices
JP4795666B2 (ja) * 2004-10-29 2011-10-19 株式会社東芝 健康管理支援装置および健康管理支援プログラム
TW200626895A (en) * 2005-01-27 2006-08-01 Well Genome Science Inc Method using hair examination to perform evaluation
US20070054252A1 (en) * 2005-08-23 2007-03-08 Microlife Intellectual Property Gmbh Method and a system for teaching and guiding an individual in changing the lifestyle and a method and system for treating an individual
US20070122824A1 (en) * 2005-09-09 2007-05-31 Tucker Mark R Method and Kit for Assessing a Patient's Genetic Information, Lifestyle and Environment Conditions, and Providing a Tailored Therapeutic Regime
US7695911B2 (en) * 2005-10-26 2010-04-13 Celera Corporation Genetic polymorphisms associated with Alzheimer's Disease, methods of detection and uses thereof
US20070196344A1 (en) * 2006-01-20 2007-08-23 The Procter & Gamble Company Methods for identifying materials that can help regulate the condition of mammalian keratinous tissue
TWI317507B (en) * 2006-02-13 2009-11-21 Yi Cheng Yu Health management system with circular risk references
US20080131887A1 (en) * 2006-11-30 2008-06-05 Stephan Dietrich A Genetic Analysis Systems and Methods
US20090018923A1 (en) * 2007-07-13 2009-01-15 Yen-Fu Chen Method and apparatus for recommending a payment method in a transaction
EP2227780A4 (en) * 2008-03-19 2011-08-03 Existence Genetics Llc GENETIC ANALYSIS
KR20110074527A (ko) * 2008-09-12 2011-06-30 네이비제닉스 인크. 복수의 환경 및 유전 위험 인자를 통합하기 위한 방법 및 시스템

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101189514A (zh) * 2004-08-30 2008-05-28 希尔氏宠物营养品公司 基于基因组的饮食设计
WO2006065658A2 (en) * 2004-12-14 2006-06-22 Genomas, Inc. A physiogenomic method for predicting clinical outcomes of treatments in patients
US20060184489A1 (en) * 2004-12-17 2006-08-17 General Electric Company Genetic knowledgebase creation for personalized analysis of medical conditions
WO2008067551A2 (en) * 2006-11-30 2008-06-05 Navigenics Inc. Genetic analysis systems and methods

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106611095A (zh) * 2015-10-16 2017-05-03 完全优诊所 可进行健康分类的装置
CN110494880A (zh) * 2017-01-27 2019-11-22 欧瑞3恩公司 基于个人基因轮廓来判定和展现购买建议的系统和方法
CN107273699A (zh) * 2017-07-07 2017-10-20 成都脉安科健生物科技有限公司 营养指导方案获取方法、装置及电子设备
CN109256213A (zh) * 2018-08-21 2019-01-22 四川靠谱健康管理有限公司 一种结合遗传风险与环境危险因素的健康管理方法
US11540879B2 (en) 2021-04-16 2023-01-03 Physcade, Inc. Personalized heart rhythm therapy
US11583346B2 (en) 2021-04-16 2023-02-21 Physcade, Inc. Personalized heart rhythm therapy

Also Published As

Publication number Publication date
TWI423063B (zh) 2014-01-11
TW201407399A (zh) 2014-02-16
GB2478065A (en) 2011-08-24
TW201020844A (en) 2010-06-01
US20100042438A1 (en) 2010-02-18
AU2009279434A1 (en) 2010-02-11
BRPI0917089A2 (pt) 2015-12-15
GB201103011D0 (en) 2011-04-06
KR20110053995A (ko) 2011-05-24
JP2011530750A (ja) 2011-12-22
TWI516969B (zh) 2016-01-11
WO2010017520A1 (en) 2010-02-11
EP2321753A1 (en) 2011-05-18
IS8948A (is) 2011-02-23
JP2015064884A (ja) 2015-04-09
US20140172444A1 (en) 2014-06-19

Similar Documents

Publication Publication Date Title
CN102171697A (zh) 用于个性化行动计划的方法和系统
CN102187344A (zh) 用于综合多种环境与遗传风险因子的方法和系统
Rothschild et al. Environment dominates over host genetics in shaping human gut microbiota
TWI363309B (en) Genetic analysis systems, methods and on-line portal
JP5491400B2 (ja) 祖先データを用いるゲノム解析の方法及びシステム
Zhang et al. Genomewide scan of hoarding in sib pairs in which both sibs have Gilles de la Tourette syndrome
Epstein et al. A simple and improved correction for population stratification in case-control studies
Barbeira et al. Fine‐mapping and QTL tissue‐sharing information improves the reliability of causal gene identification
Resnick et al. The impact of genetics on physical resilience and successful aging
Rashidi et al. Association of the functional serotonin transporter haplotype with familial form of obsessive compulsive disorder in Iranian patients
Kim et al. Practical issues in genome‐wide association studies for physical activity
Bartol Re-examining the gene in personalized genomics
EP3693972A1 (en) System and method for interpreting data and providing recommendations to a user based on his/her genetic data and on data related to the composition of his/her intestinal microbiota
Cabrera-Mendoza et al. The impact of assortative mating, participation bias and socioeconomic status on the polygenic risk of behavioural and psychiatric traits
Lehrer et al. Can social scientists use molecular genetic data to explain individual differences and inform public policy?
Mrug et al. Neighborhood Disadvantage and Parenting in Early Adolescence Predict Epigenetic Aging and Mortality Risk in Adulthood
WO2022145135A1 (ja) 情報処理方法、情報処理装置、及び情報処理プログラム
US20220208348A1 (en) Systems and methods for producing a homeopathic program for managing genetic disorders
Thara et al. Design and clinical characteristics of a homogeneous schizophrenia pedigree sample from Tamil Nadu, India
Moon et al. Prognostic Genomic Predictive Biomarkers for Early-Stage Lung Cancer Patients

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information

Address after: American California

Applicant after: NAVIGENICS INC.

Address before: American California

Applicant before: Navigenics Inc.

COR Change of bibliographic data
RJ01 Rejection of invention patent application after publication

Application publication date: 20110831

RJ01 Rejection of invention patent application after publication