CN102034015B - 基于基因组的警报系统 - Google Patents

基于基因组的警报系统 Download PDF

Info

Publication number
CN102034015B
CN102034015B CN200910174593.2A CN200910174593A CN102034015B CN 102034015 B CN102034015 B CN 102034015B CN 200910174593 A CN200910174593 A CN 200910174593A CN 102034015 B CN102034015 B CN 102034015B
Authority
CN
China
Prior art keywords
rule
genomic
warning system
data
report
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN200910174593.2A
Other languages
English (en)
Other versions
CN102034015A (zh
Inventor
詹姆士·普朗特
大卫·贝克
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
PARSWAY GENOMICS Corp
Original Assignee
PARSWAY GENOMICS Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by PARSWAY GENOMICS Corp filed Critical PARSWAY GENOMICS Corp
Priority to CN200910174593.2A priority Critical patent/CN102034015B/zh
Priority to CN201610248998.6A priority patent/CN105930689A/zh
Publication of CN102034015A publication Critical patent/CN102034015A/zh
Application granted granted Critical
Publication of CN102034015B publication Critical patent/CN102034015B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations

Landscapes

  • Bioinformatics & Cheminformatics (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Genetics & Genomics (AREA)
  • Molecular Biology (AREA)
  • Chemical & Material Sciences (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Biotechnology (AREA)
  • Evolutionary Biology (AREA)
  • Analytical Chemistry (AREA)
  • Medical Informatics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Medical Treatment And Welfare Office Work (AREA)
  • Apparatus Associated With Microorganisms And Enzymes (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本发明提供了一种基于基因组的计算机警报系统,包括记录会员基因组数据的会员数据库、规则生成器、分析模块和警报模块,其中所述规则生成器被设置成将定性的研究成果中包含的数据转换成定量的、离散的规则,并将这些规则传送给所述分析模块,所述分析模块被设置成根据所述规则对所述会员数据库中的基因组数据进行查询,并将生成的结果集输出给所述警报模块,所述警报模块被设置成根据所述结果集中的信息编写警报报告。这些警报报告可以被传送给与所述会员。

Description

基于基因组的警报系统
发明领域
本发明涉及用于分析和发布遗传学信息的自动化系统,更具体地涉及基于个人基因组的信息分析和发布。
发明背景
遗传学研究领域快速不断地产生关于人类健康和疾病的引人注目的新成果。众多研究者和研究机构致力于定期产生关于且基于人类遗传组成的新成果。即便是本领域的专家也发现难以跟上快速发展且高度动态的人类基因组以及其隐含的健康相关问题的科学知识。就个人健康而言,非专业人员依赖其个人医生的专业知识,但是不能从新的遗传学发现中受益,除非等待若干年直到一项重大的遗传学发现成熟并在卫生系统中广泛传播直到社区医生的办公室。
近几个月来出现了遗传测试服务的供应商,其以相对低廉的价格向普通民众提供对其基因组非常高程度的利用。虽然个人现在可以得到相当详细的个体遗传组成信息,但还需要解释其含义以及对个人健康和疾病的可能影响,这很棘手。虽然咨询个人医生甚至查阅最新研究可能有助于理解遗传组成的含义,但理解消化遗传学研究并将其归纳成有助于进行健康决定的抽象规则仍然非常复杂。因此非常需要运用自动化系统,将大量新近发表的研究信息归纳为离散的定义和规则,并进一步基于任何特定的基因组自动整理该信息,并根据具体基因组的具体遗传特征向个人发布信息。这样,个人就不用分析新的遗传学研究来找出那些适用于自己遗传组成的研究成果。
发明概述
现在,詹姆士·普朗特和大卫·贝克发明了基于基因组的警报系统,其包括在新进展的研究基础上根据会员的基因组数据提供电子警报的装置和方法。这些会员系统或者基于遗传学的“直接面向客户”的系统的主要功能是根据会员的具体遗传档案以“警报”的方式提供高度相关的信息。
已经设计并发明了遗传信息分析和发布系统,并且在此首次披露。这些基于基因组的计算机警报系统主要由会员数据库组成,该数据库为基因组数据和电子通讯地址信息分配存储容量,并为其内包括的每个会员建立基因组数据和电子通讯地址信息之间的联系。这些警报系统进一步包括表现为存储的计算机逻辑的规则,所述规则取决于遗传特征相关的参数(即,基因、SNP、拷贝数等)。有时,分析模块的查询引擎部分对会员数据库中存储的数据进行查询,所述查询根据这些已定规则形成。返回的结果集包括那些可能受到影响或者由于其个人基因组的具体特征而被关注的会员。对于执行查询产生的结果集中所包括的任何会员,系统警报模块自动生成报告描述新研究如何可能引起关注,并通过电子通讯系统例如电子邮件服务器来发布该报告。
因此本发明与此前已知的方法和装置形成对照。本发明包括的自动化警报系统根据新近发布的研究数据向会员提供针对他们遗传档案的警报。
本发明实施方案提供了以下方面:
1)一种基于基因组的计算机警报系统,其包括:
记录会员基因组数据的会员数据库;
规则生成器,
分析模块,和
警报模块,
其中,所述规则生成器被设置成将定性的研究成果转换成定量的、离散的规则,并将这些规则传送给所述分析模块,
所述分析模块被设置成根据所述规则对所述会员数据库中的基因组数据进行查询,并将生成的结果集输出给所述警报模块,
所述警报模块被设置成根据所述结果集中的信息编写警报报告。
2)如1)所述的基于基因组的计算机警报系统,其中所述规则生成器包括数据处理器,该数据处理器将所述定性的研究成果转换成所述定量的、离散的规则。
3)如1)所述的基于基因组的计算机警报系统,其中所述规则生成器包括专家界面,该专家界面将所述定性的研究成果转换成所述定量的、离散的规则。
4)如1)所述的基于基因组的计算机警报系统,其中所述会员数据库还包括与会员健康和生活方式相关的其它信息。
5)如4)所述的基于基因组的计算机警报系统,其中所述分析模块包括查询引擎,该查询引擎根据所述规则对所述会员数据库中的基因组数据进行查询。
6)如1)-5)任一项所述的基于基因组的计算机警报系统,其还包括电子发布系统,该电子发布系统可从所述警报模块接收编写好的报告,并将报告发送给所述会员或其代理人。
7)如6)所述的基于基因组的计算机警报系统,其中所述电子发布系统是电子邮件服务器。
发明目的
本发明的主要目的是提供遗传会员系统,其用于提供电子警报。
本发明的一个目的是直接向客户提供遗传学分析和监测。
通过参考优选实施方案的详细描述和附图可以更好地理解本发明。本说明书中的实施方案是实现本发明的具体途径,但不包括所有可能的途径。因此,可能存在某些实施方案,其并不偏离所附权利要求书中所阐明的本发明的精神与范围,但是并没有在本说明书中以具体实例出现。本领域普通技术人员可以理解有许多可能的替代方案。
附图说明
通过以下说明、所附权利要求书、以及附图将能更好地理解本发明的各种特征、方面和优点。
图1为依据本发明的警报系统的示例方案的一般性框图;
图2为依据这些教导的警报系统的另一种重要方案的详细框图。
本发明的优选实施方案
在第一个重要的说明性实施例中,本发明基于基因组的计算机警报系统结合图1的示意图进行了说明。具体而言,基于基因组的警报系统1包括与基因组扫描仪3结合的计算机服务器2或者计算机系统。人DNA4样本作为输入在所述扫描仪的接收端口5被接收。所述基因组扫描仪应用现代生物学、化学、光学和电子学方法来分离具体的遗传序列,包括重要的SNP(单核苷酸多态性)以及其它被关注的序列。所述基因组扫描仪将人基因组转换为数字输出,可存储在专门准备的会员数据库6中。
为多个会员中的每个存储会员记录,其中可以包括数字化基因组类型数据。设定数据库方案,使会员与存储的关联基因组一一对应。这些可以通过独特的标识数据库索引机制或“主关键字”相结合。
分析模块被设置成根据其中生成的数据库查询指令来查询会员数据库。那些数据库查询指令根据规则生成器8不断生成并提供给所述分析模块的动态的、更新的规则形成。所述规则生成器响应从研究界9和具体研究工作10接收的输入生成代表计算机逻辑的规则,该输入包括基于特定遗传特征存在或不存在而得出的结论。
在某些特别优选的方案中,可以使用专家11查阅研究成果并将非离散的结论转换成离散的规则与算法。该专家可与作为规则生成器的一部分提供的用户界面一起协同工作,从而使所述研究可转换为完全的逻辑描述。
可替代地,某些研究可通过用于分析和解释数据的完全自动化系统结合到所述规则生成器。尤其是当研究者用可被自动化系统分析的规定格式发表研究成果时。所述分析模块对数据库执行一个或多个查询后,结果集12从该分析模块被传送到警报模块13。所述警报模块包括根据作为结果集接收的信息编写报告所需的所有设备。例如,当结果集识别出具有新研究所鉴定出的遗传特征的特定标记时,编写报告以向受影响的会员详细解释情况。该报告可直接发送给该会员。一些报告可设定为发给会员的代理人或代表,例如医生。相应地,所述警报被送到指定地址,并且报告格式可顾及接收者的具体专业知识。
电子发布系统可被设置为例如电子邮件服务器14,其从所述警报模块接收编写好的报告并根据合适的会员电子邮件地址自动发送,其中所述电子邮件地址已经通过所述数据库方案与会员的基因组关联,所述报告通过互联网15发送到会员的工作站16,在那里该报告可被用户接收并查阅。这样,可通过个人的基因组连续地向该个体提供最新研究。再也不需要梳理成千上万的文献去寻找那些与该个体特定遗传组成相关的文献,相反地,“前沿的”新研究会自动来到用户/会员身边。
新的遗传学发现被公开发表后的很短一段时间内,具有与该研究相关的基因特征的系统用户不需做任何事情即可了解该新成果。所述系统反应的特征可被描述为“信息推动”作用,其中在来自用户的要求触发下,报告和信息被自动传送。
通过图2的详细示意图可更深入地了解本发明。研究界21定期产生记录新的遗传学相关医学研究成果的出版物。其可包括但不限于出版物例如医学杂志、期刊、博士论文、新闻网、FDA报告/警告、基因学发现等等。新近发表的研究22可以以与机器处理相配合的格式提供,从而其提出的结果被规则生成器24的数据处理器23部分分析并解释,得到依赖于例如特定的遗传学标记的规则或算法形式的离散的计算机可执行逻辑。
可替代地,新近发表的研究可被专家接收以解释结果并形成离散的机器可执行逻辑和规则。在这种情况下,提供了规则生成器的专家界面25部分,由此专家能够控制规定的模板规则的状态和变量以得到反映所查阅研究的本质的算法和逻辑。这种抽象化步骤允许不容易被自动化系统分析的研究通过人类解释者的帮助转换为离散的规则。
当DNA样本26存入基因组扫描仪系统27的接收端口时,该系统针对会员个体而启动。所述基因组扫描仪的输出是个人基因组的数字化表示,并且对于具体个体,该数字化表示与会员数据库结合,基因组数据被存储在会员数据库中,所述会员数据库具有特别准备的方案,其中会员与任何特定基因组的一一对应关系被强化。在某些优选的实施方案中,该信息被存储在单独的数据库记录中(如示意图中数据行28所示)。例如通过这种方式每个会员可被分配在不同的数据库记录中。
除了基因组信息,数据库记录还可提供与会员健康和生活方式相关的其它信息存储。存储在不同栏中的信息(例如标明会员为吸烟者的二元指标,或者表示会员体重的体重值整数表示)可与遗传数据存储在一起。这样,当一个研究涉及与其它健康因素相关的遗传发现时,它们的数字化表示可录入数据库。其中可用于关联个体会员的数据包括:生活方式因素、代谢测定值、家族史、医疗记录数据、锻炼方案,等等。
虽然这些类别的信息本身值得关注,但对于这些系统最重要的数据元素还包括具体联系说明。由于这些装置的基本目的是提供电子警报,有必要指定该警报被传送到哪里。在最优选的方案中,所述警报通过“电子邮件服务器”形式的电子通讯系统发布。因此,在任何特定的基因组、其它健康信息以及警报传送地址(例如电子邮件地址、医生电子邮件地址、或患者电子邮件地址)之间建立了重要关联。相应地,为这些数据库提供方案以适应健康数据,其中所述健康数据与为警报指定的至少一个电子邮件地址相结合。
就所述规则生成器模块所形成的规则而言,规则集保持作为分析模块210的一部分。多个存储的规则211形成了基础,基于该基础,查询引擎212可以查询由与会员关联的遗传信息所形成的数据库。例如,新的研究可能提示当在某些人的遗传序列中发现已知的多态性213(SNP1)时,其具有罹患某种疾病的重大风险。可对会员信息数据库运行查询,得到所有具有该多态性的会员的结果集214。可在新规则加入规则集时运行查询,或者可设定时间215定期进行查询。当查询产生结果集并且一个或多个会员符合所述规则中阐明的条件时,那些会员的记录被送到警报模块。对每一个会员,可编制反映新研究细节的定制的报告。新研究的确切含义可能对任何两组人是不同的,即根据该研究,相对于非吸烟者,新发现的癌症基因可能对吸烟者更加重要。在另一个说明性实施例中,某一报告可能更适合于老年会员,其可在存储为警报模块一部分的模板217中得到说明。
警报一旦最终完成,就以电子形式被传递与发布,例如通过SMTP电子邮件服务器结合互联网218,到达用户/会员工作站219,在此该警报和警报报告可在标准HTML浏览器210或客户桌面程序221中查看。
根据本发明的每个优选的实施方案,提供了基于遗传学的警报系统。本领域普通技术人员能够了解所述每个实施方案包括一种装置,一个优选实施方案中的装置可能不同于另一实施方案中的装置。相应地,在一种实施例中提到的限制不应被延续并推定为另一实施例的一部分。
以上实施例是针对特定的实施方案,其阐明了本发明的装置和方法的优选方案。为了完整起见,对本发明装置和其组成元件以及包括所述装置的方法和步骤进行了更全面的说明。
本领域普通技术人员现在可以充分了解如何实现基于遗传学的警报系统,所述警报系统监测新研究从而提供与系统会员中特定会员相关的警报。虽然参考一些优选方案(包括发明者预期的最佳模式),已经用清晰且简明的语言对本发明进行了相当详细的描述,但其它方案也是可能的。因此,本发明的精神和范围不限于本文中优选方案的描述,而应限于本说明书所附的权利要求书。

Claims (4)

1.一种基于基因组的计算机警报系统,包括:
a)基因组扫描仪,其配置为接收人类DNA样本,从中分离具体的遗传序列,以及输出表示被分离的遗传序列的数字基因组数据;
b)计算机系统,其连接到所述基因组扫描仪,所述计算机系统包括:
(i)存储工具,其配置为从所述基因组扫描仪接收所述数字基因组数据并将所述数字基因组数据存储在会员数据库中,所述会员数据库包括所述数字基因组数据和多个会员中的每一个会员的健康相关因素,使得在会员、相关的数字基因组数据和健康相关因素之间存在一一对应,所述健康相关因素包括生活方式因素、代谢测定值、家族史、医疗记录数据及锻炼方案中的至少一个;
(ii)包括专家界面的规则生成器,该规则生成器配置为将关于存在或不存在具体的遗传特征的研究工作的非离散的结论转换为离散的规则和算法,该规则和算法响应于新的研究工作被更新,其中所述规则生成器是人控制的,该专家界面配置为使人类专家能够操纵规定的模板规则的状态和变量以得到算法和规则,使得所述算法和规则反映由人类专家所查阅的研究工作的本质以及使得所述算法和规则能够随所作的研究被使得可用而被更新;
(iii)分析模块,其配置为使用根据所述规则和算法形成的数据库查询指令来查询所述会员数据库,并配置为响应于所述数据库查询指令输出结果集,其中每当新的规则变得可用时,所述数据库查询指令被安排以自动地对所述数字基因组数据运行;
(iv)警报模块,其配置为接收所述结果集并根据在所述结果集中接收的信息编写报告;和
(v)电子发布系统,其配置为从所述警报模块接收编写好的报告并将所述报告发送给与所述多个会员中的至少一个会员相关联的至少一个警报传送邮件地址。
2.如权利要求1所述的基于基因组的计算机警报系统,其中所述报告被直接发送给所述多个会员中的至少一个会员。
3.如权利要求1所述的基于基因组的计算机警报系统,其中所述报告被配置为发送给所述多个会员中的至少一个会员的代表。
4.如权利要求1所述的基于基因组的计算机警报系统,其中在来自所述多个会员中的至少一个会员的要求触发下,所述报告被自动传送给所述多个会员中的至少一个会员。
CN200910174593.2A 2009-09-30 2009-09-30 基于基因组的警报系统 Expired - Fee Related CN102034015B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN200910174593.2A CN102034015B (zh) 2009-09-30 2009-09-30 基于基因组的警报系统
CN201610248998.6A CN105930689A (zh) 2009-09-30 2009-09-30 基于基因组的警报系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN200910174593.2A CN102034015B (zh) 2009-09-30 2009-09-30 基于基因组的警报系统

Related Child Applications (1)

Application Number Title Priority Date Filing Date
CN201610248998.6A Division CN105930689A (zh) 2009-09-30 2009-09-30 基于基因组的警报系统

Publications (2)

Publication Number Publication Date
CN102034015A CN102034015A (zh) 2011-04-27
CN102034015B true CN102034015B (zh) 2016-05-11

Family

ID=43886901

Family Applications (2)

Application Number Title Priority Date Filing Date
CN201610248998.6A Pending CN105930689A (zh) 2009-09-30 2009-09-30 基于基因组的警报系统
CN200910174593.2A Expired - Fee Related CN102034015B (zh) 2009-09-30 2009-09-30 基于基因组的警报系统

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CN201610248998.6A Pending CN105930689A (zh) 2009-09-30 2009-09-30 基于基因组的警报系统

Country Status (1)

Country Link
CN (2) CN105930689A (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108804479B (zh) * 2017-05-05 2022-08-19 张汉威 数据分析系统及其分析方法

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101063990A (zh) * 2006-04-30 2007-10-31 迈世亚(北京)科技有限公司 医疗信息处理系统及方法

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030208454A1 (en) * 2000-03-16 2003-11-06 Rienhoff Hugh Y. Method and system for populating a database for further medical characterization
US20020082869A1 (en) * 2000-12-27 2002-06-27 Gateway, Inc. Method and system for providing and updating customized health care information based on an individual's genome
US20040122702A1 (en) * 2002-12-18 2004-06-24 Sabol John M. Medical data processing system and method
US8346482B2 (en) * 2003-08-22 2013-01-01 Fernandez Dennis S Integrated biosensor and simulation system for diagnosis and therapy
US8775092B2 (en) * 2007-11-21 2014-07-08 Cosmosid, Inc. Method and system for genome identification
US20090216558A1 (en) * 2008-02-27 2009-08-27 Active Health Management Inc. System and method for generating real-time health care alerts

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101063990A (zh) * 2006-04-30 2007-10-31 迈世亚(北京)科技有限公司 医疗信息处理系统及方法

Also Published As

Publication number Publication date
CN105930689A (zh) 2016-09-07
CN102034015A (zh) 2011-04-27

Similar Documents

Publication Publication Date Title
Bussey et al. MatchMiner: a tool for batch navigation among gene and gene product identifiers
Christoffels et al. STACK: sequence tag alignment and consensus knowledgebase
US6675166B2 (en) Integrated multidimensional database
Gollub et al. The Stanford Microarray Database: data access and quality assessment tools
Huang et al. The EMOTIF database
US7734656B2 (en) System and method for electronically managing medical data files in order to facilitate genetic research
AU785341B2 (en) Artificial intelligence system for genetic analysis
US7778844B2 (en) System and method for managing the exchange of information between healthcare systems
CN103733194A (zh) 动态组织云计算资源以便于发现
US20050027564A1 (en) Term management system suitable for healthcare and other use
CN102067140B (zh) 用于系谱分析的系统、方法和计算机程序产品
Jun et al. A novel method of IP R&D using patent analysis and expert survey
Stock et al. Intellectual property information: A comparative analysis of main information providers
CN102034015B (zh) 基于基因组的警报系统
Markowitz et al. Applying data warehouse concepts to gene expression data management
CN115907649A (zh) 网格化政务数据管理系统
US20040225555A1 (en) System and method for generating targeted marketing resources and market performance data
CN100445989C (zh) 用于生成对关于选择对象的信息的请求的系统和方法
KR20220147357A (ko) 의약품 재고량을 예측하는 방법
Patterson et al. Towards automated case knowledge discovery in the M 2 case-based reasoning system
CA2456943A1 (en) System and method for creating data links between diagnostic information and prescription information records
CN112435002A (zh) 一种基于区块链的资产与数据集成管理方法
Gul et al. Data integration of electronic health records using artificial neural networks
Chen et al. Teleconsultation demand classification and service analysis
Markowitz et al. Integration Challenges in Gene Expression Data Management.

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20160511

Termination date: 20180930

CF01 Termination of patent right due to non-payment of annual fee