CN1426534A - 用于提供基因网入口的方法,系统,和计算机软件 - Google Patents
用于提供基因网入口的方法,系统,和计算机软件 Download PDFInfo
- Publication number
- CN1426534A CN1426534A CN01804139A CN01804139A CN1426534A CN 1426534 A CN1426534 A CN 1426534A CN 01804139 A CN01804139 A CN 01804139A CN 01804139 A CN01804139 A CN 01804139A CN 1426534 A CN1426534 A CN 1426534A
- Authority
- CN
- China
- Prior art keywords
- probe
- group
- data
- identifier
- user
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B50/00—ICT programming tools or database systems specially adapted for bioinformatics
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B25/00—ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
- G16B25/30—Microarray design
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B25/00—ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
Landscapes
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Engineering & Computer Science (AREA)
- Medical Informatics (AREA)
- General Health & Medical Sciences (AREA)
- Theoretical Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Biotechnology (AREA)
- Evolutionary Biology (AREA)
- Biophysics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Bioethics (AREA)
- Databases & Information Systems (AREA)
- Genetics & Genomics (AREA)
- Molecular Biology (AREA)
- Apparatus Associated With Microorganisms And Enzymes (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
描述了系统,方法和计算机程序产品,它们处理有关购买生物设备,材料,或有关试剂的查询或订单。在一些实现方式中,一用户选择探针设置标识符,它识别能够检测生物分子的微阵列探针设置组。识别的相应基因或EST和用有关的产品数据与之相关,并把产品数据提供给用户。此外,用户可以基于产品数据选择购买的产品。如果是这样的话,基于购买订单可以调整用户的帐户。在相同的或其他的实现方式中,一个局部的基因组数据库被周期的更新。响应于探针设置标识符的一用户选择,从局部基因组数据库把对应于基因或EST的有关数据提供到用户。
Description
相关申请
本申请要求美国临时专利申请序列号为No.60/178,077,标题为“用于提供基因网入口的方法,系统,和计算机软件”的优先权,该申请于2000年1月25日提出申请,在此结合参考它的全部内容以用于所有目的。
背景技术
本发明涉及生物信息学领域,特别涉及在诸如因特网的网络上用于提供基因信息的计算机系统,方法,和产品。
对于分子生物学,生物化学,和许多有关健康领域的研究需要大量的组织机构以及由新的实验技术产生的复杂数据的分析。通过快速发展的生物信息学领域从事这些任务。例如参看,由H.Rashidi and K.Buehler著的《生物信息学基础》:生物学和医学应用(
Application in Biological Science and Medicine)(CRC Press,London,2000);生物信息学:分析基因和蛋白质的实用指南(
A Practical Guide to the Analysis of Gene and Proteine)(B.F.Ouelette and A.D.Bzevanis,eds.,Wiley&Sons,Inc.,1998),在此结合参考它们的全部内容。概括的说,生物信息学的一个范畴是把计算技术应用到大型的基因数据库,通常在诸如因特网之类的网络上分布和通过网络访问,以便达到说明基因结构和/或位置,蛋白质功能,和新陈代谢处理之间的关系。
发明概述
扩展使用微阵列技术是促进生物信息发展的一个推动力。特别的是,微阵列和相关的仪器和计算机系统已经快速的发展起来,并且大规模的收集组织采样中有关基因或表现序列标记(EST)的表达式的数据。在这些事情当中,可使用该数据以用于研究遗传特性和检测有关基因和其他疾病或条件的突变。更特别的是,通过微阵列实验获得的数据对于研究是有价值的,因为在许多其它原因当中,许多疾病状态实质上是通过各种基因的不同的表现水平来表现其特征的,也通过在遗传DNA的复制数中的改变或通过特定基因转录(transcripts)(例如,通过启动控制,提供RNA前体,或RNA处理)水平中的改变。这样,例如,研究员使用微阵列回答问题:在一个恶性肿块的细胞中表现的是哪个基因,但没有在健康组织中表现或者没有在按照一个特殊状况的治疗的组织中表现?在特殊的组织结构中表现的是哪个基因或EST而没有在其他的组织中表现?在特殊的种类中表现的是哪个基因或EST而没有在其他的种类中表现?然而,在回答这些和其他的问题中,数据收集只是一个开始步骤。从由微阵列技术产生的大量的数据中提取生物意义的信息,和设计改进的试验设备,对研究人员来说是一大挑战。现在需要的是用先进的工具和信息提供给研究员以便执行这些任务。
在此针对这些和其他的需要描述了系统、方法和计算机程序产品。在一些实现方式中,一个网入口处理有关购买生物设备或物质材料,或者有关试剂的查询或订单。用户选择“探针设置标识符”(在下面描述的一个广义术语),它可以与一个或多个探针的探针组设置组相关。这些探针能够检测生物分子。这些生物分子包括,但不限于此,包括DNA表现的核酸或对应基因的mRNA转录和/或表现(出于方便,该核酸此后简单的称为“mRNA转录”)。相应的基因或EST被识别并与提供给用户的有关数据相关。以某些方面,用户可以选择购买基于数据的产品。如果用户决定作出一个购买,根据购买的订单调整用户的帐户。
这些实现方式的一个优点是,基于来自一个初始实验的结果,可以用针对实验的产品建议展示给一个用户。通过用户的探针设置标识符的选择表示出这些初步的结果,例如通过指定那些探针设置标识符,它们对应于在控制中和试验采样中表示为相当高等级微分式的探针。
在相同的或其他的实现方式中,一个局部基因组数据库被周期的更新。在某些方面,可以从远程数据库作出这种更新。响应于探针设置标识符的一个用户选择,有关基因或EST的数据从局部基因组数据库被提供到用户。另一方面,有关基因或EST的数据从局部基因数据库被提供到用户以响应一个基因和/或EST标识符的用户选择。
这些实现方式的一些优点包括基于实验的结果用户能够启动一个数据请求的能力。仅仅作为一个例子,用户通过选择对应于相对高的微分基因表达式的探针设置标识符来表明这些结果。此外,这些实现还可以具有优点,因为在用户请求的时间上该基因数据是局部的可用的并且通常不需要包含询问一个远程数据库来响应用户的请求。相反,周期的进行远端数据库的询问,例如一周。这样,即使用户的选择包括大量的探针设置标识符,指明大量的基因和EST的表达式或微分式,从局部基因数据库可以快速地把一个响应提供到用户。由于远程数据库的多径或批询问而通常避免了有效延迟。
此外,在前述的和其他的实现中,描述了一种方法,通过一个用户放置一个计算机实现的查询或者订购有关购买的一个或多个产品。用户选择第一组探针设置标识符,该选择经因特网被发送到一个入口系统,该系统能够具有对应于用户选择的探针设置标识符的一个或多个基因或EST的相关数据。用户从入口系统接收相关的数据。用户可以选择一些或全部的数据否则表示出另外的期望来购买与数据有关的产品。如果用户选择购买一个产品,用户的帐户因此而被调整。
在一些实现方式中,描述了一种系统,用于提供有关一个或多个基因或EST的数据,其中每个基因或EST至少具有一个对应于由一个探针设置标识符识别的探针设置,并能够检测一个生物学分子。生物学分子可以是一个相应基因的一种核酸或一种mRNA转录。如上所述,一个或多个探针设置标识符可以包括一个基因或EST标识符,比如一个接入编号。系统包括一个输入管理器,它接收第一组探针设置标识符的一个用户选择;一个基因确定器,识别对应于由第一组探针设置标识符标识的探针设置的基因或EST;一个相关器,用数据相关基因或EST;和一个输出管理器,给用户提供数据。这些仪器的输入和输出管理器可以经因特网被耦合到用户。
第一组探针设置标识符可以是第二组探针设置的探针设置标识符的一个子集,探针设置具有能够检测相应基因或EST的表达式或微分式的能力。例如,通过一个探针阵列软件应用程序提供的一个图形用户接口用户可以选择该子集。例如可以这样作出该选择,通过在表示探针设置的一个分散绘图中围绕着非正常值画一个圈,其中该非正常值表示具有相对高阶的微分式的探针设置。作为许多可能的其他的例子,在一个指令的表格中通过探针设置标识符的高亮输入项用户可以选择子集。
典型的把探针设置安置在一个或多个探针阵列上,如提到的,可以是任何各种类型的微阵列,比如使用VLSIPSTM技术(下面描述)的那些综合的或点状阵列。因此,术语“探针设置”一般理解为不仅包括一组综合的探针,例如按照VLSIPSTM技术,而且还包括按照各种点状阵列技术(也在下面描述)沉积的一个或多个点。这些点例如是低聚核苷酸或从那些克隆产生的其他的cDNA无性繁殖或PCR产品。该数据可以包括关于可用性,价格,成分,适用性的产品数据,或者包括生物设备或物质的各种产品的订单,或者一种试剂,它可以用于生物设备或物质,或者附加的信息,比如核苷酸或蛋白质顺序信息或定位的或功能注释信息。作为一些例子,该设备可以是一个探针阵列或一个显微镜载片,或者物质可以是克隆,低聚核苷酸,抗体,或蛋白质。
其他的实现方式直接针对用于提供有关一个或多个基因或EST的数据的方法,其中每个基因或EST至少具有由探针设置标识符识别的相应的探针设置,和能够进行生物分子的检测。生物分子可以是一种核酸或一种相应基因的mRNA转录。该方法包括步骤:接收第一组探针设置标识符的用户选择;识别相应于由第一组探针设置标识符标识的探针设置的基因或EST;用数据与基因或EST进行相关;并将数据提供给用户。还有其他的仪器是直接针对实现前述方法的一种计算机程序产品。
另外的实现直接针对一种方法,用于放置一个计算机实现的查询或有关购买一个或多个产品的订购指令。该方法包括步骤:在用户计算机上接收第一组一个或多个探针设置标识符的用户选择,其中每个探针设置标识符识别一个能够检测相应基因的表达式的探针设置;把用户选择通过因特网提供到一个入口系统,该入口系统能够用数据与相应于由第一组探针设置标识符标识的探针设置的一个或多个基因或EST进行相关;并从入口系统接收相关的数据。此外,用户还可以选择用于购买的产品数据。
另一个实现直接针对一种系统,用于提供有关一个或多个基因或EST的数据,其中每个基因或EST至少具有一个由探针设置标识符标识的相应的探针设置,和能够检测一个生物分子。生物分子可以是一种核酸或一种一个对应于基因的mRNA转录。系统包括一个数据库管理器,它周期性地更新包括有关基因或EST数据的一个局部基因数据库;一个输入管理器,接收一个用户选择的探针设置标识符;一个用户服务管理器,相应于探针设置标识符构造有关基因或EST的局部基因数据库数据;以及一个输出管理器,把数据提供到用户。
在上述的实现中,数据库管理器可以周期性更新局部基因数据库,例如一周,用序列数据,外来结构或定位数据,拼接变量数据,标记结构或定位数据,多形态数据,同族数据,蛋白质同族分类数据,路径数据,可替换的基因命名数据,文献列举数据,注解数据,其他的基因组或蛋白质组数据,或者任何它们的组合。通过与远程数据库可能是在因特网上周期性的通信可以完成这种更新。可以包括任何成百上千的公共或所有人的远程数据库,比如GenBank,GenBankNew,SwissPort,GenPept,DB EST,Unigene,PIR,Prosite,PFAM,Prodom,Blocks,PDB,PDBfinder,EC Enzyme,Kegg Pathway,Kegg Ligand,OMIM,OMIM Map,OMIM ALLele,DB SNP,和/或PubMed。而数据库管理器周期性的与远程数据库通信,典型的(但不是必须的)不响应一个用户的请求,输入管理器典型的(但不是必须的)动态的接收用户的探针设置标识符的选择。在本文中使用的单词“动态的”意在表示实时响应一个用户的查询。
在另一个实现中,描述了用于提供产品数据的一种系统,该数据可以包括生物产品数据。系统具有一个输入管理器,它从用户接收一个基因,EST,和/或探针设置标识符。例如,用户可以规定一个或多个基因接入号码。此外,系统具有一个用户服务管理器,用一个或多个产品数据相关或关联基因,EST,和/或探针设置标识符。用户服务管理器另外可选择协同一个数据库管理器,从一个或多个局部和/或远程数据库或者其它的局部或远程数据源获得产品数据,例如从一个网页。此外在系统中还包括一个输出管理器,提供产品数据到用户。在一些方面,根据购买可以调整用户帐户,或者对于依赖于卖主的用户,可以调整一个卖主帐户。从用户接收信息和把信息提供到用户可以在一个网络上进行,比如因特网。在另一个方面,描述了用于提供产品数据的一种方法,例如,生物产品数据。该方法包括步骤:从用户接收一个基因,EST,和/或探针设置标识符;用一个或多个产品数据与基因,EST,和/或探针设置标识符相关;从一个局部和/或一个远程数据库或者其它的局部和/或远程数据源获得产品数据;和提供产品数据到用户。该方法可选的包括根据购买调整一个用户帐户,或者对于依赖于卖主的用户调整一个卖主的帐户。
另一个方面是用于提供有关一个或多个基因或EST产品数据的一种系统。每个基因或EST至少具有由一个探针设置标识符标识的相应的探针设置,和能够检测一个生物分子。该系统包括一个输入管理器,接收一个或多个探针设置标识符;一个相关器,用一个或多个产品数据的第一组与探针设置标识符相关;和一个输出管理器,提供第一组数据给用户。另一个方面是用于提供有关一个或多个基因或EST的产品数据的一种系统。该系统包括一个输入管理器,接收一个或多个基因和/或EST标识符;一个相关器,用一个或多个产品数据的第一组与标识符相关;和一个输出管理器,提供第一组数据给用户。
一个附加的方面是用于提供有关一个或多个基因或EST产品数据的一种方法。每个基因或EST至少具有由一个探针设置标识符标识的相应的探针设置,和能够检测一个生物分子。该方法包括步骤,接收一个或多个探针设置标识符;用一个或多个产品数据的第一组与探针设置标识符相关;和提供第一组数据给用户。另一个方面是提供有关一个或多个基因或EST产品数据的一种方法。该方法包括步骤,接收一个或多个基因和/或EST标识符;用一个或多个产品数据的第一组与标识符进行相关;和提供第一组数据给用户。
按照本发明的另一个方面,描述了用于提供有关一个或多个基因或EST产品数据的一种系统。该系统包括接收装置,用于在因特网上接收一个或多个基因或EST标识符;相关装置,用于用一个或多个产品数据与基因或EST标识符进行相关;以及提供装置,用于提供产品数据给用户。
按照本发明的另一个方面,描述了用于提供有关一个或多个基因或EST产品数据的一种系统,其中每个基因或EST至少具有由探针设置标识符标识的相应的探针设置,并能够检测一个生物分子。该系统包括:接收装置,用于从用户接收一个或多个探针设置标识符的第一组的选择;相关装置,用于将一个或多个产品数据的第一组与第一组的探针设置标识符进行相关;和提供装置,用于提供第一组数据给用户。
在一个附加的方面,描述了用于提供有关一个或多个基因或EST数据的一种系统,其中每个基因或EST至少具有由探针设置标识符表示的一个相应的探针设置,和能够检测生物分子。该系统包括更新装置,用于周期性地更新包括有关基因或EST数据的一个局部基因数据库;输入管理装置,用于从用户接收一个或多个探针设置标识符的第一组的选择;数据管理装置,用于从局部基因数据库周期性地更新有关对应于第一组探针设置标识符的基因或EST的第一组数据;和提供装置,用于提供第一组数据给用户。
上述的实现方式不必彼此包含或排斥并可以以任何方式组合,是非冲突的和有各种可能的,不管它们是以相同的,或不同的方面或实现方式出现。一个实现的描述并不是用来对其他实现方式进行限制。此外,在该说明书中其他地方描述的任何一个或各个功能,步骤,操作,或技术可以以可替换的实现方式来结合在概述中描述的任何一个或多个功能,步骤,操作,或技术。因此,上述的实现方式仅是示例而不是用来限定的。
附图简要说明
通过结合附图进行的下列的详细描述,上述和其他的优点将变得更加显而易见。在附图中,相同的参考数字表示相同的结构或方法步骤,并且参考数字的最左边的一个或两个数字说明该图的编号,在图中该参考单元是第一次出现(例如,单元180在图1中第一次出现和单元1020在图10中第一次出现)。在功能块图中,长方形通常表示功能单元,平行四边形通常表示数据,带弧边的长方形通常表示存储的数据,带有一对双边界的长方形通常表示预定义的功能单元,和梯形通常表示手动操作。在方法流程图中,长方形通常表示方法步骤和菱形通常表示判定单元。然而,所有这些习惯用法只是意在典型或示例,而不是用来受限制。
图1是包括一个扫描仪和一个计算机系统的一个探针阵列分析系统的功能方框图,在计算机系统上可以执行计算机应用程序,用于提供探针设置标识符和用于接收针用于处理探针设置标识符的用户选择;
图2是探针阵列分析应用程序的一个实施例的功能方框图,如所示的用于在图1的计算机系统的系统存储器中所存储的应用程序;
图3是用于经因特网获得基因信息的一个常规系统的功能方框图;
图4是经因特网耦合到远程数据库和网页以及耦合到客户的一个基因入口的一个实施例的功能方框图,包括具有图1的用户计算机系统的网络;
图5是图4的基因入口的一个实施例的功能方框图,包括一个数据库服务器,入口应用计算机系统,和入口端因特网服务器的示例实施例;
图6是一个简化图,表示计算机应用平台的一个实施例,用于结合诸如图4中所示的客户实现图4和5的基因入口;
图7是一个实施例的方法流程图,用于提供给一个用户有关基因表达式,或者微分式,实验结果的基因产品信息;
图8是可以在图5的入口应用计算机系统上执行的一个用户服务管理器应用的一个实施例的功能方框图;
图9是一个简化图,表示一个基因或探针设置标识符到数据库的一个实施例,比如可以通过图8的用户服务管理器结合图7的方法;
图10是一个图示用户接口的实施例,可以通过图2的一个探针阵列分析应用来产生;以及
图11是另一个图示用户接口的实施例,可以通过图2的一个探针阵列分析应用来产生。
详述说明
现在,结合参考基因入口400的一个示例实施例来描述系统、方法和计算机产品。所示的入口400处于图4中的一个因特网环境中,并在图5-11中进行了更详细的示例。
在一个典型的实现中,入口400可以用于从带有探针阵列的实验中把有关结果的信息提供给一个用户。该实验通常包括使用扫描设备检测探针靶对的杂交,和通过各种软件应用程序分析检测的杂交,现在结合图1和2进行描述。探针阵列103
各种技术和科技可以用于存放或合成在一个基片或支持物上的生物材料的密集的阵列。例如,由加利福尼亚Santa Clara Affvmetrix有限公司制造的AffymetrixGeneChip阵列,按照有时称作VLSIPSTM(超大规模的固定聚合物综合)的技术进行合成。VLSIPSTM技术的一些方面在下列的美国专利中都有描述:5,143,854(Pirrung,et al.);5,445,934(Fodor,et al.);5,744,305(fodor,et al.);6,022,963(Mcgall,et al.);和6,083,697(Beecher,et al.)在。在此结合这些专利的全部内容作为参考。这些阵列的探针由低聚核苷酸组成,它通过一些方法来合成,该方法包括激活一个基片区和然后用选择的单体溶液接触基片的步骤。被激活的区域通过一个掩膜用一个光源显示,这与在制造集成电路中使用的照相技术是相同的。基片的其他区域保持非激活状态,因为掩膜阻断了对它们的照射。通过重复激活不同的区域组和用基片接触不同的单片溶液,在基片上产生了聚合物的不同的阵列。在这些方法的各种实现中使用了各种其他的步骤,比如从基片中洗涤未反应的单片溶液。
这些探针一般地连同标签的生物试样一起使用,比如细胞,蛋白质,基因或EST,其它的DNA序列,或其他的生物元素。在此称为“目标”的这些试样被处理以便它们与探针阵列中的确定探针空间上相关联。例如,一个或多个化学标签的生物试样,即目标,在探针阵列上被分布。一些目标与至少空间上补偿探针杂交和保持在探针的位置上,同时非杂交的目标被洗去。这些带有它们的“标记”或“标签”的杂交的目标因而与补偿探针的目标有关。杂交的探针和目标有时可以被称作“探针-目标对”。检测这些对能出于各种目的,比如确定是否一种目标核蛋白酸具有与一个特定参考序列相同或不同的一个核苷酸序列。例如参看,美国专利No.5,837,832,涉及和结合了上面的内容。其它的使用包括基因表达式监视和评估(例如参见,美国专利No.5,800,992(Fodor,et al.);美国专利No.6,040,138(Lockhart,et al.);和国际申请号PCT/US98/15151,公开为WO99/05323(BALABAN,etal.)),基因类型(美国专利No.5,856,092,Dal,et al.),或其他核蛋白酸的检测。上述‘992’,‘138’,和‘092’专利,以及公开物WO99/05323,在此出于所有目的而结合参考它们的全部内容。
现存在有用于在一个基片或支持上沉积探针的其他的技术。例如,商业上在显微镜片上制造的“点状阵列”。这些阵列包括液体点,它们包含潜在变化的合成物和浓缩物的生物材料。例如,在阵列中的一个点可以在一种水溶液中包括少许短条低聚核苷酸,或者它可以包括高浓缩的长条合成蛋白质。Affymetrix417TM阵列器是一种设备,它按照这些技术和方法,在一个显微镜片上沉积密集压缩的生物材料阵列,这些技术和方法在PCT申请PCT/US99/00730(国际公开号WO99/36760)进行了描述,在此结合它的全部内容作为参考。此外,还存在用于产生点状阵列的其他的技术。例如,美国专利nO.6,040,193(Winkler,et al.)是针对处理配制滴剂以产生点状阵列。‘193专利,和美国专利No.5,885,837(Winkler)也描述了在一个基片上或在放量在基片的块上使用微通道或密纹,以便合成生物材料的阵列。这些专利进一步描述了通过反应区上的惰性区和测试点把一个基片的反应区彼此隔离。在此结合参考‘193和‘837专利的全部内容。另外的技术是基于喷流生物材料以形成一个点状阵列。其他实施的喷射技术可以使用诸如吸液比重计或压力电子泵以推进生物材料。目前有各种其他的技术用于在一个基片上或在基片内合成,沉积,或定位生物材料。
为了确保合适的解释在此使用的术语“探针”,应该注意在相关文献中出现的相矛盾的惯例。在一些文章中使用的单词“探针”并不涉及如上所述的在一个基片上被合成的或在一个载片上被沉积的生物材料,但在此被称作“目标”。为避免混淆,在此使用的术语“探针”被称作诸如按照VLSIPSTM技术合成的那些探针;以便生成点状阵列的沉积的生物材料;和合成的,沉积的,或定位的试样以形成按照其他目前的或未来技术的阵列。这样,出于方便,按照任何这些技术形成的微阵列此后可以被通常和集中地称作“探针阵列”。而且,术语“探针”并不限于固定在阵列格式中的探针。相反,对于其它并行的试验设备,描述的功能和方法对于提供基因组信息和智能e-商业也是有用的。例如,这些功能和方法可以被应用于探针设置标识符,识别在珠子上和珠子中的,光纤中的,或其他物质或媒介的固定的探针。
典型的探针通过检测在目标中出现mRNA的转录存在或分布量能够检测对应的基因或EST的表达式。通过检测标签的cRNA可以依次地完成这种检测,该标签的cRNA是从目标中的mRNA导出的cDNA中导出的。通常,一个探针设置包含在唯一转录区中的子序列和不对应于一个完整的基因序列。在此通常使用的单词“设置”涉及一个或多个;例如,探针设置可以由一个或多个探针组成,和一组探针设置标识符可以由一个或多个探针设置标识符组成。扫描仪190
图1是一个系统的功能方框图,尤其适用于在其他事情中分析已经被标签的目标杂交的探针阵列。图1的表示杂交的探针阵列103可以包括任何类型的探针阵列,如上所述。使用各种商业设备可以检测在杂交探针阵列103中的标签的目标,出于方便此后称作“扫描仪”。图1所示的一个示例的设备是扫描仪190。通过从标签中检测荧光或其他的辐射,或者通过发射的,反射的,或散射的辐射扫描仪成像目标。出于方便,此后这些处理通常集中的简单称作“辐射”的检测所使用各种的检测方案。取决于辐射和其它因素的类型。一个典型的方案是使用光和其它的元素以提供激励光和选择性地收集辐射。此外,通常包括使用光电二极管,电荷耦合器,光电倍增管,或类似的设备以便登记收集辐射的各种光检测器系统。例如,使用荧光标签的一种扫描系统在美国专利No.5,143,854中被描述,可以参考上述内容进行结合。在美国专利5,578,832;5,631,734;5,834,758;5,981,956和6,025,601,以及在PCT申请PCT/US99/06097(公开号WO99/47964)中描述了其他的扫描仪或扫描系统,在此出于所有目的结合参考它们的全部内容。
扫描仪190提供表示检测的辐射的强度(也可以是其它的特征,比如颜色)的数据,以及在基片上检测到辐射的位置。该数据一般以一种数据文件的形式被存储在一个存储器设备中,比如在用户计算机100的系统存储器120中。一种类型的数据文件,比如图2所示的图像数据文件212,一般包括对应于扫描基片的子区域的元素的强度和位置信息。在文章中的术语“元素的”意味着来自该区域辐射的强度,和/或其他的特征,每个表示一个单一的值。当显示成用于观看或处理的一个图像时,元素的图像元素,或像素,通常表示该信息。因此,例如,一个象素具有从基片扫描辐射时表示基片子区域元素的强度的一个单一的值。该象素也可以具有表示另外特征的另外的值,比如颜色。例如,在其中检测高强度辐射的一个扫描的元素的子区域可以通过具有高亮度的象素表示(此后,称为“明亮”像素),和低强度辐射可以通过低亮度(一个“暗淡”像素)的一个象素来表示。可替换的,可以作出一个象素的彩色值来表示强度,颜色,或检测的辐射的其他的特征。这样,一个高亮度辐射的区域可以被显示成红象素以及一个低亮度辐射区域可以被显示成蓝像素。作为另一个例子,在基片的特定的子区域上的一个波长的检测的辐射可以被表示成红象素,和在另一个子区域上检测的第二波长的辐射可以通过一种接近的蓝像素表示。许多其他的方案是已知的。探针阵列分析应用199
一般的,人们可以检查一个打印的或显示的由一个图像文件中的数据构成的图像并可以识别那些是明亮的或暗淡的单元,或者另外通过一个像素特征(比如颜色)来识别。然而,这需要频繁的以一种自动化的,可计量的,和重复性的方式提供该信息,这是与各种图像处理和/或分析技术相兼容的。例如,通过有关位置的计算机应用可以提供信息来用于处理,在该位置上用已知的位置检测杂交的目标,在已知的位置上,已知的相同的探针被合成或沉积。诸如目标DNA或RNA的核苷酸或单体的信息则可以被推导。已经描述了作出这些推导的技术,例如,在美国专利No.5,733,729(Lipshutz)中,和美国专利NO.5,837,832中,在此出于各种目的结合参考它们的全部内容。
商业上可获得各种的计算机软件应用程序来用于控制扫描仪(和其他的有关杂交处理的仪器,比如杂交箱),以及用于获得和处理由扫描仪提供的图像文件。示例是来自Affymetrix公司的JaguarTM应用程序,这一方面描述在美国临时专利申请,序列号为60/226,999,于2000年8月22日申请,和来自Affymetrix的微阵列程序应用,这方面描述在美国临时专利申请,序列号为60/220,587,于2000年7月25日申请。由这些应用程序产生的处理过的图像文件通常被进一步处理以提取附加的数据。特别是,数据挖掘软件应用程序通常用于辅助标识和分析生物上的所关心的模式或探针设置的杂交的程度。Affymetrix数据挖掘工具是这种类型的一个软件应用的例子。此外,软件应用程序用于存储和管理通常由探针阵列实验和通过上述的图像处理和数据挖掘软件产生的大量的数据。Affymetrix实验室信息管理系统(LIMS)是这些数据管理应用程序的一个例子,它的这些内容被描述在美国临时专利申请,序列号为60/220,645,于2000年7月25日提交申请。此外,由数据库管理软件访问的各种特性数据库,比如AffymetrixEASI(表达式分析序列信息)数据库和数据库软件,提供给研究者探针设置和基因或EST标识符之间的关系。在这段中提到的所有专利申请在此结合参考它们的全部内容。
出于参考的方便性,这些类型的计算机软件应用程序(即用于获得和处理图像文件,数据挖掘,数据管理,各种数据库和与有关探针阵列分析的其他的应用程序)在图1中通常集中的表示为分析应用程序199。图2是探针阵列分析应用程序199的一个功能方框图,如示例存储用于执行的(对应于应用程序199的可执行的代码199A)在图1的用户计算机100的系统存储器120中的程序。
作为本领域技术人员应该清楚,应用程序199存储在和/或从计算机100执行并不是必需的;相反,应用程序199的一些或全部可以存储在和/或从一个应用程序服务器或者其他的计算机平台执行,它们在一个网络中被连接到计算机100。例如,对于涉及大规模数据库操作的应用程序就具有特别的优越性,比如AffymetrixLIMS或者Affymetrix数据挖掘工具(DMT),将从一个数据库服务器来执行,比如图4的用户数据库服务器412。可替换的,LIMS,DMT,和/或其他的应用程序可以从计算机100上执行,但在其上运行的那些应用程序的数据库的一些或全部可以被存储来用的在服务器412上公共访问(可能连同一个数据库管理程序,比如来自Oracle公司的Oracle8.0.5数据库管理系统)。按照已知的技术使用商业上可用的硬件和软件就可以实现这样的网络安排,比如那些可用于一个局域网络或广域网的。图4中表示了通过网络电缆480将用户计算机100连接到用户数据库服务器412(并连接到用户端因特网客户410,它可以是相同的计算机)的一个局域网。同样的,出于控制扫描仪190和接收从它输入的数据的目的,可以使扫描仪190(或多个扫描仪)经电缆480用于一个用户的网络。
再参考图2,可执行的应用程序199A以各种格式产生各种类型的数据,那些所显示的仅仅作为示例。出于方便,在此使用的术语“文件”涉及由可执行应用程序199A产生的或使用的数据,但可以使用相关领域的已知的可替换技术的任何类型的用于存储,传送,和/或操作的数据。在该图的例子中,数据分析程序210从扫描仪190接收图像数据文件212并在其中产生单元强度文件216。该例子的文件216包含由扫描仪190扫描的每个探针,表示对于那个探针由扫描仪190测量的象素强度的单一的值。这样,该值是出现在目标中的标记的mRNA的分布量的一个测量,而该目标杂交到相应的探针。许多这样的mRNA可以出现在每个探针中,作为一个探针可以包括,例如,设计的成百万的低聚核苷酸仪以检测nRNA。
在示例的例子中,探针阵列数据分析程序210产生一个包含有关试验,抽样,和探针阵列信息的实验信息文件213,该文件通常由用户101输入。该示例的数据分析程序210的一个主要的功能是分析文件216和/或文件212,可能连同来自文件213的信息和内部库文件(未显示),它们规定了探针和控制的序列和位置的细节。诸如该例的数据分析程序210的程序的目的通常是提供信息,比如杂交程度,绝对的和/或微分(在两个或更多的实验上)表达式,基因型比较,多形态和变种检测,以及其他分析的结果。在该例中,文件215表示这种数据分析程序210的分析输出。数据分析程序210可以处理文件215以生成报告文件214,它可以响应用户101的有关形式和内容的请求。作为本领域普通技术人员来说应该清楚的是,由示例的数据分析程序210产生的前述的和后述的文件,报告,以及数据表示仅仅是示例,可以以许多其他的方法处理,组合,安排,和/或表示描述的数据以及其他的数据。
此外,数据分析程序210产生各种类型的曲线、图、表格和其他的表格式的和/或图形的诸如包含在文件215中的分析数据的表达式。在图10中显示了一个示例,显示了一个图形用户接口(GUI)1000,它具有分散式绘图窗口1010和表格式窗口1020。在分散绘图窗口1010中,直线1011对在不同实验中由探针设置组测量的微分式的等级提供一个参考基准。点的位置,每个点表示来自一个或多个微阵列的一个探针设置,沿着一个轴规定在一个实验或一组实验(例如,测量控制采样的实验)中探针设置的表达式的程度,和沿着其他的轴,另一个实验或另组实验中的表达式的程度等级(例如,测量疾病采样的实验)。
在图10中,用户101具有围绕着群集点1016的一个划界线1014(使用现有已知的技术)。在表格式窗口1020中,对应于窗口1010中一个点的每个探针设置被识别和被描述在一个分离的行中。在该例中,以及如在列1034中一样行输入项包括在一个特殊试验中表达等级的测量(如在列1032)一样,一个指示是否表达式在实验中不存在(A)或存在(P)。对应于点的行,即探针设置组,包围在环圈1014中的在窗口1020中被高度照亮以便用户101可以容易的识别有关选择的探针设置组的信息。此外,如在列1036一样,在窗口1020中的每行包括一个探针设置标识符。
例如,对应于行1021和1022的该探针设置被加亮去示出在窗口1010中已经围绕其相应的点。在列1036中对于这些行,即,”M13903_at″和″M14091_at″的输入项分别是用于其相应的探针设置的探针设置标识符。因此图10是说明了由用户101可以选择探针设置标识符的很多技术。尤其是,用户101在当前的例子中通过在窗口1010围绕的点(而在这样情况下,该选择的探针设置标识符包括围绕的点)和/或在窗口1020中通过挑选一个行进行这些选择(而在这样情况下,该选择的探针设置标识符包括在列1036中的名称)。如图2所示,探针设置标识符222表示这些或者其他的可以由用户101通过施加诸如数据分析程序210提供用于选择的探针设置标识符。此外,在这个例子的用于命名探针设置的数据分析程序210中使用的协定包括有时表示该基因的接入编号或者对应于该探针设置的EST信息。例如,在行1021中的探针设置标识名“M13903_at”表示基因的接入编号或者对应于该行是M13903的对应于该探针设置的EST。在其他的例子中,该相应的接入编号可以直接显示。用于由用户101选择的这些接入编号的设备是由在图2中的接入编号124表示的。虽然,如所说明的,接入编号可以起一种探针设置标识符的作用(因此接入编号124可以被认为是探针设置标识符222的一个子组),为了说明和讨论方便起见,在图2中它们被清楚地示出。
其他的可执行的应用199A,诸如数据挖掘工具220也可以提供探针设置标识符222(选择性地包括接入编号224)给用户101。另一个例子是数据库应用230,其中一个说明性的GUI在图11中表示。数据库应用230是一个用于相关探针设置的应用程序,一般地对于相应的基因或者EST通过探针设置标识符,诸如名称、号码和/或符号识别。数据库230的一个例子是来源于上述注释的Affymetrix公司的EASI数据库应用。在图11的例子中,GUI 1100包括一个查询窗口1110,和一个结果窗口1120。如图11所示,按照已知的技术,通过选择一个特定的探针阵列1112和与阵列1112相关的说明文字部分1114或者任何与阵列1112相关的探针设置,用户101有效地已经产生一个查询。应用程序230实施该数据库(未示出)的搜索,并且在窗口1120中显示该查询的结果。如在下面相对于图5的数据库的说明,数据库应用程序230以及其相关的数据库的功能也可以或选择性地被包括在入口400内,使得由数据库管理512通过询问本地程序库数据库516满足该用户的查询。在两种情况下,该用户查询的结果一般地包括满足该查询的探针阵列的标识,例如阵列1122,以及探针设置标识符,例如标识符1124以及1126。如在先前举例的,被给予标识符1124的名称″AF058789_at″可以表示是对应于其标识的探针设置的基因的接入编号或者EST。用户101可以用相应的标识符1126加亮一个探针设置标识符,诸如在图11示出的。窗口1120的公认的树状结构表示通过标识符1126识别的该探针设置是安排在阵列1122上的。通过标识符1126识别的与该探针设置相关的描述性信息也被加亮,并且以与标识符1126一样的树状结构在相同的行中显示。
在图2中示出的LIM应用225也是作为一个可执行的分析应用程序199A的示范的例子。应用225可以管理由数据分析程序210(例如文件212-216)使用或者产生的文件,以及由DMT 220及其他类型的探针阵列分析应用程序产生或者使用的文件或者数据。LIM 225可以随着时间的过去存储、保持、处理以及显示由一个或多个实验者产生的这些及其他数据,去简化管理和实验计划以及就其结果提出报告。基于程序库数据库(未示出),LIM 225也可以提供在图2中由文件217(在下面进行描述)表示的SIF信息。如上所述相对于应用程序230,文件217可以选择或者另外地由入口400存储和保持。例如,SIF信息可以存储在本地程序库数据库516中,并且由数据库管理512管理,它可以包括LIM诸如LIM 225或者合并某些或者所有其功能。用户计算机100
在图1中示出的用户计算机100可以是特别设计和装备的计算装置,以支持和执行探针阵列应用程序199的某些或者所有功能。计算机100也可以是现在或今后开发的任何各种类型的通用计算机,诸如个人计算机、网络服务器、工作站或者其他的计算机平台。计算机100一般地包括已知的元器件,诸如处理器105、操作系统110、图形用户界面(GUI)控制器115、系统存储器120、存储器存储设备125以及输入输出控制器130。相关领域的技术人员将明白,计算机100的元件存在许多可能的配置,未示出的某些元器件一般地可以包括在计算机100内,诸如超高速缓冲存储器、数据备份单元以及许多其他的设备。处理器105可以是商用的处理器,例如由英特尔公司制造的Pentium处理器、由Sun微系统制造的SPARC处理器,或者可以是可用的其他的处理器的一种。处理器105执行操作系统110,例如它可以是来源于微软公司的Windows类型操作系统(诸如具有SP6a的Windows NT4.0);可以从许多卖方获得的Unix或者Linux类型操作系统;其它的或者未来的操作系统;或者他们的某些组合。操作系统110与程序包和硬设备以公知的方式接口,并且便于处理器105协调和执行以各种编程语言编写的不同的计算机程序的功能。操作系统110一般地和处理器105协同,协调和执行计算机100的其他的组成部分的功能。操作系统110还完全按照已知的技术提供时刻表、输入输出控制、文件和数据管理、存储器管理,以及通信控制以及相关的业务。
系统存储器120可以是任何已知的或者将来出现的存储装置设备。例如它包括任何一种通常可用的随机存取存储器(RAM)、诸如驻留数据的硬盘或者磁带的磁性介质、诸如直读式记录光盘的光学介质、或者其他的存储器存储设备。存储装置设备125可以是任何已知的或者将来出现的设备,包括高密度盘驱动器、磁带驱动器、活动硬盘驱动器、或者软盘驱动器。这种类型的存储器存储设备125一般分别从程序存储器介质(未示出)读取和/或写入,诸如高密度盘、磁带、活动硬盘或者软磁盘。所有的这些程序存储器介质,或者其它的现在在用或者稍后可能开发的可以认为是计算机程序产品。显然,这些程序存储器介质一般地存储计算机软件程序和/或数据。也称作计算机控制逻辑的计算机软件程序一般地存储在系统存储器120中和/或结合存储器存储设备125使用的该程序存储器设备中。
在某些实施例中,所描述计算机程序产品包括在其上存储的具有控制逻辑(计算机软件程序,包括程序代码)的计算机可用的介质。当由处理器105执行的时候,该控制逻辑使处理器105去实施在此处描述的功能。在另外一个实施例中,例如,某些功能主要是在使用硬设备状态机的硬设备中实施的。硬设备状态机的实现使得实施在此处描述的功能将对相关领域的技术人员来说是显而易见的。
输入输出控制器130可以包括用于接受和处理来自用户信息的任何种类的已知设备,无论是人工或者机械,无论本地或者远程。上述的设备包括,例如,调制调解器卡、网络接口卡、声卡或者其他类型用于任何种类已知的输入装置102的控制器。输入输出控制器130的输出控制器可以包括用于呈现信息给用户的任何种类已知的显示设备180的控制器,无论是人工或者机械,无论本地或者远程。如果一种显示设备180提供视觉信息,这种信息一般地可以是逻辑上和/或物理上组织为图象元素的阵列,图象元素往往被称为像素。图形用户界面(GUI)控制器115可以包括用于在计算机100和用户101之间提供图形输入输出接口以及用于处理用户输入的任何种类已知的或者未来的软件程序。在举例说明的实施例中,该计算机100的功能性单元通过系统总线104彼此通信。这些通信的某些在不同的实施例可以使用网络或者其他类型的远程通信来实现。
对于那些有关领域的技术人员来说,如果以软件实施,应用程序199可以经由输入装置102中的一种载入系统存储器120和/或存储器存储设备125将是显然的。应用程序199的全部或者部分也可以驻留在只读存储器或者存储器存储设备125的类似装置中,上述的设备不要求应用程序199首先经由输入装置102加载。那些本领域的技术人员将明白,为方便运行,应用程序199或者其部分可以由处理器105以已知的方式加载到系统存储器120或者超高速缓冲存储器(未示出)或者两个上述存储器中。获得基因组数据的传统技术
用于经因特网获得基因组数据的若干常规方法是可利用的,其中一些在由Ouelette和Bzevanis所编的书中描述,合并在上面作为参考。图3是一个表示简化的例子的功能方块图。如图3所示,用户101可以查阅任何很多公用的或者其他资料以获得接入编号224′。如手工操作312表示的,用户101通过经由任何网络浏览器进入医学和国家卫生研究所(如2001年1月可访问的因特网URL http://www.ncbi.nlm.nih.gov)的国家图书馆的国家生物技术信息(NCBI)中心的因特网网址启动请求312。尤其是,用户101可以进入Entrez搜索与检索系统,其在NCBI从不同的数据库提供信息。这些数据库提供对于核苷酸序列、蛋白质的序列、大分子结构、整体基因组以及相关于此公布数据的信息。示例性地假定,用户101以此方式进入NCBI Entrez核苷酸数据库314,并且接收包括基因或者EST序列316的信息。特别地,如果接入编号224′表示大量(例如一百)感兴趣的EST或者基因,作为可以容易地去做探针阵列实验的分析的情况,迄今描述的操作任务可能花费很多时间,或许几小时。
用户101一般地从序列316复制序列信息,并且通过NCBI的BLAST网页324(如2001年1月在http://www.ncbi.nlrn.nih.gov/BLAST/可访问)粘贴这个信息进入到可访问的HTML文件之内。这个由用户启动的图3的批BLAST请求322表示的操作,如果包括许多序列,它也可能是耗费时间的和冗长的。BLAST是基本本地定位搜索工具的缩写,在该领域是众所周知的,并且由相似性搜索程序组成,使用试探式算法寻找对于两个蛋白质和DNA的序列数据库去寻找本地定位。例如,用户101可以使用″blastn″核苷酸序列数据库实施BLAST搜索。由类似的核苷酸和/或蛋白质的序列数据326表示的这个批BLAST搜索的结果对于用户101持续很多小时可能是不行的。然后用户101可以手动地或者使用各种各样的软件工具启动比较和估计332,。随后用户101可以报出报告334,以解释搜索的发现和定位策略以及对于下一步实验的要求从用户101输入到基因组入口400
图4是一个示例性说明由用户101可以与基因组网入口400连接配置的功能方块图。应该会明白,图4只是简化和说明性地,在图4示出的网络和因特网连接的很多的实施和变化对于那些本领域的普通技术人员将是显然的。
用户101利用用户计算机100和如上所述的的分析应用程序199(包括产生和/或访问文件212-217的某些或者全部)。如图4所示,在这个例子中,将文件212-217保持在用户数据库服务器412上,用户计算机100经网络电缆480耦合到用户数据库服务器412。计算机100′、100″以及在局域网或者包括企业内部网、因特网或者任何其他网络的广域网中的其他用户的计算机也可以经电缆480耦合到服务器412。
应该明白电缆400仅仅代表任何类型的网络连通性,它可以包括电缆、发射机、中继站、网络服务器以及许多未示出但是对于那些相关领域普通技术人员是显然的其他的组成部分。经用户计算机100,用户101可以操作由用户端因特网客户410提供的网浏览器去通过因特网499与入口400通信。入口400可以是类似于经因特网499与其他的用户和/或用户的网络通信,如由因特网客户410′和410″表示的。
如前所述,由用户101提供给入口400的信息一般包括一个或多个″探针设置标识符″。这些探针设置标识符一般地作为在探针阵列上实施的实验的结果以引起用户101的注意。例如,用户101可以选择那些能够允许从相应的特别感兴趣的基因或者EST的检测mRNA转录表示的标识微阵列探针的探针设置标识符。正如本领域中众所周知的,一个EST是不能充分地表征基因序列的片段,然而一个基因序列通常是完全和充分地表征的。该词″基因″在此处通常用于涉及基因的已知序列的全部大小,以及涉及可计算推算的基因。在某些实施中,由该阵列检测的代表这些基因或者EST具体的序列可以被称为″序列信息片段(SIF)″,并且如上所述相对于LIMS 225操作可以记录在″SIF文件″中。在特定的实施中,一个SIF已经认为是较好地代表来自给定基因或者EST的mRNA转录的交感序列的一部分。该交感序列可能是通过比较和分组EST取得的,并且也可能通过比较EST与基因组序列信息取得的。一个SIF是在该阵列上具体地设计用于探针的交感序列的一部分。相对于网入口400的操作,假定某些微阵列探针设置可以设计成基于EST序列能检测基因的表达式。
如上所述,术语″探针设置″泛指来自在微阵列上的一排探针的一个或多个探针。例如,在一个AffymetrixGeneChip探针阵列中,其中探针是在衬底上人工合成的,探针设置可以由30或者40个探针组成,一般地其中一半被控制。这些探针共同的或者以它们某些或者全部不同的组合被认为是表示基因或者EST的表达式。在定点探针阵列中,一个或多个点可以同样地构成一个″探针设置″。
该术语″探针设置标识符″被广泛地在此处使用,其中很多类型的这种标识符可能和将要被包括在这个术语的含义内。探针设置标识符的一种类型是名称、号码或者其他的分配给识别探针设置的目的的符号。这个名称、号码或符号例如可以是由该探针阵列的制造商任意地分配给探针的设置。例如用户可以通过加亮或者键入该名称选择这个类型的探针设置标识符。作为在此处想要的另一种类型的探针设置是图形表示的探针设置。例如,可以在分散绘图或者其他的示意图上显示的那些点,其中每个点代表一个探针设置。
典型地,在图上该点的位置表示在一个或多个实验中来自混合、标记的、目标(在下面更详细描述)的、信号的强度。这样的话,用户通过敲击、画一个围绕的环,或者选择一个或多个点可以选择一个探针设置标识符。在与数据分析程序210的操作结合,并且更具体地说,与相对于用户101画围绕在散绘图上的绘环1014,和/或选择与加亮行1021或者1022有关的名称或者接入编号结合来提供上述选择的例子。其他的例子在上面相对于由用户101在数据库中选择的行1126提供,该数据库以接入编号和其他的基因组信息来相关探针设置。
作为在此处使用的术语,另一个类型的探针设置标识符包括核苷酸序列。例如,说明性地假定特定的SIF是500碱基的单一顺序,其是共同序列的一部分或者从EST和/或基因组序列信息收集的标本序列。进一步假定一个或多个探针设置被设计成能代表该SIF。因此规定500碱基序列全部或者一部分的用户可以认为已经具有对应的探针设置的全部或者某些。作为进一步的例子,用户可以规定500碱基顺序的一部分,它可以是SIF唯一的,或者也可以标识另一个SIF、EST、EST的群、交感序列和/或基因分组。在那种情况下,该用户已经对于一个或多个基因或者EST规定探针设置标识符。在另一个变化中,说明性地假定特定的SIF是特定的交感序列的一部分。进一步假定用户规定交感序列的一部分是未包括在该SIF内,而对将要表示的交感序列或者基因或者EST的交感序列是唯一的。在那种情况下,即使用户规定的序列未包括在该SIF内,由用户规定的该序列是对应于该SIF标识该探针设置的探针设置标识符。作为那些有关领域的技术人员现在将会理解,相对于EST和基因或者EST的部分序列的用户说明要求并联的情况是可能的。
探针设置标识符的另一个例子是基因或者EST的一个接入编号。基因和EST接入编号是公开可利用的。因此一个探针设置可以通过接入编号或者一个或多个EST和/或对应于该探针设置的基因的号码识别。在探针设置和EST的或者基因之间的一致性可以在适当的数据库中保持,诸如由数据库应用程序230或者本地程序库数据库516访问的,其中该一致性可以提供给用户。同样地,对使用其公开可利用的接入编号作为探针设置标识符的目的来说,除EST以外的基因片段或者序列可以被映射(例如,通过查阅适当的数据库)给相应的基因或者EST。例如,用户可以对与特定的SIF相关的产品或者基因组信息感兴趣,特定的SIF源自于EST-1和EST-2。该用户可以装备有在SIF (或者SIF序列的部分或者全部)和EST-1或者EST-2或者双方之间的一致性。为了获得与该SIF相关的产品或者基因组数据,或者它的部分序列,该用户可以选择EST-1、EST-2或者两者的接入编号。基因组网入口400
基因组网入口400提供给用户101与一个或多个基因或者EST相关的数据。每个基因或者EST具有至少一个对应的通过探针设置标识符识别的探针设置,正如所述的,作为说明性的和非限制性的例子,该探针标识符可以是号码、名称、接入编号、符号、图形表示(例如点或加亮的列表的条目)、或者核苷酸序列。该相应的探针设置能够允许检测其对应的基因的表达式。响应用户选择的一个或多个探针设置标识符,入口400给用户101提供基因组信息和/或关于生物制品的信息。这个信息可以有助于用户101解析实验的结果,以及设计或者实施后续的实验。
图5是入口400的许多可能的实施例的一个的功能方块图。在这个例子中,入口400具有包括三个计算机平台的硬件组成部分:数据库服务器510、因特网服务器530以及应用服务器520。入口400的不同的功能单元,诸如数据库管理器512、输入和输出管理器532和534,以及用户服务管理器522在这些计算机平台上执行其操作。即,在一个典型的实施中,管理器512、532、534以及522的功能是通过软件应用的执行以及通过由服务器510、530以及520代表的计算机平台来执行的。入口400首先相对于其计算机平台描述,然后相对于其功能单元描述。
虽然它们典型地属于通常被称为服务器的计算机类别,服务器510、520以及530的每一个可以是任何类型的已知的计算机平台或者在未来将开发的类型。但是,它们也可以是主机、工作站或者其他的计算机类型。它们通过任何已知的或者未来的电缆类型或者其他的通信系统连接,双方联网或者不联网。它们可以是相互定位或者它们实际上可以是分离的。根据类型和/或所选定的计算机平台构成,在任何计算机平台上可以采用不同的操作系统。合恰的操作系统包括Windows NT、Sun Solaris、Linux、OS/400、康柏Tru64、Unix、SGIIRIX、西门子Reliant Unix等等。
以此方式在多个计算机平台上执行入口400的功能存在很大的优点,诸如低成本调配、数据库转换或者转换为企业应用程序,和/或更有效的防火墙。但是,其他的配置也是可能的。例如,对于那些相关领域的普通的技术人员是众所周知,除了由图5表示的三层服务器端组成部分之外,所谓的双重的或者N层结构是可能的。例如,参见E.Roman的Mastering Enterprise JavaBeansTM和JavaTM2平台(John Wiley& Sons公司,NY,1999)和J.Schneider以及R.Arora的Using EnterpriseJavaTM(Que公司,Indianapolis 1997),为了通用的目的在其整体中在此合并参考其中两者。
很清楚未在图5中示出的用于因特网商务的许多硬件和相关的软件或者程序包组成部分可以在服务器端结构中实施。对于实施一个或多个防火墙的组成部分去保护数据和应用程序、不间断电源供给、局域网交换机、网络服务器路由软件以及许多其他的组成部分都未示出。同样地,通常包括在服务器类别计算平台中的各种计算机组成部分和其他的类型计算机将被包括但是未示出。例如,这些组成部分包括处理器、存储单元、输入/输出设备、总线及其上面说明的与用户计算机103有关的组成部分。那些本领域普通的技术人员将会容易地理解如何实现这些及其他常规的组成部分。
入口400的功能单元也可以按照各种软件提供商和平台实现(虽然不排除入口400的某些或者全部的功能也可以以硬件或者程序包实现)。在各种各样的商用产品之中可利用用于实现电子商务网入口的产品是来自BEA系统的BEA WebLogic,它是所谓的″中间件″应用程序。这些及其他中间件应用程序有时被称为″应用服务器″,但是不要与应用服务器520混淆,应用服务器520是一个计算机。这些中间件应用程序的功能通常是将辅助其他的软件单元(诸如管理器512、522或者532)去共享资源和协调行为。该目标包括使写入、保持以及改变该软件单元更容易,以避免数据阻塞,并且防止系统死机或者从系统故障中恢复。因此,这些中间件应用程序可以提供加载平衡、失败经过以及故障容忍度,有关领域的普通的那些技术人员将理解所有的这些特征。
其他的开发产品,诸如来自Sun微系统公司的JavaTM2平台可以在入口400中采用以提供一套应用编程接口(API),尤其是提高实施可升级的和安全的组成部分。来源于Sun微系统的被称为J2EE(JavaTM2企业版)的平台被配置用于随企业JavaBeans使用。企业JavaBeans使用以Java语言编写的分布式目标应用程序简化服务器端组成部分的结构。因此,在一个实施中,入口400的功能单元可以以Java编写,并且使用J2EE和企业JavaBeans实现。如由那些本领域普通的技术人员理解,各种各样的其他的软件开发方法或者结构可以用来实现入口400的功能单元以及其相互连接。
这些平台和组成部分的一个实施在图6中示出。图6是一个简化的图形,说明在用户方上用户端因特网客户410和在入口端上因特网服务器530的输入和输出管理器532和534之间的交互作用,以及在入口400的三层(服务器510、520以及530)之中的通信。在客户410上的浏览器605向服务器530发送和从服务器530接收HTML文献620。HTML文献625包括applet 627。在用户计算机103上运行的浏览器605提供一个用于applet 627的运行时间容器。在服务器530上的管理器532和534的功能,诸如GUI操作的实现可以随JavaTM平台操作通过servlet和/或JSP 640实现。在服务器530上执行的servlet引擎提供一个用于servlet 640的运行时间容器。来自Sun微系统公司的JSP(Java服务器主页)是一个用于GUI操作的文字类环境,一种备选方案是来自微软公司的ASP(活动服务器主页)。App服务器650是在上面被称为中间件的产品,并且在应用服务器520上执行。EJB(企业JavaBeansTM)是一种规定用于企业beans结构的标准,它是应用程序组件。类似地,CORBA(通用的对象请示代理软件结构)是一种用于分布式目标系统的标准,即,由CORBA标准是通过CORBA依次的产品诸如JavaTM IDL来实现的。一种EJB依从的产品的例子在上面被称为WebLogic。对于那些有关领域的技术人员来说,用于因特网入口和其与客户通信的标准、平台、组成部分及其他单元的实施的更详细的资料是为大家所熟知的。
如上所述,入口400的一个功能单元是输入管理器532。管理器532从用户101经因特网499接收一组,即一个或多个探针设置标识符。管理器532处理和转发这些信息给用户业务管理器522。这些功能被按照已知的为因特网服务器的操作所共用的技术实施,也通常以类似的文字引用介绍该服务器。入口400的另一个功能单元是输出管理器534。也按照那些已知的方法,管理器534经因特网499提供由用户业务管理器522组合的信息给用户101,其中一个方面相对于图6描述如上。由管理器522组合的信息在图5中表示为数据524,标记为″响应用户请求综合的基因组和/或产品网页″。在一定意义上,该数据尤其是至少部分地基于该数据被集成在由用户101的探针设置标识符的技术规范上,因此对应于那些标识符该基因和/或EST具有共享的关系。由管理器534代表的数据524可以按照各种已知的方法实现。作为某些例子,数据524可以包括HTML或者XML文献、电子邮件或者其他文件、或者其他形式的数据。该数据可以包括因特网URL地址,使得用户101可以从远端源取回附加的HTML、XML或者其他的文献或者数据。
入口400进一步包括数据库管理器512。在举例说明的实施例中,数据库管理器512协调来自或者到任何本地数据库511、513、514、516以及518的数据的存储、维护、补充等等其他的传输。管理器512可以和适当的数据库应用程序,诸如Oracle 8.0.5数据库管理系统合作实现这些功能。
在某些实施中,管理器512周期性地更新本地基因组数据库518。在数据库518中的数据更新包括与一个或多个探针设置相应的基因或者EST相关的数据。该探针设置可以在任何微阵列产品上使用或者计划使用,和/或期望或者计划在任何制造商或者研究人员的微阵列产品中使用。例如,该探针设置可以包括在来自Affymetrix公司库存的GeneChip探针阵列上人工合成的所有的探针设置,包括其Arabidopsis基因组阵列、CYP450阵列、果蝇基因组阵列、大肠杆菌基因组阵列、GenFlexTM标记阵列、HIV PRT Plus阵列、HuGeneFL阵列、人类基因组U95组、HuSNP探针阵列、鼠科的基因组U74组、P53探针阵列、老鼠基因组U34组、老鼠神经生物学U34组、老鼠毒物学U34阵列或者酵母基因组S98阵列。该探针设置也可以包括那些在常规阵列上用于用户101或者其它的人工合成的。但是,在数据库518中更新的数据没必要如此限制。而是,其可以涉及许多基因或者EST。可以存储在数据库518的数据的类型相对于管理器522的操作描述如下,直接定期从远端源采集这些数据,在数据库518中提供在本地保持的数据给用户。
数据库516包括在上面相对于数据库应用程序230所引用的数据类型,即,与其相应的基因或者EST以及其标识符相关的数据。数据库516也包括SIF及其他程序库数据。用户业务管理器522有时将相对于程序库及其他数据更新的信息提供数据库管理器512。有时候,虽然这些信息也可以被公开进行利用,作为在网络站点上用于加载,但这些更新信息将由专有信息的拥有者或者管理者提供。
在本地产品数据库514中由管理器512存储的信息可以同样地由卖方、销售者或者代理商提供或者从公共资源诸如网络站点中获得。各式各样的相关产品信息可以包括在数据库514中,其中例如包括实用性、价格、成分、适宜性或者订购数据。该信息可以涉及各式各样的产品,包括所有的类型的生物设备或者物质,或者所有的类型的可以用于生物设备或者物质的试剂。只提供几个例子,如该设备、物质或者试剂可以是一种低聚核苷酸、探针阵列、克隆、抗体或者蛋白质。存储在数据库514中的数据也可以包括链接,诸如因特网URL地址,到产品数据可利用的远端地址,诸如卖方网址。
数据库511包括与探针的序列有关的探针设置标识符的信息。这些信息可以由探针的制造商、设计探针用于定点阵列或者其他的常规阵列的研究人员或者其它人来提供。此外,入口400的应用不局限于以阵列形式排列的探针。如所述的,探针可以固定在小珠、光纤或者其他的衬底或者介质上或者之中。因此,数据库511可能也包括考虑这些探针序列的信息。
数据库519包括用户和它们用于和或者经过入口400进行商务的帐户的信息。可以从用户获得任何种类的帐户信息,诸如当前的订单、过去的订单等等,所有的一切对于那些普通的本领域技术人将是容易地显而易见的。同时,按照已知的在电子商务中使用的方法,与用户相关的信息可以通过记录和/或解析用户与入口400的交互作用来研究。例如,用户业务管理器522可能注意到用户兴趣的基因组区域,它们的购买或者产品查询行为,其各种各样的业务的访问频率等等,并且将这个信息提供给数据库管理器512,用于在数据库519中存储或者更新。
入口400的另一个功能单元是用户业务管理器522。管理器522可以周期性地使得数据库管理器512去从各种各样的信源,诸如远程数据库402更新本地基因组数据库518。例如,按照任意的按年代先后的时刻表(例如,每天每周等等),根据已知的方法,管理器522通过制订适当的查询可以启动搜索远程数据库402,寻址各种各样的数据库402的URL,或者通过其他的传统方法用于通过因特网实施数据搜索和/或检索数据或者文献。这些搜索查询和相应的地址可以以已知的方式提供给输出管理器534用于出示给数据库402。输入管理器532接收对于查询的答复,并且提供它们给管理器522,然后提供它们给数据库管理器512,用于更新数据库518,所有这些全部根据各种已知的方法用于管理信息流向、来自以及在因特网站点内,。
入口应用程序管理器526管理入口400的行政方面,可能利用中间件产品诸如应用服务器产品的辅助。所描述的这些行政任务的一个可以是发布定期的指令给管理器522去启动数据库518的定期更新。做为选择,管理器522可以自动启动这个任务。按照相同的周期时刻表不需要在数据库518中的所有数据被更新。而是,按照不同的时刻表,一般是对于不同类型数据和/或来自不同的信源的数据更新。此外,这些时刻表可以改变,并且无须按照一致的时刻。即,对于特定的数据的更新可以在一天以后出现,然后在二天以后再次更新,其次以不同的周期可以继续去变化。很多因素可以影响经管理器526或者管理器522的确定去保持或者变化这些周期,诸如来自各种各样的远程数据库402的响应时间,在那些数据库中信息的值和/或时间性,与访问相关的成本考虑或者该数据库的许可,必须访问的信息数量等等。
在某些实施中,管理器522从在本地基因组数据库518中的数据构成一组与对应于由用户101选择的探针设置标识符组基因或者EST相关的数据。该用户选择可以由输入管理器532按照已知的方法转发给管理器522。同样按照已知的方法,基于该用户选择,管理器522通过形成适当的查询诸如一种SQL语言从数据库518获得数据。然后管理器522转发该查询给数据库管理器512以相对于数据库518来执行。
如所述的,以此方式可以从远程数据库402访问各种类型的数据,并且保持在本地基因组数据库518中。例子包括序列数据、外来(exonic)结构或者定位数据、拼接变量数据、标记结构或者定位数据、多形态数据、同族数据、蛋白质同族分类数据、路径数据、可替换的基因名称数据、文学列举数据以及注释数据。也可能有许多其他的例子。同样,目前不是可用的,而在未来变得可用的基因组数据可以访问以及如在此处描述的在本地保持。目前适用于以描述的方式访问的远程数据库402的例子包括GenBank,GenBank New,SwissProt,GenPept,DB EST,Unigene,PIR,Prosite,PPAM,Prodom,Blocks,PDB,PDBfinder,EC Enzyme,Kegg Pathway,Kegg Ligand,OMIM,OMIMMap,OMIM Allele,DB SNP以及PubMed。目前存在适宜的成百上千的其他的数据库,因此这个列表仅仅是说明性的。
此外,本地基因组数据库518也可以用获得的数据或者从由数据库管理器512服务的其他的本地数据库推导出(由用户服务管理器522)的数据来补充。尤其是,虽然为了说明方便起见示出的本地产品数据库514是和数据库518分离的,但其可以是同一的数据库。作为选择,在数据库514中的全部数据或者一部分可以从数据库518复制或者可访问。
现在提供更具体的例子,用户服务管理器522怎样接收和响应来自用户101的请求,以用于基因组信息和用于产品信息和/或订购。这些例子是相对于图7、图8和图9描述的。
图7是一个表示示例性的方法的流程图,通过举例说明入口400的实施例可以响应用户对基因组或者产品信息的请求。按照这个例子的步骤710,输入管理器532经因特网499从客户410接收由用户101对数据的请求。例如,这个请求可以包括一个HTML或者XML文件,其包括某一个探针设置标识符的用户101的选择。如所述的,作为一个非限定的例子,该探针设置标识符可以是数字、名称、接入编号、符号、图形表示或者核苷酸或者其他的序列。在某些情况下,用户101通过利用一个或多个分析应用程序199A可以进行这个选择,以选择探针设置标识符(例如,如上所述画一个围绕点的环),然后通过各种已知的方法激活与入口400的通信,诸如右击鼠标。按照各种已知的方法,该请求也可以规定用户101是否对基因组和/或产品数据以及所期望的数据的类型详情感兴趣。例如,用户101可以从下拉菜单选择产品的类别、卖方或者产品的名称等等。如上所述,管理器532提供用户101的请求给用户服务管理器522。
按照步骤720,用户服务管理器522启动用户101的识别。图8是一个更详情地给出管理器522的功能单元的方框图,包括帐户ID确定器822,在这个说明性的实施例中其进行标识用户101的任务。确定器822可以利用任何已知的方法去获得这个信息,诸如使用cookies技术或者从由用户输入的识别号码的用户请求中提取。通过数据库管理器512,确定器810可以比较用户标识和在用户帐户数据库513中的条目以进一步标识用户101。在另外一个实施例中,如上所述,虽然可以记录统计或者与用户101的请求相关的信息,但无须获得用户101的标识。
按照步骤725,用户服务管理器522制订一个适当的查询(例如,使用SQL语言版本)用于相关探针设置标识符与相应的基因或者EST。基因或者EST确定器820是示例性地执行这个操作任务的管理器522的功能单元。确定器820转发该询问给数据库管理器512。如果由用户101提供的探针设置标识符包括序列信息,那么该询问可以从数据库511,和/或从在数据库516中的SIF信息中寻求,一个或多个探针设置的识别具有相应(例如,类似于生物学含义)的序列。如果该探针设置标识符包括名称或者号码(例如,接入编号),那么该询问可以从数据库516寻找该探针设置的标识,如所述的,包括和名称、号码及其他对应于基因或者EST的探针设置标识符相关的数据。用户101也可以在本地采用数据库应用程序230去获得这个信息,并且按照已知的方法,在该信息请求中包含它。在这种情况下,无须实施步骤725。
如在步骤730表示的,用户服务管理器522接着会用基因组信息和/或产品信息来相关所表示的基因和/或EST。在举例说明的例子中这个操作任务的执行是通过相关器830来进行的。在许多可能的实施例的一个中,相关器830制订一个询问经由数据库管理器512到数据库513,以便在本地产品数据库514和/或本地基因组数据库518中获取连接到适当的信息。图9是一个数据库513简化的图形表示。那些本领域普通的技术人员将会理解,这个表示是为清楚说明目的提供的,并且许多其他的实施例是可能的。在到数据库513的适当的询问的一个方面中,为了说明假定是关系数据库,基因或者EST接入编号902与链接904到探针设置ID 912相关。如在图9表示的,通过将两个ID 902A和902B相关到同一链接904N,多个基因和/或EST可以与同一的探针设置ID有关。用于建立这个相关关系的信息类似于如上所述在数据库516中提供的信息,并且因此该链接可以使用数据库516预先确定或者动态地确定。
在另外一个实施例中,相关器830简单的相关一个或多个基因或者EST标识符,诸如接入编号与诸如生物制品的产品。这些实施例在图8中是由从确定器810(它是可选择的)径直到相关器830的箭头表示的。该相关可以按照任何种类的传统方法实现,诸如通过提供一个询问给本地产品数据库514、给远程主页404和/或远程数据库402。这些询问可以通过分类、类型、名称或者产品的卖方标引或者键控,例如,在检验查表、关系数据库或者其他的数据结构中可能是恰当的。此外,按照那些相关领域的普通技术人员所知的方法,该询问可以搜索产品、产品网页,或者逻辑上或者句法上与基因或者EST标识符有关的其他的产品数据源。然后该询问的结果可以由输出管理器534提供给用户101,诸如经因特网499提供给客户410。
随着到探针设置ID912的适当的链接904,可以获得链接到相关的产品和/或基因组数据的一个或多个链接916。例如,链接904N可以链接到探针设置912C,它是与链接916C到相关的产品和/或基因组数据有关系的。用于建立这个相关的信息可以由用户基于专业输入和/或计算机执行的询问实质分析(例如,统计和/或由一个自适应系统,诸如神经系统网络)预先确定。例如,可以观察或者预料(如所述的,由人工或计算机)用户引导基因表达式实验导致识别某种基因可能希望使用对于该基因的抗体去继续控制蛋白质水平实验。在基因和适当的抗体之间的关系可以被存储在合适的数据库中,例如数据库516。因此链接916C可以包括到产品或基因组数据标识符的链接,它识别关于适当的抗体(例如,到产品/基因组ID922A的链接)的数据的链接,识别一般的抗体目录链接(例如,ID922B),或者识别明确设计用于检测另一个兴趣的接合形式基因的探针阵列链接(例如,ID922C)。为了说明的目的,尤其是在这个例子中,假定链接916C通向ID922C。关于接合变量探针阵列可用性的信息可以由链接926的内容预先确定。例如,可以存储因特网和/或数据库询问URL的链接926D(如所示,与ID922C有关系)通向卖主的网页、本地产品数据库514和/或本地基因组数据库518。同样,链接926D的内容可以由数据库514或者518或者远程数据库诸如数据库402或网页404动态地确定。这些处理和类似的处理由图7的步骤735表示。
正如那些本领域普通技术人员将理解的,数据库513的这种说明性的安排可能具有很多改变和变化的实施例。例如,探针设置标识数据可以链接到阵列标识符(诸如阵列ID914),然后它可以与链接916有关联。作为很多可能的例子的另一个,基因或EST接入编号可以直接链接到产品和/或基因组数据ID 922,或者,甚至直接到链接926。例如示例的实施由用户基于更窄的询问提供机会用于进行大范围关联。例如,用户可以只选择一个探针设置标识符,但是标识符可以链接到多重基因和/或ETS的数据,其还可以链接到多个产品或基因组数据。在另一个例子中,链接926D可以包括一个到本地基因组数据库518的链接。基于探针设置标识符、基因或EST接入编号、序列信息或者其它的由用户101的询问提供或推出的数据,数据库518可以按照已知的询问和/或检索技术检索相关的数据。
现在返回到图7,尤其是步骤740,按照由相关器830拥有的询问返回的数据被作为适当的返回的数据的本质提供给产品数据处理器842、基因组数据处理器844,或者两者。这了便于说明,处理器842和844的功能分开示出,但是没有必要这么做。处理器842和844应用所有已知的介绍或者数据传送技术以准备图形用户接口,用于传送的文件和其它形式的数据。然后将这样处理的数据提供给输出管理器534,用于传送给客户410。
在某些实施例中,用户101可以对这种由表示希望购买产品或者接收更多的信息而发送的数据响应。用于索取进一步信息的请求可以以类似于图7的如上所述的方式处理。如果用户101表示出希望购买产品(参见判定单元745)的要求,该表示的产品可以准备装船或者其它处理,并且按照已知的用于实施电子商务的方法,可以调整该用户的帐户。作为许多供选择的实施例的一个,用户服务管理器522可以通知产品卖方用户101的订单,并且该卖方可以船运或者命令这批产品装船。在这个实施例的一个方面中,管理器522接着会说明费用应该从用于介绍的卖方处收费。
在入口400的某些实施例中,用户101可以提供给入口400(例如,经由客户410、因特网499以及输入管理器532)一个或多个基因或者EST上升号码或者其他的基因或者EST标识符。做为选择,或者此外,用户101可以提供给入口400一个或多个探针设置标识符。用户101可以从公共资源,从标志用户101已经作为进行试验探针阵列的结果,或者从在探针阵列上具有相应的探针的一系列基因或者EST,或者从任意其他的资源或者以任意其他的方式获得基因、EST和/或探针组标识符。输入管理器532接收一个或多个基因、EST或者探针组标识符,并且将它或者它们提供给用户服务管理器522,它制订一个询问给数据库管理器512。按照已知的询问方法和格式,该询问从与基因、EST和/或探针设置标识符相关的产品信息的本地产品数据库514寻找信息。为此目的,本地产品数据库514基于或者在任意一个或多个基因、EST和/或探针组标识符上的键控可以标引或者可查找产品。按照已知的方法,某些实施例可以包含和基因、EST或者探针设置标识符类似性匹配,例如如果提交了基因、EST、SFI(对应于该探针组标识符)序列的全部或者一部分。同样,按照已知的方法诸如查表,可以实施名称连接关系功能,使得供选择的名称或者基因、EST或者探针设置标识符的形式可以找到,并且在产品数据查询中使用。此外,在某些实施例中,按照已知的因特网搜索技术,管理器522可以启动远程数据库402和/或远程卖方网页404的远程数据检索以从远端源获得产品信息。这些搜索可以基于例如产品分类或者卖方,而该产品分类在本地产品数据库514中与产品、分类相关或者卖方与基因、EST或者由用户101提供的探针设置标识符有关。管理器522可以提供对应于基因、EST和/或探针组标识符的产品数据,从本地产品数据库514和/或远程页或者数据库404或者402中获得产品数据,并且经由输出管理器534将这些产品数据提供给用户101。例如,这个产品数据可能包含在网页524中。在一些实施例中,入口400提供一个用于提供产品数据,典型的生物制品数据的系统。该系统包含:输入管理器532,它从用户101接收一个或多个基因、EST、和/或探针组标识符;用户服务管理器522,它用一个或多个产品数据来相关基因、EST、和/或探针设置标识符,而且使(例如,经由数据库管理器512)产品数据或者例如从在本地数据库514或者在某些实施例中例如远程地从主页404或者数据库402获得;以及输出管理器534,其将该产品数据提供给用户101。
类似地,提供了一种提供生物制品数据的方法,该方法包含步骤:从用户101接收一个或多个基因、EST、和/或探针设置标识符;用一个或多个产品数据相关基因、EST、和/或探针组标识符;使产品数据从本地(例如数据库514)或者从远端(例如主页404或者数据库402)获得;以及该产品数据提供给用户101。
如上所指出的,入口400的功能单元可以以硬件、软件、程序包或者其任意组合实现。在如上所述的实施例中,为了方便起见通常假定入口400的功能以软件实现。即,举例说明的实施例的功能单元包括软件指令装置,以便去执行描述的功能。这些软件指令可以以任何程序设计语言编程,诸如Java、Perl、C++、其他的高级程序设计语言、低级语言以及其任意组合。因此入口400的功能单元可以称为执行″一组基因组网络入口指令″,以及其功能单元可以类似地被描述为由服务器510、520以及530执行的基因组网入口指令的装置。
在某些实施例中,计算机程序产品被描述为包括在其上存储的具有控制逻辑(计算机软件程序,包括程序代码)的计算机可用的介质。当由处理器执行的时候,该控制逻辑使处理器去实现在此处描述的入口400的功能。在另外一个实施例中,例如,某些上述的功能主要是在使用硬设备状态机的硬设备中实施的。硬设备状态机的实现使得实施在此处描述的功能将对有关领域的技术人员来说是显而易见的。
已经描述了各种各样的实施例和实施方式,对于那些相关领域的技术人员来说应该是显而易见的,已经仅仅通过举例来呈现的上述实施例只是说明性的,而不是限定性的。用于在举例说明的实施例的各种各样的功能单元之中分配功能的许多其他的方案是可能的。任何单元的功能可以以在备选方案实施例中的多种方式执行。同样,在备选方案实施例中,几个单元的功能可以由较少的或者单个单元执行。
例如,为了清楚起见,用户服务管理器522的功能被作为由在图8示出的功能单元的实施来描述。但是,管理器522没有必要被分成这些或者其他的不同的功能单元。类似地,为了方便起见分别地描述的特定的功能单元的操作没有必要分别地执行。例如,产品数据处理器842的某些或者全部功能可以由基因组数据处理器844实施,反之亦然。类似地,在某些实施例中,所有的功能单元可以比那些相对于举例说明的实施例描述的实施例执行更少的或者不同的操作。同样,在一个特定的实施例中,为了清楚的说明起见示出的功能单元可以合并在其他的功能单元内。
例如,处理器842和844的功能可以被归于单个功能单元。类似地,数据库管理器512的某些或者全部功能可以由用户服务管理器522和/或由输入管理器532执行。
还有,该功能序列或者部分功能通常可以改变。例如,帐户ID确定器810的功能可以在用户数据处理器840之后执行。从而在这点上在图8中的数据流量和控制仅仅是示范性的。类似地,在图7示出的方法步骤没有必要总是按照那些图说明性的例子建议的顺序执行。例如,识别用户的方法步骤720可以在步骤725、730或者735之后执行。
某些功能单元、文件、数据结构等等可以在举例说明的实施例中作为位于计算机100的系统存储器120或者通常在服务器510、520、或者530中描述。但是,在其他的实施例中,它们可以位于或者分配在计算机系统或者其他的平台,其相互定位和/或彼此远离。例如,在图5示出的一个或多个数据文件或者数据结构511、513、514、516或者518相互定位,并且“局限于”服务器510,可以位于计算机系统中或者远离服务器510的系统。在这些情况下,相对于这些数据文件或者数据结构的数据库管理器512的操作可以经网络或者通过任何众多的其他的已知的用于传送数据和/或控制到或者来自远端位置的装置执行。
此外,那些相关领域的技术人员将明白,在功能单元和各种各样的数据结构之间和之中的控制和数据流可以在许多方法从如上所述的控制和数据流中改变。尤其是,中间功能单元(未示出)可以直接控制数据流,并且各种各样的单元的功能可以组合、分解或者重新排序去允许并行处理或者用于其他的原因。同样,中间数据结构或者文件可以使用,并且各种各样的描述的数据结构或者文件可以组合或者排列。因此很多其他实施例及其改进都落在由所附权利要求以及其等效规定定义的本发明的范围之内。
Claims (102)
1.一种系统,用于提供有关一个或多个基因或EST的数据,其中每个基因或EST至少具有由探针设置标识符标识的一个相应的探针设置,和能够检测生物分子,包括:
构成和安排输入管理器以便从用户接收第一组的一个或多个探针设置标识符的选择;
构成和安排基因判定器以识别第一组的一个或多个对应于由第一组探针设置标识符标识的探针设置组的基因或EST;
构成和安排相关器,用第一组的一个或多个数据与第一组的基因或EST相关;和
构成和安排一个输出管理器,以将第一组数据提供给用户。
2.权利要求1的系统,其中:
第一组探针设置标识符识别能够检测包括核蛋白酸的生物分子的探针设置组。
3.权利要求1的系统,其中:
第一组探针设置标识符识别能够检测包括相应基因的mRNA转录的生物分子的探针设置组。
4.权利要求1的系统,其中:
第一组探针设置标识符包括已经能够检测它们相应基因或EST的表达式或微分式的所有的或部分的第二组的一个或多个探针设置组的探针设置标识符。
5.权利要求4的系统,其中:
由第二组探针设置标识符标识的探针设置组被安置在一个或多个探针阵列上。
6.权利要求5的系统,其中:
由第二组探针设置标识符标识的探针设置组包括就地合成的低聚核苷酸。
7.权利要求6的系统,其中:
探针阵列包括一个GeneChip探针阵列。
8.权利要求5的系统,其中:
至少一个由第二组探针设置标识符标识的探针设置组由点状的探针阵列上的单一的点组成。
9.权利要求5的系统,其中:
探针阵列包括一个点状阵列。
10.权利要求9的系统,其中:
至少一个点状阵列的点包括低聚核苷酸。
11.权利要求1的系统,其中:
所述用户包括远程用户,和
输入管理器经过网络接收远程用户的选择。
12.权利要求11的系统,其中:
所述网络包括因特网。
13.权利要求1的系统,其中:
第一组探针设置标识符的至少第一探针设置标识符包括对应于第一探针设置标识符的基因的基因标识符。
14.权利要求13的系统,其中:
基因标识符包括一个接入编号。
15.权利要求1的系统,其中:
用户选择第一组探针设置标识符,这至少部分的基于基因或EST的表达式或微分式的等级的指示,该基因或EST对应于由第一组探针设置标识符标识的探针设置组。
16.权利要求1的系统,其中:
第一组的一个或多个数据包括有关可用性,价格,成份,适用性,或订单的产品数据的一个或任何组合。
17.权利要求16的系统,其中:
第一组的一个或多个数据包括关于生物设备或材料的产品数据,或者可以用于一个生物设备或材料的试剂。
18.权利要求17的系统,其中:
设备,材料,或试剂包括低聚核苷酸,探针阵列,克隆,抗体,或蛋白质的一个或任何组合。
19.权利要求1的系统,其中:
第一组的一个或多个数据至少部分的包括存储在本地产品数据库中的数据。
20.权利要求19的系统,其中:
第一组的一个或多个数据包括至少一个到表示生物产品的卖方的远程数据的链接。
21.权利要求20的系统,其中:
所述链接包括一个因特网URL。
22.权利要求20的系统,其中:
所述远程数据包括一个HTML或XML文件。
23.权利要求1的系统,其中:
所述用户包括一个远程用户,和
输出管理器经过网络将第一组产品数据提供给用户。
24.权利要求23的系统,其中:
所述网络包括因特网。
25.一种方法,用于提供有关一个或多个基因或EST的数据,其中每个基因或EST至少具有由探针设置标识符标识的相应的探针设置,和能够检测一种生物分子,其包括下列步骤:
从用户接收第一组的一个或多个探针设置标识符的选择;
识别对应于由第一组探针设置标识符标识的探针设置组的第一组的一个或多个基因或EST;
用第一组的一个或多个数据与第一组的基因或EST相关;和
将第一组数据提供给用户。
26.权利要求25的方法,其中
第一组探针设置标识符识别能够检测包括核蛋白酸的生物分子的探针设置组。
27.权利要求25的方法,其中:
第一组探针设置标识符识别能够检测包括相应基因的mRNA转录的生物分子的探针设置组。
28.一种计算机程序产品,用于提供有关一个或多个基因或EST的数据,其中每个基因或EST至少具有由探针设置标识符标识的一个对应的探针设置,并能够检测生物分子,其中当在一个计算机上执行计算机程序产品时,该程序实现一个方法,其包括下列步骤:
从用户接收第一组的一个或多个探针设置标识符的选择;
识别对应于由第一组探针设置标识符标识的探针设置组的第一组的一个或多个基因或EST;
用第一组的一个或多个数据与第一组的基因或EST相关;和
将第一组数据提供给用户。
29.权利要求28的计算机程序产品,其中
第一组探针设置标识符识别能够检测包括核蛋白酸的生物分子的探针设置组。
30.权利要求28的计算机程序产品,其中:
第一组探针设置标识符识别能够检测包括相应基因的mRNA转录的生物分子的探针设置组。
31.一种系统,用于提供有关一个或多个基因或EST的数据,其中每个基因或EST至少具有由探针设置标识符标识的一个相应的探针设置,和能够检测生物分子,包括:
构成和安排输入管理器以便经因特网从用户接收第一组的一个或多个探针设置标识符的选择,该探针设置标识符包括已经能够检测它们相应基因或EST的表达式或微分式的所有的或部分的第二组的一个或多个探针设置组的探针设置标识符;
构成和安排基因判定器以识别第一组的一个或多个对应于由第一组探针设置标识符标识的探针设置组的基因或EST;
构成和安排相关器,用第一组的一个或多个有关生物设备或材料的产品数据,或者可以用于生物设备或材料的一种试剂与第一组的基因或EST相关;和
构成和安排一个输出管理器,以将第一组产品数据提供到用户。
32.权利要求31的系统,其中:第一组探针设置标识符识别能够检测包括核蛋白酸的生物分子的探针设置组。
33.权利要求31的系统,其中:
第一组探针设置标识符识别能够检测包括相应基因的mRNA转录的生物分子的探针设置组。
34.权利要求31的系统,其中:
至少一个由第一组探针设置标识符标识的探针设置组被安置在GeneChip探针阵列上。
35.一种系统,用于提供有关一个或多个基因或EST的数据,其中每个基因或EST至少具有由探针设置标识符标识的一个相应的探针设置,和能够检测生物分子,包括:
构成和安排输入管理器以便从用户接收第一组的一个或多个探针设置标识符的选择;
构成和安排基因判定器以识别第一组的一个或多个对应于由第一组探针设置标识符标识的探针设置组的基因或EST;
构成和安排帐户识别判定器,以识别对应于用户的帐户;
构成和安排相关器,用第一组的一个或多个包括产品价格数据的产品数据与第一组的基因或EST相关;
构成和安排帐户数据处理器,至少部分的基于产品价格数据调整对应于用户的帐户;和
构成和安排输出管理器,以将第一组产品数据提供到用户。
36.权利要求35的系统,其中:
第一组探针设置标识符识别能够检测包括核蛋白酸的生物分子的探针设置组。
37.权利要求35的系统,其中:
第一组探针设置标识符识别能够检测包括相应基因的mRNA转录的生物分子的探针设置组。
38.权利要求35的系统,其中:
至少一个由第一组探针设置标识符标识的探针设置组被安置在GeneChip探针阵列上。
39.一种系统,用于处理用户的一个订单以购买一个或多个产品,包括:
构成和安排输入管理器以便经因特网从用户接收第一组的一个或多个探针设置标识符的第一用户选择,其中每个探针设置标识符标识能够检测生物分子的探针设置;
构成和安排基因判定器以识别第一组的一个或多个对应于由第一组探针设置标识符标识的探针设置组的基因或EST;
构成和安排帐户识别判定器,以识别对应于用户的帐户;
构成和安排基因-订单的相关器,用第一组的一个或多个包括产品价格数据的产品数据与第一组的基因或EST相关;和
构成和安排输出管理器,至少将部分的第一组产品数据提供到用户。
40.权利要求39的系统,其中:
第一组探针设置标识符识别能够检测包括核蛋白酸的生物分子的探针设置组。
41.权利要求39的系统,其中:
第一组探针设置标识符识别能够检测包括相应基因的mRNA转录的生物分子的探针设置组。
42.权利要求39的系统,其中:
进一步构成和安排输入管理器,基于第一组的产品数据,从用户接收一个或多个购买产品的第二用户选择。
43.权利要求42的系统,进一步包括:
构成和安排帐户数据处理器,至少部分的基于对应于第二用户选择的产品价格数据,调整对应于用户的帐户。
44.一种方法,用于处理用户有关一个或多个产品的查询或订单,包括下列步骤:
从用户接收第一组的一个或多个探针设置标识符的选择,其中每个探针设置标识符标识能够检测生物分子的探针设置;
识别对应于由第一组探针设置标识符标识的探针设置组的第一组的一个或多个基因或EST;
用包括产品价格数据的第一组的一个或多个产品数据与第一组的基因或EST进行相关;和
至少将部分的第一组产品数据提供到用户。
45.权利要求44的方法,其中:
第一组探针设置标识符识别能够检测包括核蛋白酸的生物分子的探针设置组。
46.权利要求44的方法,其中:
第一组探针设置标识符识别能够检测包括相应基因的mRNA转录的生物分子的探针设置组。
47.权利要求44的方法,进一步包括步骤:
基于提供到用户的部分的第一组产品数据,接收一个或多个购买产品的第二用户选择。
48.权利要求47的方法,进一步包括步骤:
识别对应于用户的一个帐户,和
至少部分的基于对应于第二用户选择的产品价格数据,调整对应于用户的帐户。
49.一种方法,用于放置计算机实现的有关一个或多个产品购买的查询或订单,包括下列步骤:
从一个用户计算机接收第一组的一个或多个探针设置标识符的第一用户选择,其中每个探针设置标识符标识能够检测生物分子的探针设置;
经因特网将第一用户选择提供到一个入口系统,该入口系统能够用对应于由第一组探针设置标识符标识的探针设置组的一个或多个基因或EST与产品数据进行相关;和
从入口系统接收相关的产品数据。
50.权利要求49的方法,其中:
第一组探针设置标识符识别能够检测包括核蛋白酸的生物分子的探针设置组。
51.权利要求49的方法,其中:
第一组探针设置标识符识别能够检测包括相应基因的mRNA转录的生物分子的探针设置组。
52.权利要求49的方法,进一步包括下列步骤:
能够具有用于购买的相关的产品数据的一个或多个的第二用户选择;和
将第二用户选择提供到入口系统。
53.一种系统,用于提供有关一个或多个基因或EST的数据,其中每个基因或EST至少具有由探针设置标识符标识的一个相应的探针设置,和能够检测一种生物分子,包括:
构成和安排数据库管理器,周期性的更新包括有关基因或EST数据的一个局部基因组数据库;
构成和安排输入管理器以便从用户接收第一组的一个或多个探针设置标识符的选择;
构成和安排用户-服务管理器,根据局部基因组数据库构成与对应于第一组探针设置标识符的基因或EST有关的第一组数据;和
构成和安排输出管理器,将第一组数据提供到用户。
54.权利要求53的系统,其中:
第一组探针设置标识符识别能够检测包括核蛋白酸的生物分子的探针设置组。
55.权利要求53的系统,其中:
第一组探针设置标识符识别能够检测包括相应基因的mRNA转录的生物分子的探针设置组。
56.权利要求53的系统,其中:
数据库管理器按照年代顺序周期更新局部基因组数据库。
57.权利要求56的系统,其中:
所述年代顺序周期是预定的。
58.权利要求56的系统,其中:
所述年代顺序周期大于大约10小时和小于大约10天。
59.权利要求53的系统,其中:
数据库管理用更新数据周期性的更新局部基因组数据库,该更新数据包括一个或多个以下数据的任何组合,序列数据,外来结构或定位数据,拼接变量数据,标记结构或定位数据,多形态数据,同族数据,蛋白质同族分类数据,路径数据,可替换的基因命名数据,文献列举数据,或注释数据。
60.权利要求53的系统,其中:
所述数据库管理器用来自一个或多个远程数据库的更新数据周期性的更新局部基因组数据库。
61.权利要求60的系统,其中:
从一个或多个远程数据库的更新包括经因特网进行更新。
62.权利要求61的系统,其中:
远程数据库由下列的一个或多个的任何组合所组成,GenBank,GenBank New,SwissProt,GenPept,DB EST,Unigene,PIR,Prosite,PFAM,PFAM,Prodom,Blocks,PDB,PDBfinder,EC Enzyme,KeggPathway,Kegg Ligand,OMIM,OMIM Map,OMIM ALLele,DB SNP,和PubMed。
63.权利要求53的系统,其中:
构成和安排输入管理器以动态的接收用户-启动的选择。
64.权利要求53的系统,其中:
所述第一组包括已经能够检测它们相应基因或EST的表达式或微分式的所有的或部分的第二组的一个或多个探针设置组的探针设置标识符。
65.权利要求64的系统,其中:
由第二组探针设置标识符标识的探针设置组被安置在一个或多个探针阵列上。
66.权利要求65的系统,其中:
探针阵列包括GeneChip探针阵列。
67.权利要求65的系统,其中:
所述探针设置组包括单一的点状探针;
探针设置标识符包括识别单一的点状探针的点状探针设置标识符;和
探针阵列包括含有单一点状探针的点状阵列。
68.权利要求67的系统,其中:
所述单一点状探针包括一种低聚核苷酸。
69.权利要求64的系统,其中:
所述用户包括一个远程用户,和
输入管理器经网络接收远程用户的选择。
70.权利要求69的系统,其中:
所述网络包括因特网。
71.权利要求53的系统,其中:
所述用户包括一个远程用户,和
输出管理器经一个网络将第一组数据提供到用户。
72.权利要求71的系统,其中:
所述网络包括因特网。
73.权利要求53的系统,其中:
至少一个探针设置标识符包括对应于探针设置标识符的基因的基因标识符。
74.权利要求73的系统,其中:
基因标识符包括一个接入编号。
75.一种系统,用于提供有关一个或多个基因或EST的数据,其中其中每个基因或EST至少具有由探针设置标识符标识的一个相应的探针设置,并能够检测基因的表达式,该系统包括:
构成和安排数据库管理器,周期性的更新包括有关基因或EST数据的局部基因组数据库,其中按照预定的周期做出更新;
构成和安排输入管理器以便动态的接收第一组的一个或多个探针设置标识符的用户-启动的选择;
构成和安排一个用户-服务管理器,根据局部基因组数据库构成与对应于第一组探针设置标识符的基因或EST有关的第一组数据;和
构成和安排输出管理器,以将第一组数据提供到用户。
76.一种系统,用于提供有关一个或多个预定的基因或EST的数据,其中每个设定的基因具有由一个探针设置标识符唯一标识的一个相应的预定的探针设置,并能够检测基因的表达式,该系统包括:
构成和安排数据库管理器,周期性的更新包括有关预定的基因或EST数据的一个局部基因组数据库,其中按照预定的周期做出更新;
构成和安排输入管理器以便动态的接收第一组的一个或多个预定探针设置标识符的用户-启动的选择;
构成和安排用户-服务管理器,根据局部基因组数据库构成与对应于第一组预定的探针设置标识符的基因或EST有关的第一组数据;和
构成和安排输出管理器,以将第一组数据提供到用户。
77.一种系统,用于提供有关一个或多个基因或EST的数据,其中每个基因或EST具有由探针设置标识符标识的一个相应的探针设置,并能够检测基因的表达式,该系统包括:
构成和安排数据库管理器,用来自一个或多个远程数据库的更新数据更新包括有关基因或EST数据的局部基因组数据库,其中按照预定的周期通过因特网做出更新;
构成和安排输入管理器以便动态的接收第一组的一个或多个探针设置标识符的用户-启动的选择;
构成和安排用户-服务管理器,根据局部基因组数据库构成与对应于第一组探针设置标识符的基因或EST有关的第一组数据;和
构成和安排输出管理器,以将第一组数据提供到用户。
78.一种系统,用于提供有关一个或多个基因或EST的数据,其中每个基因或EST具有由探针设置标识符标识的一个相应的探针设置,并能够检测基因的表达式,该系统包括:
构成和安排数据库管理器,用来自一个或多个远程数据库的更新数据更新包括有关基因或EST数据的局部基因组数据库,其中所述更新是按照预定的周期经因特网进行的;
构成和安排输入管理器以便经因特网动态的接收第一组的一个或多个探针设置标识符的用户-启动的选择;
构成和安排用户-服务管理器,根据局部基因组数据库构成与对应于第一组探针设置标识符的基因或EST有关的第一组数据;和
构成和安排输出管理器,经因特网将第一组数据提供到用户。
79.一种方法,用于提供有关一个或多个基因或EST的数据,其中每个基因或EST至少具有由探针设置标识符标识的一个相应的探针设置,并能够检测它相应基因的表达式,包括下列步骤:
周期的更新包括有关基因或EST数据的局部基因组数据库;
从用户接收第一组的一个或多个探针设置标识符的选择;
根据局部基因组数据库构成与对应于第一组探针设置标识符的基因或EST有关的第一组数据;和
将第一组数据提供到用户。
80.权利要求79的方法,其中:
经因特网从一个或多个远程数据库用更新数据周期性的更新局部基因组数据库,该更新数据包括一个或多个以下数据的任何组合,序列数据,外来结构或定位数据,拼接变量数据,标记结构或定位数据,多形态数据,同族数据,蛋白质同族分类数据,路径数据,可替换的基因命名数据,文献列举数据,或注释数据。
81.一种计算机程序产品,用于提供有关一个或多个基因或EST的数据,其中每个基因或EST至少具有由一个探针设置标识符标识的一个相应的探针设置,并能够检测它相应基因的表达式,其中当在一个计算机系统上执行计算机程序产品时,实现的方法包括下列步骤:
周期性地更新包括有关基因或EST数据的局部基因组数据库;
从用户接收第一组的一个或多个探针设置标识符的选择;
根据局部基因组数据库构成与对应于第一组探针设置标识符的基因或EST有关的第一组数据;和
将第一组数据提供到用户。
82.一种系统,用于提供有关一个或多个基因或EST的数据,其中每个基因或EST至少具有由一个探针设置标识符标识的一个相应的探针设置,并能够检测一种生物分子,包括:
构成和安排输入管理器以便从用户接收第一组的一个或多个探针设置标识符的选择;
构成和安排相关器,用第一组的一个或多个产品数据与第一组的探针设置标识符相关;和
构成和安排输出管理器,以将第一组数据提供到用户。
83.权利要求82的系统,其中
第一组探针设置标识符识别能够检测包括核蛋白酸的生物分子的探针设置组。
84.权利要求82的系统,其中:
第一组探针设置标识符识别能够检测包括相应基因的mRNA转录的生物分子的探针设置组。
85.权利要求84的系统,其中:
由第二组探针设置标识符标识的探针设置组被安置在一个或多个探针阵列上。
86.权利要求85的系统,其中:
所述用户包括一个远程用户,和
所述输入管理器经因特网接收远程用户的选择。
87.权利要求82的系统,其中:
第一组探针设置标识符的至少第一探针设置标识符包括对应于第一探针设置标识符的基因的一个基因标识符。
88.权利要求87的系统,其中:
所述基因标识符包括一个接入编号。
89.权利要求82的系统,其中:
第一组的一个或多个产品数据包括有关可用性,价格,成份,适用性,或订单的产品数据的一个或任何组合。
90.权利要求89的系统,其中:
第一组的一个或多个产品数据包括关于生物设备或材料,或者可以用于生物设备或材料的一种试剂的产品数据。
91.权利要求90的系统,其中:
设备,材料,或试剂包括低聚核苷酸,探针阵列,克隆,抗体,或蛋白质的一个或任何组合。
92.权利要求82的系统,其中:
第一组的一个或多个产品数据至少部分地包括存储在一个局部产品数据库中的数据。
93.权利要求82的系统,其中:
第一组的一个或多个数据至少包括一个到表示生物产品的一个卖方的远程数据的链接。
94.一种方法,用于提供有关一个或多个基因或EST的数据,其中每个基因或EST至少具有由一个探针设置标识符标识的一个相应的探针设置,并能够检测一种生物分子,包括下列步骤:
从用户接收第一组的一个或多个探针设置标识符的选择;
用第一组的一个或多个产品数据与第一组的探针设置标识符相关;和
将第一组数据提供到用户。
95.权利要求94的方法,其中
第一组探针设置标识符识别能够检测包括核蛋白酸的生物分子的探针设置组。
96.权利要求94的方法,其中:
第一组探针设置标识符识别能够检测包括相应基因的mRNA转录的生物分子的探针设置组。
97.权利要求94的系统,其中:
由第一组探针设置标识符标识的探针设置组被安置在一个或多个探针阵列上。
98.一种计算机程序产品,用于提供有关一个或多个基因或EST的数据,其中每个基因或EST至少具有由一个探针设置标识符标识的一个相应的探针设置,并能够检测一种生物分子,其中当在一个计算机上执行计算机程序产品时,实现的方法包括下列步骤:
从用户接收第一组的一个或多个探针设置标识符的选择;
用第一组的一个或多个产品数据与第一组的探针设置标识符相关;和
将第一组数据提供到用户。
99.一种系统,用于提供有关一个或多个基因或EST的产品数据,包括:
构成和安排输入管理器以便通过因特网接收一个或多个基因或EST标识符;
构成和安排相关器,用一个或多个产品数据与基因或EST标识符相关;和
构成和安排输出管理器,以将产品数据提供到用户。
100.权利要求99的系统,其中:所述产品数据是生物产品数据。
101.权利要求99的系统,其中:
所述基因或EST标识符包括基因或EST接入编号。
102.一种方法,用于提供有关一个或多个基因或EST的产品数据,包括:
经因特网接收一个或多个基因或EST标识符;
用一个或多个产品数据与基因或EST标识符相关;和
将产品数据提供给用户。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US17807700P | 2000-01-25 | 2000-01-25 | |
US60/178,077 | 2000-01-25 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN1426534A true CN1426534A (zh) | 2003-06-25 |
CN100350406C CN100350406C (zh) | 2007-11-21 |
Family
ID=22651083
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNB018041396A Expired - Fee Related CN100350406C (zh) | 2000-01-25 | 2001-01-24 | 用于提供基因网入口的方法和系统 |
Country Status (6)
Country | Link |
---|---|
EP (1) | EP1252513A4 (zh) |
JP (1) | JP2003521057A (zh) |
CN (1) | CN100350406C (zh) |
AU (1) | AU2001237965A1 (zh) |
CA (1) | CA2398382A1 (zh) |
WO (1) | WO2001056216A2 (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1932040B (zh) * | 2006-09-21 | 2010-06-09 | 武汉大学 | 全基因组目标基因家族成员的自动化快速检测系统 |
CN105051742A (zh) * | 2013-01-25 | 2015-11-11 | Illumina公司 | 利用云计算环境来共享生物相关数据的方法和系统 |
CN115240769A (zh) * | 2022-07-25 | 2022-10-25 | 纳昂达(南京)生物科技有限公司 | 一种基于互联网的探针设计交互系统 |
Families Citing this family (40)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
ES2288760T3 (es) | 1996-04-25 | 2008-01-16 | Bioarray Solutions Ltd. | Ensamblaje electrocinetico controlado por luz de particulas proximas a superficies. |
US9709559B2 (en) | 2000-06-21 | 2017-07-18 | Bioarray Solutions, Ltd. | Multianalyte molecular analysis using application-specific random particle arrays |
US7262063B2 (en) | 2001-06-21 | 2007-08-28 | Bio Array Solutions, Ltd. | Directed assembly of functional heterostructures |
JP2003099624A (ja) * | 2001-09-25 | 2003-04-04 | Toyo Kohan Co Ltd | Dna提供システム |
ES2661167T3 (es) | 2001-10-15 | 2018-03-27 | Bioarray Solutions Ltd. | Análisis multiplexado de loci polimórficos mediante consulta simultánea y detección mediada por enzimas |
JP2005516300A (ja) | 2002-01-25 | 2005-06-02 | アプレラ コーポレイション | 製品およびサービスに対する注文を発注し、受理し、および充足する方法 |
US7526114B2 (en) | 2002-11-15 | 2009-04-28 | Bioarray Solutions Ltd. | Analysis, secure access to, and transmission of array images |
JP3677275B2 (ja) * | 2003-06-12 | 2005-07-27 | 株式会社日立製作所 | 塩基配列関連情報を用いた情報処理システム |
US7595279B2 (en) | 2003-09-22 | 2009-09-29 | Bioarray Solutions Ltd. | Surface immobilized polyelectrolyte with multiple functional groups capable of covalently bonding to biomolecules |
JP4579525B2 (ja) * | 2003-10-27 | 2010-11-10 | 日立ソフトウエアエンジニアリング株式会社 | 遺伝子発現データ管理表示方法 |
CA2544041C (en) | 2003-10-28 | 2015-12-08 | Bioarray Solutions Ltd. | Optimization of gene expression analysis using immobilized capture probes |
US7848889B2 (en) | 2004-08-02 | 2010-12-07 | Bioarray Solutions, Ltd. | Automated analysis of multiplexed probe-target interaction patterns: pattern matching and allele identification |
JP2007148752A (ja) * | 2005-11-28 | 2007-06-14 | Canon Inc | 標的物質の自動解析装置および判定ソフトウェア更新方法 |
US9445025B2 (en) | 2006-01-27 | 2016-09-13 | Affymetrix, Inc. | System, method, and product for imaging probe arrays with small feature sizes |
US8009889B2 (en) | 2006-06-27 | 2011-08-30 | Affymetrix, Inc. | Feature intensity reconstruction of biological probe array |
KR101289403B1 (ko) | 2011-04-27 | 2013-07-29 | 한국생명공학연구원 | 십자화과 식물 유전자의 진화 및 기능 연구를 위한 발현 유전체 비교분석 시스템 구축 방법 |
EP2751729B1 (en) * | 2011-09-01 | 2020-10-21 | Genome Compiler Corporation | System for polynucleotide construct design, visualization and transactions to manufacture the same |
CN105637097A (zh) | 2013-08-05 | 2016-06-01 | 特韦斯特生物科学公司 | 从头合成的基因文库 |
WO2016126882A1 (en) | 2015-02-04 | 2016-08-11 | Twist Bioscience Corporation | Methods and devices for de novo oligonucleic acid assembly |
WO2016172377A1 (en) | 2015-04-21 | 2016-10-27 | Twist Bioscience Corporation | Devices and methods for oligonucleic acid library synthesis |
WO2017029249A1 (en) | 2015-08-17 | 2017-02-23 | Koninklijke Philips N.V. | Multi-level architecture of pattern recognition in biological data |
KR20180057634A (ko) | 2015-09-03 | 2018-05-30 | 벡톤 디킨슨 앤드 컴퍼니 | 라벨링된 생체분자를 제공하기 위한 방법 및 시스템 |
US10844373B2 (en) | 2015-09-18 | 2020-11-24 | Twist Bioscience Corporation | Oligonucleic acid variant libraries and synthesis thereof |
CN108698012A (zh) | 2015-09-22 | 2018-10-23 | 特韦斯特生物科学公司 | 用于核酸合成的柔性基底 |
CN115920796A (zh) | 2015-12-01 | 2023-04-07 | 特韦斯特生物科学公司 | 功能化表面及其制备 |
EP3500672A4 (en) | 2016-08-22 | 2020-05-20 | Twist Bioscience Corporation | NOVO SYNTHESIZED NUCLEIC ACID BANKS |
KR102217487B1 (ko) | 2016-09-21 | 2021-02-23 | 트위스트 바이오사이언스 코포레이션 | 핵산 기반 데이터 저장 |
KR102514213B1 (ko) | 2016-12-16 | 2023-03-27 | 트위스트 바이오사이언스 코포레이션 | 면역 시냅스의 변이체 라이브러리 및 그의 합성 |
WO2018151952A1 (en) * | 2017-02-16 | 2018-08-23 | Becton, Dickinson And Company | Methods and systems for providing epitope tagged biomolecules |
SG11201907713WA (en) | 2017-02-22 | 2019-09-27 | Twist Bioscience Corp | Nucleic acid based data storage |
WO2018170169A1 (en) | 2017-03-15 | 2018-09-20 | Twist Bioscience Corporation | Variant libraries of the immunological synapse and synthesis thereof |
SG11201912057RA (en) | 2017-06-12 | 2020-01-30 | Twist Bioscience Corp | Methods for seamless nucleic acid assembly |
WO2018231864A1 (en) | 2017-06-12 | 2018-12-20 | Twist Bioscience Corporation | Methods for seamless nucleic acid assembly |
WO2019051501A1 (en) | 2017-09-11 | 2019-03-14 | Twist Bioscience Corporation | PROTEINS BINDING TO GPCR AND METHODS OF SYNTHESIS |
JP7066840B2 (ja) | 2017-10-20 | 2022-05-13 | ツイスト バイオサイエンス コーポレーション | ポリヌクレオチド合成のための加熱されたナノウェル |
EP3735459A4 (en) | 2018-01-04 | 2021-10-06 | Twist Bioscience Corporation | DNA-BASED DIGITAL INFORMATION STORAGE |
KR20210013128A (ko) | 2018-05-18 | 2021-02-03 | 트위스트 바이오사이언스 코포레이션 | 핵산 하이브리드화를 위한 폴리뉴클레오타이드, 시약 및 방법 |
CA3131691A1 (en) | 2019-02-26 | 2020-09-03 | Twist Bioscience Corporation | Variant nucleic acid libraries for antibody optimization |
CN113766930A (zh) | 2019-02-26 | 2021-12-07 | 特韦斯特生物科学公司 | Glp1受体的变异核酸文库 |
US11332738B2 (en) | 2019-06-21 | 2022-05-17 | Twist Bioscience Corporation | Barcode-based nucleic acid sequence assembly |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5630125A (en) * | 1994-05-23 | 1997-05-13 | Zellweger; Paul | Method and apparatus for information management using an open hierarchical data structure |
US6308170B1 (en) * | 1997-07-25 | 2001-10-23 | Affymetrix Inc. | Gene expression and evaluation system |
AU4696399A (en) * | 1998-06-22 | 2000-01-10 | Regents Of The University Of California, The | Composition and methods for evaluating an organism's response to alcohol |
EP1043667A2 (de) * | 1999-03-18 | 2000-10-11 | Saischek, Jörn | Online Service zur effizienten Kontaktaufnahme zwischen Käufern und Anbietern chemischer Produkte |
-
2001
- 2001-01-24 CN CNB018041396A patent/CN100350406C/zh not_active Expired - Fee Related
- 2001-01-24 WO PCT/US2001/002316 patent/WO2001056216A2/en active Application Filing
- 2001-01-24 CA CA002398382A patent/CA2398382A1/en not_active Abandoned
- 2001-01-24 EP EP01910348A patent/EP1252513A4/en not_active Withdrawn
- 2001-01-24 AU AU2001237965A patent/AU2001237965A1/en not_active Abandoned
- 2001-01-24 JP JP2001555252A patent/JP2003521057A/ja not_active Withdrawn
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1932040B (zh) * | 2006-09-21 | 2010-06-09 | 武汉大学 | 全基因组目标基因家族成员的自动化快速检测系统 |
CN105051742A (zh) * | 2013-01-25 | 2015-11-11 | Illumina公司 | 利用云计算环境来共享生物相关数据的方法和系统 |
US10217156B2 (en) | 2013-01-25 | 2019-02-26 | Illumina, Inc. | Methods and systems for using a cloud computing environment to share biological related data |
CN115240769A (zh) * | 2022-07-25 | 2022-10-25 | 纳昂达(南京)生物科技有限公司 | 一种基于互联网的探针设计交互系统 |
CN115240769B (zh) * | 2022-07-25 | 2023-12-29 | 纳昂达(南京)生物科技有限公司 | 一种基于互联网的探针设计交互系统 |
Also Published As
Publication number | Publication date |
---|---|
EP1252513A4 (en) | 2007-07-18 |
WO2001056216A2 (en) | 2001-08-02 |
AU2001237965A1 (en) | 2001-08-07 |
WO2001056216A9 (en) | 2002-10-17 |
WO2001056216A3 (en) | 2002-03-07 |
JP2003521057A (ja) | 2003-07-08 |
CA2398382A1 (en) | 2001-08-02 |
CN100350406C (zh) | 2007-11-21 |
EP1252513A2 (en) | 2002-10-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN100350406C (zh) | 用于提供基因网入口的方法和系统 | |
US20020183936A1 (en) | Method, system, and computer software for providing a genomic web portal | |
US20050009078A1 (en) | Method, system, and computer software for providing a genomic web portal | |
US20040126840A1 (en) | Method, system and computer software for providing genomic ontological data | |
US20040002818A1 (en) | Method, system and computer software for providing microarray probe data | |
US20030100995A1 (en) | Method, system and computer software for variant information via a web portal | |
US20040049354A1 (en) | Method, system and computer software providing a genomic web portal for functional analysis of alternative splice variants | |
US20030120432A1 (en) | Method, system and computer software for online ordering of custom probe arrays | |
US8340950B2 (en) | Direct to consumer genotype-based products and services | |
US9286438B2 (en) | Systems and methods for producing chemical array layouts | |
US7451047B2 (en) | System and method for programatic access to biological probe array data | |
US20020150966A1 (en) | Specimen-linked database | |
US20040142371A1 (en) | Process for requesting biological experiments and for the delivery of experimental information | |
WO2006060187A2 (en) | Systems and methods for probe design | |
WO2006060200A1 (en) | Systems and methods for producing chemical array layouts | |
US6816867B2 (en) | System, method, and user interfaces for mining of genomic data | |
US20020147512A1 (en) | System and method for management of microarray and laboratory information | |
US20070148658A1 (en) | Systems and methods for biopolymeric probe design using graphical representation of a biopolymeric sequence | |
US20090299650A1 (en) | Systems and methods for filtering target probe sets | |
Cordonnier‐Pratt et al. | MAGIC Database and interfaces: an integrated package for gene discovery and expression | |
US20070021919A1 (en) | Silico design of chemical arrays | |
WO2002091110A2 (en) | Method, system and computer software for providing a genomic web portal | |
US20080005142A1 (en) | Systems and methods for array content information exchange | |
US20090089329A1 (en) | Systems and methods for the dynamic generation of repeat libraries for uncharacterized species | |
JP2002267668A (ja) | Dnaアレイの情報利用方法、情報提供方法、作製方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20071121 Termination date: 20150124 |
|
EXPY | Termination of patent right or utility model |