CN1145098A - 基因转录物比较分析 - Google Patents

基因转录物比较分析 Download PDF

Info

Publication number
CN1145098A
CN1145098A CN95192325A CN95192325A CN1145098A CN 1145098 A CN1145098 A CN 1145098A CN 95192325 A CN95192325 A CN 95192325A CN 95192325 A CN95192325 A CN 95192325A CN 1145098 A CN1145098 A CN 1145098A
Authority
CN
China
Prior art keywords
sequence
transcript
library
mrna
gene
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN95192325A
Other languages
English (en)
Inventor
J·J·塞尔哈默
R·W·施科特
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Incyte Corp
Original Assignee
Incyte Pharmaceuticals Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from US08/187,530 external-priority patent/US5840484A/en
Application filed by Incyte Pharmaceuticals Inc filed Critical Incyte Pharmaceuticals Inc
Publication of CN1145098A publication Critical patent/CN1145098A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6809Methods for determination or identification of nucleic acids involving differential detection
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • G16B30/10Sequence alignment; Homology search
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • G16B30/20Sequence assembly
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B35/00ICT specially adapted for in silico combinatorial libraries of nucleic acids, proteins or peptides
    • G16B35/10Design of libraries
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B35/00ICT specially adapted for in silico combinatorial libraries of nucleic acids, proteins or peptides
    • G16B35/20Screening of libraries
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B35/00ICT specially adapted for in silico combinatorial libraries of nucleic acids, proteins or peptides
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B50/00ICT programming tools or database systems specially adapted for bioinformatics
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/60In silico combinatorial chemistry

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Biophysics (AREA)
  • Biotechnology (AREA)
  • Organic Chemistry (AREA)
  • Analytical Chemistry (AREA)
  • Molecular Biology (AREA)
  • Medical Informatics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Library & Information Science (AREA)
  • Biochemistry (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Genetics & Genomics (AREA)
  • Immunology (AREA)
  • Microbiology (AREA)
  • General Engineering & Computer Science (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

在生物样品中量化基因转录物相对丰度的方法和系统。该方法的一个实施方案产生多RNA或其对应的cDNA的高产出序列特异性分析(基因转录物图象分析)。方法的另一实施方案通过使用高产出cDNA序列分析完成基因转录物图象分析。另外,基因转录物图象可以用于在一给定的细胞或细胞群中检测或诊断特殊的生物学状态,疾病或与基因转录物相对丰度有关的状况。本发明提供了在两个或更多生物样品中比较基因转录物图象分析的方法,用来区分两个样品并且确定在两个样品中表达情况不同的一个或多个基因。

Description

基因转录物比较分析
1.发明领域
本发明属于分子生物学和计算机科学领域;更确切地说,本发明描述了分析基因转录物的方法和分析细胞与组织的遗传表达的方法。
2.发明背景
直到最近,分子生物学的历史还由“一次一个基因”方式写成。科学家们观察了细胞的物理变化,从细胞或其环境中分离出混合物,提纯了蛋白,将蛋白测序并由此制备了探针以寻找其相应的基因。
最近,不同的国家已经设立了大量的项目来对人类基因组的几十亿个碱基测序,这些项目的典型步骤是:先将基因组分为染色体的大片段,然后确定这些片段的序列,再分析这些序列与已知蛋白或是蛋白的被称为基元(motif)部分的一致性。不幸的是,大多数基因组DNA并不编码蛋白,虽然其被假定为对细胞合成蛋白的能力有作用,其与医学上应用的关系目前并未为人们所知。
第三种方法包括只对编码积极参与合成蛋白的细胞机制的转录物(即mRNA)进行测序,。其优点在于细胞已经编辑剪除了所有不编码的DNA,使确认RNA中编码蛋白的部分相对容易些。对研究基因的工作者来说,这种途径的用途并不很一目了然。事实上,最初提出cDNA测序时,这种方法曾受到负责基因测序者的严厉指责。例如,美国人类基因组项目主席将cDNA测序贬为无价值的,并且拒绝为其提供资金。
在本公开内容中,我们给出分析DNA的方法,包括分析cDNA文库的方法。基于我们的分析和研究,我们把每一种单独基因产物视作信息的“象素”,其与(并只与)基因的表达相关。在此我们给出一种方法,此方法能将基因表达信息的单独“象素”组合成单一基因转录物的“图象”,在图象中,每个单独的基因同时可见,并且使基因象素间的关系容易看到和理解。
我们进一步给出一种新的我们称为电子减法(electronic subtraction)的新方法。电子减法能使研究基因的科研人员将单一的图象转变为活动的画面,画面描述细胞或完整组织水平上基因表达的瞬态或动力学过程。正是这种对细胞或器官水平上的细胞机制“运作”的认识形成了本新发明。本发明为活细胞的生理学进程提供了新的视角,并且为揭示和发现医学上新的治疗和诊断途径提供了希望。
我们给出了第二种我们称之为“电子Northern”的方法,该方法能够跨越多种细胞和组织追踪某单一基因的表达。
核酸(DNA和RNA),其序列携带遗传信息并由此而成为生命的基本分子。在所有活体生物,包括细菌、真菌、病毒、植物和动物中都发现有核酸。不同细胞、组织和生物体在一段时间内,在不同条件、不同处理和培养下测定其不同核酸的相对丰度是很有意义的。
人体的所有可分裂细胞,都有同一套23对染色体。据估计,这些常染色体和性染色体编码约100,000个基因。据信不同类型细胞间的差别反映了这100,000个左右基因的不同表达。了解在不同细胞中的哪些基因被转录,且知道转录物的相对丰度,就能回答生物学的基本问题了。
以前,通过标准的分子生物学技术如PCR,Northen印迹分析或其它类型DNA探针分析如原位杂交,本领域只能一次分析少数已知的基因。每一种上述的方法一次可分析的仅是已知基因和/或少数基因的转录物。参考文献:Nucl.Acids Res.19,7097-7104(1991);Nucl.Acids Res.18,4833-42(1990);Nucl.Acids Res.18,2789-92(1989);European J.Neuroscience2,1063-1073(1990);Analytical Biochem.187,364-73(1990);Genet.AnnalsTechn.Appl.7,64-70(1990);GATA 8(4),129-33(1991);Proc.Natl.Acad.Sci.USA 85,1696-1700(1988);Nucl.Acids Res.19,1954(1991);Proc.Natl.Acad.Sci.USA 88,1943-47(1991);Nucl.Acids Res.19,6123-27(1991);Proc.Natl.Acad.Sci.USA85,5738-42(1 988);Nucl.Acids Res.16,10937(1988).
研究基因的类型及数量,已用许多方法进行了好多年。所述基因的转录物是在如激活、分化、衰老、病毒转化、形态发生和有丝分裂这样的细胞进程中诱导或是调节的。最早的一种方法是在一个细胞、组织、器官系统,或甚至是生物体中在所感兴趣的过程之前或之后分离蛋白并分析蛋白的水平。其中一种分析某样品中的多种蛋白的方法是用双向凝胶电泳,原则上其中的蛋白形成各自的带而被确定和定量,并且最终简化为不连续的信号。目前双向分析仅能解析约15%的蛋白。为了更确定地分析那些被解析的带,每条带必须从膜上切下,并用Edmen降解来对其进行蛋白质测序分析。不幸的是,大多数的带在量上太小以至不能得到可靠的序列,并且其中许多带包括不止一种蛋白。第二困难在于许多蛋白的氨基末端被封闭,使测序过程更加复杂。
由于重组DNA技术能放大包含极少材料的信号,分析基因转录水平上的分化克服了上述不利之处及缺陷。一种最常用的方法,我们称之为“杂交减法”,包括在所感兴趣的发育过程之前(B)和之后(A)从生物样品中分离出mRNA,将一套mRNA转录为cDNA,通过杂交从样品A中减去样品B(cDNA减去mRNA),并且利用未杂交的mRNA部分构建一个cDNA文库。许多不同的课题组成功地运用这种策略,有许多流程已经发表,并且在相同的基本方案上加以了改进。参考文献:Nucl.Acids Res.19,7097-7104(1991);Nucl.Acids Res.18,4833-42(1990);Nucl.Acids Res.18,2789-92(1989);European J.Neuroscience 2,1063-1073(1990);AnalyticalBiochem.187,364-73(1990);Genet.Annals Techn.Appl.7,64-70(1990);GATA 8(4),129-33(1991);Proc.Natl.Acad.Sci.USA 85,1696-1700(1988);Nucl.Acids Res.19,1954(1991);Proc.Natl.Acid.Sci.USA88,1943-47(1991);Nucl.Acids Res.19,6123-27(1991);Proc.Natl.Acad.Sci.USA 85,5738-42(1988);Nucl.Acids Res.16,10937(1988).
虽然这些技术中的每一种都有其特定的优缺点,这些方法仍有其局限性与不足之处:首先,构建这样的基因文库所需的时间和精力是很大的。典型地,一个训练有素的分子生物学者,根据其水平、经验及运气,构建及表征一个这样的基因文库需三到六个月。其次,所得到的减法基因文库通常不如标准方法建立的基因文库,一个典型的传统cDNA文库至少需要106个克隆的克隆群,并且一般的插入片段大小为1-3kB。相比之下,减法基因库的克隆群含102或103个克隆且一般的插入片段大小为0.2kB。因此,与这些基因文库相关的克隆和序列信息可能有显著的丢失。第三,这种途径允许研究人员捕捉的仅是相对于样品B来说样品A中诱导的基因,反之则不行,且与第三种感兴趣的样品(C)作比较也并非易事。第四,这种途径要求很大量(几百微克)的“驱动者”mRNA(样品B),由于许多组织和细胞很难大量得到,这样就显著地限制了能用的减法的数量及类型。
第五,减法的解析依赖于DNA:DNA或RNA:DNA杂交体的物理性质。一个给定序列寻找杂交配对物的能力取决于其特定的CoT值。CoT值是某特定序列拷贝数(浓度)与杂交时间的积的函数。其结果是对于丰富序列来说,杂交事件很快发生(低CoT值),而稀有序列将在很高的CoT值形成双螺旋。使稀有序列形成双螺旋从而可被有效地选出的CoT值在便利的时间范围内是很难达到的。因此,杂交减法并不是一种研究稀有mRNA种类相对水平的有用技术。第六,对于某一给定序列来说,双螺旋的形成也与核苷酸碱基组成有关,这种事实使问题更加复杂化。那些富含G+C的序列比A+T含量高的序列形成更强的双螺旋。因此,通过杂交减法前者序列将倾向于被选择性地除去。第七。不很精确的配对在杂交过程中也是可能发生的。当这种情况发生时,其同源基因的表达可能“掩盖”了感兴趣的基因的表达,人为地歪曲了从该特定基因得到的结果。
Matsubara和Okubo建议用部分cDNA序列来建立基因的表达描述,这可用于人的基因组功能分析。Matsubara和Okubo告诫人们不要用随机引发,因为这种方法从单独的mRNA中产生多种单一的DNA片段,从而歪曲了每个基因库中特定mRNA的数量的分析。他们从3’端引导cDNA基因文库中随机选择克隆测序,并且建立了不同的EST的出现频率。他们建议,比较不同类型的细胞中EST的清单以将基因分类。即使基因的完整序列未知或基因产物的生物活性未知,在许多不同类型的细胞中表达的基因也被称为管家基因,那些在某些细胞中选择性表达的基因称为细胞特异性基因,。
通过对每个RNA和/或它们相应的cDNA进行高产出序列特异分析,本发明提供了对于某一给定生物样品中多种基因转录物相对丰度的定量方法,避免了以前技术中的缺陷。
本发明和现有的发现的蛋白的方法相比有好几种优点,现有的发现蛋白的方法是通过在生物学效应的基础上力图分离单个蛋白。本发明的方法提供了细胞描述的详细特征比较,揭示了每种转录物的表达上的各种变化。
本发明与现有的减法方法相比有许多优点,包括一个更复杂的基因库分析(与103个克隆相比有106~107个克隆),该分析能确定低丰度的信息和确定丰度上升和下降的信息。与以前构建基因库的方法相比,这种大基因库的构建是很常规的。另外,用本发明的方法很容易分辨出同源物。
本方法是很方便的,因为它将大量的数据组成一个能理解的易领会的形式。最显著的差异被电子减法强化。做深入的分析更方便了。
本发明比以前的cDNA电子分析方法有若干优点。当分析大于100,优选地大于1000个基因转录物时,本方法特别有效力。在这种情况下发现了新的低频转录物且测定了组织类型。
基因表达的高解析度分析能被直接用来作为特征描述或用来确定疾病特异性的基因,作为对比较经典的诊断途径的发展。
这种过程被称为基因转录物频率分析。基因转录物的定量分析结果被称为基因转录物的比较分析。
3.发明概述
本发明是一种分析含基因转录物样品的方法,包括下列步骤:(a)构建一个生物序列的文库;(b)产生一套转录物序列,该套序列中每一个转录物序列表示了文库中的一个不同的生物序列;(c)在一个已编程的计算机(其中贮存了表示参考序列的参考转录物序列数据库)中处理转录物序列,用以对每一个转录物序列产生一个确定的序列值,上述的每个确定序列值表示序列的标注,且表示文库中某一生物序列与至少一个参考序列间的配对程度,和(d)处理每一个上述的确定序列值以产生最终的数据值,该数据值表示了每一确定的序列值在文库中的出现次数。
本发明还包括比较两种含基因转录物样品的方法。第一种样品用上述方法处理。第二种样品用来产生第二种生物序列文库,以产生第二套转录物序列,在第二套序列中每一个转录物序列表示了第二个文库中某一生物序列。然后,第二套转录物序列在一个已编程的计算机中处理以产生第二套确定的序列值,称为“进一步确定的序列值”,每一个值表示一个序列的标注,和第二个文库中某一生物序列与至少一种参考序列间的匹配程度。处理进一步确定的序列值以产生进一步的最终数据值,该值表示每一个进一步确定的序列值在第二个文库中出现的次数。处理第一种样品中的最终数据值和第二种样品中的进一步确定的序列值以产生转录物序列的比率,此比率表示了两种样品间的基因转录物数量上的差别。
在进一步的实施方案中,所用方法包含了对某一生物样品中mRNA相对丰度进行量化,方法如下:(a)从生物样品中分离出总mRNA转录物;(b)通过序列特异性方法确定转录该mRNA的基因;(c)确定每个基因对应的mRNA转录物的数量;和(d)用mRNA转录物的数量来决定该mRNA转录物在总mRNA转录物中的相对丰度。
在此还公开了一种进行基因转录物图象分析的方法,该方法先获得mRNA的混合物,从中得到cDNA拷贝,将cDNA插入到一个合适载体中,将载体转染到一个合适的宿主菌株细胞中,然后涂平板,使其长成菌落,每一个克隆代表一个特定的mRNA。分离出一批有代表性的转染了cDNA的克隆。该克隆群中每个克隆用能确定特定mRNA的转录模板基因的序列特异性方法确定。每个基因被确定到单个克隆的次数被用来评估基因转录物的丰度。按丰度的顺序列出基因及其丰度以产生基因转录物的“图象”。
在更进一步的实施方案中,将一种类型细胞或组织中的基因转录物的相对丰度与第二种类型细胞或组织中的基因转录物的相对丰度相比,以便确定异同处。
在更进一步的实施方案中,所用方法包括一个用来分析生物序列文库的系统,该系统包括用来得到一套转录物序列的方法,其中每一种转录物序列代表文库中某一不同的生物序列;以及一种用来在一个计算机系统中处理转录物序列的方法,该计算机中已贮存一个表示参考序列的参考转录物序列数据库。该计算机用软件编程以对每一转录物序列产生一个确定的序列值,其中每一种所述的确定的序列值代表序列的一个标注和文库中的不同的生物序列与至少一种参考序列的匹配程度,处理每一上述的确定的序列值以产生最终数据值,该值代表每一确定的序列值在文库中的出现次数。
实际上,本发明是用来对在一生物样品中的基因转录物的相对丰度定量的方法和系统。本发明提供一种在两个或多个不同生物样品中比较基因转录物图象的方法,以便将两样品加以区别,并确定一个或多个在两个样品中不同地表达的基因。因此该基因转录物图象及其比较可用于诊断。该方法的一种实施方案对复合RNA或其相应的cDNA进行了高产出的序列特异性分析:基因转录物图象。该方法的第二种实施方案通过用高产出cDNA序列分析得到基因转录物的图象分析。另外,两个或多个基因转录物图象可以进行比较并用来检测或诊断某一特定生物状态、疾病、或与在给定细胞或细胞群中基因转录物相对丰度有关的条件。
4.表和附图的描述
4.1表
表1给出了表2-表5中使用的符号的详细解释。
表2列出了一百个最普通的基因转录物。它是HUVEC cDNA文库的分离物的部分清单,该cDNA文库的构建和测序见后面的描述。左手栏中涉及的是表中序列的丰度顺序。标有“数字”的下一栏是克隆号,该克隆号是第一个HUVEC序列与在“条目”栏号中序列相匹配的确定参考的克隆号。没有测序的分离物未列在表2中,标有“N”的再下一栏表示与在“条目”栏中的参考转录物的序列相配对程度一样的cDNA的总数。
标有“条目”的一栏给出了NIH GENBANK位名,该位名与文库中的序列号相对应。“s”栏表示了在一些情况下参考序列的种类,“s”栏中的符号在表1中列出。标有“描述符”的一栏给出了与“条目”栏中的NIH GENBANK位名相关的序列的平白的英文解释。
表3是在正常的单核细胞和活化了的巨噬细胞中最丰富的15种基因转录物的比较。
表4是将THP-1和人类的巨噬细胞cDNA序列进行概括性比较的文库减法分析的详细总结。在表4中用了与表2中一样的符号。附加栏用来列“bgfreq”(在减法文库中的丰度数),“rfend”(在靶文库中的丰度数)和“比率”(靶丰度数除以减法丰度数)。细读表以后清楚,当在减法文库中的丰度数为“0”时,该靶丰度数除以0.05,这是一个获得结果的办法(不可能除以0)且将结果与减法数为1的比率相区别。
表5是计算机程序,是用源程序写出的,用来产生基转录物减法形象。
表6是在本发明提供的电子Northern印迹分析中所用的数据库entries的部分清单。
4.2附图的简述
图1是根据构建基因库中序列的制备和分析部分所收集和贮存的数据的总结图。
图2是一个代表着在发明方法的一类优选实施方案中用“丰度排序”软件执行的操作顺序的图。
图3是本发明系统的优选实施方案的方框图。
图4是一个更详细的生物信息流程的方框图,该生物信息流程从新序列(已被测序但未被确认的)到转录物图象分析的印出。和数据库订阅的条例。
5.本发明的详细描述
本发明提供一种在不同生物样品中比较基因转录物相对丰度的方法。该方法通过对每一个RNA及其相应cDNA(或换而言之,对于代表其它生物序列的数据)用高效产生的序列特异性分析。这个过程在此处表示为基因转录物图象。对一套基因转录物相对丰度的定量分析在此处表示为“基因转录物图象分析”或“基因转录物频率分析”。本发明能得到任意类型器官中任一给定细胞群或组织中的总的基因转录物图谱。本发明可得到一个样品的图谱,该样品可以是含单细胞(或单细胞克隆),或许多细胞或比单细胞更复杂的且含多种细胞类型的组织,如肝。
本发明在诊断、毒理学和药理学等领域有显著的优点。能在还未作诊断的病人中作很复杂的诊断测试。取到含病人体液或组织的生物样品,然后分离基因转录物,并扩大到能确定它们的程度。也可选择将基因转录物转变为cDNA。将基因转录物样品进行序列特异性分析和定量。将这些基因转录物序列丰度和包括病人及健康人的标准数据集的参考数据库序列丰度进行比较。病人的疾病和病人的数据集密切相关。
例如,正如在表3中基因转录物频率分析体现正常单核细胞和活化的巨噬细胞间差别一样,基因转录物频率分析也能用来对正常细胞或组织与有病的细胞或组织加以区别。
在毒理学中,一个基本问题是哪些测试对预测或检测毒效最有效。基因转录物图象提供了细胞和组织环境的详细信息,而有些信息是不能用传统上的,不详细的筛选方法得到的。基因转录物图象对预测药物毒性和药效是一种更有效的方法。在药理学领域运用这种工具会得到相似的益处。基因转录物图象能选择性地用于查明预期受比如能解除毒物毒性的酶影响的蛋白类别。
在第二实施方案中,比较性基因转录物频率分析可用于区分对抗癌药物有反应和无反应的癌细胞。抗癌药物例子有:三苯氨胺、长春新碱、长春花碱、鬼臼毒素、依托泊甙、替尼泊甙、顺铂,生物反应的调节物,如干扰素、IL-2、GM-CSF、酶、激素等。本方法也提供一种通过功能类别来对基因转录物进行分类的手段。在癌细胞例子中,转录因子或其它重要的调节分子对于在不同的文库中进行分析是相当重要的类别。
在第二实施方案中,比较性基因转录物频率分析用来区分对照的肝细胞与从实验药物如FIAU治疗的病人身上分离出的肝细胞,以区分疾病引起的和药物引起的病理现象。
在第二实施方案中,比较性基因转录物频率分析用来区分用锂治疗和未用锂治疗的病人的脑组织。
在更进一步的实施方案中,比较性基因转录物频率分析用来区分用环孢菌素和FK-506处理的细胞和正常细胞。
在更进一步的实施方案中,比较性基因转录物频率分析可用来对病毒性感染(包括HIV感染)的人类细胞和未感染的人类细胞加以区分。基因转录物频率分析还可用来检测在抗HIV、感染HIV和HIV敏感的细胞中的基因转录物。基因转录物丰度的比较将显示治疗的成功和/或研究新的途径的成功。
在更进一步的实施方案中,比较性基因转录物频率分析用来对有多种疾病的不健康的病人和健康人中支气管洗出液加以区别。
在更进一步的实施方案中,比较性基因转录物分析用来对细胞、植物、微生物及动物的突变体和野生型之间加以区别。另外转录物丰度程序也适用于科研工作者评估在许多不同组织中某一基因的转录。这种比较能确定不产生某一基因产物的缺失突变体和产生丰度减少或其它不同信息的点突变体。这种突变会影响基础性的生化或药理学过程,如矿质营养和代谢,并且能被本领域的技术人员所知的手段分离出来。因此,具有产量提高,对害虫有抵抗力和其它特性的庄稼能被开发出来。
在更进一步的实施方案中,比较性基因转录物频率分析能用作种间比较性分析,这就允许人们可选择更好的药理学的动物模型。在本实施方案中,人或其它动物(如鼠),或其被培养的细胞用一种特定的测试试剂处理。每一cDNA群体的相对序列丰度被确定下来。如果动物测试系统是一种好的模型,动物cDNA群中的同源基因应与人类细胞中的同源基因类似地改变表达。如果用药物测出副效应,详细的转录物丰度分析将被用来检测基因转录物的改变。通过比较基本的生理学变化,将能对模型进行评估。
在更进一步的实施方案中,比较性基因转录频率分析被用作在临床研究中对病人的细胞或组织(如血样)给出一个高度详细的基因转录物图谱。特别是,基因转录物频率分析可被用于对某一疾病状况或条件给出一高解析基因表达图谱。
在优选的实施方案中,本方法使用高产出cDNA测序以确定感兴趣的特定转录物。然后,所生成的cDNA和推断出的氨基酸序列将广泛地与GENBANK和其它下面所述序列数据库比较。与现有的通过试图确定在一特定生物效应中所包含的单一蛋白的双向凝胶发现蛋白的方法相比,本方法有好几种优点。此处,对活化的和非活化的细胞的详细比较的图谱揭示单一转录物在表达中的大量变化。当确定该序列是否是“严格”匹配、近似匹配或非匹配的之后,该序列被送入数据库。然后,将与每一种基因相对应的cDNA的拷贝数制表。虽然所有的条目的内容可以被慢而费力地由人工处理,但计算机程序将这些信息制表是快速有效的。cDNA拷贝数(任选地除以在该数据集中的总序列数)提供了与每个基因相应的转录物的相对丰度的图。列出的代表基因能根据在总cDNA中的丰度排序。大量的比较或量度的附加类型是可能的且在下面有例示。
一个可选的产生基因转录物图象的方法包括以下步骤:先得到测试mRNA的混合物,提供有代表性的一批单一探针,这些探针的序列至少与测试mRNA中的一部分互补。然后,将固定量的测试mRNA和成列的探针加到一起。测试mRNA和探针一起温育足够的时间以形成测试mRNA与探针的杂交物。mRNA和探针的杂交物被检测并被定量。由杂交物在探针序列的位置来确定杂交物。每种杂交物的数量合计起来给出一个总量。每种杂交物的数量除以总量就可得到一组相对丰度数,这称为基因转录物图象分析。
6.实施例
下面的实施例用来说明主题发明。这些实施例以实例的方式来提供,并且不包含限制本发明的目的。
6.1组织来源和细胞系
为了用本发明要求的计算机程序进行分析,生物序列实际上可从任何来源得到。最常用的是从人体中得到的组织。组织可从身体任一器官、任一年龄的供体、任何不正常或不死细胞系得到。在一些情况下更愿意选择不死细胞系,因为其细胞类型具有单纯性;其它组织样品必定包括了混合的细胞类型。有一种特殊的技术可得到单一细胞(例如,脑细胞),并利用该细胞的自身机制来产生足量的用来测序的cDNA,其所用的技术和分析手段在此有描述(美国专利号5,021,335和5,168,038,该文献在此引入作为参考)。本文所举的实施例用如下细胞系:类单核U-937细胞、活化的类巨噬THP-1细胞,诱导的血管内皮细胞(HUVEC细胞)和类肥大细胞HMC-1细胞。
U-937细胞系是人类组织淋巴瘤细胞系,其具有单核白细胞的特征,是从一个患扩散的组织淋巴瘤病人的胸膜渗出物中得到的恶性细胞建立起来的。(Sundstrom,C.and Nilsson,K.(1976)Int.J.Cancer 17:565)。U-937是少数几种具有组织细胞形态学、细胞化学、表面受体和类单核细胞特征的人类细胞系之一。这些细胞能诱导出最终为单核细胞的分化,并且当用人类混合淋巴细胞培养物的上清激活时,这些细胞表达新的细胞表面分子。在这种体外激活类型中,细胞经历形态学上和功能上的变化,包括针对红细胞和肿瘤靶细胞的抗体依赖性细胞毒性(ADCC)的增加(巨噬细胞的一种主要功能)。用佛波醇12-肉豆蔻酸酯13-乙酸酯(PMA)在体外活化U-937细胞,刺激了几种化合物的产生,包括前列腺素、白细胞三烯和血小板激活因子(PAF),这些是有力的炎症介体。因此U-937是很适于确定和分离与正常单核细胞相关的基因转录物的细胞系。
HUVEC细胞系是从人脐静脉早期通道内皮细胞培养物(CellSystems Corp.,12815 NE 124th Street,Kirkland,WA 98034)中得到的正常的、均一的、性质明确的细胞系。仅对诱导或处理后的HUVEC细胞的基因转录物进行了测序。一份含有1×108细胞的培养物在收获前用1U/ml的rIL-1b和100ng/ml的E.coli脂多糖(LPS)内毒素处理5个小时。第二份2×108细胞培养物在收获前用4U/ml TNF及2U/ml γ-干扰素(IFN-gamma)平行处理。
THP-1是具有明显单核细胞特性的人类白细胞系。这一细胞系由一名患有严重单核细胞白血病的一周岁男性儿童的血液中分离得到(Tsuchiya,S.et al.(1980)Int.J.Cancer:171-76)。下列几点是说明这一细胞系的单核细胞本质的细胞学和细胞化学判据:(1)存在能够被氟化钠抑制的α-萘酚丁酸酯酶的活性;(2)能够产生溶菌酶;(3)具有吞噬溶胶(latex)颗粒和致敏SRBC(绵羊红血细胞)的能力;(4)用伴刀豆球蛋白A(Con A)处理后再用丝裂霉素C处理的THP-1细胞可以激活T淋巴细胞。在形态学上,其细胞质中含有嗜天青颗粒,细胞核凹进并有不规则深陷的褶皱。细胞系具有Fc和C3b受体,可能在吞噬过程中起作用。用肿瘤促进因子12-o-十四酰-佛波醇-13乙酸酯(TPA)处理的THP-1细胞停止分裂并分化为与来自正常单核细胞的巨噬细胞十分相似的类巨噬细胞细胞。当细胞发生形态转变时,细胞核变得更加无规则,细胞质中出现更多的吞噬泡。分化了的THP-1细胞同时也表现出增强的对组织培养塑料的粘附性。
HMC-1细胞(人类肥大细胞系)是从一位患肥大细胞白血病的MayoClinic患者的外周血培养建立起来的(Leukemia Res.(1988)12:345-55)。HMC-1细胞培养物与未成熟的鼠肥大细胞克隆相似,含有组胺,对于氯乙酸酯酶、氨基己酸酯酶、嗜曙红主要碱性蛋白(MBP)及类胰蛋白酶染色法均呈现阳性结果。但是,HMC-1细胞丧失了合成正常IgE受体的能力。在用白细胞泳动法直接从患者血液中分离出的HMC-1细胞具有10∶16转位功能,因而排除了其在培养过程中获得此功能的可能。由此可见,HMC-1细胞系是肥大细胞的一个很好的模式细胞。
6.2 cDNA文库的构建
为了进行文库间的比较,所有文库必须在相似条件下制备。在构建过程中,有几个因素至关重要。这些因素中的一个是分离mRNA的方法。重要的是必须使用相同的条件以从对比文库中除去DNA和非均一性核RNA。cDNA的大小分级必须严格控制。在制备对比文库时应当优选地使用同一克隆载体,至少也要使用同一类型的载体(例如单向插入载体)以保证结果的可比性。优选使用单向插入载体以使结果分析更为简便。
在制备cDNA时,优选地使用寡聚dT单向引物从而使得从每个mRNA转录物只获得一个克隆。当然,用寡聚dT和随机引物的混合物也有其优点,在也以搜寻基因为目的时,这一混合物可以导致更大的序列多样性。应用DR2(Clontech公司)及的HXLOX(US Biochemical公司)或Invitrogen和Novagen公司的载体也可以得到相似的效果。这些载体都应满足两个条件:第一,有商用引物如T3或M13反向引物的引物结合位点;第二,能够容纳多至10kB的插入片段。
cDNA克隆的随机取样也是很重要的,因此应该使用相当大量的克隆。分析5,000个克隆以得出正确结果是很常见的操作,如果要得到非常稀有的基因和/或测定它的相对丰度时,可能会从一个文库中对100,000个克隆取样。cDNA的大小也要严格控制。可选地,可以选择噬菌斑而不是克隆。
除了下面将要提到的Stratagene公司的Uni-ZAPTM载体系统外,据信也可以使用其它类似的单向载体。例如,这些载体包括但不限于DR2(Clontech公司)和HXLOX(US.Biochemical公司)。
一种优选的方法是将构建文库的具体细节(如图1中所示)都收集起来并储存于一个数据库中以方便日后对参考序列进行检索。图1包括了有关文库合作者或细胞或cDNA提供者、预处理方法、生物来源、培养物、mRNA制备以及cDNA构建过程的许多重要信息。当要深入分析序列及文库时,有关其它步骤的类似的详尽信息将是有益的。
cDNA文库的构建是从由细胞和组织样品中获得RNA开始的。可以依据已有文献中描述过的方法来进行(参看Manatis,T.et al.(1982),分子克隆,冷泉港实验室纽约),或者也可以直接购买cDNA文库。U-937 cDNA文库(分类号937207)购自Stratagene公司(11099 M.Torrey Pines Rd.,La Jolla,CA 92037)。
THP-1 cDNA文库是由Stratagene公司用常规方法从用100nm TPA处理48小时和1μg/ml LPS处理4小时的THP-1细胞培养物中制备的。人肥大细胞HMC-1 cDNA文库也是Stratagene公司从培养的HMC-1细胞用常规方法构建的。而HUVEC cDNA文库是Stratagene公司将两批诱导过的HUVEC细胞分别处理后用常规方法构建得到的。
重要的是,以上所有文库均用同一种方式制得。首先,纯化poly(A+)RNA(mRNA)。对于U-937和HMC-1RNA,cDNA合成仅用寡聚dT引发。对THP-1和HUVEC RNA,分别同时用寡聚dT和随机六聚体引发cDNA合成,由此得到的两个cDNA文库各自在独立条件下处理。然后,将合成的寡聚核苷酸和cDNA的末端连接起来使其能够插入Uni-ZAPTM载体系统(Stratagene公司),从而能得到高效率的单向(有意义方向)λ文库构建体,并可以用简便的蓝-白筛选在质粒系统中检测有无cDNA插入的克隆。最后,混合等量的噬菌体以使两个文库合并为一个。
基因文库的筛选可以用DNA探针或抗体探针来进行,Stratagene公司提供的pBluescript噬菌粒可以迅速地在体内进行切割。应用噬菌粒的质粒系统可以很方便地进行插入分析、测序、定点突变、产生单向切除和对融合蛋白进行表达。用常规方法构建好的文库噬菌体颗粒被用于感染Stratagene公司的XLl-Blue E.coli宿主菌株,这一菌株具有高的转化效率,增加了获得cDNA文库中稀有的和非典型性克隆的几率。
6.3分离cDNA克隆
各个cDNA克隆均以噬菌粒的形式通过体内切割步骤获得,其中宿主菌株被λ噬菌体和辅助噬菌体f1同时感染。由含有文库的噬菌体和辅助噬菌体指导合成的蛋白在λDNA上打开缺口,从而启动依λ靶DNA上特定序列的新DNA合成,并且产生了包含全部pBluescript质粒序列和cDNA插入序列的一个较小的单链环状噬菌粒DNA分子。从细胞中分离纯化这一噬菌粒用于再次感染新的寄主细菌,在菌体内形成双链噬菌粒DNA。由于噬菌粒携带β-内酰胺酶的基因,因而可以在含有氨苄青霉素的平板上筛选新转化的细菌。
在纯化噬菌粒DNA的过程中使用的是Magic MiniprepsTM DNA纯化系统(Promega Catalogue#A7100.Promega公司,2800WoodsHollow Rd.,Madison,WI 53711)。通过使用一种专利DNA结合树脂,这一小量法过程提供了一个简便可靠的裂解细菌细胞并快速分离纯化噬菌粒DNA的方法。从纯化树脂上洗脱下来的DNA可以直接用于DNA测序及其它分析操作。
噬菌粒的纯化也可以使用QIAGEN的DNA纯化系统中的QIAwel1-8质粒纯化系统来完成,(QIAGEN公司,9259 Eton Ave.,Chattsworth,CA 91311)。这一产品系列使用QIAGEN的阴离子交换树脂,采用3M公司的多孔格式EMPORETM膜技术,提供了一种简便、迅速、可靠及高产出的裂解细菌和分离高纯度噬菌粒DNA的方法。从纯化树脂上洗脱的DNA可以直接用于DNA测序及其它分析操作。
最近出现了第二种纯化噬菌粒的方法。它基于Miniprep试剂盒(分类号77468,得自先进基因技术公司,19212 Orbit Drive,Gaithersburg,Maryland)。这一试剂盒被设计为96孔板的规格并提供了足以进行960次纯化的试剂量。每个试剂盒都带有一套建议使用的操作规程。这一规程除以下部分需要进行少量改动外其它都被直接应用。第一,96孔板每个孔中只加入1ml灭菌的含25mg/L的羧苄青霉素和0.4%甘油的高浓度肉汤培养基。在孔中接种后培养24小时,用60μl裂解缓冲液处理。将板中容物加到初级过滤板前要在2,900rpm下离心5分钟。向Tris缓冲液中加异丙醇的任选步骤没有按常规进行。在规程的最后一步完成后,样品被转移到一个Beckman 96孔板中贮存起来。
第二新DNA纯化系统是产品WIZARDTM,可以得自Promega公司(分类号A7071),可以使之适用于96孔板规格。
6.4 cDNA克隆的测序
对从U-937和THP-1文库中随机分离的cDNA插入片段进行了部分测序。DNA测序方法已经是本领域内众所周知的。传统的酶法测定使用DNA聚合酶Klenow片段、测序酶TM或Taq聚合酶从一个寡聚核苷酸引物开始延伸DNA链,该引物与所感兴趣的DNA模板退火结合。改进了的方案可以用单链或双链模板。链中止反应产物通常用尿素-丙烯酰胺凝胶电泳分离,电泳结果通过放射自显影(对于放射性核素标记的前体)或荧光(对荧光标记前体)的方法来检测,近年来,由于发展了机械化的反应物制备、测序、荧光分析等新颖的仪器技术,使得每天可以测定的序列数目增加(如Applied Biosystem 373,377 DNA测序仪,Catalyst800)。使用上述系统,目前测序长度依据各克隆的不同从250至400碱基之间不等。另外,测序长度也随着在凝胶中电泳时间的长短而变动。一般说来,短的电泳时间倾向于截短能够测定的序列长度。为了得到确定和可重复的结果,至少25至50个碱基长度是必需的。基因转录物图象的使用可以用任何序列特异性手段,包括但不限于杂交、质谱、毛细管电泳、505凝胶电泳。
6.5 cDNA克隆及其所得蛋白的同源性检索(及后续步骤)
将从cDNA克隆得到的的核酸序列作为待查序列(序列表中的序列),可以到含有许多已知DNA序列的数据库中去寻找同源的区域。Genebank和EMBL是这样的数据库的两个代表。下面我们将描述两个同源性检索算法的具体实例,然后描述随后进行的依据本发明优选实施方案中由计算机完成的操作步骤。
在说明本发明中由计算机进行的步骤时,单词“文库”被用于指称一系列(或一群)生物样品的核酸序列。一个“文库”可以由能够表征一个生物样品的cDNA序列、RNA序列或其它类似的序列组成。我们所说的生物样品既可以由单一类型的人体细胞(或上面提到过的其它样品类型)。为了准确表示或表征一个生物样品(例如从单个人类细胞中提纯的RNA克隆的代表性cDNA序列)我们希望文库中的序列已被测定。
在下文描述的本发明中由计算机进行的步骤中,“数据库”一词指的是一套代表了一个序列集合的储存数据,而这一序列集合又反映了生物参考样品的组合,举例来说,一个数据库可以由代表被各种病毒感染的或处于不同年龄阶段的人类细胞以及不同种的哺乳动物细胞等的cDNA序列数据。
在优选的专利实施方案中,本发明使用软件(将被描述)编程的计算机进行如下操作:
(a)处理表示一个cDNA序列文库的数据(由高效率的cDNA测序法或其它方法得到)以决定文库中的每一序列是否同参考DNA序列数据库中的一个DNA序列相匹配(如果有的话,就确定这一参考数据库中与之匹配的条目并指出文库序列和参考序列间的匹配程度),并赋以一个基于序列标注和同文库中各序列匹配程度的确定的序列值;
(b)对数据库中部分或全部条目,将文库中确定为匹配的序列值的数目列表(虽然这一工作可依据全部条目的清单手工完成,但我们建议用如下的计算机软件来实现这一操作)从而得到一组最终数值或“丰度数”;
(c)如果文库大小不同,将其丰度数除以文库序列总数,得到每一确定的序列值的相对丰度数(也就是每一基因转录物的相对丰度)。
确定的序列值(或是相应的基因)的表可以依照在cDNA群中的丰度进行排序。此外还有其它很多种比较的方法和角度。
例如(详细说明见下)可以对两个不同的文库进行步骤(a)和(b)操作(有时将两个文库中的一个称为“目标”文库而第二个称为“减法”文库)。然后,对每一确定的序列值(或基因转录物)用目标库的丰度值(对该确定的序列值)除以减法库的丰度值(对该确定的序列值),得到一个“比率”值。
事实上,减法也可以在多个文库中进行。有可能把几个文库(比如说3个)中的转录物相加,然后除以得自多个文库(也比如是3个)的一组转录物。这一操作可以概括表达为(A+B+C)/(D+E+F),其中每个大写字母表示完整的一个库。任选地在实施减法之前用总和文库中转录物的丰度值除以总样品的大小。
和标准的杂交技术允许在两个文库之间进行单一的减法不同,当对一系列文库转录物序列进行处理并将结果储存入计算机后,就可以在文库中实施任意数目的减法。例如通过这种方法,比率的数值可以用第一个文库的相对丰度除以第二个文库中的对应数值而得到,反之亦然。
作为步骤(a)的一个变化,文库也可以由得自cDNA克隆的核苷酸序列组成。可以实施步骤(a)中的同源(相似)区域检索的商用数据库有Genebank(NIH),EMBL(欧洲分子生物学实验室,德国)以及GENESEQ(Intelligenetics,Mountain View,California)。
D,J.Lipman和W.R.Pearson的题目为“快速和灵敏的蛋白质相似性检索”Science,227:1435(1985)的文章描述了一种可用于步骤(a)的同源性检索算法。在这一算法中,检索同源区域的过程分两步进行。首先,通过使用一种同源值表来计算匹配值,从而得到最高度同源性区域。在这一步骤中引入一个参数Ktup来规定进行两序列比较时可以移动的最小窗口大小。同时,Ktup值也规定了从序列中提取出最高度同源区域时所需要达到的碱基对数目。在这一步中,不进行插入或删除操作,序列同源性用一个起始值(INIT)表示。
在第二步中,通过插入一段间隙,加入一个可被删除的部分,将同源区域“校准”,以得到最高的匹配值。从第一步得到的匹配值用同源值表和插入值表重新计算,最后的结果是一个优化(OPT)数值。
两个DNA序列间的同源性可用Harr的方法建立点阵同源性图来比较和检验(Needleman,S,B,Wunsch c.o.,J.Mol.Biol.48:443(1970))。这一方法可生成一张二维图,有助于确定相对于重复区的同源区。
但是在一类优选的实施方案中,步骤(a)是通过使用名为INHERIT670 Sequence Analysis System的商业软件处理文库数据来进行的。这一程序可从Applied Biosystems公司(Foster City,California)处得到,此外还包括叫做Factura Software的软件,也可得自该公司。Fuctura程序先对每一文库序列进行预处理,“剪辑掉”和感兴趣的序列无关的信息,比如说用于文库制备的载体序列。其它可以剪辑掉或掩蔽(而被检索程序所忽略)的序列包括但不限于ploy A尾和重复性GAG、CCC序列。可以编制一个简单的检索程序用于掩蔽掉这样的“低信息度”的序列,或者象BLAST一类的程序可以忽略这种低信息度序列。
在INHERIT 670序列分析系统执行的算法中,使用模式规范语言(由TRW公司开发)来辨别同源区域。在INHERIT Analysis用户手册1.0版,Applied Biosystems公司,(1991.1)的第2至15页中这样写道:“有三个参数决定INHERIT analysis进行序列比较的方式:窗口大小、窗口偏置和容错度。窗口大小规定将待查序列划分的片段长度,窗口偏置规定从何处开始下一片段(用于比较),计数时从上一片段的起点开始。容错度指的是在规定长度序列中可以容忍的插入、缺失或是替换的总数。容错度可以取0-6的任何整数值。系统的缺省设置如下:窗口长度=20,窗口偏置=10,容错度=3”。
使用这三个参数的组合可以在一个数据库(如DNA数据库)中搜寻包含有同源区的序列并对合适的序列给出一个初始值。然后,使用点阵同源图来检验这些同源区域从而得到相对于重复区的同源区,通过Smith-Waterman校准方法可以显示这一同源检索的结果。此INHERIT软件在使用UNIX操作系统的Sun计算机系统上执行。
INHERIT的可选研究手段包括BLAST程序,GCG(可得自GeneticsComputer Group,WI)和Dasher程序(Temple Smith,Boston大学,Boston,MA)。核苷酸序列可以在Genbank,EMBL或诸如GENESEQ(可取自Intelligenetics,Mountain View,CA)的用户数据库或其它基因数据库中检索。此外,我们用自备的数据库检索了一些序列。
在优选实施方案中,用INHERIT软件分析转录物序列,寻找最匹配的参考基因转录物来指定为序列标称物,并且赋予同源度,二者合起来作为确定的序列值,输入用“丰度排序与减法分析”计算机程序(见下述)编程的Macintosh个人计算机(可得自Apple公司)并由计算机进一步处理。在“丰度排序和减法分析”程序(又称为“丰度排序程序”)处理之前,对来自cDNA克隆的确定的序列用匹配度赋值(根据上面给出的参数),匹配度依照下列类别:“严格”匹配(具有高度一致性的区域)、人类同源匹配(具有高度相似性,但不是“严格”匹配的区域),非人类同源匹配(存在于非人类的物种中具有高度相似性的区域),非匹配(与以数据库形式存储的确定的的核苷酸序列无明显同源性的区域)。可选地,匹配度可以是如下所述的数值。
再参考在参考序列与数据库之间确定匹配的步骤,可以由核苷酸序列推导出蛋白质和肽类序列,应用推导出的多肽序列,可以周与处理cDNA序列相似的方式进行匹配确定。一段蛋白质序列可以用作待查序列,与存储于诸如Swiss/Prot,PIR和NBRF蛋白质数据库中的确定的序列相比较,来发现同源蛋白质。首先,对这些蛋白质应当用一张同源性分值表(Orcutt,B.C.和Dayoff,M.O.分值矩阵,PIR报告MAT-0285(1985年2月))给同源性记分,得到一个INIT值。通过插入一段间隙(这段间隙添加了一个可以被删除的部分)将同源序列校准以获得最高匹配值。应用同源值表和插入值表再计算匹配值,得到优化(OPT)数值,即使对一段分离得到的序列的正确阅读框架毫无了解,也可以通过检索所有3个阅读框架进行上述的蛋白质同源性检索。
与DNA序列同源性检索相类似,应用INHERIT 670序列分析系统也可以确定肽类及蛋白质的序列同源性。模式规范语言和参数窗口被用来检索蛋白质数据库,寻找包含以一个初始值记分的同源性区域。接下来的在点阵同源性图上的显示展示出相对于重复区域的同源性区域。可应用于模式检索数据库的其它检索工具,包括PLsearch Blocks(取自Henikoff &Henikoff,华盛顿大学,西雅图),Pasher和GCG。模式检索数据库包括,但不限于,Protein Blocks(可取自Henikoff & Henikoff,华盛顿大学,西雅图),Brookhaven Protein(可取自Brookhaven国家实验室,Brookhaven,MA),PROSITE(可取自Amos Bairoch,日内瓦大学,瑞士),ProDom(可取自Temple Smith,波士顿大学)和PROTEINMOTIF FINGERPRINT(可取自利兹(Leeds)大学,联合王国)。
INHERIT DNA分析系统(可获自Applied Biosystems,公司,FosterCity CA)的一部分,ABI Assembler应用软件,可以通过把选定的序列片段的数据组合成一段大的序列,生成及管理序列组合项。Assembler软件综合了两种先进的计算机技术,最大限度地提高了将已测序的DNA片段装配成装配体(Assemblage)的能力。装配体是一种特殊的数据分组,其中序列之间的关系以图形叠加,图形排列及统计图显示出来。该过程基于片段装配的Meyers-Kececioglu模型(INHERITTM Assembler用户手册,Applied Biosystems,公司,Foster City,CA),以图论作为一种非常严格的装配DNA序列片段的多序列排列工具的基础。其它可用的装配程序包括MEGALIGN(可取自DNASTAR公司Madison,WI),Dasher和STADEN(可取自Roger Staden,英国剑桥)。
下一步,参考图2,我们更详细地描述“丰度排序”程序。该程序实施上述“步骤(b)”,将与每个数据库条目匹配的文库中序列的数目(即每个数据库条目的“丰度值”)制表。
图2是丰度排序程序的优选实施方案的流程图。该丰度排序程序实施方案的源代码列表见表5。在表5的实施方法中,丰度排序程序用FoxBASE编程语言写成。该语言可从微软公司买到。尽管FoxBASE是本技术首选程序,但是不应局限于此。正如对本领域的技术人员显而易见的,许多其它编程语言也可使用。Sybase是一个尤其合乎需要的可选程序。图2中列出的子程序名对应于表5列出的子程序。
再参考图2,“确定的序列”是转录物序列,它们代表文库中每一段序列和与之匹配的数据库条目的相应识别标志(若有的话),换句话说,“确定的序列”是代表上述步骤(a)的输出的转录物序列。
图3是实施本发明的系统的方块图。图3系统包括文库生成单元2,此文库生成单元生成一个文库并且决定着一个对应于构成文库的生物序列的转录物序列输出流。编程的处理器4从单元2接收数据流并依照上述步骤(a)处理数据,生成确定的序列,处理器4可以由下列软件编程,即商业的称为INHERIT 670序列分析系统的计算机程序,商业的称为Factura程序的计算机程序(二者均可得自Applied Biosystems,公司)和UNIX操作系统。
仍参考图3,确定的序列装入由丰度排序程序编程的处理器6,处理器6生成图2和图3提到的最终转录物序列。图4显示一个plannedrelational计算机系统的更加详细的方块图,它包括各种可被执行的检索技术以及用于检索的数据库的组合。
参考图2,丰度排序程序首先对确定的程序进行称为“模板数(Tempnum)”的操作,以弃去除了与选择类型的数据库条目匹配的确定的序列之外的所有确定的序列。例如,用“模板数”处理可以挑选出代表与下列类型数据库条目(定义见上述)相匹配的确定的序列,这些类型是“严格”匹配,人类“同源”匹配,代表见于人类以外的其它物种的“其它种”匹配“非”匹配(没有明显地与代表先前确定的核苷酸顺序的数据库条目具有同源性的区域),“I”匹配(非先前已知DNA序列的Incyte),或“X”匹配(与参考数据库中的ETS相匹配)这样就去除了U、S、M、V、A、R和D序列(定义见表1)。
在“模板数”过程中选出的确定的序列值,再进行称为“模板读(Tempred)”的进一步选择(清除)操作。举例来说,该操作可以弃去所有代表与被选择的数据库条目相匹配的确定的序列值。接着,在“模板指认(Tempdesig)”操作中依照文库对经“模板读”过程选出的确定的序列值进行分类。可以认为“确定的序列”可以代表来自单一文库或两个文库或更多文库的序列。
首先考虑如下情况,即确定的序列值代表来自单一文库的序列。在这种情况下,在“模板读”过程中决定的所有确定的序列值,经过“文库模板(Templib)”操作排序,经过“文库排序(Libsort)”操作进一步排序,最后经“目标模板排序(Temptarsort)”过程进一步排序。例如,这三次排序操作可以按“丰度数”递降顺序排序确定的序列(以生成一个递减丰度数的表,每一个丰度数对应一个特定的确定的序列条目;或生成几个递减丰度数的表,每一表中的丰度数对应一选定类型的数据库条目),并把每个排序表中的冗余部分剔除。在此情况下,可略过称为“挤压(Cruncher)”的操作,则“最终数据”值是经“目标模板排序”过程建成的有组织的转录物序列。
下一步考虑这种情况,即经“模板读”操作产生的转录物序列代表来自两个文库的序列(这两个文库称为“目标”文库和“减法”文库)。例如,目标文库可能包括来自一种患病细胞克隆的cDNA序列,而减法文库可能包括来自接受药物处理后该患病细胞的克隆的cDNA序列。又例如,目标文库可能包括来自一个年轻人的一种细胞类型的克隆的cDNA序列,而减法文库可能包括来自这个人在不同年龄时同种细胞类型的克隆的cDNA序列。
在这种情况下,“模板指认”操作使所有代表目标文库的转录物序列依照“文库模板”(接下去是“文库排序”和“目标模板排序”)操作处理,而使所有代表减法文库的转录物序列按照“Tempsub”(接下去是“减法排序(Subsort)”和“减法模板排序(Tempsubsort)”)操作处理。例如,连续的“文库模板”,“文库排序”和“目标模板排序”排序操作从目标文库中按丰度数递降顺序对确定的序列排序(以生成一张递减的丰度数的表,每一个丰度数对应于一个数据库条目,或者生成几张递减的丰度数的表,每张表的丰度数对应一种选定类型的数据库条目),并将每张已排序表中的冗余部分剔除。连续的“减法模板(Tempsub)”,“减法排序”和“Tempsubsort”排序操作从减法文库中按丰度数递降顺序对确定的序列排序(以生成一张递减的丰度数的表,每一个丰度数对应一个数据库条目,或者生成几张递减的丰度数的表,每张表的丰度数对应一种选定类型的数据库条目),并将每张已排序表中的冗余部分剔除。
“Tempsubsort”操作的转录物序列输出典型地代表已排序表,从该表可生成一张直方图,沿其中一轴(例如横轴)的位置表示(目标文库序列的)丰度数,沿第二轴的(例如纵轴)位置表示确定的序列值(例如人类或非人类基因类型)。类似地,“Tempsubsort”操作的转录物序列输出典型地代表已排序表,从该表可生成一张直方图,沿其中一轴(例如横轴)的位置表示(减法文库序列的)丰度数,沿第二轴(例如纵轴)的位置表示确定的序列值(例如人类或非人类基因类型)。
来自Tempsubsort的转录物序列(已排序表)输出和Tempsubsort排序操作通过称为“挤压”的操作综合到一起。“挤压”操作确定各对相对应的目标与减法丰度数(二者代表同一确定的序列值),用其中一个除以第二个,从每对相对应的丰度数得到一个“比率”值,然后按比率值递降顺序排序比率值。“挤压”操作的数据输出(图2中的终转录物序列)一般地是一张已排序表,从该表可以生成一张直方图1,沿其中一轴的位置表示(对于来自目标文库与减法文库的相对应的确定的序列的)丰度数比率的大小,沿第二轴的位置表示确定的序列值(例如基因类型)。
优选地,在获得两个文库丰度值的比值之前挤压操作将每一比率值除以目标文库和减法文库二者之一或全部的总序列数。从挤压操作生成的“相对”比率值结果表可以应用于医学、科研或工业等许多用途。另外,优选地,挤压操作的输出是一个表的集合,每个表代表对于数据库条目的一个不同的选定子集(例如蛋白质家族)的比率值的递降序列。
举一个例子,对于一个文库,本发明的丰度排序程序把对应于数据库中确定的每一基因的mRNA转录物数目制成表格。这些数目除以取样的克隆的总数,除得的结果反映了mRNA转录物在其来源的细胞类型或组织中的相对丰度。在此,获取这种最终数据集合称为“基因转录物图象分析”得到的减法数据精确地显示了在高度详尽的复杂体系中,哪些蛋白质和基因被增量调节和减量调节。
6.6 HUVEC cDNA文库
表2是一张列举诱导的HUVEC文库中各种基因转录物的丰度表。转录物以丰度降序排列,这种电子排序简化了组织分析,加速了对该细胞类型特异的重要的新蛋白质的确定过程。这种上皮细胞位于心血管系统的组织中,对其组成,尤其是它在应激反应中的组成,了解越多,就会有更多的蛋白质目标可供选择,用以治疗该组织的疾患,例如普遍存在的动脉硬化症。
6.7单核细胞和肥大细胞cDNA文库
表3和表4给出两个文库的一个缩短的比较。表3和表4中的“正常单核白细胞”是HMC-1细胞,“激活巨噬细胞”是由PMA预处理和LPS激活的THP-1细胞。表3按丰度降序列出两种细胞类型的最丰富的基因转录物。由于从每种细胞类型中只选用15个基因转录物,该表可用于快速定量比较常见的转录物。这种丰度排序,加上方便的同步显示,提供了一种及时而有用的研究工具。在本例中,该研究工具表明:1)15种最大量的激活巨噬细胞转录物中仅有一种也见于15种最丰富的单核白细胞基因转录物(多聚腺苷酸结合蛋白);2)相对而言,一种新基因转录物(以前未在其它数据库中见到报导)更显著地出现在激活巨噬细胞中,但在正常巨噬细胞中不是同样地显著。这种研究工具为研究人员研究新蛋白提供了一条捷径,这些新蛋白可以是受体、细胞表面信号分子和细胞内信号分子,它们可以在商业药物筛选程序中用作药物靶。这种研究工具同目的在于鉴别细胞内和细胞周围的重要蛋白质的无的放矢的发现程序相比要节省相当多的时间,因为这些执行日常细胞功能并且对应于稳态mRNA的蛋白质在进一步研究其特性的过程中迅速被消除。
这样就说明基因转录物图谱如何随着变化的细胞功能而变化。本领域的专业人员均了解细胞的生化组成随着诸如癌症(包括癌症各个阶段)和接触毒物等其它功能变化而变化。如同在表3中那样的基因转录物减法图谱对这种基因表达和蛋白质研究是一种有用的初步筛选工具。
6.8正常单核白细胞和激活单核
白细胞cDNA文库的减法分析
cDNA数据存入计算机以后,表5所述的计算机程序就可用于从例6.7所讨论的两个文库中获取所有基因转录物的比率,基因转录物按比率值降序排序。如果基因不在一个文库之中,则该基因转录物的丰度未知,但应当小于1。作为近似以获得一个比率(如果未见于文库的基因的丰度定为0,则得不到该比率),只见于二个文库之一的基因赋予丰度值1/2。不在文库中的克隆的丰度赋为1/2,增加了“开启-关闭”基因的相对重要性,这些基因的产物可能是药物候选物。打印出的计算机处理结果称为减法表,它也是一种极有价值的筛选方法,这可以从下面的数据上看出来。
表4是一张减法表,其中正常单核白细胞文库用计算机从激活巨噬细胞文库中“减去”。该表最为有效地显示了由于巨噬细胞的激活引起的基因转录物的丰度变化,甚至在列举的前20种基因转录物中就有几种未知的基因转录物。因此,电子计算机减法是一件有用的工具,可用它协助研究人员更快地确定两种细胞类型之间基本生化物质的变化。这样一种工具可以为花费大量资金用于研究的大学和制药公司在研究发现的初期节省宝贵的时间和实验室资源,并且可以加快药物开发周期,从而使研究人员更早地建立药物筛选方案。因此,该研究工具为新药物更快更经济地推向公众提供了一条途径。
此外,这样的减法表可用于病人诊断。单个病人的样本(诸如来自组织活体解剖或血样的单核白细胞)可以与此处提供的数据比较,来诊断与巨噬细胞激活相关的状况。
表4揭示了许多新的基因转录物(标为Incyte克隆)。注意在激活巨噬细胞中许多基因的开启(亦即单核白细胞在bgfreg栏中值为0)。本筛选方法优于其它筛选方法,例如Western印迹法,后者不能揭示如此大量的不同的新基因转录物。
减法筛选方法也揭示出在激活巨噬细胞中有大量癌症基因转录物(rho致癌基因,ETS2,rab-2 ras,YPT1相关和急性髓样白血病mRNA)。这些基因转录物归因于无限增殖细胞系的使用,因此其本身令人颇感兴趣。该筛选技术提供一个包括致癌基因在内的增量调节基因转录物的详细图片,有助于解释为何抗癌药物干扰病人的激活的巨噬细胞介导的免疫反应。具备了由该筛选方法得来的知识,本领域的研究人员可以建立更有目的性、更有效的药物筛选方案来确定对下列情况分别有效的药物。这些情况为:1)相关的癌症和具有相同基因转录物图谱的激活的巨噬细胞的状态;2)仅为癌症;3)激活的巨噬细胞的状态。
平滑肌衰老蛋白(22kd)在激活的巨噬细胞中受增量调节,这说明它是控制炎症的可供阻抑的候选物。
6.9正常细胞和肝炎感染的肝细胞cDNA文库的减法分析
在本实施例中,大鼠们接触肝炎病毒,并维持群体状态,直到它们显示明确的肝炎症状为止。经诊断患有肝炎的大鼠的一半用新型抗肝炎药剂(AHA)处理,从所有接触肝炎病毒之前的大鼠和所有接受或未接受AHA治疗之后的大鼠中提取肝样本。另外,也可以当患肝炎大鼠恰好在接受AHA治疗之前获取它肝样本。
如例6.2和6.3所述处理肝组织,获取mRNA并进一步对cDNA测序。每一样本的cDNA依照表5的计算机程序处理并做丰度分析。得到的cDNA的基因转录物图象为每种动物的基线(对照)以及这些动物的感染和/或治疗后的状态提供了一幅详细的图片。一组样本的cDNA数据可以对所有对照样本,所有受感染大鼠的样本和所有受AHA治疗的大鼠的样本进行综合,得到一组扼要的基因转录物图谱。
减法操作可以在合适的个体文库和分组文库之间进行。对动物个体、对照与研究后样本可以做减法。并且,如果是在AHA治疗前和治疗后获得的样本,则动物个体和受治疗的组的数据可做减法。此外,所有对照样本的数据可以汇集起来求平均值,对照平均值可以从研究后AHA和研究后非AHA治疗cDNA样品的平均值中做减法得到。如果有治疗前和治疗后的样本,它们可以单个地(或用电子计算机求平均后)比较并做减法。
这些减法表可用于两种一般用途。首先,用与持续肝恶化或与持续肝恢复相联系的基因转录物来分析表中差值。减法表用来把药物治疗效果从更深层的肝炎基本病理中分离出来。由于肝炎影响多种参数,只用对一般酶的血检很难检测出附加的肝毒性,而基因转录物组成与减法提供了更复杂的生化图片,研究人员可应用它来分析这类难题。
此外,减法表提供一种工具,用来确定临床标记物,蛋白质个体或其它生化决定因素,这些生化物质用于预测和/或评价临床最终结果,诸如疾病,药物引起的状况改善,甚至是药物引起的附加病理现象。减法表特异地显示被开启和关闭的蛋白。因此,减法表对一组候选基因转录物作为临床标记物的应用提供初步筛选。随后,附加的细胞和组织文库的计算机减法揭示何种潜在标记物真正地出现在不同的细胞和组织文库中。在附加文库中存在的候选基因转录物从潜在临床标记物集合中被剔除。接着对血液或其它已知具有或不具有相关状态的相关样品的测试加以比较,以使临床标记物的选择合理化。依照本方法,不需要确定蛋白质转录物的具体生理效应,即可将基因转录物定为临床标记物。
6.10电子Northern印迹法
电子减法的一个缺陷是难以同时比较多于一对的图象。一旦某个特定基因产物被确定为适于进一步研究(通过电子减法或其它方法),研究单个基因在大量不同组织中的表达将是有用的。实验室中“Northern”印迹杂交技术用于此目的。在该技术中,单个cDNA或相应的探针经标记后与包含从大量组织或细胞类型中制备的RNA样本的印迹杂交。经放射自显影,该特定基因的表达模式会依次在所有涵盖的样本中定量。
6.11第I期临床试验
基于上述动物试验的安全性和有效性的确定,实行第I期临床测试。正常的病人接受正常的初期临床实验室测试。另外,采集适当样本,进行基因转录物分析。在测试过程中按预定设置的间隔采集病人样本。依上述内容对样本进行基因转录物分析。此外,在早期大鼠毒性研究中注意到的基因转录物变化,经认真评价,作为后面病人的临床标记物。基因转录物分析中的变化经过评价,作为与临床状况和症候和其它实验室结果相关的毒性指示物。此外,对个体病人样本和平均病人样本实行减法操作。减法分析着重显示出受治疗病人的任何毒理变化。这是一种非常精细的毒性确定法。减法方法也对临床标记物进行注解。可用减法分析法分析进一步的子组,这包括,举例来说,1)按有害效应的发生与类型分类;2)按剂量分类。
6.12临床研究中的基因转录物成像分析
单基因转录物图象分析(或多基因转录物图象分析)在其它临床研究中也是有用的工具。例如,治疗前后的基因转录物成像分析的差别可以用于对安慰剂治疗和药物治疗的病人的评估。该方法也有效地筛选临床标记物,以备下一步的药物临床应用。
6.13种间比较基因转录物分析
减法方法可用于筛选多种来源的cDNA文库。例如,应用基因转录物分析比较不同物种的同一细胞类型,以筛选特定的差别,诸如解毒酶系统中的差别。这样的检测有助于对一种动物模型的选择与合理性进行确证,这种动物模型用于药物筛选的商业用途或用于人类或动物的药物毒性检测。如果不同种动物间的比较按每一物种列成一栏,则称之为种间比较或动物印迹法。
本发明的实施方案可以采用从微软公司购置的FoxBASE编程语言编写的数据库。本发明的其它实施方案采用其它数据库,诸如随机肽数据库,聚合物数据库,人工合成寡聚物数据库或寡聚核苷酸数据库,它们分别高于在下述文献中描述的类型,即:美国专利5,270,170,1993年12月14日公开,授与Cun等;PCT国际申请公开,标注WO 93 22684,1993年11月11日出版;PCT国际申请公开,标注WO 93 06121,1993年4月11日出版;PCT国际申请公开,标注WO 91 19818;1991年12月26日出版。这四种参考专利(在此引入作为参考)包括教学手段,可应用于本发明其它实施方案的实施。
前文提到的所有参考文献均在此引入作为参考。
本领域的专业人员均明确,不偏离本发明的实质和范围,本发明的上述方法和系统会有许多修改和变通。尽管本发明是与特定的优选实施方案相联系来描述,应当理解为,本发明的权利要求不应过份限于该特定的实施方案。名称(D)                 分布(F)                    定位(Z)                   功能(R)E=严格的              C=非特异的                 N=核                     T=翻译H=同源的              P=细胞/组织特异的          C=细胞基质               L=蛋白质加工O=其它种              U=未知                     K=细胞骨架               R=核糖体蛋白N=不匹配                                          E=细胞表明               O=致癌基因D=非编码基因            种(S)                     Z=细胞内膜               G=GTP结合蛋白U=不可读              H=人                       M=线粒体                 V=病毒成分R=重复DNA             A=猿                       S=分泌的                 Y=激酶/磷酸化酶A=只有poly-A          P=猪                       U=未知                   A=肿瘤抗原相关的V=只是载体            D=狗                       X=其它               I=结合蛋白M=线粒体DNA           V=牛                                                 D=No-结合/转录S=跳读                B=兔                        状态(I)                  B=表面分子/受体I=与Incyte克隆匹配    R=大鼠                     0=当前无兴趣             C=Ca++结合蛋白X=EST匹配             S=仓鼠                     1=无初级分析             S=配体/效应物
                   C=鸡                       2=初级分析已完成         H=应激反应蛋白文库(L)                F=两栖类                   3=全长序列               E=酶U=U937                I=无脊椎动物               4=次级分析               F=铁蛋白M=HMC                 Z=原生动物                 5=组织Northern杂交       P=蛋白酶/抑制物T=THP-1               G=真菌                     6=获得全长               Z=氧化磷酸化H=HUVEC                                                                     Q=糖代谢S=脾                                                                        M=氨基酸代谢L=肺                                                                        N=核酸代谢Y=T细胞与B细胞                                                              W=酯代谢A=腺状的                                                                    K=结构的
                                            表1                          X=其它
                                                                         U=未
表2克隆数15000至20000文库:HUVEC按丰度排序分析的总克隆数:5000319个基因,共1713个克隆
  号数    N  c   条目      s     描述符1    15365    67    HSRPL41        Riboptn  L412    15004    65    NCY015004      INCYTE   0150043    15638    63    NCY015638      INCYTE   0156384    15390    50    NCY015390      INCYTE   0153905    15193    47    HSFIB1         Fibronectin6    15220    47    RRRPL9     R   Riboptn L97    15280    47    NCY015280      INCYTE 0152808    15583    33    M62060         EST HHCH09 (IGR)9    15662    31    HSACTCGR       Actin,gamma10   15026    29    NCY015026      INCYTE   01502611   15279    24    HSEF1AR        Elf 1-alpha12   15027    23    NCY015027      INCYTE   01502713   15033    20    NCY015033      INCYTE   01503314   15198    20    NCY015198      INCYTE   01519815   15809    20    HSCOLL1        Collagenase16   15221    19    NCY015221      INCYTE   01522117   15263    19    NCY015263      INCYTE   01526318   15290    19    NCY015290      INCYTE   01529019   15350    18    NCY015350      INCYTE   01535020   15030    17    NCY015030      INCYTE   01503021   15234    17    NCY015234      INCYTE   01523422   15459    16    NCY015459      INCYTE   01545923   15353    15    NCY015353      INCYTE   01535324   15378    15    S76965         Ptn kinase inhib25   15255    14    HUMTHYB4       Thymosin beta-426   15401    14    HSLIPCR        Lipocortin I27   15425    14    HSPOLYAB       Poly-A bp28   18212    14    HUMTHYMA       Thymosin,alpha29   18216    14    HSMRP1         Motility relat ptn;MRP-1;CD-930   15189    13    HS18D          Interferon induc ptn 1-8D31   15031    12    HUMFKBP        FK506 bp32   15306    12    HSH2AZ         Histone H2A33   15621    12    HUMLEC         Lectin,B-galbp,14kDa34   15789    11    NCY015789      INCYTE   01578935   16578    11    HSRPS11        Riboptn S1136   16632    11    M61984         EST HHCA13 (IGR)37   18314    11    NCY018314      INCYTE   01831438   15367    10    NCY015367      INCYTE   01536739   15415    10    HSIFNIN1       interferon induc mRNA40   15633    10    HSLDHAR        Lactate dehydrogenase41   15813    10    CHKNMHCB       C Myosin heavy chain B42   18210    10    NCY018210      INCYTE   01821043   18233    10    HSRPII140      RNA polymerase II44   18996    10    NCY018996      INCYTE   01899645   15088     9    HUMFERL        Ferritin,light chain46   15714     9    NCY015714      INCYTE   01571447   15720     9    NCY015720      INCYTE   01572048   15863     9    NCY015863      INCYTE   01586349   16121     9    HSET           Endothelin50   18252     9    NCY018252      INCYTE   01825251   15351     8    HUMALBP        Lipid bp,adipocyte52   15370     8    NCY015370      INCYTE 015370
表2继续
   号数    N  c    条目      s    描述符53    15670    8    BTCIASHI     V    NADH-ubiq oxidoreductase54    15795    8    NCY015795         INCYTE    01579555    16245    8    NCY016245         INCYTE    01624556    18262    8    NCY018262         INCYTE    01826257    18321    8    HSRPL17           Riboptn   L1758    15126    7    XLRPL1BRF         Riboptn   L159    15133    7    HSAC07            Actin,beta60    15245    7    NCY015245         INCYTE    01524561    15288    7    NCY015288         INCYTE    01528862    15294    7    HSGAPDR           G-3-PD63    15442    7    HUMLAMB           Laminin receptor,54kDa64    15485    7    HSNGMRNA          Uracil DNA glycosylase65    16646    7    NCY016646         INCYTE    01664666    18003    7    HUMPAIA           Plsmnogen activ gene67    15032    6    HUMUB             Ubiquitin68    15267    6    HSRPS8            Riboptn   S869    15295    6    NCY015295         INCYTE    01529570    15458    6    RNRPS10R     R    Riboptn   S1071    15832    6    RSGALEM      R    UDP-galactose epimerase72    15928    6    HUMAPOJ           Apolipoptn J73    16598    6    HUMTBBM40         Tubulin,beta74    18218    6    NCY018218         INCYTE    01821875    18499    6    HSP27             Hydrophobic ptn p2776    18963    6    NCY018963         INCYTE    01896377    18997    6    NCY018997         INCYTE    01899778    15432    5    HSAGALAR          Galactosidase A,alpha79    15475    5    NCY015475         INCYTE    01547580    15721    5    NCY015721         INCYTE    01572181    15865    5    NCY015865         INCYTE    01586582    16270    5    NCY016270         INCYTE    01627083    16886    5    NCY016886         INCYTE    01688684    18500    5    NCY018500         INCYTE    01850085    18503    5    NCY018503         INCYTE    01850386    19672    5    RRRPL34      R    Riboptn   L3487    15086    4    XLRPL1AR     F    Riboptn   L1a88    15113    4    HUMIFNWRS         tRNA synthetase,trp89    15242    4    NCY015242         INCYTE    01524290    15249    4    NCY015249         INCYTE    01524991    15377    4    NCY015377         INCYTE    01537792    15407    4    NCY015407         INCYTE    01540793    15473    4    NCY015473         INCYTE    01547394    15588    4    HSRPS12           Riboptn   S1295    15684    4    HSEF1G            Elf 1-gamma96    15782    4    NCY015782         INCYTE    01578297    15916    4    HSRPS18           Riboptn   S1898    15930    4    NCY015930         INCYTE    01593099    16108    4    NCY016108         INCYTE    016108100   16133    4    NCY016133         INCYTE    016133
正常单核白细胞与激活的巨噬细胞
15种丰度最大的基因
        正常的                       激活的1延伸因子1α                白细胞介素-1β2核糖核蛋白体磷蛋白         巨噬细胞炎症蛋白-13核糖核蛋白体S8蛋白同系物   白细胞介素-84β-珠蛋白                  淋巴细胞激活基因5铁蛋白H键                  延伸因子-1α6核糖核蛋白体L7蛋白         β-肌动蛋白7核质蛋白                   Rantes T细胞特异性蛋白8核糖核蛋白体S20蛋白同系物  Poly-A结合蛋白9转铁蛋白受体               Osteopontin;nephropontin10 Poly-A结合蛋白           肿瘤坏死因子α11翻译控制的肿瘤ptn         INCYTE克隆01105012核糖核蛋白体S25蛋白       Cu/Zn超氧化物歧化酶13信号识别颗粒SRP9          腺苷酸环化酶(酵母同系物)14组蛋白H2A.Z               NGF相关B细胞激活分子15核糖核蛋白体Ke-3蛋白      蛋白酶Nexin-1,神经酸质衍生表3
表4文库:THP-1减去:HMC按丰度排序分析的总克隆数:73751057个基因,共2151个克隆号数     条目          描述符                     bgfreq rfend   比率10022    HUMIL1       IL 1-beta                      0    131    262.0010036    HSMDNCF      IL-8                           0    119    238.0010089    HSLAG1CDN    Lymphocyte activ gene          0     71    142.0010060    HUMTCSM      RANTES                         0     23    46.00010003    HUMMIP1A     MIP-1                          3    121    40.33310689    HSOP         Osteopontin                    0     20    40.00011050    NCY011050    INCYTE 011050                  0     17    34.00010937    HSTNFR       TNF-alpha                      0     17    34.00010176    HSSOD        Superoxide dismutase           0     14    28.00010886    HSCDW40      B-cell activ,NGF-relat        0     10    20.00010186    HUMAPR       Early resp PMA-induc           0      9    18.00010967    HUMGDN       PN-1,glial-deriv              0      9    18.00011353    NCY011353    INCYTE 011353                  0      8    16.00010298    NCY010298    INCYTE 010298                  0      7    14.00010215    HUM4COLA     Collagenase,type IV           0      6    12.00010276    NCY010276    INCYTE 010276                  0      6    12.00010488    NCY010488    INCYTE 010488                  0      6    12.00011138    NCY011138    INCYTE 011138                  0      6    12.00010037    HUMCAPPRO    Adenylate cyclase              1     10    10.00010840    HUMADCY      Adenylate cyclase              0      5    10.00010672    HSCD44E      Cell adhesion glptn            0      5    10.00012837    HUMCYCLOX    Cyclooxygenase-2               0      5    10.00010001    NCY010001    INCYTE 010001                  0      5    10.00010005    NCY010005    INCYTE 010005                  0      5    10.00010294    NCY010294    INCYTE 010294                  0      5    10.00010297    NCY010297    INCYTE 010297                  0      5    10.00010403    NCY010403    INCYTE 010403                  0      5    10.00010699    NCY010699    INCYTE 010699                  0      5    10.00010966    NCY010966    INCYTE 010966                  0      5    10.00012092    NCY012092    INCYTE 012092                  0      5    10.00012549    HSRHOB       Oncogene rho                   0      5    10.00010691    HUMARF1BA    ADP-ribosylation fctr          0      4     8.00012106    HSADSS       Adenylosuccinate synthetase    0      4     8.00010194    HSCATHL      Cathepsin L                    0      4     8.00010479    CLMCYCA      I Cyclin A                     0      4     8.00010031    NCY010031    INCYTE 010031                  0      4     8.00010203    NCY010203    INCYTE 010203                  0      4     8.00010288    NCY010288    INCYTE 010288                  0      4     8.00010372    NCY010372    INCYTE 010372                  0      4     8.00010471    NCY010471    INCYTE 010471                  0      4     8.00010484    NCY010484    INCYTE 010484                  0      4     8.00010859    NCY010859    INCYTE 010859                  0      4     8.00010890    NCY010890    INCYTE 010890                  0      4     8.00011511    NCY011511    INCYTE 011511                  0      4     8.00011868    NCY011868    INCYTE 011868                  0      4     8.00012820    NCY012820    INCYTE 012820                  0      4     8.00010133    HSI1RAP      IL-1 antagonist                0      4     8.00010516    HUMP2A       Phosphatase,regul 2A          0      4     8.00011063    HUMB94       TNF-induc response             0      4     8.00011140    HSHB15RNA    HB15 gene;new Ig              0      3     6.00010788    NCY001713    INCYTE 001713                  0      3     6.00010033    NCY010033    INCYTE 010033                  0      3     6.00010035    NCY010035    INCYTE 010035                  0      3     6.00010084    NCY010084    INCYTE 010084                  0      3     6.00010236    NCY010236    INCYTE 010236                  0      3     6.00010383    NCY010383    INCYTE 010383                  0      3     6.000
表4继续号数       条目          描述符      bgfreq rfend 比率10450    NCY010450    INCYTE 010450    0    3    6.00010470    NCY010470    INCYTE 010470    0    3    6.00010504    NCY010504    INCYTE 010504    0    3    6.00010507    NCY010507    INCYTE 010507    0    3    6.00010598    NCY010598    INCYTE 010598    0    3    6.00010779    NCY010779    INCYTE 010779    0    3    6.00010909    NCY010909    INCYTE 010909    0    3    6.00010976    NCY010976    INCYTE 010976    0    3    6.00010985    NCY010985    INCYTE 010985    0    3    6.00011052    NCY011052    INCYTE 011052    0    3    6.00011068    NCY011068    INCYTE 011068    0    3    6.00011134    NCY011134    INCYTE 011134    0    3    6.00011136    NCY011136    INCYTE 011136    0    3    6.00011191    NCY011191    INCYTE 011191    0    3    6.00011219    NCY011219    INCYTE 011219    0    3    6.00011386    NCY011386    INCYTE 011386    0    3    6.00011403    NCY011403    INCYTE 011403    0    3    6.00011460    NCY011460    INCYTE 011460    0    3    6.00011618    NCY011618    INCYTE 011618    0    3    6.00011686    NCY011686    INCYTE 011686    0    3    6.00012021    NCY012021    INCYTE 012021    0    3    6.00012025    NCY012025    INCYTE 012025    0    3    6.00012320    NCY012320    INCYTE 012320    0    3    6.00012330    NCY012330    INCYTE 012330    0    3    6.00012853    NCY012853    INCYTE 012853    0    3    6.00014386    NCY014386    INCYTE 014386    0    3    6.00014391    NCY014391    INCYTE 014391    0    3    6.000
表5
*减法输出的主菜单
SET TALK OFF
SET SAFETY OFF
SET EXACT ON
SET TYPEAHEAD TO 0
CLEAR
SET DEVICE TO SCREEN
USE ″SmartGuy:foxBASE+/Mac:fox files:Clones.dbf″
GO TOP
STORE NOMBER TO INITIATE
GO BOTTOM
STCHE NUMBER TO TERMINATE
STORE ′        ′TO Target1
STORE ′        ′TO Target2
STORE ′        ′TO Target3
STORE ′        ′TO Object1
STORE ′        ′TO Object2
STORE ′        ′TO Object3
STORE 0 TO ANAL
STORE 0 TO EMATCH
STORE 0 TO HMATCH
STORE 0 TO CMATCH
STORE 0 TO IMATCH
STORE 0 TO PTF
STORE 1 TO BAIL
DO WHILE .T.
* Program.:Subtraction 2.fmt
* Date....:10/11/94
* Version.: FoxBASE+/Mac,ravision 1.10
* Notes....:Format file Subtraction 2
*
SCREEN 1 TYPE 0 HEADING ″Screen 1″ AT 40,2 SIZE 286,492 PIXELS FONT ″Geneva″,9 COLOR 0,0,0,
@ PIXELS 75,120 TO 178,241 STYLE 3871 COLOR 0,0,-1,24610,-1,8947
@ PIXELS 27,134 SAY ″Subtraction Menu″ STYLE 65536 FONT ″Geneva″,274 COLOR 0,0,-1,-1,-1,-1
@ PIXELS 117,126 GET EMATCH STYLE 65536 FONT ″Chicago″,12 PICTURE ″@*C Exact″ SIZE 15,62 CO
@ PIXELS 135,126 GET HMATCH STYLE 65536 FONT ″Chicago″,12 PICTURE ″@*C Hcmologous″ SIZE 15,1
@ PIXELS 153,126 GET CMATCH STYLE 65536 FONT ″Chicago″,12 PICTURE ″@*C Other spc″SIZE 15,84
@ PIXELS 90,152 SAY ″Matches:″ STYLE 65536 FONT ″Geneva″,12 COLOR 0,0,-1,-1,-1,-1
@ PIXELS 171,126 GET Imatch STYLE 65536 FONT ″Chicago″,12 PICTURE ″@*C Incyte″ SIZE 15,65 CO
@ PIXELS 252,137 GET initiate STYLE 0 FONT ″Geneva″,12 SIZE 15,70 COLOR 0,0,-1,-1,-1,-1
@ PIXELS 252,236 GET terminate STYLE 0 FONT ″Geneva″,12 SIZE 15,70 COLOR 0,0,-1,-1,-1,-1
@ PIXELS 252,35 SAY ″Include clones″ STYLE 65536 FONT ″Geneva″,12 COLOR 0,0,-1,-1,-1,-1
@ PIXELS 252,215 SAY ″->″ STYLE 65536 FONT ″Geneva″,14 COLOR 0,0,-1,-1,-1,-1  
@ PIXELS 198,126 GET PTF STYLE 65536 FONT ″Chicago″,12 PICTURE ″@*C .Print to file″SIZE 15,9
@ PIXELS 90,9 TO 181,109 STYLE 3871 COLOR 0,0,-1,-25600,-1,-1 
@ PIXELS 90,288 TO 181,397 STYLE 3871 COLOR 0,0,-1,-25600,-1,-1
@ PIXELS 81,296 SAY ″Background:″STYLE 65536 FONT ″Geneva″,270 COLOR 0,0,-1,-1,-1,-1.
@ PIXELS 45,135 GET ANAL STYLE 65536 FONT ″Chicago″,12 PICTURE ″@*R Overall;Function″ SIZE 4
@ PIXELS 81,26 SAY ″Target:″ STYLE 65536 FONT ″Geneva″,270 COLOR 0,0,-1,-1,-1,-1
@ PIXELS 108,20 GET target1 STYLE 0 FONT ″Geneva″,9 SIZE 12,79 COLOR 0,0,-1,-1,-1,-1
@ PIXELS 135,20 GET target2 STYLE 0 FONT ″Geneva″,9 SIZE 12,79 COLOR 0,0,-1,-1,-1,-1
@ PIXELS 162,20 GET target3 STYLE 0 FONT ″Geneva″,9 SIZE 12,79 COLOR 0,0,-1,-1,-1,-1
@ PIXELS 108,299 GET object1 STYLE 0 FONT ″Geneva″,9 SIZE 12,79 COLOR 0,0,-1,-1,-1,-1
@ PIXELS 135,299 GET object2 STYLE 0 FONT ″Geneva″,9 SIZE 12,79 COLOR 0,0,-1,-1,-1,-1
@ PIXELS 162,299 GET object3 STYLE 0 FONT ″Geneva″,9 SIZE 12,79 COLOR 0,0,-1,-1,-1,-1
@ PIXELS 276,324 GET Bail STYLE 65536 FONT ″Chicago″,12 PICTURE ″@*R Rum;Bail out″SIZE 4112
*
* EOF:Subtraction 2.fmt
  IF Bail=2
  CLEAR
  CLOSE DATABASES
  USE ″SmartGuy:FoxBASE+/Mac:fox files:clonea.dbf″
  SET SAFETT ON
  SCREEN 1 OFF
  RETURN
				
				<dp n="d33"/>
   ENDIF
  STORE VAL(SYS(2)) TO STARTIME
  STORE UPPER(Target1) TO Target1
  STORE UPPER(Target2) TO Target2
  STORE UPPER(Target3) TO Target3
  STORE UPPER(Object1) TO Object1
  STORE UPPER(Object2) TO Object2
  STORE UPPER(Object3) TO Object3
  clear
  SET TALX ON
  GAP=TERMINATE-INITIATE+1
  GO INITIATE
  COPY NEXT GAP FIELDS NUMBER,library,D,F,Z,R,ENTRY,S,DESCRIPTOR,START,RFEND,I TO TEMPNUM
  USE TEMPNUM
  CCONT TO TOT
  COPY TO TEMPRED FOR D=′E′,OR.D=′O′.OR.D=′H′.OR.D=′N′.OR.D=′I′
  USE TEMPRED
  .
  IF Ematch=0 .AND. Hmatch=0 .AND. Omatch=0 .AND. IMATCH=0 
  COPY TO TEMPDESIG
  ELSE
  COPY STRUCTURE TO TEMPDESIG
  USE TEMPDESIG
   IF Ematch=1
   APPEND FROM TEMPNUM FOR D=′B′

  ENDIF

  IF Hmatch=1

  APPEND FROM TEMPNUM FOR D=′H′

  ENDIF

  IF Omatch=1

  APPEND FROM TEMPNUM FOR D=′O′

  ENDIF

  IF Imatch=1

  APPEND FROM TEMPNUM FOR D=′I′.OR.D=′X′
  *.OR.D=′N′

  ENDIF
  ENDIF
  COUNT TO STARTOT
  COPY STRUCTURE TO TEMPLIB
  USE TEMPLIB  
   APPEND FROM TEMPDESIG FOR library=UPPER(target1)
   IP target2<>′               ′
   APPEND FROM TEMPDESIG FOR library=UPPER(target2)
   ENDIF
   IF target3<>′          ′
   APPEND FROM TEMPDESIG FOR library=DPPER(target3)
   ENDIF
  COUNT TO ANALTCT
  USE TEMPDESIG
  COPY STRUCTURE TO TEMPSUB
  USE TEMPSUB

  APPEND FROM TEMPDESIG FOR library=UPPER(Object1)

  IP target2<>′            ′

  APPEND FROM TEMPDESIG FOR library=UPPER(Object2)

  ENDIF

  IF target3<>′            ′

  APPEND FROM TEMPDESIG FOR library=UPPER(Object3)

  ENDIF
  COUNT TO SUBTRACTOT
  SET TALX OFF
  ********************************************************************
  * COMPRESSION SUBRCUTINE A
  ?′COMPRESSING QUERY LIBRARY′
  USE TEMPLIB
				
				<dp n="d34"/>
SORT ON ENTRY,NUMBER TO LIBSORT
USE LIBSORT
COUNT TO IDGENE
REPLACE ALL RFEND WITH 1
MARK1=1
SW2=0
DO WHILE SW2=0 ROLL
   IF MARK1>=IDGENE
   PACK
   COUNT TO AUNIQUE
   SW2=1
   LOOP
   ENDIF
GO MARK1
DUP=1
STORE ENTRY TO TESTA
STORE D TO DESIGA
SW=0
DO WHILE SW=0 TEST
SXIP
STORE ENIRY TO TESTB
STORE D TO DESIGB
   IF TESTA=TESTB,AND.DESIGA=DESIGB
   DELETE
   DUP=DUP+1
   LOOP
   ENDIF
GO MARK1
REPLACR RFEND WITH DUP
MARK1=MARK1+DUP
SW=1
LOOP
ENDDO.TEST
LOOP
ENDDO ROLL
SORT ON RFEND/D,NUMBER TO TEMPTARSORT
USE TEMPTARSORT
*REPLACE ALL START WITH RFEND/IDGENE=10000
COUNT TO TEMPTARCO
*****************************************************************
* COMPRESSION SUBRCUTINE 3
? ′COMPRESSING TARGET LIBRARY′
USE TEMPSUB
SORT ON ENTRY,NUMBER TO SUBSORT
USE SUBSORT
COUNT TO SUBGENE
REPLACE ALL RFEND WITH 1
MARK1=1
SW2=0
DO WHILE SW2=0 ROLL
   IF MARK1>=SUBGENE
   PACK 
   COUNT TO BUNIQUE
   SW2=1
   LOOP
   ENDIF
GO MARK1
DUP=1
STORE ENIRY TO TESTA
STORE D TO DESIGA
SW=0
DO WHILE SW=0 TEST
SKIP
STORE ENTRY TO TESTE
STORE D TO DESIGB
   IF TESTA=TESTB.AND.DESIGA=DESIGB
				
				<dp n="d35"/>
  DELETE

  DUP=DUP+1

  LOOP

  ENDIF
 GO MARK1
 REPLACE RFEND WITH DUP
 MARK1=MARK1+DUP
 SW=1
 LOOP
 ENDDO TEST
 LOOP
 ENDDO ROLL
 SORT ON RFEND/D,NUMBER TO TEMPSUBSORT
 USE TEMPSUBSORT
 *REPLACE ALL START WITH RFEND/IDGENE*10000
 COUNT TO TEMPSUBCO
  *******************************************************************
 *FUSION ROUTINE
 ?′SUBTRACTING LIBRARIES′
 USE SUBTRACTION
 COPY STRUCTURE TO CRUNCHER
 SELECT 2
 USE TEMPSUBSORT
 SELECT 1
 USE CRUNCHER
 APPEND FROM TEMPTARSORT
 COUNT TO BAILOUT
 MARK=0
 DO WHILE .T.
 SELECT 1    
 MARK=MARK+1

  IF MARK>BAILOUT

  EXIT

  ENDIF
 GO MAR
 STORE ENTRY TO SCANNER
 SELECT 2
 LOCATE FOR ENTRY=SCANNER
 IF FOUND( )
 STORE RFEND TO BIT1 
 STORE RFEND TO BIT2
 PLSE              
 STORE 1/2 TO BIT1
 STORE 0 TO BIT2
 ENDIF
 SELECT 1
 REPLACE BGFREQ WITH BIT2
 REPLACE ACTUAL WITH BIT1
 LOOP
 ENTDO
 SELECT 1
 REPLACE ALL RATIO WITH RFEND/ACTUAL
 ? ′DOING PINAL SORT BY RATIO′
 SORT ON RATIO/D,BGFREQ/D,DESCRIPTOR TO FINAL
 USE FINAL
 **************************************************************
 set talk off
 DO CASE
 CASE PTF=0
 SET DEVICE TO PRINT
 SET PRINT ON
 ELECT
 CASE PIF=1
 SET ALTERNATE TO ″Adenoid.Patent Figures:Subtraction.txt″
				
				<dp n="d36"/>
SET ALTERNATE ON
ENDIASE
STORE VAL(SYS(2)) TO FINTIME
IF FINTIME<STARTIME
STORE FINTINE+86400 TO FINTIME
ENDIF
STORE FINTIME-STARTIME.TO COMPSEC
STORE COMPSEC/60 TO COMPMIN
********************
SET MARGIN TO 10
@1,1 SAY ″Library Subtraction Analysis″STYLE 65536 FONT ″Geneva″,274 COLOR 0,0,0,-1,-1,-1
?
?
?
?
?date()
??′   ′
??TIME()
?′Clone numbers′
??STR(INTTIATE,5,0)
??STR(TERMINATE,6,0)
?′Libraries:′
?Target1
IF Target2<>′
??′,′
??Target2
ENDIF
IF Target3<>′
??′,′
??Target3
ENDIF
?′Subtracting:
?Object1
IF Object2<>′
??′,′
??Object2
ENDIF
IF Object3<>′
??′,′
??Object3
ENDIF 
?′Designationser′
IF Ematch=0.AND.Hmatch=0.AND.Omatch=0.AND.IMATCH=0
??′All′
ENDIF
IF Ematch=1
??′Exact,′
ENDIF
IF Hmatch=1
??′Human,′
ENDIF
IF Omatch=1
??′Other sp.′
ENDIF
IF Imatch=1
??′INCYTE′
ENDIF
IF ANAL=1
?′Sorted by ABUNDANCE′
ENDIF
IF ANAL=2
?′Arranged by FUNCTION′
ENDIF
				
				<dp n="d37"/>
?′Total clones represented:′
??STR (TOT,5,0)
?′Total clones analyzed:′
??STR(STARTOT,5,0)
?′Total. computation.time:
??STR(COMPMING,5,2)
??′minutes′
?
?′d=designation f=distribution z=location r=function s=species i=inte
?
*******************************************
SCREEN 1 TYPE 0 HEADING ″Screen 1″ AT 40,2 SIZE 286,492 PIXELS FONT ″Geneva″,9 COLOR 0,0,0,
DO CASE
CASE ANAL=1
??STR(AUNTQUE,4,0)
??′genes,for a total of ′
??STR(ANALTOT,4,0)
??′clones′
?
SCREEN 1 TYPE 0 HEADING ″Screen 1″ AT 40,2 SIZE 286,492 FIXELS FONT ″Geneva″,7 COLOR 0,0,0,
list OFF fiels number ,D,F,Z,R,ENTRY,S,DESORIPTOR,RFEND,RATIO,I
SET PRINT OFF
CLOSE DATABASES
USE ″SmartGuy:FoxBASE+/Mac:fox files:clones.dbf′
CASE.ANAL=2
* arrang3/function
SET PRINT ON
SET HEADING ON
SOREEN 1 TYPE.0 HEADING ″Screen 1″AT 40,2 SIZE 286,492 FIXELB FONT ″Helvetica″,268 COLOR 0
?
?′                                   BINDING PROTEINS′
?
SCREEN1 TYPE 0 HEADING ″Screen 1″AT 40,2 SIZE,482 PIXELS FONT ″Helvetica″,265 COLOR 0
?′Surface molscules and receptors:′
SCREEN 1 TYPE 0 HEADING ″Screen 1″AT” AT 40,2 SIZE 286,492 PIXELS  SONT ″Geneva″,7 COLOR 0,0,0,
list OFF fields number,D,F,Z,R,ENTRY,S,DESORIPTOR,BGFREQ,RFEND,RATIO,I FOR R=′B′
SCREEN 1 TYPE 0 HEADING ″Screen 1″AT 40,2 SIZE 286,492 PIXELS .FONT ″Helvetica″,265 COLOR 0
?′Calcium-binding proteins:′
SCREEN 1 TYPE 0 HEADING ′Screen 1′AT 40,2 SIZE 286,492 PIXELS FONT ″Geneva″,7 COLOR 0,0,0,
list OFF fields number,D,F,Z,R,ENTRY,S,DESCRIPTOR,BGFREQ,RFEND,RATIO,I FOR R=′C′
SCREEN 1 TYPE 0 HEADING ″Screen 1″AT 40,2 SIZE 286,492 PIXELS FONT ″Helvetica″,265 COLOR 0
?′Ligands and effectors:′ 
SCREEN 1 TYPE 0 HEADING ″Screen 1″ AT 40,2 SIZE 286,492 PIXELS FONT ″Geneva″,7 COLOR 0,0,0,
list OFF fields number,D,F,Z,R,ENTRY,S,DESCRIPTOR,BGFREQ,RFEND;RATIO,I FOR R=′S′
SCREEN 1 TYPE 0 HEADING ′Screen 1′AT 40,2 SIZE 286,492 PIXELS FONT ″Helvetica″,265 COLOR 0
?′Other binding protains:′
SCREEN 1 TYPE 0 HEADING ″Screen 1″ AT 40,2 SIZE 286,492 PIXELS FONT ″Geneva″,7 COLOR 0,0,0,
list OFF fields number,D,F,Z,R,ENTRY,S,DESCRIPTOR,BGFREQ,RFEND,RATIO,I FOR R=′I′
?
SCREEN 1 TYPE 0 HEADING ″Screen 1″AT 40,2 SIZE 286,492 PIXELS FONT ″Helvetica″,268 COLOR 0
? ′                                      ONCOGENES′
?
SCREEN 1 TYPE 0 HEADING ′Screen 1′ AT 40,2 SIZE 286,492 PIXELS FONT ″Helvetica″,265 COLOR 0
?′General oncogenes:′
SCREEN 1 TYPE 0 HEADING ″Screen 1″AT 40,2 SIZE 286,492 PIXELS FONT ″Geneva″,7 COLOR 0,0 0,
list OFF fields number ,D,F,Z,R,ENTRY,S,DESCRIPTOR,BGFREQ,RFEND,RATIO,I FOR R=′O′
SCREEN 1 TYPE 0 HEADING ′Screen 1′AT 40,2 SIZE 286,492 PIXELS FONT ″Helvetica″,265 COLOR 0
?′GTP-binding proteins:′
SCREEN 1 TYPE 0 HEADING ″Screen 1″ AT 40,2 SIZE 286,492 PIXELS FONT ″Geneva″,7 COLOR 0,0,0,
list OFF fields number,D,F,Z,R,ENTRY,S,DESCRIPTOR,BGFREQ,RFEND,RATIO,I FOR R=′G′
				
				<dp n="d38"/>
SCREEN 1 TYPE 0 HEADING ″Screen 1″ AT 40,2 SIZE 286,492 PIXELS FONT “Helvetica”,265 COLOR 0
?′Viral elements:′Page,7 of 38
SCREEN 1 TYPE 0 HEADING ″Screen 1″ AT 40,2 SIZE 286,492 PIZELS FONT ″Geneva,7 COLOR 0,0,0,
list OFF fields number,D,F,Z,R,ENTRY,S,DESCRIPTOR,BGFREQ,RFEND,RATIO,I FOR R=′V′
SCREEN 1 TYPE 0 HEADING ″Screen 1″ AT 40,2 SIZE 286,492 PIXELS FONT ″Helvetica″,255 COLOR 0
?′Kinases and Phosphatases:′
SCREEN 1 TYPE 0 HEADING ″Screen 1″ AT 40,2 SIZE 286,492 PIXELS FONT ″Geneva″,7 COLOR 0,0,0,
list OFF fields number,D,F,Z,R,ENTRY,S,DESCRIPTOR,BGFREQ,RFIXD,RATIO,I FOR R=′Y′
SCREEN 1 TYPE 0 HEADING ″Screen 1″ AT 40,2 SIZE 286,492 PIXELS FONT ″Helvetica″,265 COLOR 0
?′Tumor-related antigens:′
SCREEN 1 TYPE 0 HEADING ″Screen 1″AT 40,2 SIZE 286,492 PIXELS FONT ″Geveva″,7 COLOR 0,0,0,
list OFF fields number,D,F,Z,R,ENTRY,S,DESCRIPTOR,BGFREQ,RFEND,RATIO,I FOR R=′A′
?
SCREEN 1 TYPE 0 HEADING ″Screen 1″ AT 40,2 SIZE 286,492 PIXELS FONT ″Helvetica″,268 COLOR 0
?′               PROTEIN SYNTHETIC MACHINERY PROTEINS′
?                                                                
SCREEN 1 TYPE 0 HEADING ″Screen 1″ AT 40,2 SIZE 286,492 PIXELS FONT ″Helvetica″,265 COLOR 0
?′Transcription and Numcleic Acid-binding proteins:′
SCREEN 1 TYPE 0 HEADING ″Screen 1″ AT 40,2 SIZE 286,492 PIXELS FONT ″Geneva″,7 COLOR 0,0,0,
list OFF fields number,D,F,Z,R,ENTRY,S,DESCRIPTOR,BGFREQ,RFEND,RATIO,I FOR R=′D′
SCREEN 1 TYPE 0 HEADING ″Screen 1″ AT 40,2 SIZE 286,492 PIXELS FONT ″Helvetica″ 265 COLOR 0
?′Translation:′
SCREEN 1 TYPE 0 HEADING ″Screen 1″ AT 40,2 SIZE 286,492 PIXELS FONT″Geneva″,7 COLOR 0,0,0,
list OFF fields number,D,F,Z,R,ENTRY,S,DESCRIPTOR,BGFREQ,RFEND,RATIO,I FOR R=′T′
SCREEN 1 TYPE 0 HEADING ″Screen 1″ AT 40,2 SIZE 286,492 PIXELS FONT ″Helvetica″,265 COLOR 0
?′Riboscmal proteins:′
SCREEN 1 TYPE 0 HEADING ″Screen 1″AT 40,2 SIZE 285,492 PIXELS FONT ″Geneva″,7 COLOR 0,0,0,
list OFF fields number,D,F,Z,R,ENTRY,S,DESCRIPTOR,BGFREQ,RFENT,RATIO,I FOR R=′R′
SCREEN 1 TYPE 0 HEADING ″Screen 1″AT 40,2 SIZE 286,492 PIXELS FONT ″Helvetica″,265 COLOR 0
?′Protein processing:′
SCREEN 1 TYPE 0 HEADING ″Screen 1″ AT 40,2 SIZE 286,492 PIXELS  FONT ″Geneva″,7 COLOR 0,0,0,
list OFF fields number,D,F,Z,R,ENTRY,S,DESCRIPTOR,BGFREQ,RATIO,I FOR R=′L ′
?
SCREEN 1 TYPE 0 HEADING ′Screen 1′ AT 40,2 SIZE 286,492 PIXELS FONT ″Helvetica″ ,268 COLOR 0
?
?′                                   ENZYMES′
?
SCREEN 1 TYPE 0 HEADING ′Screen 1′AT 40,2 SIZE 286,492 PIXELS FONT ″Helvetica″ 265 COLOR 0
?′Ferroproteins:′
SCREEN 1 TYPE 0 HEADING ″Screen 1″AT 40,2 SIZE 286,492 PIXELS FONT ″Geneva″,7 COLOR 0,0,0,
list OFF fields number,D,F,Z,R,ENTRY,S,DESCRIPTOR,BGFREQ,RFEND,RATIO,I FOR R=′F′
SCREEN 1 TYPE 0 HEADING ″Screen 1″AT 40,2 SIZE 286,492 PIXELS FONT ″Helvetice″,265 COLOR 0
?′Proteases and innibitors:′
SCREEN 1 TYPE 0 HEADING ″Screen 1″AT 40,3 SIZE 286,492 PIXELS FONT ″Geneva″,7 COLOR 0,0,0,
list OFF fields number,D,P,Z,R,ENTRY,S,DESCRIPTOR,BGFREQ,RFEND,RATIO,I FOR R=′P′
SCREEN 1 TYPE 0 HEADUBG ″Screen 1″ AT 40,2 SIZE 296,492 PIXELS FONT ″Helvetica″,265 COLOR 0
?′Oxidative phosphorylation:′ 
SCREEN 1 TYPE HEADING ″Screen 1″ AT 40,2 SIZE 286,492 PIXELS FONT ″Geneva″,7 COLOR 0,0,0,
list OFF fields number,D,F,Z,R,ENTRY,S,DESCRIPTOR,BGFREQ,RFEND,RATIO,I FOR R=′Z′
SCREEN 1 TYPE 0 HEADING ″Screen 1″ AT 40,2 SIZE 286,492 PIXELS FONT ″Helvetica″,265 COLOR 0
?′Sugar metabolism:′
SCREEN 1 TYPE 0 HEADING ″Screen 1″ AT 40,2 SIZE 286,492 PIXELS FONT ″Geneva″,7 COLOR 0,0,0,
list OFF fields number,D,F,Z,R,ENTRY,S,DESCRIPTOR,BGFREQ,RFEND,RATIO,I FOR R=′Q′
SCREEN 1 TYPE 0 HEADING ″Screen 1″ AT 40,2 SIZE 286,492 PIXELS FONT ″Helvetica″,255 COLOR 0
?′Amino acid metabolism:′
SCREEN 1 TYPE 0 HEADING ″Screen 1″ AT 40,2 SIZE 286,492 PIXELS FONT ″Geneva″,7 COLOR 0,0,0,
				
				<dp n="d39"/>
list OFF fields number,D,F,Z,R,ENTRY,S,DESCRIPTOR,BGFREQ,RFEND,RATIO,I FOR R=′M′
SCREEN 1 TYPE 0 HEADING ″Screen 1″ AT 40,2 SIZE 286,492 PIXELS FONT ″Geneva″,7 COLOR 0,0,0,
?′Nucleic acid metabolism:′
SCREEN 1 TYPE 0 HEADING ″Screen 1″ AT 40,2 SIZE 286,492 FIXELS FONT ″Geneva″,7 COLOR 0,0,0
list OFF fields number,D,F,Z,R,ENTRY,S,DESCRIPTOR,BGFREQ,RFEND,RATIO,I FOR R=′N′
SCREEN 1 TYPE 0 HEADING ″Screen 1″ AT 40,2 SIZE 286,492 PIZELS FONT ″Helvetica″,265 COLOR O
?′Lipid metabolism:′
SCREEN 1 TYPE 0 HEADING ″Screen 1″ AT 40,2 SIZE 286,492 PIXELS FONT ″Geneva″,7 COLOR 0,0,0,
list OFF fields number,D,F,Z,R,ENTRY,S,DESCRIPTOR,BGFREQ,RFEND,RATIO,I FOR R=′W′
SCREEN 1 TYPE 0 HEADING ″Screen 1″ AT 40,2 SIZE 286,492 PIXELS FONT ″Helvetica″,265 COLOR 0
?′Other snzymss:′
SCREEN 1 TYPE 0 HEADING ″Screen 1″ AT 40,2 SIZE 286,492 PIXELS  FONT ″Geneva″,7 COLOR 0,0,0,
list OFF fields number,D,F,Z,R,ENTRY,S,DESCRIPTOR,BGFREQ,RFEND,RATIO,I FOR R=′E′
?
SCREEN 1 TYPE 0 HEADING ″Screen 1″ AT 40,2 SIZE 286,492 PIXELS FONT ″Helvetica″,268 COLOR 0
?
?                      MISCELLANEOUS CATEGORIES′
?
SCREEN 1 TYPE 0 HEADING ″Screen 1″ AT 40,2 SIZE 286,492 PIXELS FONT ″Helvetica″,265 COLOR 0
?′Stress response:′
SCREEN 1 TYPE 0 HEADING ″Screen 1″ AT 40,2 SIZE 286,492 PIXELS FONT ″Geneva″,7 COLOR 0,0,0,
list OFF fields number,D,F,Z,R,ENTRY,S,DESCRIPTOR,BGFREQ,RFEND,RATIO,I FOR R=′H′
SCREEN 1 TYPE 0 HEADING ″Screen 1″ AT 40,2 SIZE 286,492 PIXELS FONT ″Helvetica″,265 COLOR 0
?′Structural:′
SCREEN 1 TYPE 0 HEADING ″Screen 1″ AT 40,2 SIZE 286,492 PIXELS FONT ″Geneva″,7 COLOR 0,0,0,
list OFF fields number,D,F,Z,R,ENTRY,S,DESCRIPTOR,BGFREQ,RFEND,RATIO,I FOR R=′K′
SCREEN 1 TYPE 0 HEADING ″Screen 1″ AT 40,2 SIZE 286,492 PIXELS FONT ″Helvetica″,265 COLOR 0
?′Other clones:′
SCREEN 1 TYPE 0 HEADING ″Screen 1″ AT 40,2 SIZE 286,492 PIXELS FONT ″Geneva″,7 COLOR 0,0,0
list OFF fields number,D,F,Z,R,ENTRY,S,DESCRIPTOR,BGFREQ,RFEND,RATIO,I FOR R=′X′
SCREEN 1 TYPE 0 HEADING ″Screen 1″
SCREEN 1 TYPE 0 HEADING ″Screen 1″ AT 40,2 SIZE 286,492 PIXELS FONT ″Helvetica″,265 COLOR 0
?′Clones of unknow function:′
SCREEN 1 TYPE 0 HEADING ″Screen 1″AT 40,2 SIZE 286,492 PIXELS FONT ″Geneva″,7 COLOR 0,0,0,
list OFF fiields number,D,F,Z,R,ENTRY,S,DESCRIPTOR,BGFREQ,RFEND,RATIO,I FOR R=′U′
ENDCASE
DO ″Test print.prg″
SET PRINT OFF
SET DEVICE TO SCREEN
CLOSE DATABASES
ERASE TEMPLIB,DBF
ERASE TEMPNUM,DBF
ERASE TEMPDESIG,DBF
SET MARGIN TO 0
CLEAR
LOOP
ENDDO
				
				<dp n="d40"/>
″Northern (single),version 11-25-94
close databases
SET TALX OFF
SET PRINT OFF
SET EXACT OFF
CLEAE
STORE ′         ′TO Eobject
STORE′
STORE 0 TO Numb
STORE 0 TO Zog
STORE 1 TO Bail
DO WHILE .T.
*Program.:Northern(single).fmt
*Date....:8/8/94
* Version.:.FoxBASE+/Mac,revision 1.10
* Notes....:Format file Northern (single)
*
SCREEN 1 TYPE 0 HEADING ″Screen 1″ AT 40,2 SIZE 286,492 PIXELS  FONT″Geneva″,12 COLOR 0,0,0
@ PIXELS 15,81 TO 46,397 STYLE 28447 COLOR 0,0,-1,-25600,-1,-1
@ PIXELS 89,79 TO 192,422 STYLE 28447 COLOR 0,0,0,-25600,-1,-1
@ PIXELS 115,98 SAY ″Entry #:″ STYLE 65536 FONT ″Geneva″,12 COLOR 0,0,0,-1,-1,-1
@ PIXELS 115,173 GET Eobject STYLE 0 FONT ″Geneva″,12 SIZE 15,142 COLOR 0,0,0,-1,-1,-1
@ PIXELS 145,89 SAY ″Description″ STYLE 65536 FONT ″Geneva″,12 COLOR 0,0,0,-1,-1,-1 
@ PIXELS 145,173 GET Dobject STYLE 0 FONT ″Geneva″,12 SIZE 15,241 COLOR 0,0,0,-1,-1,-1
@ PIXELS 35,89 SAY ″Single Northern search screen″ STYLE 65536 FONT ″Geneva″,274 COLOR 0,0,-
@ PIXELS 220,162 GET Eail STYLE 65536 FONT ″Chicago″,12 PICTURE ″@*R Continue;Bail out″ SIZE
@ PIXELS 175,98 SAY ″Clone #:″ STYLE 65536 FONT ″Geneva″,12 COLOR 0,0,0,-1,-1,-1
@ PIXELS 175,173 GET Numb STYLE 0 FONT ″Geneva″,12 SIZE 15,70 COLOR 0,0,0,-1,-1,-1
@ PIXELS 80,152 SAY ″Enter any ONE of the following:″ STYLE 65536 FONT ″Geneva″,12 COLOR -1,
*
*EOF:Northern(single),fmt
READ
IF Bail=2
CLEAR
screen 1 off
RETURN
INDIF
USE ″SmartGuy:FoxBASE+/Mac:Fox files:Lookup,dbf″
SET TALK ON
IF Eobjeot<>′
STORE UPPER(Eobject) to Eobject
SET SAFETY OFF
SORT ON Entry TO ″Lookup entry,dbf″
SET SAFETY ON
USE ″Lookup entry,dbf″
LOCATE FOR Look=Eobject
IF .NOT,FOUND<>
CLEAR
LOOP
ENDIF
EROWSE
STORE Entry TO Searchval
CLOSE DATABASES
ERASE ″Lookup entry,dbf″
ENDIF
IF Dobject<>′
SET EXACT OFF
SET SAFETY OFF
SORT ON descriptor TO ″Lookup descriptor.dbf″
SET SAFETY On
USE ″Lookup descriptor,dbf″
LOCATE FOR UPPER(TRIM(descriptor))=UPPER(TRIM(Dobject)) 
IF .NOT.FOUND( )
CLEAR
				
				<dp n="d41"/>
LOOP
ENDIF
EROWSE
STORE Emtry TO Searchval
ERASE ″Lookup descriptor,dbf″
SET EXACT ON
ENDIF
IF Numb<>0
USE ″SmartGuy:FoxBASE+/Mac:Fox files:clones,dbf″
Go Numb
BROWSE
STORE Entry TO Searchval
ENDIF
CLEAR
?′Northern enalysis for entry′
??Searchval
?
?′Enter Y to proceed
WAIT TO OK
CLEAR
IF UPPER(OK)<>′Y′
screen 1 off
RETURN
ENDIF
* COMPRESSION SUBROUTINE FOR Library,dbf
?′Compressing the Libraries file now...′
USE ″SmartGuy:FoxBASE+/Mac:Fox files:libraries.dbf′
SET SAFETY OFF
SORT ON library TO ′Compressed libraries.dbf″
* FOR entered>0
SET SAFETY ON
USE ″Compressed libraries.dbf″
DELETE FOR entered=0
PACK
COUNT TO TOT
MARK1=1
SW2=0 
DO WHILE SW2=0 ROLL

  IF MARK1>=TOT

  PACK

  SW2=1

  ENDIF
GO MARK1
STORE library TO TESTA
SKIP
STORE Library TO TESTB
IF TESTA=TESTB
DELETE
ENDIF
MARK1=MARK1+1
LOOP
ENDDO ROLL
* Northern analysis
CLEAR
?′Doing the northern now...
SET TALK ON
USE ″SmartGuy:FoxBASE+/Mac:Fox files:clones.dbf″
SET SAFETY OFF
COPY TO ″Hits.dbf″entry=searchval
SET SAFETY ON
				
				<dp n="d42"/>
* MASTER ANALYSIS 3;VERSION 12-9-94
* Master menu for analysis output
CLOSE DATABASES
SET TALK OFF
SET SAFETY OFF
CLEAR
SET DEVICE TO SCREEN
SET DEFALLT TO ″SmartGuy:FoxBASE+/Mac:fox files:Output programs:″
USE ″SmartGuy:FoxBASE+/Mac:fox files:Clones.dbf″
GO TOP
STORE NUMBER TO INITIATE
GO BOTTOM
STORE NUMBER TO TERMINATE
STORE 0 TO ENTIRE
STORE 0 TO CONDEN
STORE 0 TO ANAL
STORE 0 TO EMATCH
STORE 0 TO HMATCH
STORE 0 TO OMATCH
STORE 0 TO IMATCH
STORE 0 TO XMATCH
STORE 0 TO PRINTON
STORE 0 TO PTF
DO WHILE .T.
*Program.:Master analysis.fmt
* Date....:12/9/94
* Version.:FoxBASE+/Mac,revision 1.10
* Notes....:Format file Master analysis
*
SCREEN 1 TYPE 0 HEADING ″Screen 1″ AT 40,2 SIZE 286,492 PIXELS FONT ″Ganeva″,9 COLOR 0,0,0,
@ PIXELS 39,255 TO 277,430 STYLE 28447 COLOR 0,0,-1,-25600,-1,-1
@ PIXELS 75,120 TO 178,241 STYLE 3871 COLOR 0,0,-1,-25600,-1,-1
@ PIXELS 27,98 SAY ″Customized Output Menu″ STYLE 65536 FONT ″Geneva″,274 COLOR 0,0,-1,-1,-1
@ PIXELS 45,54 GET conden STYLE 65536 FONT “Chicago”,12 PICTURE ″@*C Condensed format″ SIZE
@ PIXELS 54,261 GET anal STYLE 65536 FONT ″Chicago″,12 PICTURE ″@*RV Sort/number;Sort/entry;
@ PIXELS 117,126 GET EMATCH STYLE 65536 FONT ″Chicago″ ,12 PICIURE ″@*C Exact″SIZE 15,62 CO
@ PIXELS 135,126 GET HMATCH STYLE 65536 FONT ″Chicago″,12 PICTURE ″@*C Homologous″ SIZE 15,1
@ PIXELS 153,126 GET OMATCH STYLE 65536 FONT ″Chicago″,12 PICTURE ″@*C Other spc″ SIZE 15,84
@ PIXELS 90,152 SAY ″Matches:″ STYLE 65536 FONT ″Geneva″,268 COLOR 0,0,-1,-1,-1,-1
@ PIXELS 63,54 GET PRINTON STYLE 65536 FONT ″Chicago″,12 PICTURE ″@*C Include clone listing″
@ PIXELS 171 126 GET Imatch STYLE 65536 FONT ″Chicago″ ,12 PICTURE ″@*C Incyte″ SIZE 15,65 CO
@ PIXELS 252 146 GET initiate STYLE 0 FONT ″Geneva″,12 SIZE 15,70 COLOR 0,0,-1,-1,-1,-1
@ PIXELS 270 146 GET terminate STYLE 0 FONT ″Geneva″,12 SIZE 15,70 COLOR 0,0,-1,-1,-1,-1
@ PIXELS 234,134 SAY ″Include clones″STYLE 65536 FONT ″Geneva″,12 COLOR 0,0,-1,-1,-1,-1
@ PIXELS 270 125 SAY ″->″ STYLE 65536 FONT ″Geneva″,14 COLOR 0,0,-1,-1,-1,-1
@ PIXELS 198 126 GET PIF STYLE 65536 FONT ″Chicago″,12 PICTURE ″@*C Print to file″ SIZE 15,9
@ PIXELS 189 0 TO 257,120 STYLE 3871 COLOR 0,0,-1,-25600,-1,-1
@ PIXELS 209 8 SAY ″Library selection″ STYLE 65536 FONT ″Geneva″,266 COLOR 0,0,-1,-1,-1,-1
@ PIXELS 227 18 GET ENTIRE STYLE 65536 FONT ″Chicago″,12 PICTURE ″@*RV All;Selected″ SIZE 16
*
* EOF:Master analysis.fmt
READ
   IF ANAL=9
   CLEAR
   CLOSE DATAEASES
   ERASE TEMPMASTER,DBF
   USE ″SmartGuy:FoxBASE+/Mac:fox files:clones.dbf″
   SET SAFETY ON
   SCREEN 1 OFF
   RETURN
   ENDIF
clear
?INITIATE
?TERMINATE
?CONDEN
?ANAL
				
				<dp n="d43"/>
?ematch
?Hmatch
?Cmatch
?IMATCH
SET TALK ON
   IF ENTIRE=2
USE ″Unique libraries.dbf″
   REPLACE ALL i WITH′
   BROWSE FIELDS i,libname,library,total,entered AT 0,0
   ENDIF
USE ″SmartGuy:FoxBASE+/Mac:fox files:clcnes.dbf″
* COPY TO TEMPNUM FOR NUMBER>=INITIATE,AND.NUMBER<=TERMINATE
* USE TEMPNUM
COPY STRUCTURE TO TEMPLIB
USE TEMPLIB
   IF ENTIRE=1
   APPEND FROM ″SmartGuy:FoxBASE+/Mac:fox files:Clones.dbf″
   ENDIF
   IF ENTIRE=2
USE ″Unique libraries,dbf″
   COPY TO SELECTED FOR UPPER (i)=′Y ′
   USE SELECTED
   STORE RECCOUNT() TO STOPIT
   MARK=1

     DO WHILE ,T,

     IF MARK>STOPIT

     CLEAR

     EXIT

     ENDIF

     USE SELECTED

     GO MARK

     STORE library TO THISONE

     ?′COPYING′

     ??THISONE

     USE TEMPLIB

     APPEND FROM ″SmartGuy:FoxBASE+/Mac:fox files:Clones,dbf″ FOR library=THISONE

     STORE MARK+1 TO MARK

     LOOP

     ENDDO

  ENDIF
USS “SmartGuy:FoxBASE+/Mac:fox files:clones.dbf″
COUNT TO STARTOT
COPY STRUCTURE TO TEMPDESIG
USE TEMPDESIG

  IF Ematch=0.AND.Hmatch=0.AND.IMATCH=0

  APPEND FROM TEMPLIB

  ENDIF

  IF Ematch=1

  APPEND FROM TEMPLIB FOR D=′E′

  ENDIF

  IF Hmatch=1

  APPEND FROM TEMPLIB FOR D=′H′

  ENDIF

  IF Omatch=1

  APPEND FROM TEMPLIB FOR D=′O′

  ENDIF

  IF Imatch=1

  APPEND FROM TEMPLIB FOR D=′I′ .OR,D=′X′ ,OR,D=′N′

  ENDIF

  IF Xmatch=1

  APPEND FROM TEMPLIB FOR D=′X′

  ENDIF
COUNT TO ANALTOT
set talk off
*********************************
DO CASE
				
				<dp n="d44"/>
CASE PTF=0
SET DEVICE TO PRINT
SET PRINT ON
CASE PTF=1
SET ALTERNATE TO ″Total function sort.txt″
*SET ALTERNATE TO ″H and O function sort.txt″
*SET ALTERNATE TO ″Shear Stress HUVEC 2:Abundance sort.txt″
*SET ALTERNATE TO ″Shear Stress HUVEC 2:Abundnce con.txt″
*SET ALTERNATE TO ″Shear Stress HUVEC 2:Function sort.txt″
*SET ALTERNATE TO ″Shear Stress HUVEC 2:Distribution sort.txt″
*SET ALTERNATE TO ″Shear stress HUVEC 1:Clone list.txt″
*SET ALTERNATE TO ″Shear Stress HUVEC 2:Location sort.txt″
SET ALTERNATE ON
ENDCASE
******************************
IF PRINTON=1
@1,30 SAY ″Database Subset Analysis″ STYLE 65536 FONT ″Ganeva″,274 COLOR 0,0,0,-1,-1,-1
ENDIF
?
?
?
?
?date<>
??′           ′
??
??TIME()
?′Clone numbers′
??STR(INITIATE,6,0)
??′through′
??STR(TERMINATE,6,0)
?′Libraries:′
IF ENTIRE=1
?′All libraries′
ENDIF
IF ENTIRE=2

    MARK=1

    DO WHILE .T.

    IF MARK>STOPIT

    EXIT

    ENDIF

    USE SELECTED

    GO MARK

    ?  ′    ′

    ??TRIM (libname)

    STORE MARK+1 TO MARK

    LOOP

    ENDDO
ENDIF
?′Desionations:′
IF Ematch=0 .AND. Hmatch=0 .AND. Omatch=0 .AND. IMATCH=0
??′All′
ENDIF
IF Ematch=1
?? ′Exact,′
ENDIF
IF Hmatch=1
??′Human,′
ENDIF 
IF Omatch=1
??′Other sp. ′
ENDIF
IF Imatch=1
??′INCYTE′
ENDIF
IF Xmatch=1
??′EST′
				
				<dp n="d45"/>
ENDIF
IF CCNDEN=1
?′Condensed format analysis′
ENDIF
IF ANAL=1
?′Sorted by NUMBER′
ENDIF
IF ANAL=2
?′Sorted by ENTRY′
ENDIF 
IF ANAL=3
?′Arranged by ABUNDANCE′
ENDIF
IF ANAL=4
?′Sorted by INTEREST′
ENDIF
IF ANAL=5
?′Arranged by LOCATION′
ENDIF 
IF ANAL=6
?′Arranged by DISTRIBUTION′
ENDIF
IF ANAL=7
?′Arranged by FUNCTION′
ENDIF
?′Total clones represented:′
??STR(STARTOT,6,0)
?′Tocal clones analyzed:′
??STR(ANALTOT,6,0)
?
?′l=library d=designation f=distributicn z=location r=function c=cer
?
*****************************************************************************
USE TEMPDESIG
SCREEN 1 TYPE 0 HEADING ″Screen 1
DO CASE
CASE ANAL=1
* sort/number
SET HEADING ON
IF CONDEN=1
SORT TO TEMP1 ON ENTRY,NUMBER
DO ″COMPRESSION number.PRG″
ELSE
SORT TO TEMP1 ON NUMBER
USE TEMP1
list off fields number,L,D,F,Z,R,C,ENTRY,S,DESCRIPTOR
*list off fields number,L,D,F,Z,R,C,ENTRY,S,DESCRIPTOR,LENGTH,RFEND,INIT,I
CLOSE DATABASES
ERASE TEMP1.DBF
ENDIF
CASE ANAL=2
* sort/DESCRIPTOR
SET HEADING ON
*SORT TO TEMP1 ON DESCRIPTOR,ENTRY,NUMBER/S for D=′E′,OR.D=′H′,OR.D=′O′,OR,D=′X′.OR.D=′I′
*SORT TO TEMP1 ON ENTRY,DESCRIPTOR,NUMBER/S for D=′E′.OR.D=′H′,OR.D=′O′.OR.D=′X′.OR.D=′I′
SORT TO TEMP1 ON ENTRY,START/S for D=′E′.OR.D=′H′ .OR.D=′O′ .OR.D=′X′.OR.D=′I′
IF CONDEN=1
DO ″COMPRESSION entry.PRG″
ELSE
USE TEMP1
list off fields number,L,D,F,Z,R,C,ENTRY,S,DESCRIPTOR,LENGTH,RFEND,INIT,I
CLOSE DATABASES
ERASE TEMP1.DBF
ENDIF
				
				<dp n="d46"/>
CASE ANAL=3
″sort by abundance
SET HEADING ON
SORT TO TEMP1 ON ENTRY,NUMBER for D=′E′.OR.D=′H′.OR.D=′O′.OR.D=′X′.OR.D=′I′
DO ″COMPRESSION abundance.PRG″
CASE ANAL=4
* sort/interest
SET HEADING ON
IF CONDEN=1
SORT TO TEMP1 ON ENTRY,NUMBER FOR I>0
DO ″COMPRESSION interest.PRG″
ELSE
SORT ON I/D,ENTRY TO TEMP1 FOR I>1
USE TEMP1
list off fields number,L,D,F,Z,R,C,ENTRY,S,DESCRIPTOR,LENGTH,RFEND,INIT,I
CLOSE DATABASES
ERASE TEMP1.DBF
ENDIF
CASE ANAL=5
* arrange/location
SET HEADING ON
STORE 4 TO AMPLIFIER
?′Nuclear:′
SORT ON ENTRY,NUMBER FIELDS RFEND,NUMBER,L,D,F,Z,R,C,ENTRY,S,DESCRIPTOR,LENGTH,INIT,I,COMMEN
IF CONDEN=1
DO ″Compression location.prg″
ELSE
DO ″Normal subroutine 1″
ENDIF
?′Cytoplasmic:′
SORT ON ENIRY,NUMBER FIELDS RFEND,NUMBER,L,D,F,Z,R,C,ENTRY,S,DESCRIPTOR,LENGTH,INIT,I,COMMEN
IF CONDEN=1
DO ″Compression location,prg″
ELSE
DO ″Ncrmal subroutine 1″
ENDIF
?′Cytoskeleton:′
SORT ON ENTRY,NUMBER FIELDS RFEND,NUMBER,L,D,F,Z,R,C,ENTRY,S,DESCRIPTOR,LENGTH,INIT,I,COMMEN
IF CONDEN=1
DO ″Compression location.prg″
ELSE
DO ″Normal subroutine 1″
ENDIF
?′Cell surface:′
SORT ON ENTRY,NUMBER FIELDS RFEND,NUMBER,L,D,F,Z,R,C,ENTRY,S,DESCRIPTOR,LENGTH,INIT,I,COMMEN
IF CONDEN=1
DO ″Compression location.prg″
DO ″Normal subroutine 1″
ENDIF
?′Intracellular membrane:′
SORT ON ENTRY,NUMBER FIELDS RFEND,NUMBER,L,D,F,Z,R,C,ENTRY,S,DESCRIPTOR,LENGTH,INIT,I,COMMEN
IF CONDEN=1
DO ″Compression location.prg″
ELSE
DO ″Normal subroutino 1″
ENDIF
?′Mitochondrial:′
SORT ON ENTRY,NUMBER FIELDS,NUMBER,L,D,F,Z,R,C,ENTRY,S,DESCRIPTOR,LENGTH,INIT,I,COMMEN
IF CONDEN=1
DO ″Compression location.prg″
ELSE
DO ″Normal subroutine 1″
ENDIF
				
				<dp n="d47"/>
?′Secreted:′
SORT ON ENTRY,NUMBER FIELDS RFEND,NUMBER,L,D,F,Z,R,C,ENTRY,S,DESCRIPTOR,LENGTH,INIT,I,COMMEN
IF CONDEN=1
DO ″Compression location.prg″
ELSE
DO ″Normal subroutine 1″
ENDIF
?′Other′
SORT ON ENTRY,NUMBER FIELDS RFEND,NUMBER,L,D,F,Z,R,C,ENTRY,S,DESCRIPTOR,LENGTH,INIT,I,COMMEN
IF CONDEN=1
DO ″Compression location.prg″
ELSE
DO ″Normal subroutine 1″
ENDIF
?′Unknown:′
SORT ON ENTRY,NUMBER FIELDS,NUMBER,L,D,F,Z,R,C,ENTRY,S,DESCRIPTOR,LENGTH,INIT,I,COMMEN
IF CONDEN=1
DO ″Compression location.prg″
ELSE
DO ″Normal subroutine 1″
ENDIF
IF CONDEN=1
SET DEVICE TO PRINTER
SET PRINTER ON
ELECT
DO ″Output heading.prg″
USE ″Analysis location.dbf″
DO ″Create bargraph.prg″
SET HEADING OFF
?′FUNCTIONAL CLASS TOTAL UNIQUE NEW % TOTAL′
?
LIST OFF FIELDS Z,NAME,CLONES,GEMES,NEW,PERCENT,GRAPH
CLOSE DATABASES
ERASE TEMP2.DBF
SET HEADING ON
*USE ″SmartGuy:FoxBASE+/Mac:fox files:TEMPMASTER.dbf″
ENDIF
CASE ANAL=6
* arrange/distribution
SET HEADING ON
STORE 3 TO AMPLIFIER
?′Cell/tissue specific distribution:′
SORT ON ENTRY,NUMBER FIELDS RFEND,NUMBER,L,D,F,Z,R,C,ENTRY,S,DESCRIPTOR,LENGTH,INIT,I,COMMEN
IF CONDEN=1
DO ″Compression distrib.prg″
ELSE
DO ″Normal subroutine 1″
ENDIF
?′Non-specifio distribution:′
SORT ON ENTRY,NUMBER FIELDS RFEND,NUMBER,L,D,F,Z,R,C,ENTRY,S,DESCRIPTOR,LENGTH,INIT,I,COMMEN
IF CONDEN=1
DO ″Compression distrib.prg″
ELSE
DO ″Normal subroutine 1″
ENDIF
?′Unknown digtribution:′
SORT ON ENTRY,NUMBER FIELDS RFEND,NUMBER,L,D,F,Z,R,C,ENTRY,S,DESCRIPTOR,LENGTH,INIT,I,COMMEN
IP CONDEN=1
DO ″Compression distrib.prg″
ELSE
DO ″Normal subroutine 1″
ENDIF
IF CONDEN=1
SET DEVICE TO PRINTER
SET PRINTER ON
				
				<dp n="d48"/>
EJECT
DO ″Output heading.prg″
USE ″Analysis distribution.dbf″
DO ″Create bargraph.prg″
SET HEADING OFF
?′FUNCTIONAL CLASS TOTAL UNIQUE * TOTAL′
?
LIST OFF FIELDS P,NAME,CLONES,GENES,PERCENT,GRAPH
CLOSE DATABASES
ERASE TEMP2.DBF
SET HEADING OF
*USE ″SmartGuy:FoxBASE+/Mac:fox files:TEMPMASTER.dbf″
ENDIF
CASE ANAL=7
* arrange/function
SET HEADING ON
STORE 10 TO AMPLIFIER
?′                          BINDING PROTEINS ′
?
?′Surface molecules and receptors:′
SORT ON ENTRY,NUMBER FIELDS RFEND,NUMBER,L,D,F,Z,R,C,ENTRY,S,DESCRIPTOR,LENGTH,INIT,I,COMMEN
IF CONDEN=1
DO ″Compression function.prg″
ELSE
ELSE
DO ″Normal subroutine 1″
ENDIF
?′Calcium-binding proteins:′
SORT ON ENTRY,NUMBER FIELDS RFEND,NUMBER,L,D,F,Z,R,C,ENTRY,S,DESCRIPTOR, LENGTH,INIT,I,COMMEN
IF CONDEN=1
DO ″Compression function.prg″
ELSE
DO ″Normal subroutine 1″
ENDIF
?′Ligands and effectors:′
SORT ON ENTRY,NUMBER,L,D,F,Z,R,C,ENTRY,S,DESCRIPTOR,LENGTH,INIT,I,COMMEN
IF CONDEN=1
DO ′Compression function.prg″
ELSE
DO ″Normal subroutine 1″
ENDIF
?′Other binding proteins:′
SORT ON ENTRY,NUMBER FIELDS,NUMBER,L,D,F,Z,R,C,ENTRY,S,DESCRIPTOR,LENGTH,INIT,I,COMMEN
IF CONDEN=1
DO ″Compression function.prg″
ELSE
DO ″Normal subroutine 1″
ENDIF
*EJECT
?′                  ONCOGENES′
?
?′General oncogenes:′
SORT ON ENTRY,NUMBER FIELDS,NUMBER,L,D,F,Z,R,C,ENTRY,S,DESCRIPTOR,LENGTH,INIT,I,COMMEN
IF CONDEN=1
DO ″Compression function.prg
ELSE
DO ″Normal subroutine 1″
ENDIF
?′GTP-binding proteins:′
SORT ON ENTRY,NUMBER FIELDS RFEND,NUMBER,L,D,F,Z,R,C,ENTRY,S,DESCRIPTOR,LENGTH,INIT,I,COMMEN
IF CONDEN=1
DO ″Compression function.prg″
ELSE
DO ″Normal subroutine 1″
ENDIF
?′Viral elements:′
				
				<dp n="d49"/>
SORT ON ENTRY,NUMEBER FIELDS RFEND,NUMBER,L,D,F,Z,R,C,ENTRY,S,DESCRIPTOR,LENGTH,INIT,I,COMMEN
IF CONDEN=1
DO ″Compression function.prg″
ELSE
DO ″Normal subroutine 1″
ENDIF
?′Kinases and Phosphatases:′
SORT ON ENTRY,NUMBER FIELDS RFEND,NUMBER,L,D,F,Z,R,C,ENTRY,S,DESCRIPTOR,LENGTH,INIT,I,COMMEN
IF CONDEN=1
DO ″Compression function.prg″
ELSE
DO ″Normal subroutine 1″
ENDIF
?′Tumor-related antigens:′
SORT ON ENTRY,NUMBER FIELDS RFEND,NUMBER,L,D,F,Z,R,C,ENTRY,S,DESCRIPTOR,LENGTH,INIT,I,COMMEN
IF CONDEN=1
DO ″Compression function.prg″
ELSE
DO ″Normal subroutine 1″
ENDIF
*EJECT
?′                        PROTEIN SYNTHETIC MACHINERY PROTEINS′
?
?′Transcription and Nucleic Acid-binding proteins:′
SORT ON ENTRY,NUMBER FIELDS RFEND,NUMBER,L,D,F,Z,R,C,ENTRY,S,DESCRIPTOR,LENGTH,INIT,I,COMMEN
IF CONDEN=1
DO ″Compression function.prg″
ELSE
DO ″Normal subroutine 1″
ENDIF
?′Translation:′
SORT ON ENTRY,NUMBER FIELDS RFEND,NUMBER,L,D,F,Z,R,C,ENTRY,S,DESCRIPTOR,LENGTH,INIT,I,COMMEN
IF CONDEN=1
DO ″Compression function.prg″
ELSE
DO ″Normal subroutine 1″
ENDIF
?′Riboscmal proteins:′
SORT ON ENTRY,NUMBER FIELDS RFEND,NUMBER,L,D,F,Z,R,C,ENTRY,S,DESCRIPTOR,LENGTH,INIT,I,COMMEN
IF CONDEN=1
DO ″Compression function.prg″
ELSE
DO ″Normal subroutine 1″
ENDIF
?′Protein processing:′
SORT ON ENTRY,NUMBER FIELDS RFEND,NUMBER,L,D,F,Z,R,C,ENTRY,S,DESCRIPTOR,LENGTH,INIT,I,COMMEN
IF CONDEN=1
DO ″Compression function.prg″
ELSE
DO ″Normal subroutine 1″
ENDIF
*EJECT
?′                                    ENZYMES′
?
?′Ferroproteins:′
SORT ON ENTRY,NUMBER FIELDS RFEND,NUMBER,L,D,F,Z,R,C,ENTRY,S,DESCRIPTOR,LENGTH,INIT,I,COMMEN
IF CONDEN=1
DO ″Compression function.prg″
ELSE
DO ″Normal subroutine 1″
ENDIF
?′Proteases and inhibitors:′
SORT ON ENTRY,NUMBER FIELDS RFEND,NUMBER,L,D,F,Z,R,C,ENTRY,S,DESCRIPTOR,LENGTH,INIT,I,COMMEN
IF CONDEN=1
DO ″Compression function.prg″
ELSE
				
				<dp n="d50"/>
DO ″Normal subroutine 1″
ENDIF
?′Oxidative phosphorylation:′
SORT ON ENTRY,NUMEBER FIELDS RFEND,NUMBER,L,D,F,Z,R,C,ENTRY,S,DESCRIPTOR,LENGTH,INIT,I,COMMEN
IF CONDEN=1
DO ″Compression function.prg″
ELSE
DO ″Normal subroutine 1″
ENDIF
?′Sugar metabolism:′
SORT ON ENTRY,NUMBER FIELDS RFEND,NUMBER,L,D,F,Z,R,C,ENTRY,S,DESCRIPTOR,LENGTH,INIT,I,COMMEN
IF CONDEN=1
DO ″Compression function.prg″
ELSE
DO ″Normal subroutine 1″
ENDIF
?′Amino acid metabolism:′
SORT ON ENTRY,NUMBER FIELDS RFEND,NUMBER,L,D,F,Z,R,C,ENTRY,S,DESCRIPTOR,LENGTH,INIT,I,COMMEN
IF CONDEN=1
DO ″Compression funotion.prg″
ELSE
DO ″Normal subroutine 1″
ENDIF
?′Nucleic acid metabolism:′
SORT ON ENTRY,NUMBER FIELDS RFEND,NUMBER,L,D,F,Z,R,C,ENTRY,S,DESCRIPTOR,LENGTH,INIT,I,COMMEN
IF CONDEN=1
DO ″Compression function.prg″
ELSE
DO ′Normal subroutine 1″
ENDIF
?′Lipid metabolism:′
SORT ON ENTRY,NUMBER FIELDS RFEND,NUMBER,L,D,F,Z,R,C,ENTRY,S,DESCRIPTOR,LENGTH,INIT,I,COMMEN
IF CONDEN=1
DO ″Compression function.prg″
ELSE
DO ″Normal subroutine 1″
ENDIF
?′Other enzymes:′
SORT ON ENTRY,NUMBER FIELDS RFEND,NUMBER,L,D,F,Z,R,C,ENTRY,S,DESCRIPTOR,LENGTH,INIT,I,COMMEN
IF CONDEN=1
DO ″Compression function.prg″
ELSE
DO ″Normal subroutine 1″
ENDIF
*EJECT
?′                      MISCELLANEOUS CATEGORIES′
?
?′Stress response:′
SORT ON ENTRY,NUMBER FIELDS RFEND,NUMBER,L,D,F,Z,R,C,ENTRY,S,DESCRIPTOR,LENGTH,INIT,I,COMMEN
IF CONDEN=1
DO ″Compression function.prg″
ELSE
DO ″Normal subroutine 1″
ENDIF
?′Structural:′
SORT ON ENTRY,NUMBER FIELDS RFEND,NUMBER,L,D,F,Z,R,C,ENTRY,S,DESCRIPTOR,LENGTH,INIT,I,COMMEN
IF CONDEN=1
DO ″Compression runcticn.prg″
ELSE
DO ″Normal subroutine 1″
ENDIF
?′Other clones:′
SORT ON ENTRY,NUMBER FIELDS RFEND,NUMBER,L,D,F,Z,R,C,ENTRY,S,DESCRIPTOR,LENGTH,INIT,I,COMMEN
IF CONDEN=1
DO ″Compression function.prg″
ELSE
				
				<dp n="d51"/>
DO ″Normal subroutine 1″
ENDIF
?′Clones of unknow function:′
SORT ON ENTRY,NUMBER FIELDS RFEND,NUMBER,L,D,F,Z,R,C,ENTRY,S,DESCRIPTOR,LENGTH,INIT,I,COMMEN
IF CONDEN=1
DO ″Compression functicn.prg″
ELSE
DO ″Normal subroutine 1″
ENDIF
IF CONDEN=1
* SET  DEVICE  TO  PRINTER
*SET PRINT ON
DO ″Output heading.prg″
***
USE ″Analysis function.dbf″
DO ″Create bargraph.prg″
SET HEADING OFF
***
SCREEN 1 TYPE 0 HEADING ″Screen 1″ AT 40,2 SIZE 286,492 PIXELS FONT ″Geneva″,12 COLOR 0,0,0
***
?′                                                                                TOTAL TOTAL NEW DIST?′         FUNCTIONAL CLASS CLONES GENES GENES FUNCTIONAL CLASS′
?′
***
*LIST OFF FIELDS P,NAME,CLONES,GENES,NEW,PERCENT,GPAPH,COMPANY
LIST OFF FIELDS P,NAME,CLONES,GENES,NEW,PERCENT,GRAPH
CLOSE DATABASES
ERASE TEMP2.DBF
SET HEADING ON
*USE ″SmartGuy:FoxBASE+/Mac:fox files:TEMPMASTER,dbf″
ENDIF
CASE ANAL=8
DO ″Subgrcup summary 3.prg″
ENDCASE
DO ″Test print.prg″
SET PRINT OFF
SET DEVICE TO SCREEN
CLOSE DATABASES
*ERASE TEMPLIB,DBF
*ERASE TEMPNUM,DBF
*ERASE TEMPDESIG,DBF
*ERASE SELECTED,DBF
CLEAR
LOOP
ENDDO
				
				<dp n="d52"/>
* COMPRESSION SUBROUTINE FOR ANALYSIS PROGRAMS
USE TEMP1                                     
COUNT TO TOT
REPLACE ALL RFEND WITH 1
MARK1=1
SW2=0
DO WHILE SW2=0 ROLL

  IF MARK1>=TOT

  PACK

  COUNT TO UNIQUE

  COUNT TO NEWGENES FOR D=′H′.OR.D=′O′

  SW2=1

  LOOP

  ENDIF
GO MARK1
DUP=1
STORE ENTRY TO TESTA
SW=0
DO WHILE SW=0 TEST
SKIP
STORE ENTRY TO TESTB

  IF TESTA=TESTB

  DELETE

  DUP=DUP+1

  LOOP

  ENDIF
GO MARK1.
REPLACE RFEND WITH DUP
MARK1=MARK1+DUP
SW=1
LOOP
ENDDO TEST
LOOP
ENDDO ROLL
GO TOP
STORE Z TO LOC
USE ″Analysis location.dbf″
LOCATE FOR Z=LOC
REPLACE CLONES WITH TOT
REPLACE GENES WITH UNIQUE
REPLACE NEW WITH NEWGENES
USE TEMP1
SORT ON RFEND/D TO TEMP2
USE TEMP2
??STR(UNIQUE,5,0)
??′genes,for a total of′
??STR(TOT,5,0)
??′.clones′
?′                      V Coincidence′
list off fields number,RFEND,L,D,F,Z,R,C,ENTRY,S,DESCRIPTOR,LENGTH,INIT,I
*SET PRINT OFF
CLOSE DATABASES
ERASE TEMP1.DBF
ERASE TEMP2.DBF
USE TEMPDESIG
				
				<dp n="d53"/>
* COMPRESSION SUEROUTINE FOR ANALYSIS PROGRAMS
USE TEMP1
COUNT TO TOT
REPLACE ALL RFEND WITH 1
MARK1=1
SW2=0
DO WHILE SW2=0 ROLL
   IF MARK1 >=TOT
   PACK
   COUNT TO UNIQUE
   SW2=1
   LOOP
   ENDIF
GO MARK1
DUP=1
STORE ENTRY TO TESTA
SW=0
DO WHILE SW=0 TEST
SKIP
STORE ENTRY TO TESTB
   IF TESTA=TESTB
   DELETE
   DUP=DUP+1
   LOOP
   ENDIF
GO MARK1
REPLACE RFEND WITH DUP
MARK1=MARK1+DUP
SW=1
LOOP
ENDDO TEST
LOOP
ENDDO ROLL
* BROWSE
*SET PRINTER ON
SORT ON DATE TO TEMP2
USE TEMP2
??STR(UNIQUE,4,0)
??′genes,for a total of′
??STR(TOT,4,0)
??′clones′
?
?′                      V Coincidence′
COUNT TO P4 FOR I=4
IF P4>0
? STR(P4,3,0)
??′genes with priority=4 (Secondary analysis:)′
list off fields number,RFEND,L,D,F,Z,R,C,ENTRY,S,DESCRIPTOR,LENGTH,INIT for I=4
?
ENDIF
COUNT TO P3 FOR I=3
IF P3>0
?STR(P3,3,0)
??′genes with priority=3(Full insert sequence:)′
list off fields number,RFEND,L,D,F,Z,R,C,ENTRY,S,DESCRIPTOR,LENGTH,INIT for I=3
ENDIF
COUNT TO P2 FOR I=2.
IF P2>0
?STR(P2,3,0)
??′genes with priority=2 (Primary analysis complete:)′
list off fields number,RFEND,L,D,F,Z,R,C,ENTRY,S,DESCRIPTOR,LENGTH,INIT for I=2
?
ENDIF
COUNT TO P1 FOR I=1
IF P1>0
				
				<dp n="d54"/>
?STR(P1,3,0)
??′genes with priority=1 (Primary analysis needed:)′
list off fields number,RFEND,L,D,P,Z,R,C,ENTRY,S,DESCRIPTOR,LENGTH,INIT for I=1
ENDIF
*SET PRINT OFF
CLOSE DATABASES
ERASE TEMP1.DBF
ERASE TEMP2.DBF
USE ″SmartGuy:FoxBASE+/Mac:fox files:clones.dbf″
				
				<dp n="d55"/>
* COMPRESSION SUBROUTINE FOR ANALYSIS PROGRAMS
USE TEMP1
COUNT TO TOT
REPLACE ALL RFEND WITH 1
MARK1=1
SW2=0
DO WHILE SW2=0 ROLL
   IF MARK1 >=TOT
   PACK
   COUNT TO UNIQUE
   SW2=1
   LOOP
   ENDIF
GO MARK1
DUP=1
STORE ENTRY TO TESTA
SW=0
DO WHILE SW=0 TEST
SKIP
STORE ENTRY TO TESTB
   IF TESTA=TESTB
   DELETE
   DUP=DUP+1
   LOOP
   ENDIF
GO MARK1
REPLACE RFEND WITH DUP
MARK1=MARK1+DUP
SW=1
LOOP
ENDDO TEST
LOOP
ENDDO ROLL
* BROWSE
*SET PRINTER ON
SORT ON NUMBER TO TEMP2
USE TEMP2
??STR(UNIQUE,4,0)
??′genes,for a total of′
??STR(TOT,5,0)
??′clones′
?′V Coincidence′
list off fields number,RFEND,L,D,F,Z,R,C,ENTRY,S,DESCRIPTOR,LENGTH,INIT,I
*SET PRINT OFF
CLOSE DATABASES
ERASE TEMP1.DBF
ERASE TEMP2.DBF
USE ″SmartGuy:FoxBASE+/Mac:fox files:clones.dbf″
				
				<dp n="d56"/>
* COMPRESSION SUBROUTINE FOR ANALYSIS PROGRAMS
USE TEMP1
COUNT TO TOT
REPLACE ALL RFEND WITH 1
MARK1=1
SW2=0
DO WHILE SW2=0 ROLL
  IF MARK1>=TOT
  PACK
  COUNT TO UNIQUE
  COUNT TO NEWGENES FOR D=′H′.OR.D=′O′
  SW2=1
  LOOP
  ENDIF
GO MARK1
DUP=1
STORE ENTRY TO TESTA
SW=0
DO WHILE SW=0 TEST
SKIP
STORE ENTRY TO TESTB
  IF TESTA=TESTB
  DELETE
  DUP=DUP+1
  LOOP
  ENDIF
GO MARK 1 
REPLACE RFEND WITH DUP
MARK1=MARK1+DUP
SW=1
LOOP
ENDDO TEST
LOOP
ENDDO ROLL
GO TOP
STORE R TO FUNE
USE ″Analysis function.dbf″
LOCATE FOR P=FUNE
RFPLACE CLONES WITH TOT
REPLACE GENES WITH UNIQUE
REPLACE NEW WITH NEWGENES.
USE TEMP1
SORT ON RFEND/D TO TEMP2
USE TEMP2
SET HEADING ON
??STR(UNIQUE,5,0)
??′genes,for a total of ′
??STR(TOT,5,0)
??′clones′
***
?′                      V Coincidence′
list off fields number,RFEND,L,D,F,Z,R,C,ENTRY,S,DESCRIPTOR,LENGTH,INIT,I
***
*SCREEN 1 TYPE 0 HEADING ″Screen 1″ AT 40,2 SIZE 286,492 PIXELS FONT″Geneva″,12 COLOR 0,0,
* list off fields RFEND,S,DESCRIPTOR
* SET PRINT OFF
CLOSE DATABASES
ERASE TEMP1.DBF
ERASE TEMP2.DBF
USE TEMPDESIG
				
				<dp n="d57"/>
* COMPRESSION SUBROUTINE FOR ANALYSIS PROGRAMS
USE TEMP 1
COUNT TO TOT
REPLACE ALL RFEND WITH 1
MARK1=1
SW2=0
DO WHILE SW2=0 ROLL
   IF MARK1>=TOT
   PACK
   COUNT TO UNIQUE
   SW2=1
   LOOP
   ENDIF
GO MARK1
DUP=1
STORE ENTRY TO TESTA
SW=0
DO WHILE SW=0 TEST
SKIP
STORE ENTRY TO TESTB

  IF TESTA=TESTB
   DELETE
   DUP=DUP+1
   LOOP

  ENDIF
GO MARK1
REPLACE RFEND WITH DUP
MARK1=MARK1+DUP
SW=1
LOOP
ENDDO TEST
LOOP
ENDDO ROLL
GO TOP
STORE F TO DIST
USE ″Analysis distribution.dbf″
LOCATE FOR P=DIST
REPLACE CLONES WITH TOT
REPLACE GENES WITH UNIQUE
USE TEMP1
sort on rfend/d to TEMP2
USE TEMP2
??STR(UNIQUE,5,0)
??′genes,for a total of ′
??STR(TOT,5,0)
??′clones′
?′                      V Coincidence′
list off fields number,RFEND,L,D,F,Z,R,C,ENTRY,S,DESCRIPTOR,LENGTH,INIT,I
* SET PRINT OFF
CLOSE DATABASES
ERASE TEMP1.DBF
ERASE TEMP2.DBF
USE TEMPDESIG
				
				<dp n="d58"/>
* COMPPRESSION  SUBROUTINE FOR ANALYSIS PROGRAMS
USE TEMP1
COUNT TO TOT
REPLACE ALL RFEND WITH 1
MARK1=1
SW2=0
DO WHILE SW2=0 ROLL
   IF MARK1>=TOT
   PACK
   COUNT TO UNIQUE
   SW2=1
   LOOP
   ENDIF
GO MARK1
DUP=1
STORE ENTRY TO TESTA
SW=0
DO WHILE SW=0 TEST
SKIP
STORE ENIRY TO TESTB
   IF TESTA=TESTB
   DELETE
   DUP=DUP+1
   LOOP
   ENDIF
GO MARK1
REPLACE.RFEND WITH DUP
MARK1=MARK1+DUP
SW=1
LOOP
ENDDO TEST
LOOP
ENDDO ROLL
GO TOP
USE TEMP1
??STR(UNIQUE,5,0)
??′genes,for a total of ′
??STR(TOT,5,0)
??′clones′
?′                       V Coincidence′
list off fields number,RFEND,L,D,F,Z,R,C,ENTRY,S,DESCRIPTOR,LENGTH,INIT,I
*SET PRINT OFF
CLOSE DATABASES
ERASE TEMP1.DBF
USE TEMPDESIG
				
				<dp n="d59"/>
* COMPRESSION SUEROUTINE FOR ANALYSIS PROGRAMS
USE ″SmartGuy:FoxBASE+/Mac:fox files:Clones.dbf″
COPY TO TEMP1 FOR
USE TEMP1
COUNT TO IDGENE FOR D=′E′.OR.D=′O′.OR.D=′H′.OR.D=′N′.OR.D=′R′.OR.D=′A′
DELETE FOR D=′N′ .OR.D=′D′ .OR.D=′A′ .OR.D=′U′ .CR.D=′S′ .OR.D=′M′ .OR.D=′R′ .OR.D=′V′
PACK
COUNT TO TOT
REPLACE ALL RFEND WITH 1
MARK1=1
SW2=0
DO WHILE SW2=0 ROLL
   IF MARK1>=TOT
   PACK
   COUNT TO UNIQUE
   SW2=1
   LOOP
   ENDIF
GO MARK1
DUP=1
STORE ENTRY TO TESTA
SW=0
DO WHILE SW=0 TEST
SKIP
STORE ENTRY TO TESTB
   IF TESTA=TESTB
   DELETE
   DUP=DUP+1
   LOOP
   ENDIF
GO MARK1
REPLACE RFEND WITH DUP
MARK1=MARK1+DUP
SW=1
LOOP
ENDDO TEST
LOOP
ENDDO ROLL
*BROWSE
*SET PRINTER ON
SORT ON RFEND/D,NUMBER TO TEMP2
USE TEMP2
REPLACE ALL START WITH RFEND/IDGENE*10000
??STR(UNIQUE,5,0)
??′genes,for a total of′
??STR(TOT,5,0)
??′clones′
?′Coincidence V      V Clones/10000′
set heading off
SCREEN 1 TYPE 0 HEADING ″Screen 1″ AT 40,2 SIZE 286,492 PIXELS FONT ″Geneva″,?COLOR 0,0,0,
list fields number,RFEND,START,L,D,F,Z,R,C,ENTRY,S,DESCRIPTOR,INIT,I
* SET PRINT OFF
CLOSE DATABASES
ERASE TEMP1.DBF
ERASE TEMP2.DBF
USE ″SmartGuy:FoxBASE+/Mac:fox files:clones.dbf″
				
				<dp n="d60"/>
* COMPRESSION SUBROUTINE FOR ANALYSIS PROGRAMS
USE TEMP1
COUNMT TO IDGENE FOR D=′E′’,OR,D=′H′,OR,D=′N′.OR.D=′A′
DELETE FOR D=′N′ .OR.D=′D′ .OR.D=′A′ .OR.D=′U′ .OR.D=′S′ .OR.D=′M′ .OR.D=′R′ .OR.D=′V′
PACK
COUNT TO TOT
REPLACE ALL RFEND WITH 1
MARK1=1
SW2=0
DO WHILE SW2=0 ROLL
   IF MARK1>=TOT
   PACK
   COUNT TO UNIQUE
   SW2=1
   LOOP
   ENDIF
GO MARK1
DUP=1
STORE ENTRY TO TESTA
SW=0
DO WHILE SW=0 TEST
SKIP
STORE ENTRY TO TESTE
   IF TESTA=TESTB
   DELETE
   DUP=DUP+1
   LOOP
   ENDIF
GO MARK1
REPLACE RFEND WITH DUP
MARK1=MARK1+DUP
SW=1
LOOP
ENDDO TEST
LOOP
ENDDO ROLL
*BROWSE
*SET PRINTER ON
SORT ON RFEND/D,NUMBER TO TEMP2
USE TEMP2
REPLACE ALL START WITH RFEND/IDGENE*10000
??STR(UNIQUE,5,0)
??′genes,for a total of ′
??STR(TOT,5,0)
??′clones′
?′Coincidence V        V Clones/10000′
set heading off
SCREEN 1 TYPE 0 HEADING ″Screen 1″ AT 40,2 SIZE 286,492 PIXELS FONT ″Geneva″,7 COLOR 0,0,0,
list fields number,RFEND,START,L,D,F,Z,R,C,ENTRY,S,DESCRIPTOR;INIT,I
*SET PRINT OFF
CLOSE DATABASES
ERASE TEMP1.DBF
ERASE TEMP2.DBF
USE ″SmartGuy:FoxBASE+/Mac:fox files:clones.dbf″
				
				<dp n="d61"/>
USE TEMP1
COUNT TO TOT
??′Total of′
?? STR(TOT,4,0)
??′clones′
?
*list off fields number,L,D,F,Z,R,C,ENTRY,DESCRIPTOR,LENGTH,RFEND,INIT,I
list off fields number,L,D,F,Z,R,C,ENTRY,DESCRIPTOR
CLOSE DATABASES
ERASE.TEMP1.DBF
USE TEMPDESIG
				
				<dp n="d62"/>
* Lifescan menu;version 8-7-94
SET TALK OFF
set cevice to screen
CLEAR
USE ″SmartGuy:FoxBASE+/Mac:fox files:clones.dbf″
STORE LUPDATE() TO Update
GO BOTTOM
STORE RECNO() TO cloneo
STORE 6 TO Chooser
DO WHILE .T.
* Program.:Lifeseq menu.fmt
* Date....:1/11/95
* Version.:FoxEASE+/Mac,revision 1.10
*Notes....:Formatt file Lifeseq menu
*
SCREEN 1 TYPE 0 HEADING ″Screen 1″ AT 40,2 SIZE 286,492 PIXELS FONT ″Geneva″,268 COLOR 0,0,
@ PIXELS 18,126 TO 77,365 STYLE 28479 COLOR 32767,-25600,-1,-16223,-16721,-15725
@ PIXELS 110,29 TO 188,217 STYLE 3871 COLOR 0,0,-1,-25600,-1,-1
@ PIXELS 45,161 SAY ″LIFESEQ″STYLE 65536 FONT ″Geneva″,536 COLOR 0,0,-1,-1,7135,5884
@ PIXELS 36,269 SAY ″TM″STYLE 65536 FONT ″Geneve″,12 COLOR 0,0,-1,-1,7135,5884
@ PIXELS 63,143 SAY ″Molecular Biology Desktop″ STYLE 65536 FONT ″Helvetica″,18 COLOR 0,0,0,
@ PIXELS 90,252 TO 251,467 STYLE 28447 COLOR 0,0,-1,-25600,-1,-1
@ PIXELS 117,270 GET Chooser STYLE 65536 FONT ″Chicago″,12 PICTURE ″G+RV Transcript profiles
@ PIXELS 135,128 SAY Update STYLE 0 FONT ″Geneva″,12 SIZE 15,79 COLOR 0,0,0,-25600,-1,-1
@ PIXELS 171,128 SAY cloneno STYLE 0 FONT ″Geneva″,12 SIZE 15,79 COLOR 0,0,0,-25600,-1,-1
@ PIXELS 135,44 SAY ″Last update:″STYLE 65536 FONT ″Geneva″,12 COLOR 0,0,-1,-1,-1,-1
@ PIXELS 171,44 SAY ″Total clones:″STYLE 65536 FONT ″Geneva″,12 COLOR 0,0,-1,-1,-1,-1
@ PIXELS 45,296 SAY ″v1.30″ STYLE 65536 FONT ″Geneva″,782 COLOR 0,0,-1,-1,-1,-1
* EOF:Lifeseq menu.fmt
READ
DO CASE
CASE Chooser=1
DO ″SmartGuy:FoxEASE+/Mac:fox files:Output programs:Master analysis 3.prg″
CASE Chooser=2
DO ″SmartGuy:FoxBASE+/Mac:fox files:Output programs:Subtraction 2.prg″
CASE Chooser=3
DO ″SmartGuy:FoxBASE+/Mac:fox files:Output programs:Northern (single) .prg″
CASE Chooser=4
USE ″Libraries.dbf″
CASE Chooser=5
DO ″SmartGuy:FoxBASE+/Mac:fox files:Output programs:See individual clone.prg″
CASE Chooser=6
DO ″SmartGuy:FoxBASE+/Mac:fox files:Libraries:Output programs:Menu.prg″
CASE Chooser=7
CLEAR
SCREEN 1 OFF
ENDCASE
LOOP
ENDDO
				
				<dp n="d63"/>
@1,30 SAY ″Database Subset Analysis″ STYLE 65536 FONT ″Geneva″,274 COLOR 0,0,0,-1,-1,-1
?
?
?
?
?date<>
??′′
??TIME<>
?′Clone numbers ′
??STR(INITIATE,6,0)
??′through′
??STR(TERMINATE,6,0)
?′Libraries:′
IF ENTIRE =1
?′All libraries′
ENDIF
IF ENTIRE=2

  MARK=1

  WHILE .T.

  IF MARD>STOPIT

  EXIT

  ENDIF

  USE SELECTED

  GO MARK

  ?′′

  ??TRIM(Libname)

  STORE MARK+1 TO MARK

  LOOP

  ENDDO
ENDIF
?′Desicnations:′
IF Ematch=0 .AND.Hmatch=0.AND.Omatch=0
??′All′
ENDIF
IF Ematch=1
??′Exact,′
ENDIF
IF Hmatch=1
??′Human,′
ENDIF
IF Omatch=1
??′Other sp.′
ENDIF
IF CONDEN=1
?′Condensed format analysis′
ENDIF
IF ANAL=1
?′Sorted by NUMBER′
ENDIF
IF ANAL=2
?′Sorted by ENTRY′
ENDIF
IF ANAL=3
?′Arranged by ABUNDANCE′
ENDIF
IF ANAL=4
?′Sorted by INTERSET′
ENDIF
IF ANAL=5
?′Arranced by LOCATION′
ENDIF
IF ANAL=6
?′Arranged by DISTRIBUTION′
ENDIF
IF ANAL=7
?′Arranged by FUNCTION′
				
				<dp n="d64"/>
ENDIF
?′Total clones represented: 
??STR(STARTOT,6,0)
?′Total clones analyzed:′
??STR(ANALTOT,6,0)
?
?
				
				<dp n="d65"/>
USE TEMP1
COUNT TO TOT
??′Total of′
??STR(TOT,4,0)
??′clones′
?
*list off fields number,L,D,F,Z,R,C,DESCRIPTOR,LENGTH,RFEND,INIT,I
list off fields number,L,D,F,Z,R,C,ENTRY,DESCRIPTOR
CLOSE DATABASES
ERASE TEMP1.DBF
USE TEMPDESIG
				
				<dp n="d66"/>
USE TEMP1
COUNT TO TOT
??′Total of′
??STR(TOT,4,0)
??′cloces′
?   
*list off fields number,L,D,F, Z,R,C,ENTRY,DESCRIPTOR,LENGTH,RFEND,INIT,I
list off fields number,L,D,F,Z,R,C,ENTRY,DESCRIFTOR
CLOSE DATABASES
ERASE TEMP1,DBF
USE TEMPDESIG
				
				<dp n="d67"/>
*Northern (single),version 11-25-94
close databases
SET TALK OFF
SET PRINT OFF
SET EXACT OFF
CLEAR
STORE′             ′TO Eobject
STORE′                                    ′TO Dobject
STORE O TO Numb
STORE 0 TO Zog
STORE 1 TO Bail
DO WHILE .T.
* Program.:Northern (single).fmt
* Date....:8/8/94
* Version.:FoxBASE+/Mac,revision 1.10
*Notes....:Format file Northern(single)
*
SCREEN 1 TYPE 0 HEADING ″Screen 1″AT 40,2 SIZE 286,492 PIXELS FONT ″Geneva″,12 COLOR 0,0,0
@ PIXELS 15,81 TO 46,397 STYLE 28447 COLOR 0,0,-1,-25600,-1,-1
@ PIXELS 89,79 TO 192,422 STYLE 28447 COLOR 0,0,0,-25600,-1,-1
@ PIXELS 115,98 SAY ″Entry#:″ STYLE 65536 FONT ″Geneva″,12 COLOR 0,0,0,-1,-1,-1
@ PIXELS 115,173 GET Eobject STYLE 0 FONT ″Geneva″,12 SIZE 15,142 COLOR 0,0,0,-1,-1,-1
@ PIXELS 145,89 SAY ″Description″STYLE 65536 FONT ″Geneva″,12 COLOR 0,0,0,-1,-1,-1
@ PIXELS 145,173 GET Dobject STYLE 0 FONT ″Geneva″,12 SIZE 15,241 COLOR 0,0,0,-1,-1,-1
@ PIXELS 35,89 SAY ″Single Northern search screen″ STYLE 65536 FONT ″Geneva″,274 COLOR 0,0,-
@ PIXELS 220,162 GET Bail STYLE 65536 FONT ″Chicagc”,12 PICTURE ″@*R Continue;Bail out″ SIZE
@ PIXELS 175,98 SAY ″Clone #:″ STYLE 65536 FONT ″Geneva″;12 COLOR 0,0,0,-1,-1,-1
@ PIXELS 175,173 GET Numb STYLE 0 FONT ″Geneva″,12 SIZE 15,70 COLOR 0,0,0,-1,-1,-1
@ PIXELS 80,152 SAY ″Enter any ONE of the following:″STYLE 65536 FONT ″Geneva″,12 COLOR -1,
* EOF:Northern (single).fmt
IF Bail=2
screen 1 off
RETURN
ENDIF
USE ″SmartGuy:FoxBASE+/Mac:Fox files:Lookup.dbf″
SET TALK ON
IF Eobject<>′ 
STORE UPPER(Ebject) to Eobject
SET SAFETY OFF
SORT ON Entry TO ″Lookup entry.dbf″
SET SAFETY ON
USE ″Lookup entry,dbf″
LOCATE FOR Look=Eobject
IF .NOT.FOUND<>
CLEAR
LOOP
ENDIF
BROWSE
STORE Entry TO Searchval 
CLOSE DATABASES
ERASE ″Lookup entry.dbf″
ENDIF
IF Dobject<>′
SET EXACT OFF
SET SAFETY OFF
SORT ON descriptor TO ″Lookup descriptor.dbf″
SET SAFETY On
USE ″Lookup descriptor. dbf″
LOCATE FOR UPPER (TRIM (descriptor))=OPPER(TRIM(Dobject))
IF .NOT.FOUND()
CLEAR
				
				<dp n="d68"/>
LOOP
ENDIF
BROWSE
STORE Entry TO Searchval
CLOSE DATABASES
ERASE ″Lookup descriptor.dbf″
SET EXACT ON
ENDIF
IF Numb<>0
USE ″SmartGuy:FoxBASE+/Mac:Fox files:clones,dbf″
GO Numb
BROWSE
STORE Entry TO Searchval
ENDIF
CLEAR
?′Northern analysis for entry′
??Searchval
?
?′Enter Y to proceed′
WAIT TO OK
CLEAR
IF UPPER(OK) <>′Y′
screen 1 off
RETURN
ENDIF
* COMPRESSION SUBROUTINE FOR Library,dbf
?′Compressing the Lihraries file now...′
USE ″SmartGuy:FoxBASE+/Mac:Fox files:libraries.dbf″
SET SAFETY OFF
SORT ON library TO″Compressed libraries.dbf″
*FOR entcred>0
SET SAFETY ON
USE ″Compressed libraries.dbf″
DELETE FOR entered=0
PACK
COUNT TO TOT
MARK1=1
SW2=0
DO WHILE SW2=0 ROLL

  IF MARK1>=TOT

  PACK

  SW2=1

  LOOP

  ENDIF
GO MARK1
STORE library TO TESTA
SKIP
STORE Library TO TESTB
IF TESTA=TESTB
DELETE
ENDIF
MARK1=MARK1+1
LOOP
ENDDO ROLL
* Northern analysis
CLEAR
?′Doing the northern now...′
SET TALK ON
USE ″SmartGuy:FoxSASE+/Mac:Fox files:clones.dbf″
SET SAFETY OFF
COPY TO ″Hits.dbf″ FOR entry=searchval
SET SAFETY ON
				
				<dp n="d69"/>
CLCSE DATABASES
SELECT 1
USE ″Compressed litraries,dbf″
STORE RECCOUNT() TO Entries
SELECT 2
USE ″Hits,dbf″
Mark=1
DO WHILE .T.
SELECT 1
IF Mark>Entries
EXIT
ENDIF
GO MARK
STORE library TO Jigger
SELECT 2
COUNT TO Zog FOR library=Jigger
SELECT 1
REPLACE hits with Zog
Mark=Mark+1
LOOP
ENDDO
SELECT 1
BROWSE FIELDS LIERARY,LIENAME,ENTERED,HITS AT 0,0
CLEAR
?′Enter Y to print:′
WAIT TO PRINSET
IF UPPER(PRINSET) = ′Y′
SET PRINT ON
CLEAR
EJECT
SCREEN 1 TYPE 0 HEADING ″Screen 1″ AT 40,2 SIZE 286,492 PIXELS  PONT ″Geneva″,14 COLOR 0,0,0
?′DATAEASE ENTRIES MATCHING ENTRY′
?? Secrcnval
?DATE()
?
SCREEN 1 TYPE 0 HEADING ″Screen 1″ AT 40,2 SIZE 286,492 PIXELS FONT ″Geneva″,7 COLOR 0,0,0,
LIST OFF FIELDS library,libname,entered,hits
?
?
SELECT2
LIST OFF FIELD NUMBER,LIBRARY,D,S,F,Z,R,ENTRY,DESCRIPTOR,RFSTART,START,RFEND
SET TALK OFF
SET PRINT OFF
ENDIF
CLOSE DATABASES
SET TALK OFF
CLEAR
DO ″Test print.prg″
RETURN
表6
文库       库名ADENINB01    发炎的增殖腺ADRENOR01     肾上腺(r)ADRENOT01     肾上腺(Y)AMLBNOT01    AML胚细胞(T)BMARNOT01     骨髓BMARNOT02     骨髓(T)CARDNOT01     心肌(T)CHAONOT01    中国仓鼠卵巢CORNNOT01    角膜基质FIBRAGT01    成纤维细胞AT 5FIBRAGT02    成纤维细胞AT 30FIBRANT01    成纤维细胞ATFIBRNGT01    成纤维细胞UV 5FIBRNGT02    成纤维细胞UV 30FIBRNOT01     成纤维细胞FIBRNOT02    成纤维细胞正常HMC1NOT01     肥大细胞系HUVELPB01  HUVECIFN,TNF,LPSHUVENOB01     HUVEC对照HUVESTB01    HUVEC剪切变HYPONOB01      下丘脑KIDNNOT01      肾(T)LIVRNOT01      肝(T)LUNGNOT01      肺(T)MUSCNOT01    骨胳肌(T)OVIDNOB01      输卵管PANCNOT01    胰腺,正常PTTUNOR01     垂体(r)PITUNOT01     垂体(T)PLACNOB01      胎盘SINTNOT02     小肠(T)SPLNFET01    脾+肝,胎儿SPLNNOT02      脾STOMNOT01      胃SYNORAE01      滑膜粘液TBLYNOT01    T+B成淋巴细胞TESTNOT01      睾丸THP1NOB01    THP-1对照THP1PEB01    THP佛波醇THP1PLB01  THP-1佛波醇LPSU937NOT01  U937,单核白细胞号数    文库         dsizr    条目       描述符                   rtstar     tstart   rfend2304    U937NOT01    EHCCT   HUMEF1B    Elongation factor 1-beta    0           0      7733240    HMC1NOT01    EHCCT   HUMEF1B    Elongation factor 1-beta    0          370     7733259    HMC1NOT01    EHCCT   HUMEF1B    Elorgation factor 1-beta    0          371     7734693    HMC1NOT01    EHCCT   HUMEF1B    Elongation factor 1-beta    0          470     7738989    HMC1NOT01    EHCCT   HUMEF1B    Elongation factor 1-beta    0          327     7739139    HMC1NOT01    EHCCT   HUMEF1B    Elongation factor 1-beta    0          375     773

Claims (16)

1.一种分析含有基因转录物的样本的方法,该方法包括下述步骤:
(a)建立一个生物序列文库,
(b)生成一个转录物序列的集合,该集合中每一段转录物序列对应文库中不同生物序列。
(c)在一台已编程的计算机中处理转录物序列,该计算机中存储了与参考生物序列对应着的参考转录物序列的数据库,从而对每一段转录物序列生成一个确定的序列值,每一个上述确定的序列值对应一个序列标注和一段转录物序列与至少一段参考转录物序列之间的匹配程度。
(d)处理每一个上述确定的序列值以生成最终数据值,它对应每一个确定的序列值出现于文库中的次数。
2.权利要求1的方法,其中步骤(a)包括下列步骤:
获取mRNA的混合物;
制备mRNA的cDNA拷贝;
分离受上述cDNA转染的代表性克隆群体,并且从中建立生物序列文库。
3.权利要求1的方法,其中的生物序列是cDNA序列。
4.权利要求1的方法,其中的生物序列是RNA序列。
5.权利要求1的方法,其中的生物序列是蛋白质序列。
6.权利要求1的方法,其中,所述匹配的第一值表示严格匹配,匹配的第二值表示非严格匹配。
7.一种比较两种含有基因转录物的样本的方法,该方法包括:
(a)按照权利要求1的方法分析第一样本;
(b)建立第二生物序列文库,
(c)生成第二转录物序列集合,该集合中的每一段转录物序列对应于上述第二文库中不同生物序列之一;
(d)在前述已编程的计算机上处理第二转录物序列集合,以生成第二确定的序列值集合,称为进一步确定的序列值,其中每一个进一步确定的序列值对应一个序列标注和在第二文库中的一段生物序列与至少一段参考序列的匹配程度;
(e)处理每一个上述进一步确定的序列值,以生成进一步最终数据值,它表示每一个进一步确定的序列值出现在第二文库中的次数。
(f)处理从第一样本得到的最终数据值与从第二样本得到的进一步确定的序列值,生成转录物序列的比率,每一比率值对应于两个样本之间基因转录物数目的差别。
8.一种将一个生物样本中的mRNA相对丰度量化的方法,该方法包括下述步骤:
(a)从生物样本中分离mRNA转录物群体;
(b)确定以序列特异性方法转录mRNA的基因;
(c)确定对应于每一个基因的mRNA转录物数目;
(d)利用mRNA转录物数目确定mRNA转录物群体中mRNA转录物的相对丰度。
9.一种包括产生基因转录物图象的诊断方法,该方法包括下述步骤:
(a)从生物样本中分离出mRNA转录物群体;
(b)确定以序列特异性方法转录mRNA的基因;
(c)确定对应于每一个基因的mRNA转录物数目;
(d)利用mRNA转录物数目确定mRNA转录物群体中mRNA转录物的相对丰度,确定mRNA转录物相对丰度值的数据来自生物样本的基因转录物图象。
10.权利要求9的方法,进一步包括:
(e)提供一个标准的正常条件下与病理条件下基因转录物图象的集合;
(f)比较生物样本的基因转录物图象与步骤(e)的基因转录物图象,以确定至少一种标准基因转录物图象,该图象最接近生物样本的基因转录物图象。
11.权利要求9的方法,其中生物样本是活体解剖组织、痰、血或尿。
12.一种生成基因转录物图象的方法,该方法包括下述步骤:
(a)获取mRNA的混合物;
(b)制备mRNA的cDNA拷贝;
(c)将cDNA插入适当的载体并利用该载体转染适当的宿主菌株细胞,宿主菌株细胞铺于平板并生长成克隆,每一克隆代表一个特定的mRNA;
(d)分离重组克隆的代表性群体;
(e)利用一种序列特异性的方法确定群体中从每一克隆中扩增的cDNA,该方法确定转录特定的mRNA的基因;
(f)确定每一基因在克隆群体中出现的次数,作为相对丰度的指标;
(g)将基因及其相对丰度按丰度次序列表,以生成基因转录物图象。
13.权利要求12的方法,还包括如下诊断疾病的步骤:
对生物样本重复步骤(a)至(g)以生成正常条件下与病理条件下基因转录物图象的参考集合,生物样本来自正常人与患各种疾病的人的随机样本;
获取一个人类的测试样本,对它实施步骤(a)至(g)以生成一个测试基因转录物图象;
比较测试基因转录物图象和基因转录物图象参考集合;
确定至少一种参考基因转录物图象,该图象最接近测试基因转录物图象。
14.一个分析生物序列文库的计算机系统,该系统包括:
接受转录物序列集合的手段,其中每一段基因转录物序列对应于文库中不同的生物序列之一;
在此计算机系统中处理转录物序列的手段,该系统中存储一个对应于参考生物序列的参考转录物序列的数据库,其中计算机用软件编程,用来对每一段转录物序列生成一个确定的序列值,每一个确定的序列值对应于一个基因标注和文库中不同生物序列之一与至少一段参考转录物序列之间的匹配程度,该手段也用来处理每一个上述确定的序列值,以产生最终数据值,这些最终数据值表示每一个确定的序列值出现在文库中的次数。
15.权利要求14的系统,还包括:
建立生物序列文库以及从该文库生成上述转录物序列集合的文库生成手段。
16.权利要求15的系统,其中文库生成手段包括:
获取mRNA混合物的手段;
制备mRNA的cDNA拷贝的手段;
将cDNA拷贝插入细胞和使细胞生长成克隆的手段;
分离克隆的代表性群体及由此建立生物序列文库的手段。
CN95192325A 1994-01-27 1995-01-27 基因转录物比较分析 Pending CN1145098A (zh)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US08/187,530 1994-01-27
US08/187,530 US5840484A (en) 1992-07-17 1994-01-27 Comparative gene transcript analysis
US08/282,955 US6114114A (en) 1992-07-17 1994-07-29 Comparative gene transcript analysis
US08/282,955 1994-07-29

Publications (1)

Publication Number Publication Date
CN1145098A true CN1145098A (zh) 1997-03-12

Family

ID=26883115

Family Applications (1)

Application Number Title Priority Date Filing Date
CN95192325A Pending CN1145098A (zh) 1994-01-27 1995-01-27 基因转录物比较分析

Country Status (17)

Country Link
US (1) US6114114A (zh)
EP (1) EP0748390A4 (zh)
JP (1) JPH09503921A (zh)
CN (1) CN1145098A (zh)
AP (1) AP9600833A0 (zh)
AU (1) AU688465B2 (zh)
BG (1) BG100751A (zh)
BR (1) BR9506657A (zh)
CA (1) CA2182217A1 (zh)
CZ (1) CZ218996A3 (zh)
EE (1) EE9600097A (zh)
FI (1) FI962987A (zh)
LV (1) LV11696B (zh)
NO (1) NO963151L (zh)
OA (1) OA10723A (zh)
PL (1) PL315687A1 (zh)
WO (1) WO1995020681A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101930502A (zh) * 2010-09-03 2010-12-29 深圳华大基因科技有限公司 表型基因的检测及生物信息分析的方法及系统

Families Citing this family (94)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6040138A (en) * 1995-09-15 2000-03-21 Affymetrix, Inc. Expression monitoring by hybridization to high density oligonucleotide arrays
US6600996B2 (en) * 1994-10-21 2003-07-29 Affymetrix, Inc. Computer-aided techniques for analyzing biological sequences
US6974666B1 (en) 1994-10-21 2005-12-13 Appymetric, Inc. Methods of enzymatic discrimination enhancement and surface-bound double-stranded DNA
US5866330A (en) 1995-09-12 1999-02-02 The Johns Hopkins University School Of Medicine Method for serial analysis of gene expression
US5695937A (en) * 1995-09-12 1997-12-09 The Johns Hopkins University School Of Medicine Method for serial analysis of gene expression
US6418382B2 (en) 1995-10-24 2002-07-09 Curagen Corporation Method and apparatus for identifying, classifying, or quantifying DNA sequences in a sample without sequencing
US5871697A (en) 1995-10-24 1999-02-16 Curagen Corporation Method and apparatus for identifying, classifying, or quantifying DNA sequences in a sample without sequencing
US5972693A (en) * 1995-10-24 1999-10-26 Curagen Corporation Apparatus for identifying, classifying, or quantifying DNA sequences in a sample without sequencing
US7291463B2 (en) 1996-01-23 2007-11-06 Affymetrix, Inc. Nucleic acid labeling compounds
US7282327B2 (en) 1996-01-23 2007-10-16 Affymetrix, Inc. Nucleic acid labeling compounds
US20010018514A1 (en) 1998-07-31 2001-08-30 Mcgall Glenn H. Nucleic acid labeling compounds
US7423143B2 (en) 1996-01-23 2008-09-09 Affymetrix. Inc. Nucleic acid labeling compounds
US6864059B2 (en) 1996-01-23 2005-03-08 Affymetrix, Inc. Biotin containing C-glycoside nucleic acid labeling compounds
US6965020B2 (en) 1996-01-23 2005-11-15 Affymetrix, Inc. Nucleic acid labeling compounds
US7468243B2 (en) 2001-03-12 2008-12-23 Affymetrix, Inc. 2-aminopyrimidin-4-one nucleic acid labeling compounds
US6312892B1 (en) * 1996-07-19 2001-11-06 Cornell Research Foundation, Inc. High fidelity detection of nucleic acid differences by ligase detection reaction
WO1998014619A1 (en) * 1996-10-03 1998-04-09 Incyte Pharmaceuticals, Inc. Methods for generating and analyzing transcript markers
US5919638A (en) * 1996-10-08 1999-07-06 Abbott Laboratories Reagents and methods useful for detecting prostate tumors
US20050202499A1 (en) 1996-10-31 2005-09-15 Billing-Medel Patricia A. Reagents and methods useful for detecting diseases of the breast
DE69737788T2 (de) * 1996-10-31 2008-03-13 Abbott Laboratories, Abbott Park Reagenzien und methoden zum nachweis von erkrankungen der brust
WO1998020143A1 (en) * 1996-11-05 1998-05-14 Abbott Laboratories Reagents and methods useful for detecting diseases of the lung
US5981190A (en) * 1997-01-08 1999-11-09 Ontogeny, Inc. Analysis of gene expression, methods and reagents therefor
US6461814B1 (en) * 1997-01-15 2002-10-08 Dominic G. Spinella Method of identifying gene transcription patterns
US5968784A (en) * 1997-01-15 1999-10-19 Chugai Pharmaceutical Co., Ltd. Method for analyzing quantitative expression of genes
JP2001522225A (ja) * 1997-01-31 2001-11-13 アボツト・ラボラトリーズ 肺の疾患の検出に有用な試薬及び方法
JP2001522238A (ja) 1997-03-31 2001-11-13 アボツト・ラボラトリーズ 胃腸管の疾患の検出に有用な試薬および方法
US6368792B1 (en) 1997-03-31 2002-04-09 Abbott Laboratories Reagents and methods useful for detecting diseases of the gastrointestinal tract
CA2285039A1 (en) 1997-03-31 1998-10-08 Abbott Laboratories Reagents and methods useful for detecting diseases of the gastrointestinal tract
WO1998044160A1 (en) * 1997-03-31 1998-10-08 Abbott Laboratories Reagents and methods useful for detecting diseases of the gastrointestinal tract
US5966711A (en) * 1997-04-15 1999-10-12 Alpha Gene, Inc. Autonomous intelligent agents for the annotation of genomic databases
NO972006D0 (no) * 1997-04-30 1997-04-30 Forskningsparken I Aas As Ny metode for diagnose av sykdommer
WO1998050567A1 (en) * 1997-05-02 1998-11-12 Abbott Laboratories Reagents and methods useful for detecting diseases of the prostate
WO1998051805A1 (en) * 1997-05-15 1998-11-19 Abbott Laboratories Reagents and methods useful for detecting diseases of the prostate
WO1998051824A1 (en) * 1997-05-15 1998-11-19 Abbott Laboratories Reagents and methods useful for detecting disease of the urinary tract
CA2292759A1 (en) 1997-06-05 1998-12-10 Abbott Laboratories Reagents and methods useful for detecting diseases of the urinary tract
CA2292788A1 (en) * 1997-06-11 1998-12-17 Abbott Laboratories Reagents and methods useful for detecting diseases of the lung
EP1003779A1 (en) * 1997-07-07 2000-05-31 Abbott Laboratories Reagents and methods useful for detecting diseases of the breast
WO1999002714A1 (en) * 1997-07-07 1999-01-21 Abbott Laboratories Reagents and methods useful for detecting diseases of the breast
WO1999002734A1 (en) * 1997-07-08 1999-01-21 Abbott Laboratories Reagents and methods useful for detecting diseases of the urinary tract
US20020064792A1 (en) * 1997-11-13 2002-05-30 Lincoln Stephen E. Database for storage and analysis of full-length sequences
CA2309756A1 (en) * 1997-11-17 1999-05-27 Abbott Laboratories Reagents and methods useful for detecting diseases of the breast
AU1681099A (en) * 1997-12-29 1999-07-19 Genena Ltd. A method for identifying and characterizing cells and tissues
US6121023A (en) * 1998-01-22 2000-09-19 Akzo Nobel N.V. Isothermal transcription based assay for the detection and quantification of the chemokine rantes
AU3217599A (en) 1998-03-31 1999-10-18 Genzyme Corporation Methods for the diagnosis and treatment of lung cancer
CA2326835A1 (en) * 1998-04-02 1999-10-14 Tellus Genetic Resources, Inc. A method for obtaining a plant with a genetic lesion in a gene sequence
US6403778B1 (en) 1998-05-04 2002-06-11 Incyte Genomics, Inc. Toxicological response markers
AU6022299A (en) * 1998-08-28 2000-03-21 Incyte Pharmaceuticals, Inc. Toxicological response markers
US6667176B1 (en) 2000-01-11 2003-12-23 Geron Corporation cDNA libraries reflecting gene expression during growth and differentiation of human pluripotent stem cells
US6453241B1 (en) 1998-12-23 2002-09-17 Rosetta Inpharmatics, Inc. Method and system for analyzing biological response signal data
AU2596800A (en) * 1998-12-31 2000-07-31 Iconix Pharmaceuticals, Inc. Method for generating a pathway reporter system
WO2000073509A2 (en) * 1999-06-01 2000-12-07 Incyte Genomics, Inc. Molecules for diagnostics and therapeutics
US6960439B2 (en) 1999-06-28 2005-11-01 Source Precision Medicine, Inc. Identification, monitoring and treatment of disease and characterization of biological condition using gene expression profiles
AU5316800A (en) * 1999-08-05 2001-03-05 Incyte Genomics, Inc. Secretory molecules
US7244559B2 (en) 1999-09-16 2007-07-17 454 Life Sciences Corporation Method of sequencing a nucleic acid
US7211390B2 (en) 1999-09-16 2007-05-01 454 Life Sciences Corporation Method of sequencing a nucleic acid
WO2001020998A1 (en) * 1999-09-24 2001-03-29 Linden Technologies, Inc. Drug discovery using gene expression profiling
AU2001224349A1 (en) * 2000-04-10 2001-10-23 The Scripps Research Institute Proteomic analysis
GB0008908D0 (en) * 2000-04-11 2000-05-31 Hewlett Packard Co Shopping assistance service
US7363165B2 (en) 2000-05-04 2008-04-22 The Board Of Trustees Of The Leland Stanford Junior University Significance analysis of microarrays
EP1287128A2 (en) * 2000-05-11 2003-03-05 Academisch Ziekenhuis bij de Universiteit van Amsterdam Myc targets
BR0111742A (pt) * 2000-06-19 2004-02-03 Correlogic Systems Inc Método heurìstico de classificação
WO2002008453A2 (en) * 2000-07-21 2002-01-31 Phase-1 Molecular Toxicology Canine toxicity genes
US7110885B2 (en) 2001-03-08 2006-09-19 Dnaprint Genomics, Inc. Efficient methods and apparatus for high-throughput processing of gene sequence data
CA2377213A1 (en) * 2001-03-20 2002-09-20 Ortho-Clinical Diagnostics, Inc. Method for providing clinical diagnostic services
US6996477B2 (en) 2001-04-19 2006-02-07 Dana Farber Cancer Institute, Inc. Computational subtraction method
AUPR480901A0 (en) * 2001-05-04 2001-05-31 Genomics Research Partners Pty Ltd Diagnostic method for assessing a condition of a performance animal
WO2003004690A2 (en) * 2001-07-06 2003-01-16 454$m(3) CORPORATION Method for isolation of independent, parallel chemical micro-reactions using a porous filter
US20030148314A1 (en) * 2001-08-01 2003-08-07 Millennium Pharmaceuticals, Inc. Compositions, kits, and methods for identification, assessment, prevention, and therapy of colon cancer
US20030054396A1 (en) * 2001-09-07 2003-03-20 Weiner Michael P. Enzymatic light amplification
US6956114B2 (en) 2001-10-30 2005-10-18 '454 Corporation Sulfurylase-luciferase fusion proteins and thermostable sulfurylase
US6902921B2 (en) 2001-10-30 2005-06-07 454 Corporation Sulfurylase-luciferase fusion proteins and thermostable sulfurylase
US20050124022A1 (en) * 2001-10-30 2005-06-09 Maithreyan Srinivasan Novel sulfurylase-luciferase fusion proteins and thermostable sulfurylase
JP5236856B2 (ja) 2001-11-09 2013-07-17 ライフ テクノロジーズ コーポレーション 遺伝子発現プロファイルを用いる病気の同定、観測及び治療及び生物学的状態の同定
WO2003071252A2 (en) 2002-02-15 2003-08-28 Exact Sciences Corporation Methods for analysis of molecular events
US20050136457A1 (en) * 2002-05-22 2005-06-23 Fujitsu Limited Method for analyzing genome
US20050158742A1 (en) * 2002-05-22 2005-07-21 Fujitsu Limited Method for analyzing genome
AR040711A1 (es) * 2002-07-29 2005-04-13 Us Agriculture Un metodo para verificacion de calidad/control de calidad para proceso de bioensayo de alto rendimiento
EP1431399A1 (en) * 2002-12-20 2004-06-23 Clinigenetics Methods and composition for identifying therapeutic agents of atherosclerotic plaque lesions
WO2004069849A2 (en) * 2003-01-29 2004-08-19 454 Corporation Bead emulsion nucleic acid amplification
US7575865B2 (en) * 2003-01-29 2009-08-18 454 Life Sciences Corporation Methods of amplifying and sequencing nucleic acids
AU2004261222A1 (en) * 2003-08-01 2005-02-10 Correlogic Systems, Inc. Multiple high-resolution serum proteomic features for ovarian cancer detection
GB0412301D0 (en) 2004-06-02 2004-07-07 Diagenic As Product and method
WO2006026654A2 (en) 2004-08-27 2006-03-09 Exact Sciences Corporation Method for detecting a recombinant event
US9109256B2 (en) 2004-10-27 2015-08-18 Esoterix Genetic Laboratories, Llc Method for monitoring disease progression or recurrence
US20070003996A1 (en) * 2005-02-09 2007-01-04 Hitt Ben A Identification of bacteria and spores
US9777314B2 (en) 2005-04-21 2017-10-03 Esoterix Genetic Laboratories, Llc Analysis of heterogeneous nucleic acid samples
US20080312514A1 (en) * 2005-05-12 2008-12-18 Mansfield Brian C Serum Patterns Predictive of Breast Cancer
CN101218497B (zh) * 2005-07-07 2012-04-25 索尼株式会社 利用瞬逝光的物质信息获取方法和物质信息测量装置、以及碱基序列确定方法和装置
US7608395B2 (en) 2005-09-15 2009-10-27 Baylor Research Institute Systemic lupus erythematosus diagnostic assay
JP2009523410A (ja) 2005-12-08 2009-06-25 ノバルティス アクチエンゲゼルシャフト 遺伝子転写に対するfgfr3の阻害剤の効果
WO2007092563A2 (en) 2006-02-08 2007-08-16 Genzyme Corporation Gene therapy for niemann-pick disease type a
US20080250016A1 (en) * 2007-04-04 2008-10-09 Michael Steven Farrar Optimized smith-waterman search
BRPI0813002A2 (pt) 2007-06-29 2017-05-02 Correlogic Systems Inc marcadores preditivos para o câncer ovariano
WO2013123481A1 (en) * 2012-02-16 2013-08-22 Cornell University Methods and kit for characterizing the modified base status of a transcriptome

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5371671A (en) * 1990-03-13 1994-12-06 The Regents Of The University Of California DNA sequence autoradiogram digitizer and methodology implemented in the same
US5723286A (en) * 1990-06-20 1998-03-03 Affymax Technologies N.V. Peptide library and screening systems
US5364759B2 (en) * 1991-01-31 1999-07-20 Baylor College Medicine Dna typing with short tandem repeat polymorphisms and identification of polymorphic short tandem repeats
ATE148889T1 (de) * 1991-09-18 1997-02-15 Affymax Tech Nv Verfahren zur synthese der verschiedenen sammlungen von oligomeren
US5270170A (en) * 1991-10-16 1993-12-14 Affymax Technologies N.V. Peptide library and screening method
US5541061A (en) * 1992-04-29 1996-07-30 Affymax Technologies N.V. Methods for screening factorial chemical libraries

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101930502A (zh) * 2010-09-03 2010-12-29 深圳华大基因科技有限公司 表型基因的检测及生物信息分析的方法及系统
CN101930502B (zh) * 2010-09-03 2011-12-21 深圳华大基因科技有限公司 表型基因的检测及生物信息分析的方法及系统

Also Published As

Publication number Publication date
AP9600833A0 (en) 1996-07-31
CZ218996A3 (en) 1997-05-14
FI962987A0 (fi) 1996-07-26
NO963151D0 (no) 1996-07-26
BG100751A (en) 1997-07-31
OA10723A (en) 2002-12-04
EP0748390A4 (en) 1998-04-01
NO963151L (no) 1996-09-27
JPH09503921A (ja) 1997-04-22
CA2182217A1 (en) 1995-08-03
BR9506657A (pt) 1997-09-16
EE9600097A (et) 1996-12-16
FI962987A (fi) 1996-09-26
US6114114A (en) 2000-09-05
PL315687A1 (en) 1996-11-25
AU1694695A (en) 1995-08-15
LV11696B (en) 1997-08-20
WO1995020681A1 (en) 1995-08-03
AU688465B2 (en) 1998-03-12
EP0748390A1 (en) 1996-12-18

Similar Documents

Publication Publication Date Title
CN1145098A (zh) 基因转录物比较分析
US5840484A (en) Comparative gene transcript analysis
JP5670615B2 (ja) 血中白血球のマイクロアレイ分析を介する全身性エリテマトーデスの疾患進行の診断、予知およびモニタリング
CN101378764A (zh) 通过血液白细胞微阵列分析对系统性红斑狼疮的诊断、预后和疾病发展的监测
WO1995020681A9 (en) Comparative gene transcript analysis
US20200347444A1 (en) Gene-expression profiling with reduced numbers of transcript measurements
US20220081721A1 (en) Characterization of bone marrow using cell-free messenger-rna
CN108588230B (zh) 一种用于乳腺癌诊断的标记物及其筛选方法
EP1250460A2 (en) Informative nucleic acid arrays and methods for making same
Hackert et al. Human and mouse neutrophils share core transcriptional programs in both homeostatic and inflamed contexts
Cao et al. Profiling brain transcription: neurons learn a lesson from yeast
CN114891869A (zh) 一种免疫细胞功能图谱体系及其构建方法与应用
Petrova et al. A revised single-cell transcriptomic atlas of Xenopus embryo reveals new differentiation dynamics.
Fomchenko et al. Proteogenomic single cell analysis of skeletal muscle myocytes
US11739369B2 (en) Immune profiling using small volume blood samples
Hackert et al. Human and murine neutrophils share core transcriptional programs in both homeostatic and inflamed contexts
Peters Mapping and modeling macrophages in tuberculosis
Patel Defining the Peripheral Blood Immune Cell Atlas of the Horse, a Non-Traditional Organism, by Single-Cell RNA Sequencing
Duhan et al. Single-cell transcriptomics: background, technologies, applications, and challenges
Tansey et al. Microfluidics-free single-cell genomics reveals complex central-peripheral immune crosstalk in the mouse brain during peripheral inflammation
WO2023115065A2 (en) Molecular signatures for cell typing and monitoring immune health
Pant et al. Monocytes in type 1 diabetes families exhibit high cytolytic activity and subset abundances that correlate with clinical progression
Pouyabahar et al. Single cell profiling reveals strain-specific differences in myeloid inflammatory potential in the rat liver
Vafadarnejad Implementation and application of bioinformatics methods to analyze and visualize single-cell RNA-sequencing data
Gersten Systems analysis of model organisms in the study of human disease phenotypes

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C01 Deemed withdrawal of patent application (patent law 1993)
WD01 Invention patent application deemed withdrawn after publication