CN114182007B

CN114182007B - Behcet disease marker gene and application thereof

Info

Publication number: CN114182007B
Application number: CN202111494172.5A
Authority: CN
Inventors: 吴春燕; 谢秋瑾; 沈秀萍
Original assignee: Shanghai Ruiyi Medical Laboratory Co ltd
Current assignee: Shanghai Ruiyi Medical Laboratory Co ltd
Priority date: 2021-12-08
Filing date: 2021-12-08
Publication date: 2023-11-24
Anticipated expiration: 2041-12-08
Also published as: CN114182007A

Abstract

The invention provides a Behcet disease gene marker, which comprises a first gene set, wherein the first gene set consists of the following genes: BA15 GI 0058342, BA17 GI 0003414, BA19 GI 0000352, BA19 GI 0000679, BA19 GI 0002844, BA19 GI 0004843, BA19 GI 0007615, BA19 GI 0011260, BA19 GI 0017177, BA1 GI 0023027, BA26 GI 0018693, BA28 GI 0005743, BA2 GI 0044108, BA19 GI 0007628, BA4 GI 0011532, BA19 GI 0013990, BA1 GI 0038716, BA1 GI 0021066.

Description

Behcet disease marker gene and application thereof

Technical Field

The invention relates to the field of biotechnology, in particular to a Behcet disease marker gene and application thereof, and more particularly relates to a kit, application of a reagent in preparation of the kit, a pharmaceutical composition or food composition for preventing or treating Behcet disease, a method for determining whether an individual has the Behcet disease, a device for determining whether the individual has the Behcet disease, a device and a method for screening medicines.

Background

Behcet s disease (BD) is an auto-inflammatory disease with multiple organ involvement, and is a typical clinical manifestation of recurrent oral and genital ulcers, skin lesions, and uveitis. BD frequently occurs in young and strong years, inflammation is repeated and treatment is troublesome, and the blindness caused by the BD is mostly irreversible blindness, so that the life quality of patients is seriously affected.

Previous studies have found that genetic factors and self-verifying reactions are involved in the pathogenesis of BD. Th1 and Th17 cells are overactivated, regulatory T cell (Treg cell) numbers and dysfunctions in BD patients.

Recent studies have shown that gut microorganisms play a critical role in regulating Th1, tj17 and Treg cells, and that gut microbial disorders are associated with many autoimmune diseases such as rheumatoid arthritis, systemic lupus erythematosus, etc., and BD.

Comparing the fecal microbiota of the behcet with that of the healthy control group using the 16SrRNA sequencing technique, behcet was first found to be associated with dysbiosis of the intestinal microbial ecosystem, in particular as a reduction in intestinal microbial diversity-a significant reduction in the genus rochanteria and the genus chalky. These microorganisms belong to the clostridium groups XIVa and IV, respectively, and are well known butyrate producers of transgenic crops in humans, and are related to healthy transgenic structures.

The first time this study further demonstrated that the production of butyrate was significantly reduced in patients with behcet, however butyrate was able to promote differentiation of regulatory T cells, and thus the study results obtained helped to speculate that defects in butyrate production could lead to reduced regulatory T cell responses and activation of immunopathogenic T effector responses. The Behcet's abnormal intestinal microbiota characteristics suggest that the intestinal microbiota plays an important role in the pathogenesis of Behcet's disease.

Disclosure of Invention

The present invention aims to solve, at least to some extent, one of the above technical problems or to at least provide a commercial choice.

According to a first aspect of the present invention there is provided a kit comprising reagents suitable for detecting at least one gene of a first set of genes, the first set of genes consisting of: BA15_gi_0058342, BA17_gi_0003414, BA19_gi_0000352, BA19_gi_0000679, BA19_gi_0002844, BA19_gi_0004843, BA19_gi_0007615, BA19_gi_0011260, BA19_gi_0017177, BA1_gi_0023027, BA26_gi_0018693, BA28_gi_0005743, BA2_gi_0044108, wherein the genes in the first gene set are identical to SEQ ID NO:1-13, wherein the genes in the first set of genes correspond one-to-one to the corresponding SEQ ID NO:1-13 has no less than 90% identity. According to the kit provided by the embodiment of the invention, the reagent for accurately detecting at least one gene in the first gene set can be used for accurately distinguishing or diagnosing the Behcet and the healthy individual.

In a second aspect of the invention, the invention proposes the use of a reagent in the preparation of a kit, said reagent being adapted to detect at least one gene of a first set of genes. According to an embodiment of the invention, the kit is for diagnosing or detecting the therapeutic effect of behcet's disease, the first gene set consisting of the following genes: BA15_gi_0058342, BA17_gi_0003414, BA19_gi_0000352, BA19_gi_0000679, BA19_gi_0002844, BA19_gi_0004843, BA19_gi_0007615, BA19_gi_0011260, BA19_gi_0017177, BA1_gi_0023027, BA26_gi_0018693, BA28_gi_0005743, BA2_gi_0044108, wherein the genes in the first gene set are identical to SEQ ID NO:1-13, wherein the genes in the first set of genes correspond one-to-one to the corresponding SEQ ID NO:1-13 has no less than 90% identity. According to the kit prepared by the reagent of the specific embodiment of the invention, at least one gene in the first gene set can be accurately detected, and a Behcet disease patient and a healthy individual can be distinguished very accurately, so that the Behcet disease diagnosis can be effectively carried out in an early stage, or the kit can be used for detecting the change of the Behcet disease in the treatment process.

In a third aspect of the invention, the invention provides a pharmaceutical or food composition for preventing or treating behcet's disease. According to an embodiment of the present invention, there is provided a substance for increasing the abundance of at least one gene in the second gene set, the second gene set consisting of: n20_gi_0009810, n48_gi_0125557, wherein the genes in the second gene set are identical to the genes in SEQ ID NO: 14. 15, and the genes in the second gene set correspond to the corresponding SEQ ID NO: 14. 15 has an identity of not less than 90%. The genes of the second gene set in the Behcet disease marker gene can be used for noninvasively finding or assisting in detecting the Behcet disease in the early stage, and determining the probability of the individuals suffering from the Behcet disease or the probability of the individuals in a healthy state; meanwhile, the increase of the abundance of various genes in the second gene set of microorganisms in the intestinal tract of a population at high risk of Behcet's disease or a patient with Behcet's disease can reduce the probability of getting Behcet's disease or slow down and cure Behcet's disease, so that the medicament or food composition comprising the increase of the abundance of at least one gene in the second gene set can be used for balancing intestinal flora, effectively preventing or treating Behcet's disease.

In a fourth aspect of the invention, the invention features a method of determining whether an individual has Behcet's disease. According to an embodiment of the invention, it comprises: (1) Determining the abundance of a marker gene in a fecal sample of the individual, the marker gene comprising at least one of a first gene set and a second gene set; (2) Comparing the abundance obtained in step (1) to a predetermined threshold to determine if the individual has behcet's disease; wherein the first gene set consists of the following genes: BA15_gi_0058342, BA17_gi_0003414, BA19_gi_0000352, BA19_gi_0000679, BA19_gi_0002844, BA19_gi_0004843, BA19_gi_0007615, BA19_gi_0011260, BA19_gi_0017177, BA1_gi_0023027, BA26_gi_0018693, BA28_gi_0005743, BA2_gi_0044108, wherein the genes in the first gene set are identical to SEQ ID NO:1-13, wherein the genes in the first set of genes correspond one-to-one to the corresponding SEQ ID NO:1-13, said second set of genes consisting of:

n20_gi_0009810, n48_gi_0125557, wherein the genes in the second gene set are identical to the genes in SEQ ID NO: 14. 15, and the genes in the second gene set correspond to the corresponding SEQ ID NO: 14. 15 has an identity of not less than 90%. According to the method provided by the embodiment of the invention, whether the individual suffers from Behcet disease can be determined according to the abundance of the marker gene in the fecal sample of the individual, wherein the marker gene is determined by verifying a large number of fecal samples in a known state and analyzing the abundance of genes of various intestinal microorganisms in the fecal samples of the Behcet disease group and the healthy group through difference comparison.

In a fifth aspect of the invention, the invention features a device for determining whether an individual has Behcet's disease. According to an embodiment of the invention, it comprises: an abundance determination unit for determining an abundance of a marker gene in a fecal sample of the individual, the marker gene comprising at least one of a first gene set and a second gene set; a comparison unit for comparing the obtained abundance with a predetermined threshold in order to determine whether the individual suffers from behcet's disease; wherein the first gene set consists of the following genes: BA15_gi_0058342, BA17_gi_0003414, BA19_gi_0000352, BA19_gi_0000679, BA19_gi_0002844, BA19_gi_0004843, BA19_gi_0007615, BA19_gi_0011260, BA19_gi_0017177, BA1_gi_0023027, BA26_gi_0018693, BA28_gi_0005743, BA2_gi_0044108, wherein the genes in the first gene set are identical to SEQ ID NO:1-13, wherein the genes in the first set of genes correspond one-to-one to the corresponding SEQ ID NO:1-13, said second set of genes consisting of: n20_gi_0009810, n48_gi_0125557, wherein the genes in the second gene set are identical to the genes in SEQ ID NO: 14. 15, and the genes in the second gene set correspond to the corresponding SEQ ID NO: 14. 15 has an identity of not less than 90%. The marker genes are determined by the inventor through comparing and analyzing the abundance of various intestinal genes in faecal samples of the Behcet and healthy people and analyzing and verifying a large number of faecal samples in known states, and the device according to the embodiment of the invention can accurately determine whether an individual is a high-risk crowd of the Behcet or the Behcet.

In a sixth aspect of the invention, the invention provides an apparatus. According to an embodiment of the invention, it comprises: a computer-readable storage medium having stored thereon a computer program for executing the method of the fourth aspect; and one or more processors configured to execute the program in the computer-readable storage medium. The device provided by the embodiment of the invention can accurately determine whether an individual is a high-risk crowd of Behcet's disease or a Behcet's disease.

In a seventh aspect of the invention, the invention provides a method of screening for a drug. According to an embodiment of the invention, the medicament is for use in the treatment or prevention of behcet's disease, the method comprising: administering a candidate drug to a subject, detecting the abundance of a marker gene in the subject's stool before and after administration, the marker gene comprising at least one of a first gene set and a second gene set, wherein a candidate drug that satisfies at least one of the following conditions is suitable for use in treating or preventing behcet's disease: (1) After said administering, said abundance of at least one gene of said first set of genes is decreased; and (2) said increase in said abundance of at least one gene of said second set of genes following said administering; wherein the first gene set consists of the following genes: BA15_gi_0058342, BA17_gi_0003414, BA19_gi_0000352, BA19_gi_0000679, BA19_gi_0002844, BA19_gi_0004843, BA19_gi_0007615, BA19_gi_0011260, BA19_gi_0017177, BA1_gi_0023027, BA26_gi_0018693, BA28_gi_0005743, BA2_gi_0044108, wherein the genes in the first gene set are identical to SEQ ID NO:1-13, wherein the genes in the first set of genes correspond one-to-one to the corresponding SEQ ID NO:1-13, said second set of genes consisting of: n20_gi_0009810, n48_gi_0125557, wherein the genes in the second gene set are identical to the genes in SEQ ID NO: 14. 15, and the genes in the second gene set correspond to the corresponding SEQ ID NO: 14. 15 has an identity of not less than 90%. The method according to the embodiment of the invention can produce or screen out drugs which reduce the abundance of various genes in the first gene set in the marker gene and/or increase the abundance of various genes in the second gene set in the intestinal marker gene, and has important significance for assisting in alleviating clinical symptoms of Behcet's disease.

Drawings

The foregoing and/or additional aspects and advantages of the present invention will become apparent and readily appreciated from the following description of the embodiments, taken in conjunction with the accompanying drawings, in which:

FIG. 1 is a schematic diagram of a test analysis procedure for screening for identification of a Behcet's disease marker gene in an embodiment of the present invention.

FIG. 2 is a graph showing the results of AUC evaluation of marker genes as diagnostic indicators in the embodiment of the present invention, wherein Specificity indicates Specificity, i.e., predicted positive and actually positive, true positive, and ordinate Sensitivity indicates Sensitivity, i.e., true negative:

2-A is a graph of AUC values and confidence interval results under the ROC curve of 52 sample data in the first period;

2-B is a graph of AUC values and confidence interval results under the ROC curve for 24 sample data from the second phase.

Detailed Description

Embodiments of the present invention are described in detail below, examples of which are illustrated in the accompanying drawings, wherein the same or similar reference numerals refer to the same or similar elements or elements having the same or similar functions throughout. The embodiments described below by referring to the drawings are illustrative only and are not to be construed as limiting the invention. It should be noted that the terms "first" or "second" and the like are used herein for convenience of description only and are not to be construed as indicating or implying relative importance or as having a precedence relationship therebetween.

In the description of the present invention, unless otherwise indicated, the meaning of "a plurality" is two or more. In this document, unless explicitly stated and limited otherwise, the terms "connected," "coupled," and the like are to be construed broadly, and may be, for example, fixedly coupled, detachably coupled, or integrally coupled; can be mechanically or electrically connected; can be directly connected or indirectly connected through an intermediate medium, and can be communication between two elements.

Biological markers are cellular, biochemical or molecular changes that can be detected from biological media. Biological agents include various body fluids, tissues, cells, feces, hair, breath, and the like.

The abundance of a certain gene refers to the copy number of the gene in the genome, and the abundance of the gene is high, i.e. the number of the gene is large. For example, the copy number of such a gene in the genome of a population of intestinal microorganisms can be expressed as the content of such a gene in the population.

Identity, according to the present invention, in order to compare two or more nucleotide sequences, the percentage of "sequence identity" between a first sequence and a second sequence can be calculated by dividing [ the number of nucleotides in the first sequence that are identical to the nucleotides in the corresponding positions ]. The nucleotides in the second sequence are subtracted by [ the total number of nucleotides in the first sequence ], then multiplied by [100% ], wherein the deletion, insertion, substitution or addition of each nucleotide in the second nucleotide sequence-relative to the first nucleotide sequence-is considered as a difference in single nucleotide (position).

Alternatively, the degree of sequence identity between two or more nucleotide sequences may be calculated using standard settings using known computer algorithms for sequence alignment, such as NCBI Blast v 2.0.

Some other techniques for determining the degree of sequence identity, computer algorithms and settings are described, for example, in WO 04/037999,EP 0 967 284,EP 1 085 089,WO 00/55318, WO 00/78972, WO 98/49185 and GB 2357768-A.

The "marker gene" in the present application is derived from a microorganism in a fecal sample of the intestinal tract, and the length thereof is not particularly limited, and may be a complete gene, a coding region or a non-coding region of a gene, and further, a nucleic acid fragment of any length may be selected as the marker gene according to the purpose of the experiment.

According to one embodiment of the present application there is provided a kit comprising reagents suitable for detecting at least one gene of a first set of genes consisting of: BA15_gi_0058342, BA17_gi_0003414, BA19_gi_0000352, BA19_gi_0000679, BA19_gi_0002844, BA19_gi_0004843, BA19_gi_0007615, BA19_gi_0011260, BA19_gi_0017177, BA1_gi_0023027, BA26_gi_0018693, BA28_gi_0005743, BA2_gi_0044108, wherein the genes in the first gene set are identical to SEQ ID NO:1-13, wherein the genes in the first set of genes correspond one-to-one to the corresponding SEQ ID NO:1-13 has no less than 90% identity.

According to a specific embodiment of the invention, the kit further comprises reagents suitable for detecting at least one gene of a second set of genes consisting of: n20_gi_0009810, n48_gi_0125557, wherein the genes in the second gene set are identical to the genes in SEQ ID NO: 14. 15, and the genes in the second gene set correspond to the corresponding SEQ ID NO: 14. 15 has an identity of not less than 90%.

According to a specific embodiment of the invention, the kit comprises reagents suitable for detecting all of the genes in the first set of genes.

According to a specific embodiment of the invention, the kit comprises reagents suitable for detecting all of the genes in the second set of genes.

According to a specific embodiment of the present invention, the marker gene is determined by comparing and analyzing and verifying differences of abundance of microorganisms in stool samples of a large number of individuals suffering from Behcet's disease and a large number of healthy control individuals, and the marker gene related to Behcet's disease among genes of microorganisms in intestinal tracts is clarified. The kit comprising the reagent for detecting the marker gene can determine the probability of the individual being in a state of Behcet's disease or the probability of the individual being in a healthy state, and can be used for noninvasive early detection or auxiliary detection of Behcet's disease.

According to a specific embodiment of the present invention, the reagent suitable for detecting the first gene set or the second gene set is not particularly limited, and any reagent that can directly or indirectly detect the abundance of the marker gene is included in the scope of the present invention, such as: and reagents used in the process of directly detecting by using PCR technology, high-throughput sequencing and other methods, or reagents used in the process of indirectly obtaining the abundance of the gene by detecting the content of the protein corresponding to the gene by using Western Blot technology, and the like.

The use of a reagent according to the invention for the preparation of a kit suitable for detecting at least one gene of a first set of genes for diagnosing or detecting the therapeutic effect of behcet's disease, said first set of genes consisting of: BA15_gi_0058342, BA17_gi_0003414, BA19_gi_0000352, BA19_gi_0000679, BA19_gi_0002844, BA19_gi_0004843, BA19_gi_0007615, BA19_gi_0011260, BA19_gi_0017177, BA1_gi_0023027, BA26_gi_0018693, BA28_gi_0005743, BA2_gi_0044108, wherein the genes in the first gene set are identical to SEQ ID NO:1-13, wherein the genes in the first set of genes correspond one-to-one to the corresponding SEQ ID NO:1-13 has no less than 90% identity.

According to a specific embodiment of the present invention, the marker gene is determined by comparing and analyzing and verifying the difference of the abundance of microorganisms in the stool samples of a large number of individuals suffering from Behcet's disease and a large number of healthy control individuals, and the marker gene related to Behcet's disease in the microbial genes of the intestinal tract is clarified. The reagent for detecting the marker gene can determine the probability of the individual suffering from Behcet's disease or the probability of the individual being in a healthy state, and can be used for noninvasive early detection or auxiliary detection of Behcet's disease.

According to some specific embodiments of the invention, the reagent is further adapted to detect at least one gene of a second set of genes consisting of: n20_gi_0009810, n48_gi_0125557, wherein the genes in the second gene set are identical to the genes in SEQ ID NO: 14. 15, and the genes in the second gene set correspond to the corresponding SEQ ID NO: 14. 15 has an identity of not less than 90%.

The present invention provides a pharmaceutical or food composition for preventing or treating behcet's disease, comprising a substance that increases the abundance of at least one gene in a second gene set consisting of: n20_gi_0009810, n48_gi_0125557, wherein the genes in the second gene set are identical to the genes in SEQ ID NO: 14. 15, and the genes in the second gene set correspond to the corresponding SEQ ID NO: 14. 15 has an identity of not less than 90%.

The marker genes are determined by the inventor through comparing and analyzing the abundance of various intestinal genes in fecal samples of the Behcet disease group and the healthy group by difference and verifying a large number of fecal samples in known states. The genes in the second gene set in the marker gene are significantly enriched in the healthy population group compared to the Behcet patient population, the significant enrichment being that the abundance of the above genes in the healthy group is statistically significantly higher or significantly, substantially higher than the abundance in the Behcet patient group compared to the abundance in the Behcet patient group; substances that can increase the abundance of the portion of the gene can be used to treat or benefit from administration to a patient suffering from Behcet's disease, the substances are not particularly limited and can include, but are not limited to, drugs that treat Behcet's disease and functional foods that are beneficial in treating or alleviating Behcet's disease. Therefore, the substance capable of increasing the abundance of the genes in the second gene set provided in this embodiment can be used for preparing a medicament for treating Behcet's disease and/or for preparing a functional food, health-care medicine or the like beneficial for treating or alleviating Behcet's disease, and the medicament or the food can effectively treat or alleviate Behcet's disease.

According to the present invention there is provided a method of determining whether an individual has Behcet's disease comprising steps (1) and (2).

(1) Determining the abundance of a marker gene in a fecal sample of the individual.

The marker gene includes at least one gene of a first gene set and a second gene set. Wherein the first gene set consists of the following genes: BA15_gi_0058342, BA17_gi_0003414, BA19_gi_0000352, BA19_gi_0000679, BA19_gi_0002844, BA19_gi_0004843, BA19_gi_0007615, BA19_gi_0011260, BA19_gi_0017177, BA1_gi_0023027, BA26_gi_0018693, BA28_gi_0005743, BA2_gi_0044108, wherein the genes in the first gene set are identical to SEQ ID NO:1-13, wherein the genes in the first set of genes correspond one-to-one to the corresponding SEQ ID NO:1-13, said second set of genes consisting of:

n20_gi_0009810, n48_gi_0125557, wherein the genes in the second gene set are identical to the genes in SEQ ID NO: 14. 15, and the genes in the second gene set correspond to the corresponding SEQ ID NO: 14. 15 has an identity of not less than 90%.

According to some specific embodiments of the invention, step (1) further comprises: obtaining nucleic acid sequencing data in a fecal sample of the individual; comparing the sequencing data to a reference genome; based on the results of the alignment, the abundance of the marker gene is determined.

According to a specific embodiment of the present invention, in step (1), the abundance of the marker gene is determined according to the following formula:

Ab(G)＝Ab(U _G )+Ab(M _G ) Wherein G represents the number of the gene, ab (G) represents the abundance of the gene G, ab (U) _G) Abundance of reads representing unique comparison of the sequencing data to the reference sequence of gene G, ab (M _G ) Representing the abundance of non-uniquely aligned reads of the sequencing data and the reference sequence of the gene G; ab (U) _G )＝U _G /l _G Wherein U is _G Representing the number of reads in the sequencing data that are uniquely compared to the reference gene of gene G, l _G Representing the saidReference gene length of gene G;wherein M is _G For the number of reads in the sequencing data that are non-uniquely aligned with the reference gene of gene G, i represents the number of the non-uniquely aligned reads, co _i An abundance ratio corresponding to the ith reading segment;wherein Co is _i,G And (3) representing the abundance ratio of the non-uniquely aligned reads i for the marker gene G, wherein N is the total number of the genes which can be aligned by the non-uniquely aligned reads i, and j represents the number of the genes which can be aligned by the non-uniquely aligned reads i. The abundance determination formula is based on the contribution condition of the read of the assembled sequence on the comparison result to the abundance of the assembled sequence, and the abundance determined while fully utilizing the sequencing data is quite accurate.

According to a specific embodiment of the invention, the following is performed to accomplish this step: obtaining sequencing data of a nucleic acid sequence in a fecal sample of the individual, the sequencing data comprising a plurality of reads; comparing the reads to genomes of various genes in the markers to obtain comparison results; and determining the abundance of each gene in the marker according to the comparison result.

The sequencing data is obtained by sequencing a nucleic acid sequence in a sample, and the sequencing can be selected from, but not limited to, a semiconductor sequencing technology platform such as PGM, ion Proton, BGISEQ-100 platform, a technology platform for sequencing by synthesis, such as Hiseq, miseq sequence platform of Illumina company and a single molecule real-time sequencing platform such as PacBio sequence platform. The sequencing mode can be single-ended sequencing or double-ended sequencing, and the obtained off-machine data is the fragment which is read out and called reads.

The alignment can be performed by using known alignment software, such as SOAP, BWA, teraMap, etc., and in the alignment process, the alignment parameters are generally set, one or a pair of reads (reads) is set to allow at most s base mismatches (mismatch), for example, s.ltoreq.2, and if more than s bases in the reads are mismatched, the reads are considered to be unable to align to (align with) the assembled fragment. The obtained comparison result comprises comparison conditions of each reading segment and each reference gene, including whether the reading segment can compare the reference sequence of a certain gene or a certain genes, whether only one gene is compared with the reference sequences of a plurality of genes, the position of the genome, the unique position of the genome or a plurality of positions and the like.

The alignment of reads with the reference genome can be divided into two parts: a) Unique reads (U): uniquely comparing the sequence of the previous gene; these reads are called unique reads. That is, if the sequences on the reads alignment are all from the same gene, define these reads as unique reads; b) Multiplex reads (M): the sequences of more than one gene are aligned and defined as multiple reads. That is, reads are defined as multiple reads if the sequences on the reads alignment are from at least two genes.

The reference genome refers to a predetermined sequence of the gene, and may be any reference template of a biological class to which a sample to be tested belongs or is included, for example, a target is a gene in the sample to be tested, the reference sequence may be a reference sequence of various genes in an NCBI database, further, a resource library containing more reference sequences may be preconfigured, for example, a sequence which is more similar to the reference sequence may be selected or determined according to factors such as a state, a region, and the like of an individual from which the sample to be tested is derived. According to one embodiment of the present invention, reference genes for various genes were constructed by the inventors.

(2) Abundance comparisons to determine if an individual has behcet's disease.

According to one embodiment of the invention, the abundance obtained in step (1) is compared to a predetermined threshold in order to determine if the individual has behcet's disease.

According to some embodiments of the invention, the threshold is preset. The abundance of each gene in the marker is pre-measured and stored in healthy individuals and diseased individuals and is used as the basis for setting a threshold value. The threshold may be a value or range of values, and the threshold corresponding to a marker gene may be set to a 95% confidence interval (Confidence interval) for the average of the abundance of the gene based on the average of the abundance of the gene in individuals of known disease or health status.

The confidence interval refers to an estimated interval of the overall parameters constructed by the sample statistics. In statistics, the confidence interval of a probability sample is an interval estimate of some overall parameter of the sample. The confidence interval reveals the extent to which the true value of this parameter falls around the measurement with a certain probability. The confidence interval gives the degree of confidence in the measured value of the measured parameter, i.e. the "certain probability" as required before, this probability being referred to as the confidence level.

According to some embodiments of the invention, the individual is determined to have behcet's disease when the abundance of the marker gene determined in step (1) reaches the threshold for abundance of behcet's disease, and is determined to not have behcet's disease.

It should be noted that, depending on the purpose or requirement, there may be different requirements for determining the confidence level of the individual status result, and those skilled in the art may select different significance levels or thresholds.

The method is based on detecting the abundance of various genes in marker genes in a stool sample of an individual, comparing the abundance of various genes determined by detection with a threshold value thereof, and determining the probability that the individual is a Behcet's disease individual or a healthy individual according to the obtained comparison result. A non-invasive method for assisting detection or assisting intervention treatment is provided for early detection of Behcet's disease.

All or part of the steps of the method for determining whether an individual has Behcet's disease using a marker gene in any of the above embodiments may be performed using an apparatus/system comprising a detachable corresponding unit function module, or the method may be programmed, stored in a machine-readable medium, and executed by a machine.

According to the present invention there is provided an apparatus for determining whether an individual has Behcet's disease, the apparatus comprising: an abundance determination unit for determining the abundance of a marker gene in a fecal sample of the individual, the marker gene comprising a first gene set and a second gene set; a comparison unit for comparing the obtained abundance with a predetermined threshold in order to determine whether the individual suffers from behcet's disease; wherein the first gene set consists of the following genes: BA15_gi_0058342, BA17_gi_0003414, BA19_gi_0000352, BA19_gi_0000679, BA19_gi_0002844, BA19_gi_0004843, BA19_gi_0007615, BA19_gi_0011260, BA19_gi_0017177, BA1_gi_0023027, BA26_gi_0018693, BA28_gi_0005743, BA2_gi_0044108, N10f_gi_0062793, wherein the genes in the first gene set are identical to SEQ ID NO:1-13, wherein the genes in the first set of genes correspond one-to-one to the corresponding SEQ ID NO:1-13, said second set of genes consisting of:

n20_gi_0009810, n48_gi_0125557, wherein the genes in the second gene set are identical to the genes in SEQ ID NO: 14. 15, and the genes in the second gene set correspond to the corresponding SEQ ID NO: 14. 15 has an identity of not less than 90%. The above description of the technical features and advantages of the method for determining whether an individual has Behcet's disease using a marker gene according to any of the embodiments of the present invention applies equally to the apparatus according to this aspect of the present invention, and will not be described in detail herein.

According to an embodiment of the invention, the abundance determination unit is adapted to determine the abundance by: obtaining nucleic acid sequencing data in a fecal sample of the individual; comparing the sequencing data to a reference genome; based on the results of the alignment, the abundance of the marker gene is determined.

According to one embodiment of the invention, the abundance of the marker gene is determined according to the following formula: ab (G) =ab (U) _G )+Ab(M _G ) Wherein G represents the number of the gene, ab (G) represents the abundance of the gene G, ab (U) _G ) Abundance of reads representing unique comparison of the sequencing data to the reference sequence of gene G, ab (M _G) Representing the abundance of non-uniquely aligned reads of the sequencing data and the reference sequence of the gene G; ab (U) _G )＝U _G /l _G Wherein U is _G Representing the number of reads in the sequencing data that are uniquely compared to the reference gene of gene G, l _G A reference gene length representing the gene G;

wherein M is _G For the number of reads in the sequencing data that are non-uniquely aligned with the reference gene of gene G, i represents the number of the non-uniquely aligned reads, co _i An abundance ratio corresponding to the ith reading segment; />Wherein Co is _i,G And (3) representing the abundance ratio of the non-uniquely aligned reads i for the marker gene G, wherein N is the total number of the genes which can be aligned by the non-uniquely aligned reads i, and j represents the number of the genes which can be aligned by the non-uniquely aligned reads i. The abundance determination formula is based on the contribution condition of the read of the assembled sequence on the comparison result to the abundance of the assembled sequence, and the abundance determined while fully utilizing the sequencing data is quite accurate. The above description of the technical features and advantages of the method for determining whether an individual has Behcet's disease using a marker gene according to any of the embodiments of the present invention applies equally to the apparatus according to this aspect of the present invention, and will not be described in detail herein.

According to yet another embodiment of the present invention, there is provided an apparatus including: a computer readable storage medium having stored thereon a computer program for performing one of the methods of determining whether an individual has a behcet's disease described above; and one or more processors configured to execute the program in the computer-readable storage medium.

According to a further embodiment of the present invention there is provided a method of screening for a drug for the treatment or prevention of behcet's disease, the method comprising: administering a candidate drug to a subject, detecting the abundance of a marker gene in the subject's stool before and after administration, the marker gene comprising at least one of a first gene set and a second gene set, wherein a candidate drug that satisfies at least one of the following conditions is suitable for use in treating or preventing behcet's disease: (1) After said administering, said abundance of at least one gene of said first set of genes is decreased; and (2) said increase in said abundance of at least one gene of said second set of genes following said administering; wherein the first gene set consists of the following genes: BA15_gi_0058342, BA17_gi_0003414, BA19_gi_0000352, BA19_gi_0000679, BA19_gi_0002844, BA19_gi_0004843, BA19_gi_0007615, BA19_gi_0011260, BA19_gi_0017177, BA1_gi_0023027, BA26_gi_0018693, BA28_gi_0005743, BA2_gi_0044108, wherein the genes in the first gene set are identical to SEQ ID NO:1-13, wherein the genes in the first set of genes correspond one-to-one to the corresponding SEQ ID NO:1-13, said second set of genes consisting of: n20_gi_0009810, n48_gi_0125557, wherein the genes in the second gene set are identical to the genes in SEQ ID NO: 14. 15, and the genes in the second gene set correspond to the corresponding SEQ ID NO: 14. 15 has an identity of not less than 90%.

By using the method for producing or screening the medicines for treating the Behcet's disease in the aspect of the invention, medicines for improving the abundance of beneficial genes in intestinal microorganisms and/or reducing the abundance of potential pathogenic genes of the intestinal microorganisms can be obtained by reasonably and effectively applying the determined Behcet's disease marker genes for screening.

The method and/or apparatus of the present invention will be described in detail below with reference to specific examples. Unless otherwise indicated, reagents, sequences, software and instrumentation not specifically indicated in the examples below are all commercially available products.

The following embodiment includes a first phase and a second phase, namely a corresponding discovery phase and a verification phase. The discovery phase includes: determining gene markers based on analysis comparing the intestinal microbial gene composition and functional changes of 16 white plug patients and 36 healthy control groups; the verification stage comprises the following steps: the accuracy of the first stage results was verified with 8 BD patients and 16 healthy control groups.

Example 1 identification of biomarkers

In this example, the inventors developed a study of the association analysis of the whole intestinal microbiota microbial genes from fecal samples of 16 white plug patients, 36 healthy controls, characterizing fecal microbiota and functional components. Overall, the inventors obtained 334Gb high quality sequencing data by experimental sequencing. Metagenomic analysis showed that 27 microbial genes are closely related to Behcet's disease, 2 genes being enriched in intestinal microbial gene sets in healthy people and 25 genes being enriched in intestinal microbial gene sets in Behcet's disease patients.

1. Acquisition of sequencing data

1.1 sample collection and DNA extraction

Both the Behcet's disease and the healthy person's samples are from the first affiliated hospital of Chongqing medical university, the experiment collects the faeces samples of 16 Chinese Behcet's disease and 36 healthy persons, wherein the fresh faeces sample of each individual is divided into 200 mg/serving, 5 serving is taken, and the fresh faeces sample is frozen and stored in a refrigerator at-80 ℃ immediately.

Total DNA was extracted from all stool samples. DNA is extracted by phenol trichloromethane treatment.

1.2 construction of library and sequencing, and reference data download

DNA banking was performed according to the instructions of the instrument manufacturer (Illumina). The library was PE150 bp sequenced. The Illumina HiSeq2000 (Illumina, san Diego, CA) platform sequenced libraries of 52 samples. Each sample produced on average 6.43Gb (sd. ±0.21 Gb) high quality sequencing results, totaling 334Gb sequencing data volume.

Referring to the experimental procedure of fig. 1, relevant biomarkers of behcet's disease are identified, wherein omitted steps or details are well known to those skilled in the art, and several important steps are described in the following steps.

2. Identification of biomarkers

2.1 basic processing of sequencing data

Sequencing data is subjected to quality control: after obtaining the sequencing data of the 52 samples of the first stage, they were filtered and quality controlled according to the following criteria: a) Removing more than 50% of reads of low quality bases (Q20); b) Removing reads greater than 5N bases; c) Tail low mass (Q20) and N bases were removed. The sequence of missing paired reads is considered a single reads for assembly.

2.2 analysis of Gene abundance

The paired-end clean reads processed in the above steps are aligned (matched) to a non-redundant gene set by SOAPalign 2.21, wherein the non-redundant gene set is constructed from the redundant gene set obtained by assembling, predicting and gene predicting the paired-end clean reads processed in the above steps. The alignment parameters are-r 2-m 100-x 1000.reads are aligned with non-redundant gene sets, and the alignment can be divided into two parts: a) Unique reads (U): only one gene of the set of genes is compared; these reads are called unique reads. That is, if reads are aligned to only one gene of the upper gene set, these reads are defined as unique reads. b) Multiplex reads (M): more than one gene of the upper gene set is aligned and defined as multiple reads. That is, reads are defined as multiple reads if they align with at least two different genes.

For gene G, the abundance is Ab (G), and the abundance is calculated as follows, in relation to the unique U reads and the shared M reads:

Ab(G)＝Ab(U _G )+Ab(M _G )，

wherein G represents the number of the gene, ab (G) represents the abundance of the gene G, ab (U) _G ) Representation ofAbundance of reads for which the sequencing data is uniquely aligned with the reference sequence of gene G, ab (M _G ) Representing the abundance of non-uniquely aligned reads of the sequencing data and the reference sequence of the gene G;

Ab(U _G )＝U _G /l _G ，

wherein U is _G Representing the number of reads in the sequencing data that are uniquely compared to the reference gene of gene G, l _G A reference gene length representing the gene G;

wherein M is _G For the number of reads in the sequencing data that are non-uniquely aligned with the reference gene of gene G, i represents the number of the non-uniquely aligned reads, co _i An abundance ratio corresponding to the ith reading segment;

wherein Co is _i,G And (3) representing the abundance ratio of the non-uniquely aligned reads i for the marker gene G, wherein N is the total number of the genes which can be aligned by the non-uniquely aligned reads i, and j represents the number of the genes which can be aligned by the non-uniquely aligned reads i.

For these reads, the inventors normalized the abundance of the unique reads of the added N genes. That is, for multiple reads, the inventors have the sum of the unique reads abundance of the N genes to which they are aligned as the denominator.

2.3 associative analysis/screening of Gene markers

In order to obtain intestinal microbial gene markers closely related to Behcet disease, the inventors made a study on the gene level on the basis of the gene abundance data of two groups of intestinal microbial genes, namely, a Behcet disease group (16 cases) and a healthy person group (36 cases).

Based on the gene abundance table obtained in the above step, the inventors set the criteria as follows: (1) The median of gene abundance in the group of Behcet's disease or in the group of healthy people must be greater than 0.00001; (2) Obtaining a difference p value of each gene between white plug patients and healthy human samples by combining the Wilcoxon rank sum test of the multiple tests of Benjamini Hochberg; (3) use threshold p_values <0.001. Then, the inventors obtained 27 intestinal microbial genes closely related to Behcet's disease. Wherein 25 genes are enriched in Behcet's Disease (BD) patients and 2 genes are enriched in healthy people (HD). These 27 microbial gene markers are shown in table 1 below.

TABLE 1

Example 2 verification of Gene markers

To confirm that the analysis results in example 1 can be used as gene markers for Behcet's disease, the gene abundances of 18 healthy persons and 8 Behcet's disease in the validated population were further compared, and the final microbial gene markers were screened according to the validation. Acquisition and processing of sequencing data for the validation population was performed with reference to example 1.

The verification result is as follows: the above-mentioned 2 genes enriched in healthy people, 2 obtained high quality verification in the verification set (p_values < 0.05), and the average value and p value of the verification of the microorganism gene markers enriched in healthy people are shown in table 2 below. The microbial genes were n20_gi_0009810 and n48_gi_0125557, respectively.

TABLE 2

For the 25 genes enriched in the above-described white-plug patients, 18 of them gave high quality validations in the validation set (p_values < 0.05), the mean and p-value cases of the validation of the microbial gene markers enriched in the white-plug patients are shown in table 3 below as BA15_gi_0058342, BA17_gi_0003414, BA19_gi_0000352, BA19_gi_0000679, BA19_gi_0002844, BA19_gi_0004843, BA19_gi_0007615, BA19_gi_0011260, BA19_gi_0017177, BA1_gi_0023027, BA26_gi_0018693, BA28_gi_0005743, BA2_gi_0044108, respectively.

TABLE 3 Table 3

The inventor believes that 2 microorganism gene markers enriched from healthy people can be used as reverse indexes of diseases of the Behcet disease, or as microorganism preparation medicine gene components for developing the treatment of the Behcet disease, or as recovery indexes for detecting the Behcet disease and monitoring the treatment progress of the Behcet disease; the 18 microorganism gene markers enriched by the Behcet are used as positive indexes of the disease of the Behcet, and are particularly used for non-invasive detection and diagnosis of the Behcet disease.

The inventor utilizes the 20 microorganism gene markers to construct a comprehensive index, estimates the area under ROC (Receiver-operating characteristic) curve AUC, and the larger the AUC is, the higher the diagnostic capability is, and the evaluation comprehensive score corresponds to the diagnostic capability of the inventor on Behcet's disease. By evaluating 52 samples of the first phase (first phase) and 24 samples of the second phase (second phase), as shown in fig. 2, both showed good diagnostic ability, with auc=88.3% at the first phase, and confidence intervals of 78.9% -97.7% as shown in fig. 2 a; auc=83.6% was obtained in stage two, with confidence intervals of 65.7% -1% as shown in fig. 2 b.

Specific information of the above gene set genes is as follows:

BA15_GI_0058342

CTGCTGAAGGATTCCGCCGACGGCGGTTCCATTGACGTGAATAACGGTACGTTCACGTTCGGTTCTCACGGCGGCTCCACTCCGACTGTCGGTTGGATTCTTTCTTCCAATATCGGAGAAAACGGCTCCCTGGAAGCCAAGAACGGTGAATTTGCCGACTGGACGATTGCCAACAACGGTAACGTTCATGTTCACTCCAACGCGATCCTTCATACAAACAGTTTGACCGGAAACGGTGCTGCTGTTAACGAAGGCAAGCTCTCTCTGGATGAAAAGGACGGTAAAGGCCCGACGTTTGACGTTGCTGGCTCTTTCACGAACAAGGGCGAAAACTCTATTCTGGACGCCTCCAAGGTCGAAAAAGTTACTGTCTCGGGTACTCATGTCAACGAAGGTCAGGCCGACTACAAGGATATGCTTGTGGCTGAAGGCGGATCTTCGACCAACAGCGGAACCGAACAGGGCAACATCCTGACGGTTGAAGGCTCTCACGCCAACACAGGCACTTCGATCTGGAACGGTGTCAACGTTGCCGAAAACGGCAAAGGCGAAAACGCCGGTAAGCTCGATGTTGGCAGTGTGTTCGACGTTCTCGGTGAGTTCGTTAACAAGGGCGCTGAAGCTGTTCTGGACGCCACCAAGACCGCAGTTACCAATGTCGCAGGCATTCTTCGCAACGAAGGCACGGCCAATTACGACGACATGACGATTGCCGACGGCGGTAAGTCTGAAAACGCAGGCTTCGAAAAGGGCGACATCCTCACGGTTGCAACAGGTGCCGAACACAGCAACAGCGGAACCTCGATTTGGAACAACGTTACCGTTCAGGACGGAGCCACTTCTACCGTTGAAGAAGGGGCCAAAGAGACGATCAATGACTCTTATGTGGTTGCGGGTGACCGTACCAACAAGGGCGAAGTTGATGCGACCGGCGTTGAGAATACCCAAGTTACGGGTACTCTCGACAATCAAGGAACCTCCAACTACGACGATATGACCGTTGAAGCGGGCGGCAAGTCCGACAACTCCGGCTACGAAAAGGGCGACATTCTTACGATTGCCGATGGCGGCGAACATACCAACTCCGGAACTTCGATCTGGAACAATCAGACAGTTAAGGAAGGCGGTACGTCCGTTACCGAAGAAGGCGGTAAAGAGACTATCAATGACAAATATGTCATTGAAGGCGATAAGACCAATAGGGGTGAAGTTGATGCTAAGGGTGTTGAGAATACCGAAGTTAAAGGTAATCTCGACAACCAGGGCAAGTCCGAGTACGACGACATGACCATCGGCGACGGCGGCAAGTCCGACAACTCCGGCTATGAAAAGGGCGACATCCTTACTATCGACAAGGGCGGTGAACATGACAACAGCGGCACGTCCATTTGGAACAACGTTGTTGTAGCAGGCGGTGATGTAAACAACACCGGCGACATTGAAACCGAAAAACTGAAGATAGACGACGGCCTGGTCAACATCGGCGAAGGCAGTCTCAATGCCGGTGAAACAGATCTGAACGGCGGCGACCTCGTTATCGGCAACGATAAAGACAGAACCCCTGAAAACAGAGTCACGGCTGAGATCAATCCGAAGGACGACGTTATCGACACGAACATCTACGTGAAGAACAACGGCGATCTGAACCTCGGACCGAAGGGCGGACTCGATTGGGCTGACTCCATCGGATCTCCGACCGTGCCAAGCGGCATACCGAGCCGATTGGTTATTACCAATAACGTGACAACCGGTCCGGGAGGAGGCATTGCCGTGGGTCCCAACGTTTGGACGGATAAAGACAATCATGTCCAGATCGGAAACGGCGATCTCTTCTTCGCCAAGGATTCTCTGACAGTTATCGACAGCTCCATCCTGACCGACGGCAAGTCTGCATTCAACACAACTTCCGACGTTGCCAAGGTCACGGTTGAACCGGGTGCAAATCTCGTTCTCGGCAATATTGAAGAAGTCGGCGACTACACAATCGTCAACGGCTACATTACAGGCGGAAATGAATCCGACGGAATGTGGACGGGCGGTTGGACAGGCGACAACCTCTATGCTCTGCCGCAGGACGGCTCCGGTATCAATTGGATCCTGAAGCTGCACAACGATCCGTCCAAGATCTGGGTGAATGCGACATTGGCTGACGTTCGCACTGTTTATCCTGACATTGCAATTCCGAATATCGCCAACGACGATATGCTCAACTGCAAGTCCGGTGATCCGGGTGCCGACTTCGTTTGTCGCGTACTTCGCGACAAAGAATTGGATGTTGCGGGCAAGACCACGATTCTGAACTCCGTGGCTAATATCGCCTTTGCAGGCGGTGCTATGTCCGTGGCGATGAACGACCTCAACACGGCTGCTGACTCCATCGAGGGCAGAGTTTCCATGCGAAACGAAGCCTTTACCGACTACGGTGTTATGCGCGAATGGGATCGTGGAAACGATCTGTGGGTCGATGTTATCGGGGGTAAGCAGAAGTACAAGAGCCTAAGTGCCACCGGTATTTCTAAAGCCGGATTCAATACGAACGCCTACGGTCTTGTTATGGGCTATGACCGCAAGTTTGCCGGTAAGTCCGTCATCTTAGGCGGCGCTTTCAGTTACAACCACGGTTCGCTTGATTCCACAGGCGACGTGCTGAAGACGAAGAACAAGTATGACAGCTTCGGCCTGCACGCTTACGGTGCTTACGCTCCGGTCGAAAAGGTCAACCTCGTCGGTACATTGAGCTGGATGCACAACTCCTCTGATATTACTCAGTCGATCAATGCAGCCGGATTCAATAAGGCTAATGCGGATGTCAAGACGAATATGTTCAGCCTCGGCGCTCGTGCCGAAGCAACTATTCCCGCCGGAAAAGCCAATATCGTTCCGCACGCAGGTCTCAGATACGTCTGGGCTAAGTCGGGCAAATACGATACGAAGGTTGACGGTAAGAAGGTTTGGAGTAACAAGGCTGACGCCACGAACACCTTCCAGCTTCCGATTGGCGCTGCTGTCAGAACCGACATTGCAACAGCCTCCGGTTGGAACATTCGCTCGCAGGCTGACGTAACTGTCATCCCGCAGTTCGGCGATACGAAGCAGAAGACCAAACTGTCCAACTTCAACGGTGTTAGCGACACGCTCTCCGGCGAATTTGCAGGCAAATTCGGTACGAACGTGAACTTAGGCGTCCAGGCTGACAAAGGCGCGGCCACTATCGGCGTCCGCTATGGCTTCACAGGCGGTACGAAGGGTAAGGCTGACCATATGTTCAAGCTTGAAGCCCGTTATCGCTTCTAA(SEQ ID NO:1)。

BA17_GI_0003414

ATGGAATCGATATATAACCTACAGAAACGCGCCTCGGAGCTGCGAGGCAAGACCGAAACTGACAGCATCAGCCCAGAGGAGGTGGGCGGACTGCATGCCGACACGCTGGCGTACATAGCCGATATGGAGCAGAGCGCGGACGGACTGGGTATACGGAAAGTGTACCAGACGAAGGCGAAGATGGAGGCGGACACGGCGCCTATGGGGACGAATGGCAAGACGCTGCGCTACGGCCAACTGGTGAGCATTTACAACGAGGCTGACAAGACGAGTGCTGAGAACGGCGACATATACGCCTGGCAGAAGCCGGGGTGGCTGAAGATGGGCAACATCGGCAACATTTACGAGCTGAAGGCGAAAATAGAGGAGGAAGCCACCGTACGTGCTGATGCCGATGCAGAACTGCAAAGAAAGATGACTGCCGAGGCAACGACAAGAGAAAGCGCCGATGCGGAAATACGGACGCTTGCCGAGGGAATAGTGGGCAGCATTGATGTGGCAAAGATAGATGCCGTGCCTGGCAGCGTGGCGGAAGCCGTAAGGATGGCGAAGGACACGCTACACTCGCGCTGGACGTTGGTCTACAATGGAATGAATGTGGGTGTAGTGGAGATTTTCTCGGATTCGATGAGACACCAACTGACGGAAGTGCTGACGACGCACTATAGCATGAATACGGAGGGTAAGTTGGACTTCAGTGCACATAATGACAAGGCTATATACAGATACTTCCGCTCGTATAACATAAACTCGGCACACTTGGAGAACAAGAAAGGAACATGGACGGAATGGGCTGAGTATATATCGGATACAGTGAAGAAGTCAATGGCTGCGTTGTCGGGCTTGATAGACAAGGAGAACAAAGCACGCACTAAGGCTGAAGCCGCCCTTGCAGAATACATAGTTGGCAACACAAATGCGATAACAGAAGAGAAGAAGGCGAGAAACTCAGCCGATGATGAACTGCGTACTGCCATTGAGGAGAAGAGCGGTGGCAACACCTATAACGTGACGGAGAAGAAACCGCTGAAGGACGGCGAATACTATACGCTTGCGACCGCCATAAAGGCAGTAGAGGCGAAAGAGCGGAAGAAGGGCCGCTGCGTGAGCTACGAGACGGAACCTGGTAAATGGGAGACCAAGCAGTTTACGGGTTCGACAACGGAGAGTTGGGAGGAACCGGTGAGTTGGGAGGACTTCGGCGGTGCGGGGACGGTGAAGAGCGTGACAGTGAACGGCACGGCACTGACCCCGGACGAGGAGGGCAACGTGAACATAGAGGTGAGGGAGACGGACGTGGACGAAAGCCTGAACGAGGAGAGCACCAACCCGGTGGAGAACCGCGTGGTGGCGACAAAGATAAAGGAGCTGGAGGCGCACACGCTGCACACGCTGGAGGTGGTGCCTGATGGTGAGGAGAACTACCTGTATGCCTATGATGAGAAGGGCAACGCCATATCGCACACGAAGCTGCCTGCAGGCGGCGGTGGCGGCACGTCGGCGACGAGCCGCATACTGGTGACAGCGAAGGTGAGCGCGGAACTGATAAAGGAGGGTGGCAACACTGTGCTGACCTGGACATACGACCACGTGAACGCGGAGAACGAGAGCGACGGCGTGAAGGCGACGGTGACGATAAGCGTGAAGATGGGCACGACGACGCTTTGGGAGCAGGAGACACGAAGCGTGGCAAAGGGCAGCTATGATGTGGATCTGACGCAATACATGAAGACGGCGGGCAAGGTGGACGTGTATGTGAAGGCGGTTTGCATGACTGACGATGGCGAACAGCAGACGAAGCAAGCTTATGCGAGCGTGACGGTGGTGGGCATGGCGCTGTCCTCGGACTACGACGTGAGCACGGGACTGCAGAGGGGCGGATATGCCGACGGCGAGACGATAAGCATACCGTTCACACTGACTGGCAGCGGGCTGAGAACTGTGTCGCTGTATGTGGACGGCGGCGAGGCACCGCTGACGAAGACGGTGCAGAAGTCGGGCACGACGAGAGACTCTTTCAGCATAGCTGCAGGAAGCCTGACCCCAGGGCGGCACTCGCTGCAGATGATAGCAGAGAGGGACGGTCTGCGCTCGGACGTGATATGGATGGATGTGCTGAAGAAAGGCTCGGACGAGCCGTATGTGGGCATAATGTTCAGCGACGCGAAGGGCGAAGTAAAGTTCGGTGCCATGCCGATAGAGCCTACGCTGACAGCACGGCAATATGGCGAGCTGCGATTCAGTTTTGCTGCGTATGACGCGAAGGCTGTGCCGGCGACGGTGAGGGAGACACAGACGGCTGACGGAACAGTGACGGAAAGAACCTATGCCGTGGGCAGAAGCAGACAGACCTACTCAGGGCGATACATGAAGCAGGGCACAGTAGCCGTAAGACTGGCGTGCGGCGAGGCGGCTACAGCCTTCAACGTGGAAGTGGAGTCGAGCGGTCTGGATATTGGCGAGGCTACGCAGGGCTTGGAGATGAAGCTGACGGCGAGCGGCAGGAGCAACACGGCGAGCGCGGAGACGCGCCAAGCATGGGAGAACAACGGCTACGGCACGACTTTCGATGGCGTGGACTGGGCGACGAGCGGCTGGGACGGCAACGCACTGGTGCTGAAGAACGGCGCGAGGGCAACCGTGGACTACCGCCCATTTCTGAAGGACGTGAAGGCGAGTGGCTGCACGGTTGAAGTGGAGCTGATGGTGAAGAACGTGTCGGACAGGGACAGCATGGTGATGGACTGCATGGAGAATGACGTGAAAGGCATCAGAGTGACGGCACAGAGCGCGACGCTACAGAGCGGATCGACGATAGACCGCGAGGACAGTGCGAACATAGATCCGGATACGGGGAAACCAATAGTGACGAAAGTGCCTGTGGGCGTGGAATCGAAATACACAGAGGGCGAGCGCATAAAGATGGCGTTTACCGTGGGCAAGAAGGCTGACGGCGGACTGATGGAACTGTATATGAACGGTGACCGCTGCTCGGCTATGTGCTATCAGGAGGACGACAACTTCATGCAGACAGAGGCGAAGGGACTGACATTCATGTCGGACGGCGCTGACGTTTACATATACGGCATACGCGCATACTCGCGACCGCTGACAGACGATGAAACAGTGGACAACCACATCGTGGACCAGCAGCTTGTGGAGACGATGGCGGAGCTGTACGAAGACAACAACGTGATAAATCCGGAGACAGGCGAGATTGACCTTGATGCGGTGATGAAACGCGGCAAGGCCGTGATAAAGATTGTGCGCTCGGAGGACTCGGGCAACGGTCTTGACGACGTGAACGCATGCAAGAACAAGAAGCAGAACTTCCATGTGGACGAGTTGACGATATATACGGCATGGGGCGACGTGATAAGGTTCACGAATATCGTGATGCGCATACAGGGCACCTCGTCAACGAAATATGCAATAAAGAACTTCCGCTTCTACTGGATGAAGTGCATGAAGGAGGGCTTGAAGCCGGAGATGTGGATAAACGGTGTGAAGCAGGATGTGAACAAACTGCCGCTGTACAAGGGAGACCCGCACCCGTGCAAGGTGAATTGCGCAAAGGCGGACTTCTCGGACTCGTCGATGAAAACGAACACGGGCATGGCCAACCTCTTCAACGACGTGCTGAGAGAGCTCTGCCCGACACCACCGCAGGAGAGCGATCCGACGGTGAGAACCGCGATATACGGCTATCCGTGCGACATATTCGCATGCACGAGGGCAGACGAGGCACATCCGACATTCTACGGACAGTACCAGATGAACAACGACAAGAGCGACTGGTATGAGGTGACGGGCATGACGGACAAGGCAAAGCACATTGCGCTGGAGTTTCTTGACAACGGTAAAAAACTGTGCAACTTCCAGACAGATGCTGACGCGGACGCGCAGCTTGACGCGGAGTTTGCCACGAGCTATGAGTTCAACTACCCGAAGGACACTTTGTGGAGTGGTGCGGACGAGGCAGGTGGGGAAACGAACGCCACGGAATACCAGAAAACCGCTGTAAGGATGATGCTGGCATGGGTGAAGGCGTGCGTGCCTACAGGTGCGGATATGACCTGCACAGACCTGGCGACATGGAAATCGGAAAAGTTCAAAACAGAGATAGACAGTCACTTCTCAAAGAAGAACCTGCTGTACTGGTATCTGTTGACCGAGTATTTTGCCATGGCGGACCAACGTGTGAAGAACACGATATGGAGAACGTGGAACGGCTTGATATGGTGGGTGACATACTATGACGGCGACACGATGCTGGGCAAACGCAACGACTCGCTGCTTGCTTACCTCTACAATGTGGCAAGGGACTCGTGGGACACGGAGAAGAAGAAATGGGTATTCGAAGGTCACGACTCATGGCTGTGGTGTCTGGTGCTGGCGAATATGGAGGACGAGCTAAAAGCCGCTGCCGAGGAACTGAGAAAGGCGCTGTCGAATCCAAAGGTGCTGAAGACACTGGAGGAGATAGAGGCAAACTGGTCGCAGAGGGAATACAACAAGAGCGGTGAGATGAAGTATATCACACCAGAGACAAAGGGCGTGAGAGTGACGGAAAACGGCGTGACCACAGACGGCAACAAGTTCTACTACATGTATGCCCTAAGTGGCACCCGAAGGATGCAGCTGAAGCACTTCATCACGAACCGCTTCGCACTGCTTGACGCGAAGTTCGGCGTGAGTAGCTACCGCGCGGACTCAGCCGGATTTTATCTGGCGAGAGAGACGAGCGACAAGGCCGACGTTATAAAAATAACGGCGAGTGACGAATACTACTTTGCTTACGGACTGAGCGGCAAGGACTATATGGAGGGCGAGACGGGACGACTGCTGCGCGGCGAGCAGGGAACGCTAAGCGTGACGGGCAAGCGTGCGCTGAACGACCCGATGCTGCTGTTCGGCGCTTCGAGAATTATGGAACTGGACATGAGGGGCGCGGCAAGCCACCTGCTGAACGGATTGGAACTGAACAACTGCGCAGCGCTGAGGAAACTGGACTTGAGCGTGGCAGACGGTTCGGAGGCATCGGTAACGACGTGGTGGCTCGTGACGGGCGGCTGCGGCCAGTTAAGAGAGGTGAACCTGAAGGGACAGACGAACGCGAGGAGTAATCGTCAGGACTCGACGGTACTGGACTTCGGAAGCCAGACGCTGTTGGAGAAGCTGGACGCGAGAGGCACGACGGTGAAGAGCGTGACGGTGGCAAAGGGCGCTCCGCTGAAGGAGCTGCGGCTGCCGGGGACGCTGACAACGCTGAGATTGGAATATCTGCCAAAGCTGACGGCGGAAGGACTGGAGATGGAGAACTGCGAGAACGTGGCGACCTTCATCTTTGACAGTTGTCCGGGACTGGAATGGAAGAGCATCTATGCGCAATGCCCGAACGTGAGGACGCTGCGTGTGGCTGACGTTGACATGGACGGTGACGGGGCTGACCTGGTGGCGATGATGGAGACCGGGATGCAGGGTGTGGATGACGACGGAACGGTGGTGGACCATGCCGTGCTGAAAGGCGAATACCGACTGACGCGAAGCATGAACGAGGCGACCTATGAGAGGCTGACTGCATGGATTGGTGACGAGTTGAGGTTGGTGCAGCCGGAGTACACGATGATAGAGTTTGACGATACGGTGAGCGACGATGCGAACGTGAGCAACCTTGACAACGGGACGGGCTACAAGTACGGCACGCCATACAAGCCGAGCGGCCACATCGAAGCGATACTAAAGCTGCGGCACAGAGTGCTGGCGAAGGTGACAAAGATGGCGACGACAACAGCGGTGAAGATAGCTGGTGTGGACACGGTGATGAACAACACGGACGGCGAGGTGACGTACTACCCACTGAATGATGCGGACAGCTATAAGTATGCCGACGGCAGCGAAGCGAAGCTTGACAGCACGGAGGGCGACATTATGATGCTGGAACCTGCAAGGTGGACAAAGGGCGTGAACGACTACCTGAACGGCAAGCACTATAGCTGCTTCAGCAGTCAGAAGGAGATGCCGAAAGTGCCGGACGTGACCATAGTGAAACTGGAGGCGATACAGGCTGGCGGCGGCTACCGCAAGGGACAAAAGGTGATGAGCGGCAAGGACACGATACGGGACTCCTACACGGCGGACACGAGCTATGCAGTGTGTAGGGTGACAGTCAACGGCTGGAAGAAGGTGCGATTCCCAACGGTGAGAGAAACGAACCTTGTAGGCTCTGCATTCGTTGATGCTAACGGCACGGTGGTGAAGAACGTGGTTGTGCCGACGATAAACTGCAAGTTTGAGAGTGGAATGTATTTGATATGCGATGTGCCGGAGGGCGCAACGGACCTATACTTCACGGTATTGAACACGGCGGAGTTTGATATGGTGGTGCTGTCGAACAGCGACAAGATAGAGGACATGGAGCCGGAATGGGTGCATGAGGATGCTTATTTGTGCGCCGTGGTGGGCAGCTCGGTAGTGGGCGAAAAGCTGAGGGCATGCGTGACGGGCGGCTCGACGACGGGCGGCTTGTCATGGACAGACTTCCACTACTACTCGCAGCGTAGGGGCATGCAGCAGATAGACGCGATGATGCACTCATGGATAGCCAACCTTGCGTATGCGAAATATGGACGCAGGGACATGCAGGCGGAGTGCGGTGCAGGTTCGCACGACTACAACCGCAAGACGGGCGGCACGATGAGTCATGGCATGGAGGACACGATTGGCTATGAGGCGGCGAAGGCGATAAAGGCGGATGTGACGAACTCGGTGGTGGACGGCTCGGTGCGCCAATACGCATGGTACAAGGCGGAAGGTGAATACGGAGTGCAAACGGTGGTGCAGGTGGTGAACACTTGCTGCCTGGGATATGAGGACATCTACGGCAACAAGTGGGACATGATGGACCGCGTGGACTTGCCGAATGACTCGGGCAACCAGGGAAAGTGGCGTATCTGGATGCCCGACGGTACGACGAGGATGGTGAAGGGCGCAACGCAGGGACTATGGATAACGGGCGTGGCGCACGGAAAATGGATGGATATGGTACCGACGGGAACTGTGAACGGTTCGTCGACGACATACTATACCGACCGCTATGAGGTGAGCACGTCGACCGGCCGTGTGGTCTATCGCGGGTGCTACAATGCGAACTCGTATGGCGGTGTGTCGTATGCGTATGCGTATGACGATGCTTCGGACTCGTATGCGTATATCGGCTCGCGTCTGGCCTTCCGCGGTAAGCTCGTACGGGCGGTGAGCGTGGCGTCGTATAAAGCGATAGTCGAGGTGGCGTGA(SEQ ID NO:2)。

BA19_GI_0000352

ATGCGTTATAAGGGAAAGGTATACCGTCCGCCCAGTGAGGCTTACAGCCTCATCGTGCAGGTGACCTACGGATGCAGCCACAACGGCTGCGCCTTTTGCGATATGTACGACGACAAGCACTTCGCCATCCGACCCATGGAGGAGGTCCGGGAGGACTTCGAGATGGCCCGCCGGGCCTATAAAAAGGTAGAGCGGGTCTTTCTGGCGGACGGCGACGCCCTGATGCGGAAAACGGAGGAACTGAGCCAAATCCTGGGCCTGATCTACGGTCTGTTCCCGGAGTGCCAGCGGGTGACGTGCTACGCCTCGCCCACCAGTCTCCAGATCAAAAGCGAGGAGGACTTGCGCCTGCTGCGGTCTCGGGGCCTGAACATGGTGTATATGGGGCTGGAGTCCGGCTGTGATGAGGTGCTGCGCCGGATGAACAAGGGCCACACGGCGGCGGCCATCGTGGCGGCGGGGCAGAAGGCCCGGCGCTGTGGACTGGCCCTGTCGGTAACGGCCATCTCAGGACTTGGGAGCCGGGAGCTGATGCGGGAGCACGCCATCGGTACGGCGGAGGCATTCAGCGCCATGAAGCCGGAGTACATCGGCCTGCTGACGCTGATGGTGGAGCCGGGTACGCCGCTGGAGAAATGGGTGCGTGAGGGCAGCTTTACCGTTCTTGGCCCGGAGGATATCCTGCGGGAGACGGAGCTGCTGCTCCAGCACATCGACAGCGAGGGCAGCGTTTTCCGGATGAACCACGCCTCCAACTACCTGACGCTGAAGGGGACGCTGAATCAGGACCGGGACGCCATGCTGGAGCGAGTGCGGAAGGGCCTGGAGGGCTACGGCCTGCGACCGGAGTACTTGCGTGCTCTGTGA(SEQ ID NO:3)。

BA19_GI_0000679

TTGAGCCGGGGCCGCATTGAAAAGGCCCTCAGCGGCTTCTACTACGTCCGCACACCGGAGGGGCTGCTGCAATGCCGGGCCAGAGGAAAATTCCGCCGGGAGGGCATCAGTCCGCTGGTGGGGGACTGGGTACAGGTCCGTGATCTGGGAGGCGACGAGGGCTTCGTGGAGGCCATCGAGCCCCGGCAGAATCGGTTTGCCCGCCCCGCCGCCGCCAACATCGACCAGCTGGTCATCATCGGCTCACAGGCCATCCCCACCACGGATCCCTACCTCATCGATCGCATTGCCTCCATCGCCGTCCTGAAGGGCTGCCGGGTGCTGCTGTGCCTGAATAAATGCGATTTGGACCCGGCGCAGGAGCTATACGACAGCTATGCCGCCTCCACCATTCCGGTGCTGCGGGTCAGTGCCGCCACCGGAGAGGGCCTGCCGGAGCTGCGCCGTGCCATGAAGGGAAAGCTGAACGCCCTCACCGGCAACTCCGGCGTGGGCAAGTCCAGCATCCTCAACGCCATGGAGCCGGTGTTCGGCCTGCCGGTGGGGGAGGTCAGCAAGGCCCTGGGCCGTGGCCGCCACACCACCCGTCATGTGGAGATGTTCCCGCTGGACGAGGATACCTACGTTATCGACACGCCGGGCTTCTCCTCCTTCGACACGGAGGAGTTAGATCTGGAGCTGAAGGCCCGCCTGCCGGAGACCTTCCCGGAGTTTGCTCCCTATCTGGGCCAGTGTCGGTTCGTGGGGTGCAGCCATGTGAAGGAAAAGGGCTGCGCCGTGTTGCAGGCGGTGAAGGACGGGAGGATCCCCGCCAGCCGCCACCGCAGCTATGTGCGGCTGTATGACGAGCTGAAGGACCTGCGGGACTGGCAGCACAAATAG(SEQ ID NO:4)。

BA19_GI_0002844

ATGCAGGGTGAAGGATTGAAAAAATTACAGAGCGGACAGCCCATCTCTACACGGGAGCTGCTGCTGCTGATCGCTCAGCTGAGTTGGCCGGCCATTCTGGCCCAGATCTCCTCCGTGGTGATGCAGTATATTGACACGGCCATGGTGGGCCAGCTGGGCTCCAATGCCTCCGCCGCTATCGGTGTGGTGGCGACCACCTCGTGGCTCTTCGGCGATCTGTGCATTGCGCTGACCATCGGCTTTAACGTGGCGGTGGCGCAGGCGCTGGGAGCCAGACAGTCGGAGAAAGCCCGCGGCATCATGAAGCTGGCCTTTCTGGTGTGCATGGCCTTCAGCCTTGTGATGATGGCCATAGCGCTGGGCATCACCGGGAATCTGCCTCGCTGGCTGCGGGCAGACCCCGCCATCTGGCAGGATGCCAGCGCCTACTTTCTGGTATATGTTCTGTCGCTGCCCTTCATGCAGCTGAATAACCTCTGCGGCGGACTGTTGCGTTCGGCGGGCAACATGAAAACCCCCGGCATCTGCATGGTGGTGATGTGCCTGCTGGACGTGGTGTTCAACGCCTTCCTCATCTTCCCCAGCGGAACGCTGCGGGTGCTGGGGGTGACGCTGCCGGGCTTCGGTCTGGGGGTTCTGGGTGCCTCCATGGGAACGGCACTGTCGCAGGTGGTCATTGCGGTGGTGCTGGTCTATATCCTGCTGGTGCGGTCGCCGGAGCTGCACCTGCGGCGGGGCGAAAAGGCACGGTTTACGGCGGCACAGCTGAAGCGCTGCCTGTCTATCTCGGCTCCCGTCATGGGCGAGCGCACCATTCTTTCCACCGCCCGGATGGTGACTACCGCCATCGTGGCCCCGCTGGGCATCATCGCCACGGCGGCCAATTCCTTCGCCATAACGGCGGAGAGTCTCTGCTATATGTCCGCCTTCGGCGTGCAGGCGGCGGCCTCCACGCTGGTGGGCCAGAGCGTAGGCGCCGGGCGGAAGGATCTGACCTATCGGCTGGGCTGGCTGACGGTTGCACTGGGCATGGGCTTGATGGTGATCACGGGGACGCTGCTGTATGTGCTGGCCCCGGCCATGATCGGCATGATGGCGGTGGACGAGGCCGTCATTGAGCTGGGCGTGCGGGTGCTGCGGATCGAGGCATTCGCGGAGCCGCTGTTCGGTGCCTCCATCGTGGCCAGCGGCGTGTTTCAGGGGACCGGCAGTACGCTGGTGCCCATGCTGCTGAATTTCGGCACCATGTGGGGCATCCGTGTGCCGCTGTCGGCCATTCTGGCGGCCAAGTGGGGCCTTGTGGGTGTTTGGGTGGCCATGGCCCTGCAGCTGGGTGTGTGCGGCATCTGCTTCCTGATCCGTCTGGCCGGCAAGCGTTGGCTGCCCAAGGAAACGCTGCAATAA(SEQ ID NO:5)。

BA19_GI_0004843

ATGTTTGAGGTCATTAAAACGGAGGGTACCGCCCGTCGGGGCCGTTTCCGGTGCGCCCACGGCGGCGAGGTGCAGACGCCGGTGTTCATGAACGTGGGTACGCAGGGGGCCATCAAGGGCGGCATCGATGCCTTCGACTTGAAGGAGCTGGGATGCCAGATCGAGCTGTCCAATACCTACCACCTGCACCTGCGCCCCGGCGATGACGTGGTGCGGCAGATGGGTGGACTGCACCGGTTCATGCGGTGGGACGGCCCCATCCTGACGGACTCCGGCGGCTTTCAGGTGTTCTCTCTGGCGGGTCTGCGGAAGATCACGGAGGAGGGCGTTACCTTCGCCAGCCATCTGGACGGCCACCGCATTTTCATGGGGCCGGAGGAGAGTATGCAGATCCAGTCCCATCTGGGCTCGGATATCGCCATGGCCTTTGACGAGTGTGTGGAAAATCCGGCCCAGTACGACTATGCCAAGGCCAGCTGTGAGCGGACCCTGCGGTGGCTGGAGCGGTGCAAGGCGGAGCACGACCGCCTGAATGCCCTGCCGGATACGGTGAACCCGCATCAGATGCTGTTCGGCATCAATCAGGGTGCTACCTATCGGGATCTGCGGATCTGGCATATGCAGCAGATCGCCAAGCTGAACTGCGACGGTTATGCCATCGGCGGCTTGGCGGTGGGGGAGCCCACGGAGGTGATGTACGACATCATCGAGGCGGTGGAGCCCTATATGCCCAAGGACAAGCCCCGGTATCTCATGGGTGTGGGGACCCCCAGCAACATCATCGAGGGCGTGGCCCGTGGTGTGGATTTCTTCGACTGCGTTATGCCGGCCCGCAACGCCCGACACGGAAAGCTCTTTACATGGCAGGGTTCCCTGAACATCAAAAATGCCAAGTACAAGCTGGATGACCGGCCCATCGACCCGACGTGTGACTGCCCGGTGTGCCGCCGGTTCAGCCGGGCCTACCTCCGTCATCTGTTCACGGCGGAGGAGATGCTGGGGATGCGTCTGGCGGTGATGCACAACCTGTACTTCTATAACAAGCTGACCCGGCGCATCCGGGAGAGCCTTGACGCCGGCTGCTTTGCGGACTTCCGGGCGGAGTACAGCCAAAAACTCGGTGAAAAGCTCTGA(SEQ ID NO:6)。

BA19_GI_0007615

ATGATCATGAAAAGAAGGATCATTGAAATCGACCGGGAGAAGTGCAACGGCTGCGGCGCCTGCGCCGAGGCCTGTCATGAGGGGGCCATCGCCATGGTAGAGGGCAAGGCCCAACTGATGCGGGACGACTACTGCGACGGGCTGGGGGACTGTCTGCCTGCCTGTCCCACCGGGGCCATCTCCTTTGTGGAGCGGGAGGCAGCCGCCTATGACGAGCAGGCGGTGCTGGCCAATAAGCAGAAGAAGATGCAGGAAAAGATGCGGAAGGAGGGTACTCCCCTGCCCTGCGGATGTCCGGGGAGCCAGTCCAGAAGCATCCGGCACACGGAGACCCGGCAGGCGGAGACCGTCTGCGCCGAACCAGTCAGCCGGCTGTCCCAGTGGCCGGTGCAGATCAAGCTGGTCCCGGTGCTGGCGCCGTATTTTGACGGGGCCAAGCTGCTCATTGCCGCCGACTGCACGGCCTACGCCTACGCCGCCTTCCATGAGCGGTTCATCAAGGGGCATATCACGCTGGTGGGCTGCCCGAAGCTGGACGGCGTGGATTACGCCGAGAAGCTGACGGAGATCATCCGCAGCAACGACATCCAGAGCGTGACCATCGTGCGGATGGAGGTCCCCTGCTGCGGCGGGCTGGAACACGCCGCAAAGACAGCATTGCAGCAGAGCGGAAAATTTATTCCGTGGCAGGTGGTGACCATCTCCACCGACGGAAGAATCCTGGACTGA(SEQ ID NO:7)。

BA19_GI_0011260

ATGTCTTACAGAATTCTGACCATCGATCCCGGCTCCACGTCCACCAAGATCGGCGTGTTTGACGACGAGAAGATGCTGTTTGAGGAGAACCTGCACCACTCTGCCGAGGAGCTGGCCCAGTTCGAAACCATTCCCCAGCAGGAGGCCTTCCGCCGCCGGCTGGTCCTGAAGGCGCTGGAGGAGCACCATATCCCGCTGGAGAGCCTCAGCGCCGTGTGCGGCCGGGGCGGCGTTCTCAAGCCTGTCCACGGCGGTACTTACCTCACCACCGATGCCATGATCGACACCCTGAAAAAGGGTCCCTACGGCCACCATGCCAGCAATCTGGGCGGCCTGCTGGCCCGTGAGATCGGTTCGGCACTACACATCCCCTCCTACATCGTGGATCCCCCCGTGGTGGATGAACTGGCGCCTCTGGCCCGCTACTCCGGCCACCCCCTCATCACCCGCCGCAGCATTTTCCACGCCCTGAACCAGAAGGCCGTGGCCAAGCGCTACGCCAAGGAGATCGGCAAGCCCTATGAGTCCCTGAACCTCATCGTCTGCCACATGGGCGGTGGCGTGTCCGTGGGCGCTCACGTCAAGGGTGAGGTGGTGGACACCGGCAATGCTCTGGAGGGCGAGGGTCCCTTCTCCCCGGAGCGGTCCGGGACGCTGCCCAGCGGCGCACTGGTGGATCTGTGCTTCAGCGGCAAGTATACCCAGCAGGAGATTCGCCGCATGATCACCGGCAACGGCGGTCTGCTGGCCTACACCGGCTCCACGGATATGCAGGAGCTGATGCGCCGGGCCGCCACCGACGCCAAGGTGCGGGAGGTTATCGACGCCTTCCACTACCGGGTCGCCAAGGAGATCGGTGCTATGGCCGCCGCCATGAAAGGGCAGGTGGATCAGATCATCCTTACCGGCGGCATTGCCCACGGTCAGGAGACGGTGGACGCCCTGAAGGGCTACGTCAGCTGGATCGCACCGGTGACGGTGTACCCCGGCGAGGGCGAGCTGCTGGCGCTGGCGGAGGGCGCTCTGCGGGTACTGCGAGGCGAGGAGACCGCCAAAATCTACGAATAA(SEQ ID NO:8)。

BA19_GI_0017177

ATGGCCAAGCAGAAATTTGAGAGAAACAAGCCCCATGTTAACATCGGCACCATCGGTCACATCGACCATGGTAAGACCACTCTGACCGCTGCCATCACCAAGTACCTGGCGCTGCAGGGCGGTGCTGAGTACACCGACTACTCTTCCATCGATAAGGCTCCCGAGGAGCGTGAGCGTGGTATCACCATCAACACCGCCCACGTCGAGTATGAGACGGCCAAGCGCCACTATGCTCACGTGGACTGCCCGGGCCACGCCGACTATATCAAGAACATGATCACCGGTGCTGCCCAGATGGACGGCGCTATCCTGGTCATCGCTGCCACCGACGGCCCCATGGCTCAGACTCGTGAGCACCTGCTGCTGGCCCGTCAGGTGAACGTGCCCTCCGTGCTGGTGTTCCTGAACAAGTGCGACCAGGTGGACGATGAGGAGCTGCTGGAGCTGGTGGAGATGGAGGTCCGTGAGCTGCTGGACTTCTACGGCTTCCCCGGCGATGATACCCCCATCATCCGTGGTTCCGCTCTGAACGCTCTGATCTCCGAGTCCACCGATCCCAACGCTCCTGAGTATGCCTGCATCAAGGAGCTGATGGACGCTGTTGACGAGTGGATCCCCACCCCCGACCGCAAGGAGGATATGCCCTTCCTGATGCCCGTCGAGGACGTGTTCACCATCTCCGGCCGTGGTACCGTTGCTACCGGTCGTGTGGAGCGTGGCGTGCTGAACCTGAACGAGAAGGTCGAGATCGTTGGTCTGTCCGACGAGAAGCGTGAGACCACCGTTACCGGTATCGAGATGTTCCACAAGCTGCTGGACTACGCTGAGGCTGGCGACAACATCGGCGCTCTGCTGCGTGGCGTGGCTAAGACCGAGATCGAGCGTGGTCAGGTTCTGTCCAAGCCCGGTTCCATTCATCCCCACACCAAGTTTGTTGGTCAGGTGTACGTTCTGACCAAGGACGAGGGTGGCCGTCACACCCCCTTCTTCAACAACTATCGTCCCCAGTTCTACTTCCGTACCACCGACGTGACCGGCATCATCTCCCTGCCCGAGGGCACTGAGATGTGCATGCCCGGCGATAACGTCGACATGAACGTGGAGCTGATCACCCCCATCGCTATCGAGACCGGTCTGCGTTTCGCTATCCGTGAGGGCGGTCGTACCGTCGGTTCCGGTGTTGTCATCGCCATCAACCAGGACTAA(SEQ ID NO:9)。

BA1_GI_0023027

ATGTATAATGACGAAAACAGAGAATTTGACCCGGTAGGCGGCGATCTGCCGCCCCAGCCGCAGCAGGACCGGACGGACCTGCCGGAGGAGGAGCCGGACGAGATCGTCAGCTGGTACACCCCCCGGCAGGAGGAGCCGGAGGAGGTCGTCAACTACTTCGTCCAGCAGCGCCCCATACCTCAGAACGTCTGGAAGCAGGCCGCCAAGACCCAGCGTAAGCGCCGCCGTCTGTGGACGTGGCTGGGCATAGGCGGCATAGCGCTGGTGGTCGTGGTCATCGTGGTAGCGGCCATCCTGTCCTCCACCGCCTCCAGCGCCCCCAGCCTGCCGGGCAGCGACGACGGCGACTCCGCCAGCAGCATGGTGGATATCTTCCGCAAGAAGGAGACCACCATCCCCCGCATCTCCGGGGAGGAGGGCGTGAAGCTCAGCTGTCAGGACCCCTCCGGTGAGGAGCTTACCATTCAGCAGGTGTACGCTAAGGTGAACCCGTCGGTGGTGGCGGTGGTGGCGGAGCAGTCCGACGGCTCTGCCGCCGTGGGTACCGGCGTCATCATGACCGAGAGCGGCTATATCATCACCAACGCCCACGTCATCTCCGGCGGCAAGAGCTGCTGGGTGGCGCTGGACACCGGCGTCACCTACGACGCCCGTCTGGTGGGCTATGACGAGGACGAGGATCTGGCGGTACTGCGGGCCATTGCGGACAATCCCCTGCCGGCGGCGGAGTTCGGCAACTCCGACCTGCTGACGGTGGGCGACCCGGTGTACGCCATCGGCAACCCTTTGGGCGTAGAGCTGCGGGGGACCCTTACCAACGGCATTGTCTCCGCCATCAACCGTGAGGTGGAGATGCAGGGCCGCACCATGACCATGATCCAGACCAACGCCGCCCTGAATAACGGCAACTCCGGCGGCCCCCTCATCAACAGCTACGGGCAGGTCATCGGCATCAACACCATGAAAATGAGCAACTCCAGCCTCTCCGAGGACGAGGCCACCGTGGAGGGACTGGGCTTCGCCCTGCCCATCAGCTCCGTGTCCTTCGTGGTCAATGACCTCATCGCCCACGGGGAGTTTCTGGGTACCCCCACCATCGGTATCACCGTCCGCACCATCGAAAAGTCCGGCGGCGGCACGCAGGTGGAGGTCTACACCGTGGACGACACCCTGGGCGCTGCGGAGGCCGGTGTGCAGCCCGGCGATATCATTCTGGAGGCGGACGGTCAGCCTGTCTCCGTCACCAGCGATCTGCTGACGGTGCGGCGCAGCCACTCCGTGGGCGACACCATCCGCCTGACCATCCAGCGGGACGGCCAGTCCCTGACGGTGGACGTGGTTCTGTACGCCAGCAAATAA(SEQ ID NO:10)。

BA26_GI_0018693

ATGTTAAGTGATTTGAATACTATAGTACAATTCTTCTCTGCTCTTTATGTGACAATTGCTATAGATAATATGATGTTCAATCGCTTTTGGACTCCGGATGTCTTTGCTGTTGTGGAAAATGCCTTGAAAAAATTTGATTTCGCTTTGAGTACGCCAAAGCAGCAAGAACTTCTAAATGTAATAAAAAATAGGTCTGTTGAGATTGATACAAGCGCAAGAAGAGAAGGGGCTTTTTATCTTATGCTCTGTGTTTCTCTTTTGATATATTTTGCCTTTGAAGGATTGCTGTCAGAGACGAATCAATGTATATGTTGTTTTGTTATATTAATGGATATGGCAATGGTTTTTGGATTATATATTATAGGGGCTTTTGAATGGAAAAGATGGTGGGAAGTCTGGTTTAGGTACATATTTGCAGTGATAGCTGCATTTGTTTGGCTATATTTGACTTCTAACGCTTCTCTGAAAATTTTGAGCATGAAAGACTTTGCCATTTCTAAAAATGTATCTATTACTTTCTTGGCAAGAATATTGATAATTTTGGTGTTTCTTGTTCCCATAGTGATGCGTATTGTTATAAATTGGTTGTATTCGACTGTTTATGTCAAGTACTTGGATGTTCGGTTAACTGAAGAGTATGTTGCTTATCAAAATACGAAGAAAGCAATACGAAGCAAAAATAAGGACTTGTGTGATTTAAGATATGATGGAGTATATAAAGAAGTCTTCTTTTCTGCTGATAAATCACAAGATAATGTTGAGACAGTGCTAGTAAATAAGCTGTTGGATTACCTTTCTTTCGCATGTAAACCTGTTAGAGTATTAGAACTTTTGTGTTATAGATTTTCTGCTGATTATAGAAATGATAACAATAATGTTAGTAAAGGTAATGAGGAAGCTTCTTATGAATTACCAGAATGA(SEQ ID NO:11)。

BA28_GI_0005743

ATGAACAAAATTTTCAAATCCATTTGGAGCTGGACGCGCTCCTGTTTTGTAGCTGTATCCGAAGCTTCTAATTCCCACGCTAACGGAAGAAACAGTACGACTTTAACAAAGCGATCCAGAGCCTTTCATTTTTGCAAACTCAATAAGACAGTTCTCGCTTTAAGCCTTCTTTGCGCTTTGCCGGTTATCTCGGAAACCGCTTTCGCTGACGGACGGGACCAAACACTCGTCAACGACAGCTCTTTGGGAACTTTTGCCGGAGATGCTCTTGTAATTGGCCAAATAGACAGATTCATGAAGCAGGAAGCGAACGTTTTAACGCAAAGCAATCTCATCTACAAGAATGTGACCGGTACTCCAAACGGTCTTTATATCAATGATGGAAACAGTCTTAGTTTAGTAGGCTCAACTGACGGAATTCTTTTGGCTGACGGCCCTGTTTCCATTTACGGGCAAAATTCAACACTTGACAAGTCGAAGTTAATCATCGGCAATCAGGAAACCCTTGCACCTACAAAAGGCACCATTAACGCAGTTTATGTCGGCATGAATCCCGACAAAATGCACAATGTCTCCCCTGAAGGAGAATTACGCTTCAGAAACGGTGTATTTACTGTAGGAAAAATTTACACCCAGGCATCGTCGTTCAGTGGTGGTGTTTATGTAGATAACTCTGCCAATGTCTCAGTAGATAACCTCTATCTGGATGTCGTCGGCTTTTTACAAAATTCCGGAAAACTGCATATTGCGAATGTGGAAATGGCCCGGCCCAATTTGCATCAAGCAGAAATAATTAACTTAGGCGAGTTGACAGCTGAAAAAGTTGATATTTCCGGATATCTTGAAAATCAACGTTCGGCCCAGATCGGCAAACTAACCCTTAGAGAGGGCGCACATACCAATTTAGCCGACATTCCTTCCGTAAATCAGAAAGGTGCCGAATTAGCAGTCAATGAACTTAACATTGAAGGTAATTCAATAGCGGGCAGCAACTTAAAAATAAGAGGCGCCCTCACAAATAAGGGCAGCCTTACTGTAACAGGAAACGCTAATGTAACAGGCGATCTCGTAAATGAAAGCCCTTCACTTTCTCTCCAAACTTTGTTATTGAAAACAGACGGTACTGATGGGAAAGACAGCGGAACATTCGAAAACCGCCAAGGAGCTGTCACAACACTCGCAGCATTGATTTCAGAAGCCGGTTCAACCGTCACAAACGACGGCAACATTAAGCTTAGTTCCGGCTCAACCATTGCCTCCACAATTTCGGGTACTTTTAAGAACAACAATGCTGCGGAATTTTACGATCTGGCTTTGGAAACCGGTTCTACTTTTGAGAATGCCGGGACAACCACAGTAAAGAATCTTCTGAGCTTGAAAGATGTCAATTCGTTGAAAATGAATTCGGGTTCTTTAAGCACTAAGAATGTAGATTTCAATTTTGCCAACAAATCGGATACCTTGGATCTTCGTAACGGTTCTCTGAAAGCAGAGTCTTTAACAGTCAGCAAAGGCAATGTTTTTTTGAGCGACTTTTCAAGCCCGGATGCTTCTGTAAAGACTTTAACCGACGGTTCCCTTTCAGCAACGACTCTCAAGGCTAAGGAAGTAAACAACAACGGAGTTATTGCCGTCAATTCTTATTATTCTGCAAAGACTACAAATAACACAGGAACCTTTTCACTCGAAGACGGGGCTTCTTTCCTCGATAAAGAAGATACGTTTGACAACGGCGGCACGATTCAGAGCAATTCGGCTATCACTGTCAATGGGAGCCTGGCAAATGCCGGCGGCATCAGAACTCCGGAATTAGTTCTTTCCTCTACAGGAAAATTCATTTCTTCCGTAGATTCCAATCTTTCCGCTCTTACTGCTGAAAAAGATTCGGAAATCGTAATCAGCCAGAACCCTTTGAGCGCTTCAACACTTAATTCCGATGGAGCCTCGATTACCGTAGAAAACGGCTCCCTCAATGTCGCGAATCTCAACGCCAACGAGGGTTCTATCACTGTAGAAGAAAACGGCTCCATTAAGACTAATAATCTTCAGGCTAAGGGAGTCACCTATACACAACACGGAACAAACGGAATCACATCACAAAACGGATGGTTCACGGACTCCACTTTGAACCTTCATGCCGGAACAATCAACGCCGTCGATATTGGAGGAACGCTCGGAAACAACACCTACAATATTTCCGGGTTAAACAGCGTCCCGCCCATCAATGACTCTGACTCTCCGGATACAAAGAATCAGTACAAAGATTCTCTGACACAGCTTATTACTGAGGAAGTCACAAGCGAAACCTTGGTTAACATTGCATCCGGCTCGGTTTTTGATGTAGAAAGAATCAGCTTGAACGGCAACAAACCCACAATCAATTTAAAAGGCGGTGCCCTTCAAACTTCCAGCAATCAACTTTTCACAGGCGCAACAAGTGAGGCCATTAAGATTGACGCCTCCGCTCCCGGCCAAACGGTAGAACTCCCGGCGGGTACTCTGATTTCCTCTTCTGTCGGAGCCGTCAAATCTTCCATCGGCAGCGGCCTTTCGCTTGAGAGCGGCAACCTCGTTATTGATGACGCCCATTATTCAGCAGAACTTGTTTCGAGCGTTGCAAAAGAACTTCAAAAGGTTTACGGACGACTTGAGAGTATTACTGTTAACTTCTTAGGCACGCTGGCCGGCGTTTTCAATATTGACAGCGCGAATCAGTTAGCTGCCACTGCAACTCCGGTCGTTCTCAATACAGTCACGCTCTATAACGGCGCTGACGAGACATCTCCCGTTTCTTCTTTGCAGGTCGGCGGATCATCCCCGGCTTCCGGTCAGCATTTTGATGCGAGCATGGGATTCAAAGACATCGCTTCAGCTGACTCTGTGGTTATTACGGGCGGTAAGGAATTGGTCTTGGTTGGCAACTCTGTCAGTTCTATTCCTAACGCTTCCTACGGGGATGAAATAAGCAAACTCCTGAAGGATTCCTCTGACGGAGGCCGCGTTTGCGTTATAGAAGGAACTTTCACTCTGGGAACGCACGGAGCTGATACACCATCCGTGGGCTCGATCAACTCAGCCGAACTCCAAGAAAAAGGCTCATTGAACCTCAAGAACGGAGAATTTGCTGTTTGGAATGTTGACTTGAGCGGTAAAGCTGACATTGCTTCCAACGCTTTGCTGCACGTTAATATCCTCAATGTTAATAAAAATGGGACCCTGACAAACAACGGAAAACTCGAACTGGAAGATAACGCAGGAACCGCAGCCTCTTTCGTCCAGCAGGGAACTGTTGCCAATAAAGCAAACGCTCTTTTTGATACTTCAGCACTGTCAGAAACAATCAACGAAGGCTCATTCCATAATGAAGGTGAAACCAAGAGCAACGTTTTGACTAACAAGGCACAGGCCGTTTTCGAAAACAGAGGAACTGTCAACGCTTCATTGCTGAATAACGCCGGAGTGTTTAAGAATTCGGAAAGCGGAAAAGCATCTTTTGCCGACGTTTCTATTTCCGGTGAGCTTTCCAATGCCGGGACGTTCAATGTTGCCGAATGTTTGGAGGTTTCCGGACACCTCACGAACGCCAAATCCCTCACTGTCGGCTCTGCCGAGATTTCCCCTGACGGAGAATTGGTCAATTCCGGAAACGCAAACGGAAAAACTCTGGTTCTCCACGGTATCCTTCACAACACGGGCGCTTCTTCTTGGGAAAATATCGAGGTTAATGAAGGAAGCACGCTTGACAACAAAGGATCGTTGGAAGCGAAATTCAGTCTCACGGTCGCGGCCTCAACCGCCACAGTAAACGAGGGCACTCTTAACGCCTCTTCTGCCGATTCCAAGCTCCTCGGCAATCTCGAAAACCGCGGAAACGCTTCTTTCGACACACTCGAAATCAGCAAAGACGCCTCCTACGCGAACCTCGGAAAAGACAATGGCAATGTCCTCACCGTCCGTGAAGGAGCTGAGTTCTACAACGAAGGAACTTCCGAATGGAACAGCGTTGCAGTAAACAAAGGTCTTTTCGAAAACAAAGGACAGATGACGGTAGCCAACCTGACTGTCAAAAATGCAATCTTTAACGTCACGGGAGGTTTACTCAAAGCTGCAAATGCTGATGTGACGGAAACCTCGATTGTCGTAGGTAGAAATTCAATGCTGAAGTCTGCATCTGAAAATGCCTACAGCAAAGCTGAATTTGCAAAGGTTTCGGAACTGAACAATCCCTACTTTGTAAAGGAAGACGGCGACCTGGGTCTAGGCGCCAACTCTCTTGATTTTGCAGCCGGTATCGGTGCTCCGATTGGAACAGGACGCCTGACCGTTACACAAAACATCACTACAACTTCCGCCGGCGGTATCGCTGTAGGAAACGGTACGTGGACAAGTGAAGCGGATCATGCCGATCTAAGCAACGGCAGCCTTGTTTTCGGAAAAGGATCAACAACCGTCATTGACTCCTCTATCCTCACCAACGGAAAGAGCGCATTTACCGCAAACGACGAAAATGCCAAAGTTACGGTAGATCCGACCGCGACTCTGGTTCTTGGCAACCTCAAGGATTCCGGTGAATACACTATCGTCAAAGGCTATGACACAACCGGCAACACGGATGCCAACGGCTGGACGGGCGGTTGGACAGGCGAGAAATTGATTGCCTTGTCTCAAGACGGTACGGGCGTCAATTGGAAACTTGAGCTTGTGAATGAAACTTCTCAGATTCGCGTTCAAGCAACCCTCTCTGACGTAAGGACCGTTTATCCGGATCTGGTCATTCCTAATATCGCCAACAGCGAAATCAAGAAAGCTGAAGAAGGTTTTGCATTTAACCTTCTTAAGGACAAAGAACTATCCGTTGCGAATAAGACCGAGCTTCTTAATTCCGCAGCGAATATCCTCACCGTCGGCGGTGCGACTGCCGTATCGCTGCAAGACCTCAGCACAGCGTTAGATTCTCTTGAGAATCGTTTGTCGATGGCGGGAGACGCTTTCCTGAACGGTTGGATGCGCCAAGAAGATCGAGGAAACGATCTCTGGATTGACGTGAAAGGCGGCAAACAAAAGTACAAGAGCCTTAGTGCTTCCGGCTTGAGCAAGCATGGCTTCGATACAAACTCCTTCGGTTTTGTCATGGGTTTCGACCGCAAGCTTGAAGGAAAACCGATTGTTCTGGGAGGCGCTTTCAGCTACAACCACGGATCTCTGGATTCTTTAGGCAACGTGACCAAGACGAAGAATAAGTACGACTCGTTCGGTCTGCACGCTTACGGTGCTTATGCTCCTCTTGAAAAACTCAACCTTATCGGAATGCTGAGTTGGATGCACAACTCTTCCGATATTTCCCAGCACGTTAATGCTGCGGGTATTGAAAAAGCAGAGGCGGATGTTAAGAGCAACCTCTTTAGCGTTGCAGCAAGAGTCGAAAGTTCCATTCCCGTAGGAAAGACTTCCATCGTTCCGCACGCCGGCCTTCGTTATGTATGGTCCAAAGCCGATAAATTTGACACCAAAGTCAAGGGAAAGAAGATTTGGAGCAATAAAGCCGATTCTGCCAACACGTTCCAAATGCCTATCGGTTTGGCTCTCCGGGCCGACCTTCCGACTGCCTCCGGCTGGATGATCAGACCGCAAGCTGATGTTTCTCTTATTCCGCAGTTCGGTGACACAAAGGTAAAGACCAAGCTTACGAACAGCTACGGTGCATCGGACAGTGTTGAAGGAGAGTTCTCCGGTAAGTTCGGCACCAAGGTAAGCATTGGCGTCCAAGCCGAAAAAGGACGTGCAACCTTCGGAGCCGGCTACGGGTTCATCGGCGGTGCAAAAGGCAAGCAGGATCACCTTTTCAAGATCGAGGCAAGATTCCGCTTTTAG(SEQ ID NO:12)。

BA2_GI_0044108

GTGGCGACCGGTTATCTGGTGGCCACCACCGCCACCTATCACACGCATACGACCTATGCGCTGATGAACCCCAGCGCTCCCATCCAGATGGTCACCGGCAACGTGCATACCGTGGAGCTGAAGGGCCTGCACAACGCACAGCTGAACAGCCTGAAGCTGTACACCTACAAGGATGGCGTGAAGGGGACGCAGGATCTGCTGTCCGGCATCAGCACCGAGGCGGACGGCTACGGGCTGAAGTACACAGCAAAGCTGGCCTCCGGCACCTATTGGGTGGAGGGCTACGACGCCAACAAGGACTGCAACGGCGGCATGGAGATGGTCATCGCTGATGATACCACCTCTGTTTCCGTACAGCGTGCCTATGAGATCTATGCCCGCAACAGCGGCTGGGTGGCAGGCACCGACTATACCATTGACTATCAGCTGACCACCGCCGACGGCGTGAAGCGCACTGCCACGCTGGGCAGCGGCACCGTTTACGGCAATCTCCGCACCACGGGTATCTTCGTGGAGACGGATACCGTGACGGTGAACCTGATCCCCTCCGAGGAGCACGCTGCGAATTACAACGTTGGCACCAAGACCGTTGTCACGAAGGTGGGCGGCGGCGCTCAGTCCTTCGATATCTCCGTACCCAAGGCCTTTACTGTGAAGGTGACGGCTCCTGCCGGCTCCACCATCAGCGTGGGTACCTTCGGCAACTACTATACCTATGAGTTCCTCCGTCCGCAGGAGGACAGCACCGCCACCAAGGACGGCGACACTGTCACCGTGACCTATCGGGTGCCGGAGACCAGCCTGAACCACTTCGTGCGGGTGCAGAATCCCGACGGTGTGACCTATTGGGACTTCAACAAGTGGACCGCCGATCAGGATATCGTCGTGACCCGTGACGATCTGCACATGGACGACGATTTCAACAAGGATACCGTCAGCCGGTTCGATAAGAACACCTACGATCTGGGCAACGTGTATCTGAACATCAACGCCAAGGGCTACATGAACATGAACGCCGGCGACACCTATGAGTTGGATGTGTTCCGTAACTGGCAGGCCATTGAGGGCTTCGTGAACGCCAAGATCGCCCTGCCGGATGCCCACTACGAGGTGGTGGACTTCGACGGCAAGCCCAGCGACGTGGTGAGCATCGCTCCCAATGCCGACAACAGCTGCCTGGCCTATATGACCGCCAACCATCAGGGTACGGCGCTGGTGAAGGTCACCTACGACGCCATGACCCATAAGCAGGGCCAGAGCAGCACCGCCGACAAGACCTTCTCCGCCATCTGGCCGGAGTTCACCGGTGTGTTTGTGGTATCCGTGGGTGCTGACGGCACCGCCATCCAGACCAATATGCTCATGGATCGTATGGATGTCGGCGTCACCAAGGACGAGCAGAAGCAGTTGGATGCCGAGCACGACATCCTGTTCTATCTGGGCACCGACGGCGCCAGCTACACCTTCACTCCGGAGAGCGGCTGCACCGTTACCGTGGCCCGCTCCACCGTGGGTAAGACCATGACCTTCAACGGCTTTACCTCCGAGGGGGTCACCGTGGACGCCGAGACCGGCGCCGTGACGGTGGCGAACCTCACCACCGGCCGCCATATCGTCCGGGTAGAAAAGGACGGCGTGGCCACCTATCAGGTCATCACCGCCCGTGGCGTCAGCTACAAGCTGTTGGACGCCGAGGGCAATGAGCTGCCGGAGAATGCCGAGGTCAAGCCCGGCGAGACGGTGCAGCTGCAGTTTACCGGGCTGGTGAGCCCCAAGGAGAAGATGGCGGGTGTGTATAACCACAACTTCTCCCTGTACTACACCGACGGCGACGGCAACTCCTTCAAGTCCAATCCCGGCAGCTACTACGGCGTGTATGACTTCAGCGGCAACCCCGCCCGTCAGCGCATCTCCATCACCGTTCCGGCGGATCAGGAGGGCCTGACCTATGAGCTGACCGGCGCCATCAAGGTGGGCGGCTACCCCGGCAAGCCCACCCATCGTATCGTGACCTACGCCGAGGGCATGGGGATGCAGCACGGTACCGCCACCGCCAGCGTGCTGGCTCAGCTGCCTCAGGTGACCTTGAAGCTGTCCGGCTATGCCGCCGACGCTGTGGAGAAGCTGATCGATGCCATCGGTACGGTGACGCTGGACAGCGAGGAGACCATCAAGGCTGCCCGTGATGCTTATGATGCTCTGACCGAGGAGCAGAAGGCTCAGGTGGGGAACTACCAGACCCTGCTGGACGCCGAGGCCAAGCTGGCTGACCTGCAGGCTGCCGACGCTGTGGAGAAGCTGATCGATGCCATCGGCACGGTGACCCTCGACAGCGAGGAGACCATCAAGGCTGCCCGTGATGCTTATGATGCTCTGACCGAGGAGCAGAAGGCTCAGGTGGGGAACTACCAGACCCTGCTGGACGCCGAGGCCAAGCTGGCTGACCTGCAGGCTGCCGACGCTGTGGAGAAGCTGATCGATGCCATCGGCACGGTGACCCTCGACAGCGAGGAGACCATCAAGGCTGCCCGTGATGGCTACGAT(SEQ ID NO:13)。

N20_GI_0009810

ATGAGCCGTGAAGTAGACCAGCGTGTTGTAGAACTGCAGTTCAACAATACGAACTTTGAGAAAAACACAAAAAAGTCCATGGACTCCATCGACAGGATGATGGAGAAACTGCAGTTCAAAGGGGCCGAAAAGGGCTTTGAGAAGCTGGATGCGGCTGCGGAAAAAGTGGATTTTGCCACCATGAACCGCTCGCTGGACACCTTGCAGCAGAAGTTTTCGGCTCTGGATATTATGGCCGCCACGGTATTGGTGAACATTACCAGCAAGGCCATGAATGCCGGCGAACGATTGGTGAAGAGCTTGTCACTGGATCAGATCACCAGCGGATGGAATAAGTACGCAGAGAAGACCTCGAACGTGCAGACCATCATGAACGCCACCGGCAAGAGCATCGATCAGGTGAACGGCTACCTGAACAAGCTGATGTGGTATTCGGACGAGACCAGTTACAGTTTCAGCGAGATGACCAGCGCGCTTTCGCAGATGACGGCGGCGGGCGGCAATATCGATAAGATGATCCCTATGATCATGGGTATTGCAAACGCCACGGCAGATGCGGGTAAGACTGGCTTTGCGTTCCAGAGCACCATCCGGAACCTGACCCAGAGCTACAGCGCAGGACACTTACAGTTACAGGACTGGAAGAGCCTGAACCTGATGGGTACGGCGACGAAAGCCCTGAAACAGGAGCTTATCGACACTGCGGAGGAGCTGGGGGTCATCAAGAAGGGTGAAGTGACCATCGCCAGCTTTGAGTCGAGCTTGCAGAAGAAATGGGCCAACACGGAGGTCATGGAAAAGACCTTCGGGAAGTATGCTTCCATGATGGAGGCGGCCTATGAGCTGACCCAGAAGAACAAAGGTATGACCAGCTCGGAGGCGCTGGAACAGCTGAAAGGGCAGTACGGAGAGCTGGCAGAACGCGCCGCCCTCGCTGCCCAGCAGGCCACCAGCTTCGCGCAGGCCATCGACTCCACAAAAGACGCCGTCAGTTCAAAATGGATGGCCGTCTTCGAGACTCTCTTTGGCAACAAGGAAGAGGCAACCGACACCTGGACGGAGCTGGCGAACCGGCTGTATGACATCTTCGTGCCGTCCATCGACGCCCTGAACGACCGGATGAAAGCGGGCCTCGACACCGGCTGGCAGCAGATGCTCTCGAACGAGCTGGGTGACCAGGGCAACGCCTACACCTATGCACTGGAGCAGGTAGCACTGGCTACTGGCGCTCTGACGGAAAAGCAGATCGAGGAGGCAGGGAGCTTCGGCGCGGCCCTGCAGGAAAATGGCGTGAGCGCCGATACGCTGCGGCAGGCGCTGGACGAAGCCCGCACCAGCACCGAGAAACTGCTGGCCCTGAGCGATAAGGAGCTGGACGCGCAGGGGTACGACAAGGACGCCATACAGAAGGCCCACGACCAGTTCGTGAAACTGAACGAGGCTGTTCAAAATGGAACACTGGACCTCGAAGGATATGCTGAGGCCATCGGAAGGGTATCGGGCCGGGAGCACCTGATACAGGGGCTTTGGAACATCATGGACGCCATCGGGAAGCTGGTTACGCCCATCAAGGAGGCCTTCAACGAGATTTTCCCGCCTGCAGACGGCGACCGAATCTATACAATCGCCGAACGGTTCGACCTGCTGACCCAGAAGCTCATCATCTCGGATAAGACGGCGGCGAACATCAAGAAGACGTTTGAGGGTGTATTTTCAGTCATCCGTGTTGGCGTGAACATGCTGAAAACCGTCGTACAGACAGCGGCAAATGTTCTTAGTGCGGCAGTCCCTCTTGGCGATGTCCTGCTTGGAATGACTGCCAGCATCGGAGGATTTGTATCCTCGGTAGATGAAAGCCTTGACCCGCTGGAAGCACTTGGCTCGATGATCACTGGTTTTGTCCAGACCATTGCACCGGTGCTTTATTCTTTTGGAAAAGAGGCTGACGTAGTATTTTCTAATTTTGCAAATGGAGCAAAAGATGCTTTCAACAGCTTCGATCCGGAAAGGATGAAAGACTTTATCACCGGAGGGTTGAGCGTCGGTATTCTGGCCTCTGTGAAGAGCTTCCTCGATGGAATCAAGTCTGTCGGGGAAAGTGCAAAAGGTATTATCGGAGGCATTAAAGATACTATCGATTCACTCGGTGAAGCAATCGATGCATGGAAAGAAGCGAAAAAATCGGAAACACTGATCACGATCGCGAAATCTATCGGTATCATTGCAGCATCGCTTGCTGTTGTATCAATGATAAAACCGGAACGACTGAGTGCTTCGATGGAGGCGATGACCGGAGTGTTTCTGGGGCTGCTCGGTGTGATGAAAGCACTTGCACTCATTTCGAAAGAAGTAAGCTCTTTGAAACTAATGGCTGTAAGCACGGGAATGATGGCAGTTTCGTCTGCAGTCCTTGTGCTGTCCGGTGCGCTGAAAGTCATTTCTACCATTGACAAAAGTAATCTTCTTGCAAGTGTTGCAGCGCTTGGCGGAGTAATGGCCGGACTTACTATTGTAGGTGCTGTACTCTCCAAGGATGAGGTAAGATTTCTGAAGGGAGCAGCCGGACTTATCGCTTTTGCAGGTGCTGTCGGCATTCTCACAACGGCACTCAAAGCACTTAGCGGTCTAAAACTGGAAGAAATGGCGAAAGGGCTTGGAGGTATATCCGGAATCGCAGCAGTTCTTGTTTTAGCAGCAAAGCTTATGAATGGCGTAAAATTCGGCATCGGAAACGGTGCTGCGTTTTTAATGCTGGCGGGCAGCATGAACCTGTTGGTATCGGCCTTCAAGAGCTTTGGCGAGATGAACTGGACTGAGATCGGGAAGGCACTTACAACAGCAGGTGCCAGTATCGGCGTTTTTGTGCTTGCATTGAATCTCGCGAAAGGAACTCTCGGAGCGGCCGTGGCGCTGACAACGATGGCCGCAGCTGTGAACCTGCTTGTACCGGCGATAAAAGAACTTGGCTCGCTGAGCCTAACCGAAATGGGCATGGCGCTTCTTGCCGTTGCGGGCGCATTCACCGCCCTTGGTGTTGCTGCAGTGATCCTTGCTCCTCTGACACCGGTCATCGTTGCATTGTCACTATCTATCAGCGCTCTTGCACTGAGCATCGGTGCATTGCTGGCACTAAATTCGGCAGCCATGTTTATTGGGAATCTGGCATCCAGTCTTACTCTGCTCCAGAATCTTAATTTCCAGGTCTTTATCGAAGCCTTGAAATCGGCGGCATGGCTGGTTGTTGAATTTATTACAGGAATCATCAAGGGGTTGGCAGAAGTTGCTTCGACGCTGGCGACTTCCATTGCCAAGATCATAGAAGCAGTATGCTCTGCTATCGTTCTTTCTGCACCTGCCATCGGAGAAGCACTTTATGCAGCAGGCACCACGCTGATCGATGTTATCATCAAACTTCTCGATTATATTTGGGTGAAATGTGAGCCCGCTCTCAATGACCTCTGGGACAAGTTTACCGGATTGGTCAAGAAAAAGGCTGAGAATTTCAGTCTGCTCGACCTGCTGGGGCTGAAGTGGAAAAACCCATTTGCGCCTTTCCTCGACGAACTGGAGCATGGCGACAGCTTTATGGCAGGGCTCTATCAGCAGATGACCGGCACGGGCAAGTATGCGACCGAAGGATTTGCTAATGGTGAGACTGACAAAGACGCCATCGCACAGGTGAAGCAGGCCAGTTCGAATGTGGCGAATACAGCTGTAGAGACCATGAAAGATGACCTCGACCAGCATTCTCCCTCCAAGGTCATGGCCGAAATTGGCCGGTTTGTGACACTGGGACTGGCGGAAGGCATCGGCGACCAGAACGCACTGGCGAAGGCGAAGGCTGCCATGCTGAACGTGGCCACCGGCATCCGTACCGTCTTTACGAACTTCTGGGGCATCCACTCGCCAAGCGACCTCGCCATGAGCGATGCGGAGAACATCCTCGAGGGCGCGGTGCTGGGAATGTGCGACCCGGAAGCACGGCAGAAGCTCTACGACGAAAGCTACAACGCTGCCTCCGAAGTGAAGGGCGGCGTGGGAAAGGCGCTGGACGAGGCGGCCACGCTGGTGCAGGACAAGATGCAGGGCATCTACGCTGCATTCAAAATGGACCCTCTGGGGAGCGGCTCGAATCCCCTGAGAAATGGCGTTGAGACGGCCAGGAAGCAGTTTGAGACGGCCATTCAGGACTCGACGCTTATCCCTGGCAAGAATGGTATCCAGACGGCGAATACGGATACAACACGGGGCGTGAATGACATTGCTGCGGCCGCTAAGAGCAGGCTTGCAGGCTACTTTGGCGCATTCGGAGACTATTACAAGAAAGCGGTCGACGACATTACGCCGGGTACGACCGACCCGACTACCAAGACGAAGGCTTCCAAGACCGGAAAGAGCCTTGCGGAGACCCTTGCAGAGGAGTACAGCAAGAAGCTGAAGGCCAACAAGTACCTGCAGGATGCGCTGAGCAAGGAGACCGCCCTGTGGGAGCTGCAGAGCGAGCACAGCGTGACCAACGAGGAGCTTCTGGCAAAGCGGACTGAGGTGGTGACCAAGCAGATCGAGCTGCAGGCAGACCGAGTGGCCATTGCACAGCAGCAGTACGATACCCTGCTGGCCCGGGTAGGTGCCGGGAACGACAAGACCAAGGACGCCTACAACACCCTGCTGGATGAGAAGGCCAATCTGGAGAAGCTGAGGCAGAGCCGCCACAGCGACATTTGGGGCGATGTACTGAGCCGGTATGAGAACGACGCCAAGACCGCCGAGGATGAGTACGACCTGTGGGTATCCATGTACGAGGACACCGCCACGGTAGCAGAGCGCTCGAACCGGCAAATGATGCAGATCAACAAAAAGATTGATGCACAGGCCAAGGTGGTAACGGCTGCCGAGGAGGAATATACCAAGCTCAAGGAAGAGTTTGGGGAGCAGAGCCAGCAGACCCAGGTGGCATACCGGAAGTATCTGGAAGAGCAGAAGGAGCAGCAGGAGCTGATCAACGAGCTTGAGAAGGCCCAGCTTACCCAGTTTGCCAACCAGATCACCCGATACGAGAAGGAAGCCAAAATCGTATCGAACCGGCAGAGGATGTTGGAAAAGCTGTACGACGACGGCAGCCTCTCGGAGCGGGAAAGCGCTTATGAACAGGCGGTGGAGAAGTACGGCGAAGGCTCCAAGGAAGCCCGGCGTGCTGCCATGCAGGGAACCATGAGCTCTCTGATGGGTGTGGGCGCTGCCATGCGCAACATGAGCACCTCGCTGAAAAAGCTGACGGAATACCAGAAGACCTATGACTTCTACGTAGCCCAGGGCAAGAAGGACAGCGAGGAGGCTCTGGACGCACTGGCAGAGCTGCAGGACGAGCAGTACAACTTTGTGGGATTTGCGGAGAGTCTGGCCTCGGCGTTTGACATGAGCGAAAACGGCAAGCAGGCCATGATGCAGTTGGGATACACCATCTCGAAGAACTGGAAACCCATCTACAACGGGTTCAACCAGGTATGGAAGAAGATAAACCCGGCCTTTGCAGAGAGCCTGACCAACCTGATCGGCTTGTACTCACGAGAGGGTGCCAGCGAGACCATGGCCGCCACCATGAACGCTGTGGTAAGTGCCATGCGGGGCGACTGGGGCAGTGCGGTGGCCAGCGGGCTTACGGCTGTGCTGGACATTGTAGGCACGGACTTTGGCCGGACTCTGAGCGAGGCCATTGGGAATGCACTGCGGAGCGCTTTTAGCGGCAACGGCCTGTTTGCCCAGCTTCTCTCGAAGCTTTTGGGAGGAATGAACCCGGGAGGCTCCGGCGGCGGAGGATTCTTCTCCAAGGCTTTGGACTTTATCAAGAGACTTCTGGGCCGGAAGAGCACCGGCGTTGCCGGCGGAGGAAGCGGGATCTCAAAATGGCTCAGCGCCGGGAAGAGCGCTCTGGGCCTTGGGAAAGCCGCCAAGGTCGCCACAGACCTGGTGCCGGTACTGCACAGCGCAGGAGCTGCCACCGCCAATGTGGCCTCCGGTGTGGCCACCGTTGCCAAGGCTGCGGGAGCCGCCAAGGTTGCTGCCACCGCTGCCGGAGCTGCCACCTCGGGAACTCTGGCCAAGGTAGGCATGGGCGTTGCCAAGGTGGCGGCAAGTCTCGGCCCTCACGGACTGCTGGTGGGTGCATGTGTGGCAGGTGCGGCCCTGGTAGGCACTGCCGTGGTGAAGAACTGGGACAAGGTGAAGGCCGGTATCGGCAAGGCCTGGGACTGGATCAAGGAGAAGGCGTCGAACCTCTGGAGCGGTGCGAAGGGTCTCGTGGGCAGTGCGATCAACATCGGCAAGAACGTCGTGGGCGGCCTATGGAACGGCATCAAGGGCGTAGCAGGCGGACTCTGGAACGGCATCAAAGGCATCGGACGAGGCATCATCAACGGCTTCAAGAGCATCTTTGGCATCCACTCGCCATCGACGGTATTTGCCGGGATCGGCGGCTACCTGATGGAAGGTCTGGCGAACGGCATCACGAACACCGCTGATGGCGTGGACCAGAGCCTTGAGGCCGTGGCAGATGGCGCTTTGGACATTGCCCAGAGCAGCGCCATGAGACTGCTGGACGTGCTGAACGACGAAAGCGACCCAAGCATCCAGCCGGTGGTAGACCTGACCAATGCAGAGAACGCTCTGGACTGGATGGACTCCCGCCTGGCAGGAGACCGGGCCGTGACCCTGAGCGCAACCCGCTCGGTAAACCTTGCCGGGACGGTGAACCAGAACGCCAATCGTCAAAATGGAAAAGCAGACCCCAACGACCCGGAGGCCCTGTCGGCCAGCGGGAACCGTGATGTGGTGGATGCGATCCAGAGCATGGGCGAGCGGATCGACGGTGTGGCAAGGGCTGTGGCCAGCATGAAGGTCGTGATGAACAGCCGGAAGCTGGTAGGTGAGATCAAGAGCGACATGAACACCGCCCTTGGCGAACTGGCGGAGAGAGGACGGTAA(SEQ ID NO:14)。

N48_GI_0125557

ATGGCAAGACCAATTCAACCAGAGCAAAGCGAACTCGTCAAAAAGACAGTGTTCTCCTATATTGTGTCCTCGGCTAAGTTCAAGTATAACTTAACCGAGAACCGCATCAAGTTTGCCCTTCTCGACAATCTCAAAGCGTTGTCGGGAATCCCAAAGAACCTTGATATTCGCAATCACAAGTTTCGTATGCACAAGCCTCAAGACTCTCGCGTCTGGGAGGTTGAAATGCCTATGAGTGATATACTCAAGTATATGGGCAGCGAAGGCACACCAAAGAAGAATCAGGCTCTTATAAGAAAAGCAGCAAAGAGCATGCAAACGAAAATCATCGAAGTTGAGAACACCGCAACTGGCGACTATTGGGGTGCAGCCCTTATCATGAATGTCTATATATCCAGAGGGTCTGGCATCATGAAATTTATCGTTGCAGATTGGGTAATGACTGCACTCCTGGACTACACACACGGCTTTCGTGAGTTCGAACTTGAAACCATGATGAAGTTAAACAGCCCTTATGCTATGCGCTTCTACGAGCTTGTTGCCAATCAAGATACGGGAACCCCAATCAACATGAAAGTTGAAACTTTACGTGAATGGATGGGCATCAAAGAGGGGCAATATTCTCGTTCGTATGATTTGCGTAAATGGGTATTAGAACCATCAAAAAAAGAACTTGACGCAAATTGTCCTTGGAGCTTTGATTTTGTCGAAGTCAAAGAGAATCCAGACAACAAGAGAAGCAAGGTTGTGAAGTATCTCATTACCCCTCGTCACATCATCGAGAACGAGAATCAGACACTTTACAAGCAATCTTTACAAGCTAATATTACAGCTCGCTTGCAACTCTCTCCGCAAGCATACGACTATCTTCGTTACAACCTCGGCTTTGAGGTAGATGAGATTAACAAGAATAAAAAAACCTTCATCGAAGCCGAAGAGAAGATTCCAGACTTCGTTGGGTTCTTGTCATCCCTTGCAGGTCCATCAAGACTTGCCGATAAGCCAAAGGCCTACATTGTTGGAGCGTGCAGAAAGAAAGCTGCAGAGCAAAAATAA(SEQ ID NO:15)。

BA15_GI_0010824

AAGAATGTGCGCAAACTGCGTGAGGGCGGTTTGGGTATCTTCATCACGTCCAACGGTACGCTTGACAACAGCAAGAAACTCCGTGACTGGATTGTGAGCGAGGGCGGCGCAGATTTCGTGGGTGCTTTCCGTATGCATAACAAGACTTTCGGCGGCACCGGGGTAACATCCGACATCGTTGTTATCCGCAAGCGTGTGAACGGGCAGAAATCCGCCCATGCCATTGATGTAAGCGATGTGAGCGGAGAGCGCATGGCTGAATATGACACTGGGGAAACACGCAAAGTCAAAGGCAAGGAAACACCGGTCATCAAGCAGCTTTCAATGGACTACAACCGCTATTTCATTGAACATCCTGAAAACATGGCAGGTGAAATGCACTTCGCATTTGAGAAAGGCGACACTTTCCGTCCGACAAGCAAGGGCTTATACCCTAAACTGGATAAGAAGCAGGAAGAAATGTTGGCTGAATTTGTCCGCTCGTTCCGTGCGGAGGAATTTGGCGAGCGCAACACAGAAGTTACCACTGATGCAATGCCCGGCAAGAAGATTGGTGAGGTGTTTGTGAAAGACGGAAAACTGTACATCAACTCAACTGCAAGCGCACAACCCCTTGAAGTGAATGCCAACAAGGTAAAAGGGCATACGAAGGTGGAATGCTTTGAGGCGTACACGGCCATCAAGGAAGCACTTGCGGAAGTCCTATCCTATCAGACCGAGAATGAAAGCGATGATGGGCTGAAACCCTTGCTTGACAAACTCAACAAGGCATACGATGATTTTGTCGGCACATACGGACACTTCAACAAAAACACTGCCATTGCGTTTCTCCGCAATGATGTGGACTATGCCAATGTGTTCGCTCTTGAAAAGTTCGAGGAAACGGCAGATGAAAAAGGAAACCGGGTACAGAAATTTGACAAGACCGATGTGTTCAGCAAACGTGTCGTTGAAAAAGAGAAAGAGCCGACCCCAACCAATGTAAAGGACGGTATCATCGCAAGTATCTTCAAGTTCGGTCGTGTTGATGTTCCATACATTGCAGAGCAGCTCGGACAGAGCGAGGAAGCCGTTAAGAAAGAAATCATCGAGAGCGGTTACGGATTTGAAGACCCTACTACCCGACAGATAGAGGTTTCTTATCAGTATTTGAGCGGCAATGTGCGTGAGAAACTGCGCCAAGCACAGGAGAACAACGAGAACGGCGAGTATGACAGCAATATCAAGGCATTGCAGGAGGTTGTTCCTATGGATATTCCTGCCCACTTGATTGACTTCACTCTGGGTAGTTCTTGGATAGAGCCGAAGATGTACGAGGAATATGTGAAAGAGCGCACCGAGGTAGGCGTGCAATTCACAGCCGTAGGCGGTACTTGGTTTATGAATGAACCATATTTTACCAACTACGAGAAGAACCGTGCTATGGGCGTTACAAGCGAAATGCTCGGTCGTACCGTTATGGGACACACCCTTATTGAAGCAGCCATTCAGAACAGAAGCATCACCGTTTCTACCGTTAAGAAGAATTGGGACGGTTCTACCGAGACCATTACCGACAAGGAGGCGACACAGGCTTGTGCTGCCAAGATTGACGAGATACGTCAGGACTTCAAGGAGTGGGCAAGGCAGAAGATGCAGAGTGATGCGGAAATGAGCGAGCGTATGGAGCGTATCTATAACGACACGTTCAACAACTATGTGCCTATGAGCATACCCGATGACTTTGTGCCGGAATACTTCGGCGGTGCATCGCACAAGTTCAAGATGCGCCCACATCAAGGCAGAGCCATTGTAAGGGGAACGATGCAGCCGTTGTTGCTTGCTCACGAGGTTGGTACAGGTAAGACATTCACTCTTATATCAACTGCAATGGAGATGCGCCGCTTGGGTACTGCACGCAAACCTATGATTGTGGTGCAGAATGCCACCGTAGGACAGTTTGTTGCAAGTGCAAAGGAACTCTACCCCAATGCAAAGATTTTGACCCTCGAAGAAGCAGACCGCAGCGCAGAGGGAAGAAAGAACTTCTATGCCAAGATACGCTACAATGATTGGGATATGATTGTAGTGCCTCAATCTACATTTGAGTTTATCCCAGACAGCGAGGAGCGACAAATGGCATTCGTTCAGTCGAAGATTGAGGAGAAAATGCTTGTGCTTGAGAAGATGAAAGAGGCAGACCCTAACGGCAAGAGTATGATTACCCGACAGGCTGAAAGAGAAATCGAACTGTTGGAGGAACAACTTGCAGGGTTGAGTGATGAGAGTGCAAAGAAACGTACTGCCGCAGATGAGAAGAAACGTGCTGTTGCATTGCAGAACGCAGAAGTCAAGGCAATGGAAATGCTCGACCGCAGGACTGATGATGTCGAGAACTTCGATGATATGGGTATTGATGCCCTGCTCATTGATGAGGCACACGAATACAAGCACCTCGGATTTGCCACCGCTATGCAGCGTGGTGTTAAGGGTGTTGACCCGTCATACAGCAAGAAATCACAAGGCGTGTTCCTGAAGACACAGGCTGTTTTGGAAAAGAACAACGGACGAAACGTAATCTTCGCCACAGGTACGCCAATCAGCAACACTGCCGCAGAGATTTGGACATTCATGCGCTATCTCATGCCTGCCGATACGATGAAAGAGTACGGTATTTATTACTTTGATGACTTTGTACGCAACTTCGGTAACATTCAGCAGATGTTGGAGTTCACCACAAGCGGAAAGTTCAAGGAGAACAACCGCTTTGCCGGATATGTGAACCTACCCGAGCTGGTGCGTATATGGTCGGGAGTGTCCGATACCGTCCTTACCAAAGAAGCCGGTGGCGTAAAGGACAAAATACCTGAAATGGAGGGAGGAAAGGCACAAGACCTTTATCTGCCACAGACACGCGCATTGCGTAGCATCATGAAGTTCGTAAAGAGCGAACTTGAACATTATGAGCAGATGAGCGGCAAGGAAAAGAAGGAGAACAGCCACATTCCGCTCACGATGTACGGTATCGCCAAAGCCGCTGCCGTGGATGCCCGGTTGGTGCAGTCCGATGCGGAGGACGACCCGAACAGCAAGACCAACGAAGCAGTTCGCCAAACTCTTCGCTCACTGAAAGAAACTGCCGACTACAAGGGTACTGTCGCCATCTTTGCCGACAATTATCAAAACAAGCAGAGCGGATTCAACCTTTATGATGACATCCGAAACAAACTGATTGCAGAAGGTGTTCCTGCTGATGAGATTGTAGTAATGAGGTCGGGAATGACCGTCAAGAAGAAACTTGAAATCTTTGAAAAGGTAAACCGTGGCGAAATTCGCGTGATTCTCGGTTCGACCTTTACGCTTGGCACCGGCGTGAACATTCAGGAACGACTGCACACGCTGATACATTTGGATGCGCCTAACCGCCCTATGGACTATACCCAGCGCAACGGACGCATTTTGCGACAGGGGAATTTGCATAAGGATATGAACAAGCCTGTACGCATCTTGCGTTTCGGAGTTGAGGACAGTTTGGATGTCACCGCCTACCAACGACTGAAAACAAAGGGGGCGATTGCCGACAGCATCATGAACGGCAAGCAGATGATGAACAACAGCATGACCAACCGTGTGCTTGAGGAGGAAGAAGATGTATTTGGCGATACCGTTGCGCAGCTCTCCGGCAGTGAGTATGCCATGCTGAAAAACAATGCGGAAAAGAATGTGCGAAAGTATGCAAGCCGCAAAAAGCAATGGGAAACAGACCAGACTTATATCCACAACGCCAAGCCAAGACTGAAAGCCTTTATCAAGGATGCGGAAAAGCGCATTGAGGACAACGGCAGATACTTGGAGGCTGTACGTTCGTCATTCCCCGATGGACAATTCAAGGAGATTGTAATCGGCAAACATCGCTTTACTTCTGTTGATACAATGGATGATTTCTTCAAGGAACACAACAAGAGTGTCCTTGCTGAAATGAAGCAGATGAAAGACGGCGAGATTGCAGGAGAACAGAAACGTGAACTGAGCATACAGATAGGCGATTTTTCATTTGTGGTTACAACAAAATTGACAAGACAGACCATGCGTGACGGTGCAACTCTTTTCAATGATGTTGAGCGCAAGATGACCTACTCATGTCCTGAACTTGGCATTGAGAATGTGCCGGTACGCCAAAACCTGATTCGCAATGCCATTGAGGACATTACAAGCAATGTGATTTCGGGAAAAGATTTTGCCGAGAGATTGAGTGCCGGAGGGCGAAGCAAGAAGCATAATGAAGCCGAATTAAAAGAACTCCTGTCAAGAGAGGGCAAGCCTTTTGAGTTTGAAAAAGAACTGGAACAGGCAAAATCGCAGTTGGAGGAATATGCCGAACTCATGAAGAAAGAGTTGGAGGAAAAGGAAGCCAAGTATGCTGAAATGGATGCAAGCGTTGAAGCTGCCAATGATATTATCAATGCCGACGAGGACGATGTCTTATATCGCAGCGATGATACGATGTATCGTATTCGCGAAGATGCCGCACCCAAAAACACAGGTATCGGATATAAGGTGTTTGTTTTGAAGAACGGTGAATTGTATCCGCCTATGGTTGCCAATCCGAACGGAGAGGCGACACCGGTCGGTGTGTGGCTGGATGCAGATGCCGCACCTATAGCCGGACAGAGCAAGACTGGGCGCAATCAAGTCAAGGCCGGAGGAAAAGGCACACAAGGCGGTAGTGGTAAACTTGCCTATCGTCCCGGATGGCATTTAGGGGTGATTCCATACGCATTGCAGTTTAACCGCATTGATGAGAACGGAGATAAAACCCTGTTCCCTGCCAATTTTGTTTGGGCTGAGGTGGAGTATGCCAATGACGTGGACTATCAGGAAGAAGCCATGAGTTATGGTTACAACAAGAACGGCAAGTTCCAACACAGTTATGCCGGACTTCCAAGGATTCCTGAAAATGGTGCGTACACTTACCGTACCAATCCTAATCCCGAAACAGACCCTTGGATAATCACAGGTGCTATGCGTGTCAAACGCTTGCTTACTCCGTCTGAAGTTGATGAAATGGTCAAGGAAGCAGGTCGTGAGCCTCAACGCAGACAGGAAAATGCTGTTACCGATGCAGAGATTGCCGCACTCAATGCAGAGATTGCAAATGACTATCGTAACGGCATTGGGGCATACACCGATGATGAAGTCAGTTATGAGAATGACCCTGCGGCAAAACTGCTCGGGCGGTCAAGGAGAACGGCAAAGCAACGGAGGGAATTTGCACAGCGTGAACGTCAGCGGATGGTGGAGAAGGTGGAAAGCCTTGTCGAGAAACTGCATCTGGACAATGTGGAGATAGTAACCGATGCTTCCACATTGGAGGGTAAGAAGCAACGTGCAAAAGGTTTCTACTCAAAGAGTACAGGCAAGATTACCATTGTTGTTCCCAACCATTCAAGCGTATTTGACATAGAGCAGACCCTGCTTCATGAAGCGGTAGCTCATTACGGATTGCGTCAGCTGTTCGGCGAACATTTTGATACATTCCTTGATAATGTATCAAACAATGCCGATGAGAACATACGCAGACGCATTGTAGATATGGCTGCAAAAAACGGTTGGGATTTCCATAAGGCTACCGAAGAATATCTTGCTTCGCTTGCAGAAGATACTGAATTTGAGAACATAAACGCAAGTTGGTGGAGGCAGATAAAGGATTTCTTCTTGAATATGCTTCACAAGATAGGTTTTGAGGATTTCAGAGGAGTTACTCTGACTGATAACGAACTCCGCTATATTCTGTGGCGCAGTTACGAAAACCTTGCGGAGCCGGGCAAATACCGTAGCATCTTGGGCGAAGCTGCTGATGTGGCAAAACAGTACGAGTTGGGTGTTGGTAACTATGCGGTTACCAATCCCAATACTCCGCACGCTGCCGAGAGCGATGATGAACTCTATCGTGATGGCGACCCCGAAATTCACGAAAGAGAGTTGGCACGAGACCGTTATGAAAGACGTGTCAAGACAGGTATGTTCCAATCACAGGAGGCATTGCAGGATAGTATGCTCGGACTGAAAGAAGCAATGCAGGCTATCCTTGGCCAAGGAACAAACATTGAAGATGTGGACGGCTTCGAGAATGCTTACTTGGGCGAAAACCGTCTGTCAAGTGTGAACAAAGCCGAAGCAGATGCTTTCGCACAGACATTGTTCAAGCCAATGCTTGATGAGGTTGCCAAACTTGCCCGAAACGAGGCTGAACGTGAGGAACTGACCGACTATATGATGGCTAAACACGGACTTGAACGTAATGCGTATATGCGCAATGAGGCTATCAAGAACGGTGCTACTGATGCAGACCAAACCGACTATGCCGGACTGACTGCCCTAACAGGTATGGACGATGTTGCAGATGCCGAAGCGGAAGCACAACGAATGGTTGATGATTACGAACAGGCACACGAGACTGCCGACCTTTGGGAGAAAGTCAATGCCGTAAGCAAAGCAATCTTGCAGAAGTCATACGAATGTGGAATGATGAGCAAGGAAACATTCGATAAAGTATCGGATATGTACGAGTTCTATATCCCATTGCGTGGCTTTGATGAAAAGACAAGTGCAGAGGCATACGCCTACCTGTCGCACAAGCATAGTGCATTCAATGCTCCTATCAAGAAAGCAGAGGGACGTAGGTCAAAAGCCGATGACCCGTTTGCCAACCTGCAATCTATGGCTGAGGGTGCGATAATGCAGGGTAACAGAAACAAGTTGGTGAAACAGCGTTTCTTGAACTTTGCCCTTAACCACCCGAGCGACCTTGTGAGCGTTAGCGACATCTGGGTTGAATATGATGCAGTAACCGATGAATGGAAGCCTGTATTCCCGGACAACATCGAGAGTACAGACACCCCCGAAGAGGTTGAGCAGAAGATGCAGGACTTTGAGACAAAGATGGAGTCATTAGCACAGCAGTACCCCGACCAATACAAGAGAGGTAAAGATGCAATCGGCATTCCTTACCGCATTGTAGAGAGCCGAGATATGCGACAGCACCAAGTTGTGGTAAAGCGTGGCGGCAGGGACTATGTGATTACCATCAACGGCAACCCTCGTGCGGCACAGGCATTGAACGGACAGACCAACCCCGACAATGATATGTCGGGTGCTATCGGTGCTATCCTCCGTGCAGGAGAAAAGATAAACCGTCAGTTGAGTGCGTTCTATACCACACGTAACCCGGACTTCATCGTATCGAACTTTATGCGTGATATGCTCTACACCAATAGTATGGCGTGGATAAAGGAAAGCCCGAACTACGCTCTGCGTTTCCACAGGAACTACCTAATGGTAAACCCTGTTACAATGAAACGCTTATTGGCGAAATATCGCAAGGGTACGCTTGATATGAGCAACAAGACCGAAGCAATGTTCCATCAGTTTATGATGAACGGAGGCGAAACAGGCTATGCTAATATCCGAGACATCGAGCAGCATAAGAACGACATCCGCAAGGAACTGAAACGAGCAAACGGCAAACTGAAACTTGCACGTGCTTGGAGCCTGCTTGCAGAGAAGTTCGATGAACTGAACAGAGCTGTTGAGAACTGCGCCCGATTTGCCGCCTTTGTAACCTCTCGTGAAATGGGCAGAAGCATTGACAGAGCCATTTACGATGCAAAGGAGATAAGCGTAAACTTCAACAAGAAAGGTAGCGGAGCGAAGTTCTATGACAGCGTAGGACAGACAAAGGCAGGAAACGCAAGTGCGTTGGTATCGGGACTTGGTCGTAGCGGTTACGTCTTTTGGAATGCCGCCATTCAAGGAACTACCAACTTCGGGCGACAGATGAAACGCCACCCTGCAAAAGCCTTTACAGGTATGGCGGCAATGTTCCTGCTCGGTGCAATCGTGGCATATTTTGGTGGCGATGATGATGAGGACGACAAGAACGCATACTACAACCTGCCCGAATACGTGAGACGTAGTAACATTTTGTTCCGTGCAGGTGACAGTTGGATTTCCATACCTCTGCCTATCGAGTACAGAGCATTCTATGGAATGGGTGAACTTATGACCTCTGTATTCAGTGGCAAGGAACACCTTACAGGTGGCGAAATTGCCGAGGCTGTTTTGGGACAGGCTACACAGATATTGCCTATCGACTTCTTGGAGGGTGGCGGCGGATTGAACGCTTTTGTTCCGAGTGCTGCCAAACCATTATGGGAAGCCTACGTTGCTGAAAAGAGTTGGACGGGTATGCCACTCTATAAAGACACTCCTTTCAACAAGGATATGCCGGAATGGACGAAAGCATACAGCAGCACCAATAAACACATCGTGAACTTGGCGGCAACTCTGAACGAGGCGACAGGTGGCGACCCATACACAAAGGGAGCAATCGACATCAACCCTGCCAAAGTCGAGTATATGCTAAACGGTTACTTCGGTGGTGTGTTCGGTACTATCGACAAACTGACAAAGACTGCTGAAACGATTGTCGGCGACAGAGAGTATGACCCTCGCAGCATACTGTTGGTAAACCGACTTGTCAAGGCAGGCGATGAACGCACCGAGTACCGTGCCGTGAATAATGAGTATTTCCGTTTGAAAGAGGAACACGACCGATTGAAAACCCAATTGAGACACTATGAGGAAGATACCGACAACGGCATCTTTGACTATGCTGAAAAGATAGATTTCCTCTACAACTCGCCCGAATACGAGCGTTACGAAATCTTTGAGGACTACCGCAAGGACATTGACGACCTCTACGATGAAATGCAGGAGGCAGTCGATGATGAAGAGCTCAAGGACATCGAAGCCGAGTTGAACGAACTCAAAAAGGAGATGATACAGGAAATGAACACAACTCGCAAACGTAAATAG(SEQ ID NO:16)。

BA19_GI_0007628

ATGTCCGTGCTGCTGTCGCTGATGATGCTGCTCTCGCTGCTGCCCACAGCAGTTCTGGCAGACGAATCAGCGACAAAGACCTACACCAAGGTCACGTCCGCCGATGAACTGGTCAGCGGCGAGTATGTGATGGTAGCCAACAACGGTTACGCCCCCGGTGTGCTGGACGGCACATGGGTCACGGCGGTGGCCGTGACAGCCGCCAACGATCAGGTCGTTGATCCCACGGGCGGCGTCTGGACGCTGACCGTGGACAAGAATGGTACCATTCTCAGCGACGCCAACGGCAAGGCCATTGCCCCCAAAGGCGGCAACAACAACGGCATTAAGAACGACAGCTATCAGTGGGCCGTGGATTTCGATGCCACCGACGGGACCTTTACCTTCGCCGGACAGGGCGATGACACGGTCAAGCTGGCCAGCAACGCCAGCGCCCAGAACAAGTTCCGGGCTTACAAAAATGAAACCATTACTAAGTCTCCCGGCGGCTACCCCTGCCACTTCACCCTCTATAAGCTGGGTGGCGGGCTGGAGCAGGTAGCTGCCCCCACCGGTACCGCCTCCGGCGATGTGAAGGTGGGCGACACCGTGGCCTTTGCCTGCAAGACGGCGGATGCCACCCTGCGGTACAAGGTGGATGACGGCGCCTATCAGGACTACACCGGCCCTGTGACCATCACCGCCTCCTGCACCATCACCGTCAAGGCTGTGAAGGACGGCATGACCGACAGTCAGGAGGTCGTGTTCACCTACAAGGCCTATCGTCTGGTGGACAAGTACGTCAAGACCGCTGCCCTCACCGGCGGCGACAAGGCGGTCATTTTCAACGCCGGCAACGGCTTTGCCGTCAGCTCCACCGTGATGGGCAATTACTACCTGACCCCCGTGGCCGCCACGGTGGAAAAGGATGTGCTGACTGCCGGCGCCATGGATGCGCTGGTCTGGGATGTCACCGCCAACGATGACGGCACCTATACCTTCACCCAGAACGACAAGACGCTGACGCTGGGTGAAAATAATGGCAAGTTCCATCTCAACATGGACGCCAAGGGCACCACTCGCTGGGATGTGGAGACCTGCAATGCCGAGAACGCCTCCTACTACCTATCCGGCAGCGGCGTCACCGGGCAGTACGGCAAGGTCTACCTGGAATACTTCGCCAAGTTCACCGAGTTCTCCGCCTACTGCACCAGCACCGACCGGCTGAAGGAAGCGGACTTCGGCATGACCTTCTACAAGCTGGCGCAGGAGAAGCAGTATGTGGACGCCACCACGGAGCCTGATCCGGAGGAGCCCGCCACCGTACCCATCCGCACAGCGCTGGAGGGCGCCACCGACACCGAGTTCACCGTCAAGGGCGTCGTGACGCTGGTGGACGGCCAGAACTACTATCTGCAGGACGCCACCGGTGCTATCTGTCTGCGTCTGGCCGCCAAGACCGATGAGATCGCTCTGGGCGACACCATCATCGGCACCGGCAAGCGGGCCGAGTTCCGGGGCATGGCGCAGCTGGGCAGCGGCACCTTCGTCAAATCCAGCGGCCTGACCCTGGACGCCAAGCCCACCACCATCGCCGCCCTGACCGCCGACGATGTGTGTACCTATGTGCAGCTGAAGGGGCTGGAGATCACCGAGATCTATGACAACAACGGTCAGTACGCCAGCCCCAATGTCACCTTCAAGGATACCGACGGTAAGACCATCCAGCTCTATAAGGCAGTTCTGCCCAAGAACGGTGACAGCTGGGCCTTTGCCGTGGGCGACAAGGTAGATGTTACCGCCGCCGTAGGCACCAACAACGGCACCCTGCAGCTGCGGAATACCGTTGCCGACGAGATCCGGGCCGCCGGTTCCGTCAATGACCCCATCACGGACGACATGATCCCCGACGGGACGCTCACCGTCAAGGAGGCCGGGGCCATCACCACCAAGACCGAAAATGTCTCCGTGGTGGGTCAGGTGGTGTATCACTACGGCAACGCCTATAACGGCGCTGCCAGCATCAGTTCCATCATTCTGGAGGACGTCATCGGCGGTGAGATCTACGGCTTCCAGATCTATGATTACGCCAACCACGCCAACTATAAGGTAGGCGACGTGGTGAAGGTCACCGGCACCGTTAGCCCCTACGGCGGCGTGCCTCAGATGCAGTCCCCTGCCATGGAGGTGGTAAAGGCCGGTGTGGAGGCCATCCCCGCACAGGAGATCACCGCCTCCCAGATGGGCGCCGACTATCTCAGTGAGTACGTCTACATCAAGGACGTGACACTGGGTACCTACAACGCTTCCGGCAGCACCACCGTCACCGACGCCACCGGCAGCACCAAGCTCTTCAAGGGTGTGCCGCTGCCTGCCAATACTACTGAGGCCGATGTCACGGCCCTGTACGCCTGCTGCTCCGCCTACAACGGCACCTATCAGCTCCGCAACGGCGCCAGCAGCGACTACGTCACCAACGTGACACCTCCCACCACCGGCCAGCTGCCTCAGGCCGGCGATGAGGTGGTCATCTACAACCAGAACGCTGAGGCGGTTCTGGCGGAGCAAAATGACAACACCGACAGCCCCGCCATCAACAAGGCGGCCGCCACCATTGCCAACGGCAAGGCTGTCTGCTCCAACGGCGCCGTGGTCTTTACCGTGGAAAAGAGCGGCGAGTACTATCGCTTCCGCAACGACACCTACGGCTATCTGTGTGCCAACGGCACCGGCAACAACGCCTTCTATTCCCTCACCGCCAGCGAGGACGCCGACTGGCTGCTCCGGGAGTGCTCCGGCAATGTGGGCGGCTACGAAATGGAGAGCCGCACCGCCAAGTATAACGGCAAATACAGCCAGTGGCTGGAGTATTACAGCGACAGCTTCAAGGTGTACAGTATGTACAGCTCCACCGGTGATCTGGACTACACCATCTACTCCTTCTCCTTCTATCCCGTGGCGGAGGGAACGGAGCTGACCGGCGGCATCGTGAATATGCCCGCCGTGGTCATCGACCACCTGTATGACGCCTATGTGGGGCAGGCCTACACCTTTAGCTTCACCGTGGATGCTCCCTTCGGTGTCAAGGGCGACATGACCGCCACGCTGGCGGGCGAGGCCCTGACTGTCACCGAGGAGGAGGGTGTTTACACCATCACCATCCCCGTGGAGAAGGTGACGGGCGACAAGCTCACCGTAACCATCAGCGGCGTGGACAATCAGGGCAAGGCCATCACCCGCACGGTGGAGATCCCCGTGAAGGACGAGCCGGTGTTCTCCGATCCCACGCCCATGCGGGGTGCTCAGACCGGCAGCGACAAGCGGCCCGCCATCTCTGTGGCGCTGGCCAATGCCGGGACGGAGCCCACCATCACCATGACGGTGAACGGCAAGACCGTGGATGCTGTGTATGCCGATGGTCGTGTCACCTACACGCCCGCTGCCGACCTCACCGACGGCCGCACGGAGGTGGTGGTCACCGCCAAGCGTGCCGACGGCAAGGAGGCCAGCTTCAACTGGTTCTTCACCGTGGGCAAGACCCAGTATCAGCTGTACTTCGGTCAGCTCCACAGCCACACCCAGTATTCCGACGGCTCCGGTACGCTGACCTCTGCGCTGGACTACATCAAGAGCATCCCCGCCAGCGCCAACGTGCAGTTCGTAGCCTTCACCGACCACTCCAACTACTTCGACTCCAAGACCAACGCCAACGTGGAGGGCGCTCTGTATGACACCTCTCTGGTGAAGGATTCCGACGCCAACCACAGCTGGAGCACCTATAAGAGCACCATCGATGCCTTCAACGCCGAGAACGCCGGTTCCATGGTGGCGCTGGGCGGCTTCGAGATGACATGGTCCGGCGGCCCCGGCCACATCAACACCTTCAACACCCCCGGCGTGGTCTCCCGCAACAACACCACCCTCAACAACAAGACCGACGACGCCGGTATGAAGGCCTACTACGCTCTGCTGAGTCAGGCCGAGGGCGTGGACTCCATCAGCCAGTTCAACCATCCCGGCACCACCTTCGGCAACTTCAGTGACTTCTCCTACTGGGATCCCGTCATTGACAGCCGTATGTATATGGTGGAGGTGGGTAACGGCGAGGGCCAGATCGGCGCCGGCGGCTACTATCCCAGCTATGAGCAGTACATCATGGCGCTGGATAAGGGCTGGCATCTGGCTCCCACCAACAACCAGGACAACCACAAGGGCCGCTGGGGCAATGCTAACGACGCCCGTGACGTTATCCTCACCGACAACTTCACCGAGAAGGGCATCTACGAGGCCATCCGGGCCCTGCGGATGTACGCCACCGAGGATAAGAACCTGGAGCTGGGCTACACCGTCAACGGTCAGATGATGGGCTCCAGCATCACCGAAGTCCCCGAGAAGCTGAATCTTGAGGTCACCGTCAACGATCCCGACAAGAACGACTCCATCTCCAAGGTGGAGGTGGTGGTCAACTCCGGCAAGGTGGTCCACACCTGGTCCGACCCCGCCGAGCTGAATCAGGGCAGCCTGTCCGTGACGCTGGATCCGGATTACAGCTACTACTTCATCCGTGTCACCGAGGGTGACGGCGATCTGGCGGTCACCTCCCCCGTGTGGGTGGGTGAGAGCCTGAAGCTGGGCATCTCCAACATGGTCTGCGGCACCGCCACTCCCGTCACCGACGAGGAGCTGACCCTGACCACCACCCTCTTCAACAGCGAGGACACCGATGCCACCATCAAGTCCCTGACCTACACCATCGGCGGCACCGTCATCGGCGTGGATAAGGGCGAGGGCGACAAGGGCTACACGCTGGGCAAGAGCAGCACGCTGGATGTCTCCTTCCACTACACCCCCACCGCCGCCCGTGTGTTCACCGTTCAGGTCACCGCCGTGGTGGAGCAGAACGGCAAGGAGTACACCTTCACCAAAACCATCGATCTGGATGTGCTCAATGCGGATGCACTGGTGTACATCGGCATCGACGCCTCCCACTACAACGAGTATGTGGCGGGCAACTACAAGGATTCCATGGGCAACTTCGGCAATCTGGCCGCTAAGTACAGCGTCCGGACCGTGCAGCTGAACTCCAGCGAGGAACTCATCGCCGCCTGTGGCAATCCCAAGTTCAAGGCTCTGATCCTCACCGCTCCCAGCCGCCGTCTGGAGGCCGCTCAGGCCGATCCCAAGACGTACAGCGCTGACGAGCTGGCGGCTATCAACGCCTTCAACGCAGCCGGAGGTACCGTCATTCTGGCGGGCTGGTCCGACAACTACGAGAACTACGACGTCATTCAGAGCAACCCCGCCATCAAGCACATGGCGGCCACCCAGAATGAGGTGCTGGCGGCCCTGGGCTCCAGCCTCCGCATCAGCGACGACGCCACCTATGACGACGTTCGCAGCGCCGCCGATGGCGTGGATAAGTGGCGGCTGTACTTCAGCTCCTACAACATGGACAACCCCCTGATGGACGGCGTGGAGGTCGATCCCGACCATCCCTATGACAAGCTCTACACCGAGCGCTTCAGCCACTACGGCGGCGCTTCCATCTATGCCGTGGACGCAAGCGGCAACGCCACCTCCACGCTGCCCGCTGCCGTGTCCCCCGTGGTGTATGGCCATGCCACCACCTACTCCGTGGACGTGGATCAGGACGGTCTGGGCGGCGCCGGCACTCCCAAGTACGCCTTTGCCGAAAACGACAGCCGCCTGATGGTCATGGCCACCGAGCAGCTGGAGGGCCGTGGCATGGTGGTGGTCTCCGGTGCGGCCTTCATGTCCAACTTTGAGGTGCAGGCCAGCATCAGCGACAACGGCTCCGAGAAGAACTACTCCAACTACAAGATCTGCGAGAATCTGCTGCAGCTCATCAACCCTGTGCAGATCACGCCCATCGCCGAGGTGCAGGCCCAGACCGAGGATGGCTACAAGTACACCATTGAGGGTGTGGTCACCTCCAACGCCTCCGGCTATGACAAGGAGACGGCCTTCTTCGACTGCATCTATGTGCAGGACGAGACCGGCGGCATCAACTGCTTCCCTGTGGCCGGCGACTTCAAGATCGGCGACCGGGTGCGTGTGTCCGGCACCACCAGCTCCTATCAGGGTGAGCACCAGCTGGCCGTCACCGACATCGTCAAGCTGGGCGAGGGTGAGGCCGTGACCCCCAGAGAGATCACCTCCACCCAGGTCAACGACGGCTCCGTGCTGGGCCAACTCATCACCCTGAAGGGCTATGTGGTGGGCATCGAGATGGCCAACGGTCTGGTGCAGACCATTCTGGTCCGTGACAGCGCCGGTGTGGTATCCCGTGTGTTCATCGACGGTTACATCTGCCCCAACGATGAGGTAAAGAACCTGGAGCTGGGGTGCGAGATCTCCGCCACGGGTCTGGCCTCCTACGACAACACCTTCGTGCTGGCCGACGGCACCGCTATGGCGCCCCGCATCCGCATCAGCAACCGTGCCGACATCATCTGCACCGCCCACACCCACCAGTTCGGTGAGTGGGTCGTCACCACGCCCGCCACCTGCACCGGGGACGGCGTGGAGACCCGCACCTGCCCCTGCGGCGAGACGGAGACCCGTGTGCTCCCCGCCACCGGTCATACGGATGCGGACAAGGACGGCAAGTGTGATACCTGCGGCGCTGAGCTGAATCCCGTGGAGCCCGGCAAGCCCGATCAGCCCACCGATCCCACCAAGCCCGCCACCGGCGACGAGAGCCGTCTGGTGCTGTGGGTCTCCCTGATGGGGATCACGGCGGTGGCCGGTGCGGCCCTGCTGGTGGGCAAGAAGCGCCGTGGATAA(SEQ ID NO:17)。

BA4_GI_0011532

ATGATGAACGTATTCGGGTCATTAGCAGTGGCCGGCATGCTTGTCGCGGGAAACGCGGGGTTTGCCGGCGCGGAGGAATTATCAGGCGACATTTCCCCGATATCTTTATCAGGAGATACCCGAAATATTATTGGGGTTGGGGATATAAGTCTCCGGTCGACCGAGCCTGCGCTGCGGTATCTCATCAATGTGTCGGGGCAAGGGCAACTTGATATTTCCATGTCCAACGGCAGTCCGATGGCTGTTGGAAATGCTGATGGGATCTATTTAAAGGATTATTCTGAGTATGATCAATACGCGTCGGCTTTCCATGTAGCTGGTTCGGGAAGTTTCGGTTCTTTTGTGGGGACAGGAACCTTCTCAATGGTGGGCGGCGGAAAGCTGTTGGGCGTGTGCGCTTTTTTGAGTGAAAGTAAAGGAACGCTGACTCTTTCTGGGGATATTACTGGTGAAGCCGAAGCCGTGATGAACGGCTCCAATGGGTATGCCTCATTTGCTGCTGCAGCGGCAGGGGGAAATCTGGTTTTTGGAGGGGACAGGACGACATTACGGGCGAAAGCATCTACAGGGAACAATGCCAATGGGGCCTTCGTCAAGTATGGAGGTATGATTGGCTTTGCCAGTAAGTCCGTATTGATTGAATCAAAAAATACGGATTCCAGCAGCGTGGGTATCAACTGTGCTGATGGTACGGTCAAAACAAGTGCTGATACGGATCTGGATATCGTGGTGGAGGGAAACAAGGCTACAACGGGTATCCAGCTTACGGCGAGTTCCTCCGATGTGCAGCTTGCCGGGAATCTTGATCTGACGGCAACGCAGACAGGGCAAGATTCTTTTGCTTCAGTACTTGGTATATCAAATGACTCAGGCAAAATGGTCGTCTCTGGCCCTACCTCGTTACGTTTGGTTACCAATGCCCCCTTTGATGCAAAGGGTATTACCGCTTCCGGCAAAGCTGATATGAGCTTTCTTGGGGATGTCGAGATTGCGGTTACGGGTAGCGCATCCGGTAGTGCTCTTTATACGACCTACCGTTATGATTATTCGACTCAAGCCGGTATCTGCCCGGTTATCTCCCTAGGTACCGACGGGAAGGCCGTAACGCTGAATTCTTCAGGTTATGGCATAAATAATCAGGGAGGAAGCGTTTCCCTCACGGGACAGCGAATCAATATAACGGGAAGCACGGGCGTCTTTGTTGAGGGGGGCGGCAATGAGAATGTTTTCGCAGACGTCCGGTTTGATGGGCCTACGACTATAAATGCGGACAAGGCGATTGTCACGAGTATCAAGGCCGGAGAGCAGGTCGGCGCTTCCGTGACCTTTGCCTATAACCCTACGCCGATCAATGTCCCCGTCACGAAGGAAAGCGCGGATTCAAAGGTGAGGGGGAGTGTCACCGGTTCCTCCGGTACAATCAACAAGGAGAACGCAGGTTCTCTTGCATTCTATGGCGATATTTCCAATTTTAGCGGAGTGTTTAATCAAAAGGGCGGAACGACGTTCTTGAGTGAAGGTGCAGCCGGGTATTTTGGCAAGGCGCAGTTAGCCGTGACGGGTGGCGCACTTGTCGCTCCTACCTTGTCCTTCCAAAAGACAGGCAAGCTTACTCTTGCGGGCGGTACGCTGGAAACGGGAACGGGACAGATCTTTACGAGCGCTTTGAACGCGGACGGGGATATGAAGGACCCCGGCGCGGTGAAGCTGAGCGACAGCAATTGGAAGTTTGACTCAGGGGTGATCGCGTTTGATGACGCCAAGTACAACATTGTATACGCCCAGACAGCGGCCGGTCTGCTGGGGGCTGGTAATGTTGCGGCGGACAATGTGTCCGGCTCGGGCTCCGCAAAGGAGATCACGTTCACCGGAACGCTTGTCGAGTTGCCCCCTGGAGATCCTGACAGCTTTGAAACGCTGCAAAAGGCCGTTCTGGATACCGGAATCGACAGCATCAAGCTGGGAAGCGATATCGTTTTATCCAAGCGCTTGCAGGGAACCACACCCGTCGCTCGCTCATTGGCCATCGACGGCAACGGGCACACGATAAGCGGAGCCTACCCGGGCCTGTGGTTCAAGGGGATGGATTCCGGGACTGTTTCCATCCAGAATATTGCCTTTGACGGCTTGAAGACGTCTTCTGGCGACAGATACGAAGGGCCCGTGTCCTTCGGCCCGGCCATTTTCTTTGATATGGGGTACTTTGCCGATAACTGGAAGAGTACCGCAAAGCTGATTATCGGTGACGGCGTCCAATTCAGGAATACGGAAAGCGTAGGTGACGGCGCCGGCGGAGCCGTCAGGACCGCGCACGGCATTGTGGAAATAGGAAACAACGTCGGTTTTATCAACTGTACGGGAGGTTCTGGAGGCGGCCTCTACAGCGAATCGTTTACCACGATCGGCGACAACGTTGTCTTTGAAGGCAACAAGGGCCGCAGAGGCGGCGCGCTGAATGTGGTTGACGATTATGAAGACTACCTCACTGATCCCGACTATGCGTCCGGCGCGCGCCGCGTAAAGTATGTACACATCGGGAAGAACGCCCTTTTCAAGAACAACAGCGTTGAATTGCTGGGTTCCGGAGGGAACGGCGGGGCCATCGAAGTGCAGTCGGGAGAGCTGAGTATCGATGACGGCGCCACGTTTACGGGAAATAGCTCCAAGTCCACAGGCGGCGCCATAGCCGTATGCGATTGGAGCCCCCAACTGCCCGCCAAGGCGGTATTGGGATCCGCGGCGTTCACTCAAAACAGCGCGGGAAGCTATGGCGGAGCGATCATCAACGAAGGCAACGTGCGCTTCAACGGTCCTGTCTCGTTTGTTGAGAATACGGCCGGCAAGATCGGGGGTGCCGTTTGCAACCTGAATACGCTGAACATGGCGGCGGAATCCACGTTTTCCAAGAATACGGCTGGAGTGGGCGGGGGGCTTTATAACGAAGGGATTGCTTCTCTGGGCAAGGCTTCCTTTATTGAAAACGCCGCTGCCGACGGTGGCGGAGCCGTATTCAACGTGCACCAGCTGACGTTTGCCGACGGAGCCGTTTTCTCCGGGAACAGCGCGACGGACGGCGGCGCCGTTTATAACGATTTCTCCGAGGATAAGGACGGCAACGCCGTGAGTGCGGGTTCCCTCGCATTCAACGGCGGAGCGCGCTTCACCGGCAATACGGCCGGCGGGCTTGGCGGGGCCATTTACAACACCCGTTCCATTACCCTCAATCCCGGCGCGGGGCAGGAGATCGTGTTCAACGGGAATACGGACTCCACGGGCTCGAACGCGATCTTCATGGGCGACGGTTCCAGTCTGGACATCACGGGAGACGGCAAGGTCGTCTTTGATGATGCGCTGTCGTCTCAAAGCGCAACGCCGATCCTGAAGAAGACGGGGAGCGGTACATTGCTGTTCAATGCCTCGATGGATGGTTTTCTGGGAACGGCTGCCTTTGAGGACGGGCGCACGGAAATTGCTCAGAAGTGGCTCATCAAGAATACGGTGACCATTACGGGCGGCAGATTGAAGATGCCTGCGTTTTCCTTTGTTGCCCAAGGTGAAGGGAACAATGTCGCTGGCGGCAAGCTGATCCTTGCTGGTGGCATCCTGGAGACCGGAACGGGACAGATCTTTGTAAACGGATTGAACGCGGAGGGGGATAACAAGGATCCCGGTGCCGTAAAGCTGAGCGGAGACAATTGGAGCTTTGATTCTGGACTGATAGCGTTCAATGACGCTCTGTACAACCTTACGTACGCTCAGGCAGCGGCTGATTCATTGGGAGCGAACAACGTAGAAGCGGGTGAGGGGGCTGGCTCCACCTCCGCGAAGGAGATCACATTCATCGGAACGGGGTATGTAGATCCTGGCCCAGATCCGGTTCCTCCTGTAGATCCTGGCCCAGATCCGGTTCCCCCTGTGGAGCCTGACCCGACTCCCCCCGCTCCTGAACCGAAGCCCGATGAAGATCGCACGGGAAAGGTCTCCGTTGACGAATTGAACAACAACCACGCCAACAACATTGTTCTTGGCAATGTGACCATCACTACCGGCACAAGTTCGGATTCGGGCAAGGATTTCGTTGTCGGCGCGAGTGCGAAGGACGACAAGACGGACTCGATAAACGGCAGCATTGGTGGGAAGAACATCGATCTCGGTTCCTCCGGTCGGAATATCTCCGTAGTGGGCGGCCATTATCTGACATTGGTTGGAGGTTCCTCCGATACGCCTTTGGTCACGGCAGGGGGAAATCCCGTCAATGTTCATGTAGGAGGTACTGGGGAAGGGGCATTCGGTGTGCTGAACCTTGGCACGCCGGTCATGGATTCCGGCGGCACGCTCTCGGGAAATATAGAAATCGCCGCGGCGAGCACCGTCAATGTCCGTGCGGGAACGCACGTCATCACGGGTGAAGCCAATGAAACCACCGGCACGGCGGACGTCGCCGGGATGAACAACAACGGCGGCACGATCAACATTGCCGAGGGGGCACATCTCCAATCGACGATACGTCAGGCCGATGGGCAGACGAATGTTTCCGGCAAGCTGACTTCCGCTTCTGTCGAACTTTCCGGAGGTGCCCTGAATGTCTCCGGCGCTGTGGATTCTTCGTCCGTCACAGCCTCCAAGGGAGATATCAAGGTTGCGGGAACGCTGGCGGCGGACGTCTTGACCACATCTTCCGATGTCCAGCTCAACATCGGCGATCAAGGGAGCGCCGGTAGAGTGGTCGCCCGTCAGGCTCAGTTGCAGGGCGGCAGGGTATTCCTTGATCCCGCGTGGAAGGGCAATGATGCATTGGCTGATGCGTCGCACGGCGTCTTCACCTTTGTGAACAATGAAATAGACGGGTTGCTCACGGCGGGGCAGAATTCCCTGCTCGTGTTGGGTGACACGGATACCGGTTGGGCGCTGGACGCGTTCGGCAGATCCAGCCTCCAGTGGGGACAGAACGGCGTAACCGCCGCGCTGGCTATTCGGAAGCCGCAGACGTTGAACGGTACGCTAGGCGCGGTGATGGTGGACGGAACCAAGACCAGCGCTCCGGTATTGACTCCGAATACGGCGACTTTCGCTGACGGTTCTTTGCTGCTCGTTGACGGGAGCGGTCTCAACGGCGCTGCGGCGTTGACGTCCCAGGGCGGGACGCTGAATGTGGATGCGGGCGCCAAGCTGCTTATCGACAACATCACGCAGGGCGAATACGCGATTACGTCCGGATTCTCGGTCAGCAACGTGCAGGGCTGGAACGGAGACAACCTTTCCACGCCGGATAATCTCATTGGGCTTGTGCTGGGCAAGGATGCCGACGGTTCGATGAAGGTACAGGCCACAGCCCGGCGCTCGTCCGATGTTTTCCGGGGGCTTTCCCTCGTCAACACGATGGATGCCATCTGGGGCAAGGGGCTGAACGACACCGAAAGCGGCAACATGGGCATCCGGTTCCTCTCTCGGGCGGTCAATGAAAACCATCTGCCCAAGGCGGACACGGTGCATACTGTTGACGGTGCGGCGCAGATCGCCGTGGCCGGAGGCGTGCAGGGTATGGCCGTCGCGGCGGCGGATGCCCCGGTTCGGGCGATTCAGGATCACGCGTCGCTTTCACATATGACCACCACGCGTGAAGGGGCCATTCGTAAGGACGGATTGAACCTCTGGATCAATGCCCTGTATGGAGCGGAACACGCGCGCAATTTGGGCGCGGGCTCTCTTGATGGCGGCTATAATGCCGATTTTGGCGGCATCGTCTTTGGCGGCGACTACGCGTTCGGCGATTTCCGGGTCGGCATGGCCCTGAACGCCGGAAGCGGTACGGCCCGTTCCCGTGGGGATTTCAACGCGACCAAGAATGATTTCGATTTCTGGGGCATGAACTTGTACGGGAGCTGGTCGCGGGATCAGTTCAATATCGTGGGCGATCTCGGTTATTCCGCCAACAAGAACGAGGTGAAGCAGGATCTGCCCACAACCATGCAGCTCGGCCAGCTCAGGGCCGATGTGGATACGGGCGTGCTGACGGCGGGTCTGCGCGGCGAATACCGGTTCGAAACGGATTGGGCCGATGTGACGCCGCATGTCGGGGTACGATACTACAACCTGCGGACGGATGGGTTCACATCTCGGATCGACGATCACGACGTGTTCCGCGTGGGACGCGATACGCAGGAGATCTGGACATTCCCGATCGGCGTGAGCTTCAGCCGCGACTTTGAAACGTCGTCCGGCTGGAAGGTGAAGCCGAGGGCCGACCTTTCCGTAGCGCCCGCTGCGGGTGATCTCAAGGCAAAGACCAAGGCCCGGGTGCCGGGCGTCGCGGCTTCCGATACGATCAAGGCCCGGATGATGGACAGCGTATCCTTTGACGGCACGCTCGGGCTTGAGGTGCAGAAGGACAACATCTCGTTCGGCCTCGACTACGGCATCCGCGCTTCGGAGCATAAGGCGGGACATGGCGTGAACGTGAGCTTCACCTACAAGTTCTAA(SEQ ID NO:18)。

N23_GI_0012606

ATGAGCAATGTATCGGTGAAGAAGGCGATGACAGAACTTCAAACTAAGAGTGGTTATTCTTTCGTATATATAGCTGGTGATGTAGATACAGACCGTACGGTTTCAATTAATGCCAGTCAGCTGAAGGATGCGGTTGCTCAGATTTTGAAGGGGCAGAATGTATCGTATGAAATTCAAGGTAAAAATATTGTAATCAAAAAAGGAAGCCAGCAGCAGGTTACTTCTTCTGAAAAGAAGAAAAAGGTAACAGGAACGGTTAAGGATTCTAATGGGGAACCGATAATTGGAGCAACAGTTATTGAGAAAGGAACTGCTAATGGTACTGTAACTGATTTTGACGGAAATTATACACTGGAGCTTTCTGACAATGGAATACTAGCTATTAGTTATATTGGTTATAAAAGTCAAGAATTTGTTGCCTCTCAGATTAAGCAGGGAGCATTAGCCGTTACATTGAAGGAAGATACAGAAGTGATGGATGAAGTCGTTGTTGTGGGGTATGGTTCTCAAAAAAAATCTAATATTACATCTGCTGTAAAAAGTATTAAATCCGAGCAGATATTAGGGGTTTCAACACCGAATGTCGAAAATATGCTTCAAGGGAAAATTGCAGGTGTTCAGGTATATCAGTCAGGAGGAAAACCTGGTGAAAAGGCTACAATTCGTGTGCGAGGAAAAAGCTCTTTAGGTAGTAGTGTAGATCCTTTATGGGTAGTGGATGGAGTTATTCAGGTTGAAAATCCAGACATTAATCCACAAGATATAGAGTCTTTAACAGTATTAAAGGATGCAGCAGCAACTTCTTTGTACGGTTCGAGAGCTACCAGTGGTGTTATTGTGGTTACAACCAAAAGAGCTAAAGAAAATAGTAGGAATATAAATATTTCAGCTAATTGGGGCATTGGCAATATCAATGAAGGAAACTTTAAGATGATGAATTCAGAACAATTGGCTGCAGAGTGGGAAAAGATGGGACTTGAGGTCCCGGAACAAGCGAGAAAGGTTGATTTTGACTGGTGGGATGCCGCTACGCAGACAAGCTTCACTCAAGATTATAATATTTCATTTTCTGGTGGTAATGATAAAATTCAAGCATATATTTCTGGTGGATATTATTCTGAAGATGCAACGATAAAAGGATTAAAAATTCAGCGTTTTAAGGCATTGACAAATATTACCTATAAGGCTGCAAAATGGTTGACAATTAAGCCTAGAATACGAGCATCTTATGACGATGATGTAGATCATAATACTCCTGATTTACATGAGTTGTATGCGCAGATGCCATGGGATTACCCGTATTATGAGGATGGAACATTGATAAACCCACGTGAGTTAAGATCTGGTTATACTTGGTATGGCCGTGATTTAACTAATAGTTTTTATGATTCTCAATGGAATTATAGCAAGACTAAGACTCTGACAACAGAAGGTGGATTTGATTTTGAAATTAGATTTAATGATAATTTCACATTCTCTTCAACAAATAGTGTTCGTTTTAGCAATAAGAAGTATTTTAATTATGAAGATCCTCGTTCTGTTGCAGGTTCAGCTGTAAAAGGTGAGATGGAAGAAACTTGGACTAAGTCTTTATCGAGATTTTCTAATCAGATGCTGAGATACAATAAAACTTTTGGTAAATTAAATGTTATAGCATTAGCAGCCTACGAGTTTAATGATTATTCGTTGGAAACCACTGATGTTATAAAACAAGGTTTCTTCCCTGGCTCCTCTGTCCTTGATAATGCTGCAAATTTAAATGCTATAAATGGAGAAAAGATGGAGTGGGCTTTATCGTCTTTCTTGTGTAATGTAAATTTTGCCTATGATTCAAAATATTTTTTGCAAGCTTCTATTCGAAATGATGCCTCTTCTCGTTTTGGTAAGGATAAGAGGAATGGTACCTTCTTCTCTGTAAGCGGTGGATGGAATATTGCGCAGGAAGATTTTTATAAACGTTCGGTTCTTGCATCAATTTTAAATGAGGCAAAATTGAGAATTAGTTATGGTGGTGTAGGAAATTTACCAAAGGATTATTATCCTCATCTCAATTTATACGATATAAAAGGTACATATAATGGGGTTAATGGCGCTTTCCCTTCTCAATTAGGGAATTCTAGTTTATCATGGGAAAAATCTTATGAAACTAATATTGGTTTAGATTTGACATTTATAAATCGGGTTAATGTATCTTTAGATTATTATATTAAAAATACTTCTGGGCTTGTATATTTTGTGACTCTGCCAGCTACGACAGGTTTTACTGGTTATTGGGATAATATTGGTGCTGTTCGTAATAAAGGGTTTGAACTTAGTTTGGATGCACAGGTTTTAAAAGATACTCCATTTAAATGGAACTTAGGATTTAATTATAGTTTGAATCGTAATAAAATTGTAGAGTTGTATCAAGGTAAGGATGTTATATCTTCATGGCAGATTCGTAGAGAGGGTGAGGATATTAATACTTTTTATTTAAGAAAGTGGGCTGGAGTTGATCCTGATAATGGTGACCCTTTGTGGGAAAAAGTAAATGAAGATGGTACAGTAACAACGACAAATAATTATAATGAAGCGACCTTACAAGTTGTAGGAAAAGCAACTCCTGATTTTACGGGCTCTATTAATTCAACAATGCAATATAAGGATTTTACGCTTTCTATGAATTGGAATTTTGTTGTTGGAAATGATGTCTATCATTATCGGGAAAATTTTGATTCAAATGGAGCTTACCCTACTTATAATCAAATGGTACCTATGGATGATTGGGTTAGATGGGAAAAACCTGGAGATATTGCAACCCATCCTCGTTTAGTTGATGGTGGAAATTTGAATTCTCAAAGAAACTCTTCTAGGTATCTGGAAGATGGGTCTTATATTCGATTGAGAAATATACAATTATCATACAGGTTGCCAGATAAATTTTTATCTAAGATTGGTTTAAAATCTACTTCAATTTATGTTAGTGGAGATAATTTATTGACATTTACAAAATATCCAGGTCGCGATCCTGAAGTAGGCGAGAGTGGAGAGGATACATATAGTTATCCTAATATTAGAAAAATTGTATTTGGGTTGAATATTAATTTTTAA(SEQ ID NO:19)。

BA19_GI_0013990

ATGAAGTTTCACCTCCCGCCGCCCGGCAGACGGCTCCGCCGTATCCTGCCGCTGCTGGGGCAGGCGGCGCTCTGCTGCGTCCTCACCGCTGCCCGGCTGGGAGGACTGTACGCCCCCTTCAGTCTGGCGGCGGCCGCCGCCGCAGGGCCGGGCCTGCCGGGTCTGCTTTCCCTGTTGGGTGTTACCGGCGGAGCGCTGCTGTTTCTGGATTTTCAACCGGGGCTGCGCCATGCCGCCGCTGCCGTGCTGCTCTTTGCCGCCCAGACGGCCTTCTGTGATACGAAGCTCTATCGCCGCCCTGCCTTCCGCCCCCTGACGGCGGCCCTCTCCCAGCTGCTGATCCAGTCGGTGTACCTGCTGTACCGTCCCCTGAGCCAGTGGGTGCTGTGCCTGACAGCCTCGGCGCTGCTGGCGGCAGCCACGGCCCTGCTGACCGCCCACGGCACGACCCTCCGGCAAAAGGGACTGCTGTACGCCGCCGCCCTGTCGCTGGCACTGGTACCGGTGACGGTAGAGGGTCTGTTCTCCGTGGGGAAAGCCCTGCTGATGGCGGAGCTGCTGCTCCTCTCCCGCCGTCTGCCGCCCCTGACGGTGGGATTGGCGGGGGCCTGTGTGGGCCTTGCGGCGGATCTGGTGCCGGAGACACCGGCGCTGCTGCTGACGGTGGCCTACGGCTGCGGCGGAGCGCTGGCCGCCTTCTATGGCCGTCTGCCCCGCATCCTCCCGGCGGCAGCCTTTTCTCTGCCCACCATCGCCTTTGCAGTGCTGCTGGATGTCGGTCCTCCCCGACAGCTGCTGCTGTCATGTCTGGCGGGCGGTGCGGCCTATCTGCTGCTGCCCCGGCGCTGGCTGCCTCCCTGCGCAGAGCGTGCCGCCCGGGTGGATGCACCCGGAGAGACGGCAAAGCCCCGCCGGCTGGAGCAGTCCGCAGCGGCACTGCGCTCCCTGTACGACAGCTTCTTCCGGGATACGGCCCTGGCCCCGCCGGAAAATCCCTCGGTGATCTTCGACCGGGCGGCGGAACAAGTGTGCCGCTCCTGCGTCCTGTGCGCCAACTGCTGGCAGCAGAACTATAACGCCACCTACAACGCCTTCAATGATGCCTGTCCGGCGCTGCTGCGCCGTGGCACGGCCCAGTCGGAGGATTTTCCCCTGTACTTCACCGCCCGGTGTGTCCATCTGCGGGAGTTTATCGCCGCCGTCAACGAGGAGCTGCGGCTTTTCCTCCTGCGCCGCCAATATCATCGCCAGCTGACCTGCTCCCGCCGTCAGGCCCAGGAGCAGTACGCCCAGATGGGGGATCTGCTGGCGGCGGCGGCCCACGCCCCGGCGGAGGAGCCCACCGGCCCCGTGGGCTATCGAGTGTCCTCGGCCCTGCGTCCCAAGGAGGGACAGCAGCTGTGCGGCGACCAGCTGGCCACGGTGGAGACCGGCGGGATGCTGTACCTCCTGCTCTCCGACGGCATGGGCAGCGGCCCGGAGGCCCACCGGGAGGCGGCGCTGACGGTGCGGCTGCTGGAGCAGTTCCTGCGGGCGGGCATTGAAGCGGCTCCGGCCCTCAAGACCCTGAACTCGGCGCTGGCCCTGCGGGGGGAGACCGGCGGGGCCTTCACCACCATCGATCTTTTGGCTCTGCGCCGCTCCACCGGCGAGGCCACCCTCTATAAATACGGCGCTGCGCCCTCCTATCTCAAGCACACCGCCCACGTCACCCGCTTCACCGCCCATTCCCTTCCGGCGGGGCTGCAGGCCACGACGGAGCCGCCGGAGGTCACTCGGCTGGCCCTCCCGGCAGGCAGCTATTTTGTCATGATCTCCGACGGCATCGCCGACGAGAACAGCGACGAGTGGCTGCAAAATCTGCTGGCGGGGTGGAACGGCACCGACGTCCACGCCCTGACGGCACTGATCCTGTCGGAATCCCGCAGCCGCAGGGGACTGGAGGACGACTGCGCCGTGCTGGCGGTACACCTGCCCCTGCCGGGAGAAAACCACCCCCGGCAGGTATAA(SEQ ID NO:20)。

BA15_GI_0061059

ATGGCAAAGACAATAGGTATAGATTTAGGTACAACAAACTCATGTGTAGCAGTTATCGAAGGCGGCGAGCCTGTAGTTATTCCTAACGCCGAGGGCGCAAGAACAACTCCTTCCGTTGTTGCTTTCTCAAAAGACGGCGAGCGTATGGTAGGTCAGGTCGCAAAGCGCCAGGCTATCACAAACCCTGACAAGACAGTTTCTTCTATTAAGAGAGAAATGGGTACATCATATAAAGTATCAATTGATGGCAAGCAGTACACACCGCAGGAAATTTCAGCTATGATTCTTTCAAAGTTAAAGGCAGACGCTGAAGCATACCTCGGCGAAAAGGTAACACAGGCAGTTATTACAGTTCCTGCTTACTTTACAGACGCACAGCGTCAGGCTACTAAGGATGCAGGTAAGATTGCAGGTCTTGATGTAAAGAGAATTATCAACGAGCCTACAGCAGCTGCTCTTTCATACGGTATAGATAAAGAAAAAGACCAGAAGGTTATGGTATATGACCTCGGCGGCGGTACATTCGATGTATCTATCATTGAGATGGGCGACGGTGTTCAGGAAGTTCTTGCAACAGCAGGTAACAACCGCCTCGGTGGTGATGACTTCGATAAGAGAATTATCGACTGGATGGTAACATCATTCAAAAACGAAACAGGTATTGACCTTTCATCAGATAAGGTTGCTATGCAGCGTTTCAAAGAGGCTGCAGAGAAAGCTAAGATAGAGCTTTCGGGCGTTACAACATCTTCAATCAACCTCCCATTCATTACAGCAGACCAGACAGGTCCTAAGCACCTTGACTTAACACTTACAAGAGCTAAGTTTGACGAACTTACAGCAGACCTTGTAGAGGCTACAATGGGTCCGGTTCGTTCGGCTCTCTCTGATTCAGGTTTACAGATCAGTCAGATTGACAAGGTTCTTATGGTCGGCGGTTCTTCAAGAATTCCTGCTGTACAGGAAGCTGTTAAGAAACTTATCGGCAAAGAGCCGTTCAAGGGCATTAACCCTGATGAGTGCGTAGCTGTAGGTGCTGCTATTCAGGGCGGCGTTCTCGGCGGCGAGGTAGAGGGACTTCTTCTCCTCGATGTTACACCTCTTTCACTTGGTGTTGAAACAATGGGCGGCGTAATGACAAAGATTATTGAGAGAAACACAACAATTCCTACAAAGAAGAGCCAGATTTTCTCAACTGCCGCTGATAACCAGACACAGGTTGAAATCAATGTTTTACAGGGTGAGCGTGAATTTGCAAGAGATAACAAGCAGCTCGGTTTGTTTGCTCTCACAGGCATTGCTCCCGCTATGCGTGGTATCCCGCAAATTGAAGTAACATTTGATATTGATGCAAACGGTATTGTTAATGTATCTGCAAAAGACCTCGGTACAGGCAAGGAGCAGAAGATTCAGATTCAGAACTCAACCTCAATGAGCAAGGAAGATATCGACAAGGCTGTTAAGGAAGCAGAGCAGTACGCCGCAGAAGATAAGAAGCACCGTGAAGAGGTTGACGCTAAGAACGAAGCAGAGAACCTTGTATATCAGGCTGAAAAGCTCGTAAACGAGAGCGGCGACAAGATTTCAGAGGACGAAAAGAATACAATCAATACAAAGTGTGCTGCAGTTAAGGACGCTATCGCTAAGAACGACAAGTCTATGATTGACGCTGCTAAGGAGGATTTACAGAAAGCTGTTTACGAAGTTTCCGCAAAACTTTATCAGCAGGCAAATCCGCAGGGTGCACAGGGTGCGGCTCCGCAGGGTGACCCACAGCAGGGCACACAGGGCGGCTCAAACGGTGACCCTAATGTATATGATGCCGATTTTAAGGATGTTGACGGCAACTGA(SEQ ID NO:21)。

N66_GI_0034565

ATGGCAGAAGATAAGAGGAAGGAGCTTTCGGCGGAAGAACGCAGAAAAATTGGAAAGCAGCGAAAGCAGGCTGCCAAAGAGGCACAAAAGTACCGAAAAAACAGGGAAAAGGCAGTAAAATCCTCCGCTAAACAGGAAAATAAAGACAGTGCCAAAAAGCAGAATGAGCCTAAAAAACAAGGCGAAAACAAAAAGCCGAAAACCGCACCGTCAAAGAAAAATTACAATGCACAAAAGGCAAAAGCAATAAAAAATAATACAAAATCCGAAAAAAAGACAGAGAACAAATCTCACAGCAAAATTGAGCAAAAACTCAATGAACAGATGAAAAAGCAGAGAGATGATCTCAGTCAGGAAGAACGCTTTATAAGAAAAAGTGAAAAGAAAATCAAAAATCTAAAGCCAAGGGCTTATGATGACGGTTTTTATATAGATGAATTTGGTGAGCGCCAAAAGCAGCAAAGAGTTGCCCAAAGTATTCACGAGCAGGAAAATGAAAAAGTTAAGCGCCTTAAAAAGCCTATGACTTCAAATCAAATTAAAAAACGCCGAATTATGGCGTCGGCAATTACCTGCGGCGTGGTGCTTTTAATCGGCGTAATTTTGTCGCTTACAGTTCTTTTTAAAACCGAAAAAATTGAGGTAGAGGGAAACAACTTTTACAGCGAAGATCAAATACTTTCGTATGCAAATGTAGCTTTGCAGAGTAATATTTTTGTAGGTAAAATGACTGCAACACCCGATAAAATTGCAGAGAAACTGCCTTATGTCGAATCTGCAAAAGTTGATTTTGTAGTGCCCGATACAATAAAAATAACCATAACGGACGCTGTTCCGTCTTATGTTATTATAAATGACGGAAAATTCCTGCTTATCAGTTCAAAAGGCAGAATACTTGATGTTATGGCTGACAATTCGTCAAACTACCCCGTACTTTCAAGCAGTTCACTTAAAAATACAACAGTCGGCGAATATGTATCATACAGCGATGAAAATGTGCCTGTAATTCTTGAAGAAATTTCCGACTCGTTAAGCAAAAATGAATTTAAAGGAATAACGGGTATTGATGTTACAAATACAGCGAATATAGAGCTTGTTTATGACAACAGAATAGCTGTTATTATCGGTTTGCCGGAAGATATTGATTACAAAATCAGAACGGCAATGGCGATAATAACCGAAAAGCTTGACCCTAACAAAACAGGTGCAATTTACGGTACTCTTGATGTTTCATCTTGCAGTACGACAAAGACATCAAGATTTAATCCTAACGAAACAATAGCGGTTACTACTGCGCCTGTCGGTACTACAATTGCGTCACAGGCTGCTGACAATACTTCTCCTGCTGTAACAACACCGCCTGCTACACTTGCCACTAATAGCAACGGCAATTATGTAGGCAGTATTCCTGCAACCGGCACAGATATAGGAAACGGTATTGTTGCTTTTGATACTGACGGCGACGGTATTGCAGAATGTTTTGATACCGACGGTGACGGATACGCCGATGTATATGGCTCGCTTAATTCGTCAGGCTCGAACGGTTCAGACAACAGCTCCGACAGCTATTCTGACGGCAGTGACGGATACAACAGCGGCGAACCGTCAGAAGATTATTCGACGCAGTATGATGACCCGAATAATTCGTATTTATAA(SEQ ID NO:22)。

N48_GI_0075374

ATGAAAGTACAAGTAAGTAATACAAACGCACCGTGTTGGCGTGACATTACGGTAAAATCAAGAGTTCCTGCACAATTGGATATCTTGCAGGAGATGGCTCGTAACATTAGTTGGGTGTGGCATAGTGAGGCGATCGAAATGTTCCGGTCTATTGATCCGGTATTGTGGAAATCGACAAACGGGAATCCTGTATTGATGCTTCAGCAGATTAATTATGAACGCTTGGAAGAAATTGCGGCTGATAAAGCGATGATGCGTCGTATTAATGACTTATACGATGAATTTAGAAAATATATGGATGTAGAAAAGAGAACCGATCTTCCTTCTGTAGCTTATTTCAGTATGGAATATGGTTTGGCTAACATCCTGAAAATATATTCGGGAGGATTGGGTATCCTTGCCGGAGATTATTTAAAAGAGGCCAGTGATTGCAATGTCGATATGGTTGCAGTGGGTTTTTTATATCGGTATGGATATTTTACCCAGACACTTTCTATGGATGGACAACAGTTGGCTAATTATGAACCTCAAAATTTCAACCAGCTTCCGGTAGAGCAAGTTACTGGCGAAAACGGACATCCGATAGTTTTAGAAGTACCTTATCCGGGACGCATTATTTACGCCAATATCTGGAAAGTAAGCGTCGGGCGGGTTCCTTTGTACCTCATGGATACCGATCTCGATTTGAATAGCGAGTTTGACAGACCTATTACATATCAGTTGTATGGGGGAGATTGGGAACATCGTATGAAACAAGAATATATGCTTGGTATAGGTGGTATTCTTATGTTGAAGCGTTTAGGTATCAAGAAGGATATTTATCATTGTAATGAAGGACATGCTGCGCTTATTAATGTGCAGAGGTTGGTAGAGTATGTTCAGAATGAAAAACTTTCATTCGAAGAAGCTCTTGAGGTCGTTCGTGCTTCGTCGCTTTATACGGTGCATACACCTGTTCCGGCCGGTCATGATAGTTTTGATGAAGGATTATTCGGAAAATATATGGGTGAGTTCCCTGCAAAACTGGGAATTTCATGGCAAGACTTGATGGATTTGGGAAGAGAAAATCCAGGGACGAACGAAAAATTCTCGATGAGTGTATTTGCATGTAATACTTGTCAGGAAGTGAACGGTGTGAGCTGGTTGCACGGAAAAGTTTCCCAACACATGTTCCAGCCTATTTGGAAAGGATATGCAGCCGAAGAACTTCATGTGGGATATGTGACTAATGGTGTACATTTTCCTACTTGGGCAGCAACCGAGTGGAAAGAATTCTATGTCGAGAAATTGGGGCGGGATTTTTTAACACATCAAGATGACCGTAAGATGTGGGAAAAAATATACGATGTGCCTGATGAGGAGATTTGGAAGCTTCGCCAGACAATGAAAAATAAATTGGTGAATTTTGTGAAAGACGATTTCCGTGAAAACTGGTTGAAAAATCAGGGAGATCCGTCACGGATTGTTTCTGTTCTTGAGCGTATCAATCCGAATGCACTACTTATCGGGTTTGCTCGTCGTTTTGCAACTTACAAACGGGCACACTTGCTTTTCACCGATCTTGAAAGATTATCCAAGATCGTGAATAATCCT(SEQ ID NO:23)。

BA1_GI_0038716

ATGACGGATTACAAAAATTTGAAGCTGATCGCATCCTCCTCTCCCCATATCCGCTCCAAGGATAACACCCGGAGCATCATGCTGGATGTCATCATCGCCCTGCTGCCCGCTCTGGTCATGAGCATCTATGTGTTCGGCGTGCGGGCCCTCACCATGGTGCTGGTGTCCGTGGCCGCTTGCGTGTTCTGGGAGTGGGCCTATCGCAAGCTCCTGAAGAAGCCCCAGTCCATCGGTGATCTGTCCGCTGTGGTCACCGGTATCCTGCTGGCCTTTGTCTGCCCCCCCACCACACCGGTGTGGATGCTGATCATCGGCGGCTTCTTCTCCATCGTGGTGGTCAAGCAGCTCTACGGCGGCATCGGCTGCAACTTCGTCAATCCCGCTCTGGTGGGCCGTGCCATGCTGCTGGCCAGCTATGCCAGCGCCATGACCCATTGGGTGGGCTTCGGCTCCAAGCTGCCTCTGGTGGGCTCCACTGCCGACGTGGTGACCAGCTCCACCCCCATGGCTGTGATGAAGGGCATCTTCTCCGCCGAGACGGCTGAGGATGCACTGGCGGCGGTCAATGACCTGACCTCCACCTTCTCCATCAGCGATATGTTCATCGGCCGCATCGGCGGCTCTCTGGGTGAGACCTCTGCGCTGGCCCTGCTGACGGGCTTTGTGTATCTGCTGCTGCGTAGGGTCATCAACTGGCAGATCCCCGTGTGCTACATCGGCACCGTGGCGGTGCTGACCCTGATCTCCGCTCCCGCCGGTATGAGCGCTGTGGACTTCATGCTCTACAACGTCTTTGGCGGCGGCCTGATGCTGGGCGCCATCTTTATGGCCACCGACTATGCCACCTCCCCTGTGACCAAGCTGGGGCAGGCCATCTTCGGCGTGGGCTGCGGCCTTATCACCTGCTTCATCCGCCGGTTCGGCTCCTATCCCGAGGGTGTGTGCTACTCCATCCTCATTATGAACTGCACCACCTGGCTGCTGGATAAGTACATCCGGCCCACCATCTACGGTGCCATCAAGAAAGACAAGAAGGAGGCGGCTGCAAAATGA(SEQ ID NO:24)。

BA1_GI_0021066

ATGGCACTGACGGTGCTGCTGCCGGAGAATCCATACAGCCGGGAGCTGTTGGCGCTGCTGACACCGCTGCTGCCGCCGGACAGCCAGATCCGTGACCCGGATGCGGGGCTGGAGGGGCTGGCCGGACAGCGGCTGCTGTTTGCTCTGGCACTGGACGAGAGCGGATGCAGCGAGAGCGGGTATCGGATGCTGATGACCCTGCGGAGGAGCCGGACGCTGCTGGAGGGCTGCGTAGCGGGGCTGGTGGTGACGGGGCGGGGAGAGCTATACACCAAGGACGCCGCCCGTGATCTGGTGTTCGCCGCCAATCAGGCGGGCTGCGCCTTTCTGGGACGCCCGCTGGTGGAGGCCACCGGTTCCCTGCGGAACTTCCGGGTGCAGGCCCAGATCGGCGGCACCGATGAGGAGACGGCCTTCCGGGCCGCCGTATCGGAGCTGCTGGAGCGGCTGACGGCGTGGGAGGGGCCTGCCCCCGTGGGGCGGGTGCTGGCGCTGCACGCCTCCCAGCGCAGCACCTCCAACACGCTGGCGCTGTGGGAGATGGTGCGCCGATCCCTGCCGCCGGAGGTGCAGGTGCAGGAGATCTGCCTGCGGAACGGGACCATGGCCGACTGCAACGGATGCAGCTACACCGCCTGTATGCACTTCGGGGAGCAGGGCGGGTGCTTCTATGGCGGGCCGATGGTGGAGGAGGTGTATCCGGCGGTGCGCTCCTGCGACACGCTGGTGATGGTCTGCGCCAACTATAACGATGCCCTCTCCGCCAATCTCACCGCCTGCGTCAACCGTCTGACGGCCTTGTTCCGCCAGACCCGGTTCTATGACAAGCGGCTTTACGGACTGGTGGTGTCCGGCTACTCCGGCGGCGATCTGCTGGCCCGGCAACTGATCTCGGCGCTGAACATGAATAAGGCCTTCTATCTGCCGCCACGGTTCTGCCTGCTGGAGACAGCCAATGAGCGGGGGAGTCTGGTGCGCCTGCCGGGGATCCGGGAGAAGGCCCGGTGCTTTGCGCGGCAGATGATGGAATAA(SEQ ID NO:25)。

BA26_GI_0114880

GCTGCGGCAAAAGACCCAGGATATACCATAGAGGGCAACGGCAGCTACACCGTGACCTCCGCTGATGGTCTGATGAATGTAGCCGAATTAGTGAACGGAGGTAAGACCGACATTAACATTACCCTCGACAAAAACATTGACCTGACGGGCAAAGACTGGACGCCGATAGGCACAAGCTTCGACAACTCATACACCGGCACCTTCGACGGCGGCGGCCATACCATCACGGGGCTGACCATTACGACAAAAGACCAATTTGTGGGTCTGTTCGGCTATCTCAATAGAGCTGGTACGGTGAAGAACGTGGTGATGGAGGGCATACAGATAACAAGCAATCACATGTTTGGCAATACTGGCGGCGTGGCAGGATTTAGCTGGGGCACCATTGAAAACTGCTCGGTGTCGGGCAGCGTCAGCGGCACGAAGTGCGTCGGCGGTGTGGTGGGTGCTCAAAAGGCCGGTTCCATCACCGGATGCAGCTCCTCGGCCACAGTGAAGGGAACGGTCGATGTCGGCGGCGTGGCAGGAGAAAAATGGGGCTCCATGACCGCTTGCTATGCCACAGGCAACGTAACCTTAGAAATAGACTCCCCAAAGAATCTCTCTGGCGGCGGTCTGGTGGGATTCAACGGAGGAAGCAGCGTCCTTGCCTGCTATGCCACGGGCAACGTAACCAGTACGGGTAGTAGCACTGGCAATGTACATATCGGCGGCTTTTTGGGAGATAACTACACCACCGTGACCGCCTGCTATTGGAAGAACAATCATGAACAAGGTATCGGCTACAATAACAAAGTCACCGAAGCCACGAAGGTGGACGGCACTGACGTTACCTGGCAGAAAGCCGTTGATGCCATGAACACCGCCTTG(SEQ ID NO:26)。

BA16_GI_0127603

GTGCTGTGGGACGAGGCGGCCAACACGGGACAGGTGCCCCAGCTCGAAAAAATCTGCGCCGTGATCCGCTCCCGCGAGGTATCGCTGACGCTCTTTTATCAGCAGTTGGCGCAGTGCAAGGCCATTTACGATAAACACGCGGAAACAATTCTCGGAAATATGGACAGCGTGGTATTCCTGGGAGGCCGCGAGGCCAGCACCATCAAGGAAATATCCGAAAACTGGCTGGGGAAAGCTACCATCTCCATGCAGACTGACAGCCGCTCCCGTGGGCAGTCGGAAAGCTACAGTCAAAATAACCAGCGTCTGGGCCGTGAGCTGATGACACCCAGCGAGCTGGCTACCATGCCCGGGGACAAGTGCATTTTACAGCTTCGGGGCCTGCCCCCGTTCTACTCCCCGAAGTATGATCTGAAAAAGCACCCGAATTATAAATACACGGCTGAAGCCGACAAACAGAAAAACGCTTTTGACCTCGACAAGCTTATCAACCGCCGCAGGCGGCCCGGGCTTAACGAGGCGTGTGAGATGTATGAGGTGGCTGTGCCGGACGATGCGCTCACGGAAGAGGACGAGGACATTCTCAACTATGACGACATCGACGATCCAGACGCCTTTGCATAA(SEQ ID NO:27)。

example 3 detection of individual State

The detection of the individual status of the sample source was performed using 50 stool samples.

The abundance of BA15 GI 0058342, BA17 GI 0003414, BA19 GI 0000352, BA19 GI 0000679, BA19 GI 0002844, BA19 GI 0004843, BA19 GI 0007615, BA19 GI 0011260, BA19 GI 0017177, BA1 GI 0023027, BA26 GI 0018693, BA28 GI 0005743, BA2 GI 0044108 of table 3 in each stool sample was determined, and it was determined whether the abundance of the 13 genes in each sample falls within a 95% confidence interval of the abundance of the respective disease control group or healthy control group, the status of the individual corresponding to the sample for which the abundance of the 13 genes falls within the corresponding interval of the disease group was determined to be a white-plug patient, the status of the individual corresponding to the sample for which the abundance of the 13 genes falls within the corresponding interval of the healthy group was determined to be a non-white-plug patient.

The result shows that the method can be used for judging the individual states of 47 samples, and judging the states of 40 samples corresponding to the individual in the 46 samples, wherein the states are consistent with the recorded states of the individual from which the samples are derived.

In addition, the inventors found that the combined detection of the genes in Table 2 and Table 3, for example, the detection of the enrichment of the gene markers in Table 3, while the gene markers in Table 2 are not enriched, can more accurately judge whether a Behcet patient or a susceptible population is found.

In the case of using the markers for the treatment of Behcet's disease, the inventors found that the gene markers in Table 2 were enriched while the growth of the gene markers in Table 3 was inhibited or cleared, and the therapeutic effect was excellent.

In the description of the present specification, a description referring to terms "one embodiment," "some embodiments," "examples," "specific examples," or "some examples," etc., means that a particular feature, structure, material, or characteristic described in connection with the embodiment or example is included in at least one embodiment or example of the present invention. In this specification, schematic representations of the above terms do not necessarily refer to the same embodiments or examples. Furthermore, the particular features, structures, materials, or characteristics described may be combined in any suitable manner in any one or more embodiments or examples.

While embodiments of the present invention have been shown and described, it will be understood by those of ordinary skill in the art that: many changes, modifications, substitutions and variations may be made to the embodiments without departing from the spirit and principles of the invention, the scope of which is defined by the claims and their equivalents.

Claims

1. Use of all genes in a first and a second gene set for the preparation of a kit for diagnosing behcet's disease, said first gene set consisting of the following genes: BA15_gi_0058342, BA17_gi_0003414, BA19_gi_0000352, BA19_gi_0000679, BA19_gi_0002844, BA19_gi_0004843, BA19_gi_0007615, BA19_gi_0011260, BA19_gi_0017177, BA1_gi_0023027, BA26_gi_0018693, BA28_gi_0005743, BA2_gi_0044108, BA19_gi_0007628, BA4_gi_0011532, BA19_gi_0013990, BA1_gi_0038716, BA1_gi_0021066, wherein the genes in the first gene set are identical to SEQ ID NO:1-13, 17, 18, 20, 24, 25;

the second gene set consists of the following genes: n20_gi_0009810, n48_gi_0125557, wherein the genes in the second gene set are identical to the genes in SEQ ID NO: 14. 15, one-to-one correspondence of the nucleic acid sequences shown in seq id no;

the application comprises the steps of obtaining nucleic acid sequencing data of a stool sample of an individual to be tested, comparing the sequencing data with a reference genome, and based on the comparison result, obtaining the nucleic acid sequencing data according to ∈>Determining abundance of all genes in a first gene set and all genes in a second gene set in a sample to be tested according to a formula, wherein the reference genome is all genes in the first gene set and all genes in the second gene set, G in the formula represents the number of genes, ab (G) represents the abundance of gene G, ab (U _G ) Abundance of reads representing unique comparison of the sequencing data to the reference sequence of gene G, ab (M _G ) Representing the abundance of non-uniquely aligned reads of the sequencing data and the reference sequence of the gene G; the Ab (U) _G ) The calculation formula of (2) is +.>U in the formula _G Representing the number of reads in the sequencing data that are uniquely compared to the reference gene of the gene G, lG representing the baseReference gene length due to G; the Ab (M) _G ) The calculation formula of (2) isM in the formula _G For the number of reads in the sequencing data that are non-uniquely aligned with the reference gene of gene G, i represents the number of the non-uniquely aligned reads, co _i An abundance ratio corresponding to the ith reading segment; the calculation formula of the abundance ratio is that Co in the formula _i,G And (3) representing the abundance ratio of the non-uniquely aligned reads i for the marker gene G, wherein N is the total number of the genes which can be aligned by the non-uniquely aligned reads i, and j represents the number of the genes which can be aligned by the non-uniquely aligned reads i.