ES2925777T3 - Procedimiento para la ciclación biocatalítica de terpenos y mutantes de ciclasa que pueden usarse en el mismo - Google Patents

Procedimiento para la ciclación biocatalítica de terpenos y mutantes de ciclasa que pueden usarse en el mismo Download PDF

Info

Publication number
ES2925777T3
ES2925777T3 ES18203725T ES18203725T ES2925777T3 ES 2925777 T3 ES2925777 T3 ES 2925777T3 ES 18203725 T ES18203725 T ES 18203725T ES 18203725 T ES18203725 T ES 18203725T ES 2925777 T3 ES2925777 T3 ES 2925777T3
Authority
ES
Spain
Prior art keywords
seq
isopulegol
citronellal
enzyme
nucleic acid
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES18203725T
Other languages
English (en)
Inventor
Michael Breuer
Bernhard Hauer
Dieter Jendrossek
Gabriele Siedenburg
Jürgen Pleiss
Demet Sirim
Silvia Racolta
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
BASF SE
Original Assignee
BASF SE
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by BASF SE filed Critical BASF SE
Application granted granted Critical
Publication of ES2925777T3 publication Critical patent/ES2925777T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/90Isomerases (5.)
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07CACYCLIC OR CARBOCYCLIC COMPOUNDS
    • C07C29/00Preparation of compounds having hydroxy or O-metal groups bound to a carbon atom not belonging to a six-membered aromatic ring
    • C07C29/17Preparation of compounds having hydroxy or O-metal groups bound to a carbon atom not belonging to a six-membered aromatic ring by hydrogenation of carbon-to-carbon double or triple bonds
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07CACYCLIC OR CARBOCYCLIC COMPOUNDS
    • C07C29/00Preparation of compounds having hydroxy or O-metal groups bound to a carbon atom not belonging to a six-membered aromatic ring
    • C07C29/56Preparation of compounds having hydroxy or O-metal groups bound to a carbon atom not belonging to a six-membered aromatic ring by isomerisation
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P7/00Preparation of oxygen-containing organic compounds
    • C12P7/02Preparation of oxygen-containing organic compounds containing a hydroxy group
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07CACYCLIC OR CARBOCYCLIC COMPOUNDS
    • C07C2601/00Systems containing only non-condensed rings
    • C07C2601/12Systems containing only non-condensed rings with a six-membered ring
    • C07C2601/14The ring being saturated

Landscapes

  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Wood Science & Technology (AREA)
  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Zoology (AREA)
  • Genetics & Genomics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • Microbiology (AREA)
  • Biotechnology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Medicinal Chemistry (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Enzymes And Modification Thereof (AREA)

Abstract

La presente invención se relaciona con nuevos mutantes con actividad ciclasa y su uso en un proceso para la ciclación biocatalítica de terpenos, como en particular para la producción de isopulegol por ciclación de citronelal; un proceso para la producción de mentol y un proceso para la conversión biocatalítica de otros compuestos con motivos estructurales similares a los terpenos. (Traducción automática con Google Translate, sin valor legal)

Description

DESCRIPCIÓN
Procedimiento para la ciclación biocatalítica de terpenos y mutantes de ciclasa que pueden usarse en el mismo
La presente invención se refiere a mutantes novedosos con actividad ciclasa, secuencias de ácido nucleico que codifican los mismos, casetes de expresión, vectores recombinantes y microorganismos recombinantes que contienen los mismos; a la aplicación de estos mutantes en un procedimiento para la ciclación biocatalítica de terpenos, tal como en particular para la preparación de isopulegol mediante ciclación de citronelal; así como a un procedimiento para la preparación de mentol.
Antecedentes de la invención
Isopulegol de fórmula (II) (2-isopropenil-5-metil-ciclohexanol), es un terpeno, que se usa como producto químico aromático, para generar "notas de flores". Además es un producto intermedio en la síntesis de mentol a partir de citral.
Figure imgf000002_0001
Los isómeros de isopulegol se encuentran en la naturaleza en un gran número de aceites esenciales. Dado que isopulegol se produce de manera relativamente fácil a partir de citronelal, del compuesto de fórmula (I) (3,7-dimetiloct-6-en-1-al), aparece con frecuencia en compañía de citronelal o bien se forma durante la obtención del aceite esencial. Isopulegol, que se prepara técnicamente a partir de (+)-citronelal, es por regla general una mezcla de distintos isómeros con una gran proporción de (-)-isopulegol.
La preparación industrial de isopulegol se realiza predominantemente mediante la ciclación química de (+)-citronelal. Originariamente se usó el 80-85 % de material de partida puro, obtenido de esencia de citronela. Desde los años noventa se sustituye éste de manera creciente por el (+)-citronelal ópticamente más puro (97,5 %) por el denominado procedimiento de Takasago. En este caso se isomeriza geranildietildiamina de manera asimétrica usando un catalizador de complejo de Rh-BINAP (complejo de Rh con 2,2'-bis(difenilfosfino)-1,1'-binaftilo) para dar (+)-citronelal.
Partiendo del citronelal se ha descrito varias veces la síntesis química de isopulegol. (+)-Citronelal puede ciclarse usando un catalizador de cobre-cromo, bromuro de cinc, cloruro de alquilaluminio, un complejo de rodio, un catalizador de ácido-base sólido, zeolita o gel de sílice. A este respecto se reemplaza el procedimiento de gel de sílice en los últimos tiempos cada vez más por el procedimiento con bromuro de cinc, dado que éste presenta una selectividad más alta.
En general se conoce la ciclación de terpenos con ayuda de ciclasas especiales. Así se cicla por ejemplo en la naturaleza escualeno con ayuda de una escualeno-hopeno-ciclasa (SHC) para dar el hopeno pentacíclico.
Las secuencias de genes y proteínas de la escualeno-hopeno-ciclasa procedente de la bacteria Zymomonas mobilis (Zm-SHC) se conocen (N.° de acceso Genpept AAV90l72 2004 y Nat Biotechnol 2005, 23:63-68, véase la SEQ ID NO:1 y 2). También Merko y col. (Tetrahedron ett. 1999, 40: 2121-2124), Füll y Poralla (FEMS Micobiol 2000, 183: 221-224) así como Reipen y col. (Microbiol. 1995, 141: 155-161) se refieren al campo técnico de las escualeno-hopeno ciclasas.
En la solicitud internacional PCT/EP2010/057696 (WO2010139719 A2) se proponen polipéptidos como biocatalizadores para la ciclación de homofarnesol para dar ambroxano.
La biosíntesis de numerosos monoterpenos en los correspondientes microorganismos de producción ya se aclaró. Con frecuencia se ciclan a este respecto moléculas de precursor lineales mediante biocatalizadores altamente específicos. En el caso de los precursores se trata por regla general de ésteres de alcoholes terpénicos lineales y ácido difosfórico. Un ejemplo típico de un precursor de este tipo es pirofosfato de geranilo. El grupo pirofosfato se elimina enzimáticamente de la molécula y a continuación se hidroliza en dos iones fosfato. Por otro lado se produce a este respecto un carbocatión, que ahora puede reaccionar posteriormente de manera intramolecular y, por ejemplo con disociación de un protón, se recombina para dar un monoterpeno cíclico (Curr. Opin. Chem. Biol. 2009,13: 18ü-188).
El objetivo de la presente invención era encontrar una alternativa a los procedimientos de ciclación química conocidos para terpenos, con la que fuera posible ciclar compuestos de terpeno por medio de catálisis enzimática, tal como por ejemplo el citronelal lineal para dar isopulegol.
Era además objetivo de la presente invención, proporcionar biocatalizadores novedosos que se pueden usar para la ciclación de terpenos, tales como, por ejemplo, de citronelal con la formación de isopulegol.
Sumario de la invención
El primer objetivo anterior se consigue mediante un procedimiento para la preparación de isopulegol de la fórmula general (I),
Figure imgf000003_0001
que comprende una etapa de reacción,
en donde citronelal de la fórmula general (II)
Figure imgf000003_0002
de manera biocatalítica para dar el isopulegol correspondiente de la fórmula (I) por medio de un mutante de enzima divulgado en el presente documento con la actividad de una citronelal-isopulegol-ciclasa.
El segundo objetivo anterior se pudo conseguir sorprendentemente mediante la provisión de mutantes de Zm-SHC-1 (SEQ ID NO:2). En particular se estableció en concreto que mediante la introducción dirigida de mutaciones en al menos una posición de secuencia altamente conservada (véase la alineación de las SEQ ID NO. 2 a 326, más adelante) se puede influir en la actividad enzimática de la manera deseada.
Descripción de las Figuras
La figura 1a muestra la secuencia de aminoácidos de tipo natural (SEQ ID NO:2) de la escualeno-hopeno-ciclasa 1 de Zymomonas mobilis (Zm-SHC-1). La posición 486 de la mutagénesis de saturación está marcada.
La figura 1b muestra la secuencia de ácido nucleico de tipo natural (SEQ ID NO:1) de Zm-SHC-1. Las posiciones 1456-1458 de la mutagénesis de saturación están marcadas.
La figura 2 muestra el rendimiento de la proteína SHC_1 WT en comparación con el mutante F486A en el desarrollo temporal con R(+)- y S(-)-citronelal 10 mM como sustrato. Está representada en cada caso la distribución porcentual de sustrato e isómeros de producto de isopulegol tras la incubación durante distintos tiempos a 30 °C. Citronelal (rombos), isopulegol I (cuadrados), isopulegol II (triángulos) e isopulegol III (cruces).
La figura 3 muestra el rendimiento de los distintos mutantes de Zm-SHC-1 en comparación con el tipo natural (wt) y el control sin enzima (K) con racemato de citronelal 10 mM como sustrato. Está representada en cada caso la distribución porcentual de sustrato e isómeros de producto de isopulegol tras la incubación durante la noche a 30 °C.
La figura 4 muestra el rendimiento de los distintos mutantes de Zm-SHC-1 en comparación con el tipo natural (wt) y el control sin enzima (K) con escualeno 25 mM como sustrato en presencia del 1 % de Triton. Está representado en cada caso la distribución porcentual de escualeno y hopeno tras la incubación durante 70 h a 30 °C.
Las figuras 5 a 7 muestran la reacción de en cada caso sustrato 20 mM tras incubación durante la noche con los mutantes Ap-SHC: F481C, Bj-SHC: F447C, Sc-SHC: F449C, Zm SHC-2: F438C y Zm SHC-1 en comparación con el control; Los sustratos eran en la figura 5 racemato de citronelal, en la figura 6 R(+)-citronelal y en la figura 7 S(-)-citronelal.
Descripción detallada de la invención
A. Definiciones generales
Las "ciclasas" en el sentido de la presente invención son en general enzimas o bien mutantes de enzima, que muestran en particular la actividad de una citronelal-isopulegol-ciclasa. Como enzimas con la actividad de una citronelalisopulegol-ciclasa son adecuadas las transferasas intramoleculares de la subclase de las isomerasas; o sea proteínas con el número EC 5.4. (código enzimático de acuerdo con Eur. J. Biochem. 1999, 264, 610-650). En particular se trata de representantes de EC 5.4.99.17. Como enzimas con la actividad de una citronelal-isopulegol-ciclasa son adecuadas en particular aquellas ciclasas que provocan también la ciclación de homofarnesol para dar ambroxano o de escualeno para dar hopeno (por tanto también a veces la denominación "SHC" Squalen Hopen Cyclase) y que se describen en detalle en la solicitud internacional PCT/EP2010/057696. En particular, las ciclasas de acuerdo con la invención son aquéllas que se han derivado mediante mutación de SHC.
Debido a la reversibilidad de las reacciones enzimáticas se refiere la presente invención a las reacciones enzimáticas descritas en el presente documento en las dos direcciones de reacción.
Los "mutantes funcionales" de una "ciclasa" comprenden los "equivalentes funcionales" de tales enzimas definidos a continuación.
El término "procedimiento biocatalítico" se refiere a aquel procedimiento realizado en presencia de actividad catalítica de una "ciclasa" de acuerdo con la invención o bien de una enzima con "actividad ciclasa", es decir, procedimientos en presencia de enzima bruta, o purificada, disuelta, dispersada o inmovilizada, o en presencia de células microbianas totales, que presentan o expresan actividad enzimática de este tipo. Por consiguiente, los procedimientos biocatalíticos comprenden procedimientos enzimáticos como también microbianos.
El término "estereoespecífico" significa que se produce uno de varios posibles estereoisómeros de un compuesto preparado de acuerdo con la invención con al menos un centro de asimetría mediante la acción de una enzima de acuerdo con la invención en alto "exceso enantiomérico" o alta "pureza enantiomérica", tal como por ejemplo al menos el 90 % de ee, en particular al menos el 95 % de ee, o al menos el 98 % de ee, o al menos el 99 % de ee. El valor de % de ee se calcula según la siguiente fórmula:
% de ee= [Xa-Xb]/[ Xa+Xb]*100,
en la que Xa y Xb representan la fracción molar de los enantiómeros A o bien B.
Los "restos del primer dominio" y los "restos del segundo dominio" son restos de aminoácido, a los que, basándose en análisis estructurales de proteína, se les asigna una especial proximidad al centro reactivo de la ciclasa. El criterio para el primer dominio es la distancia al ligando 2-azaescualeno, que está indicado en una estructura de rayos X publicada (pdb:1ump). Estos restos se han determinado automáticamente con un programa informático (http://ligin.weizmann.ac.il/cgibin/Ipccsu/LpcCsu.cgi; Sobolev V, Sorokine A, Prilusky J, Abola EE, Edelman M. Automated analysis of interatomic contacts in proteins. Bioinformatics 1999;15(4):327-332.). Este programa parte de que dos moléculas se encuentran en contacto entre sí cuando la separación de sus átomos se corresponde con la suma de sus radios de van der Waals ± 1 A. Al segundo dominio pertenecen todos los aminoácidos que se encuentran en un radio de 5 A con respecto a cada resto del primer dominio. Los restos de este tipo parecen especialmente adecuados para la ejecución de la mutación dirigida, para modificar de manera dirigida además la actividad enzimática.
Por una "actividad ciclasa", que se determinó con un "sustrato de referencia en condiciones estándar", se encuentra por ejemplo una actividad enzimática que describe la formación de un producto cíclico a partir de un sustrato no cíclico. Las condiciones estándar son por ejemplo concentraciones de sustrato de 10 mM a 0,2 M, en particular de 15 a 100 mM, tal como por ejemplo de aproximadamente 20 a 25 mM; con pH de 4 a 8, y a temperaturas de por ejemplo 15 a 30 o de 20 a 25 °C. La determinación puede realizarse a este respecto con células recombinantes que expresan ciclasa, células accesibles que expresan ciclasa, fracciones de las mismas o enzima ciclasa enriquecida o purificada. En particular, el sustrato de referencia es un citronelal de fórmula (II); en particular R(+)-citronelal, o un racemato de citronelal, en una concentración de 15 a 100 mM o aproximadamente de 20 a 25 mM, a de 20 a 25 °C y pH 4 - 6, tal como aproximadamente 4,5; tal como se describe en más detalle también en los ejemplos.
Una posición "análoga a F486" se corresponde con la posición F486 de acuerdo con SEQ ID NO:2 en vista funcional y puede determinarse mediante alineación de secuencias de SHC de otros organismos distintos de Zymomonas mobilis tal como se explica en el presente documento. Por ejemplo, la posición análoga de F486 de SEQ ID NO:3 es la posición F449 y de Se Q ID NO:4 es la posición F481 y de SEQ ID NO:5 es la posición F447 y de SEQ ID NO:6 es la posición F438. Las correspondientes analogías se aplican para las otras posiciones de secuencia descritas de manera concreta en el presente documento para la SEQ ID NO: 2, tal como los denominados "restos del primer dominio" y "restos del segundo dominio" o del motivo DXDD y sus posiciones análogas en SEQ ID NO:3 a 326).
Los "terpenos" son hidrocarburos que están constituidos por unidades de isopreno (unidades C5), en particular terpenos no cíclicos, tal como por ejemplo escualeno, pudiéndose dividir el número de carbono entre 5.
Los "terpenoides" son sustancias que se derivan de terpenos, en particular terpenos no cíclicos, por ejemplo mediante inserción adicional de átomos de C y/o heteroátomos, tal como por ejemplo citronelal.
Los compuestos "similares a terpeno" en el sentido de la presente invención comprenden en particular aquellos compuestos que se encuentran bajo la fórmula estructural general (IV), tal como se define a continuación.
Generalmente están comprendidos de manera conjunta de acuerdo con la invención todas las formas isoméricas de los compuestos descritos en el presente documento, tal como isómeros de constitución y en particular estereoisómeros y mezclas de los mismos, tal como por ejemplo isómeros ópticos o isómeros geométricos, tal como isómeros E y Z, así como combinaciones de los mismos. Si están presentes varios centros de asimetría en una molécula, entonces la invención comprende todas las combinaciones de distintas conformaciones de estos centros de asimetría, tal como por ejemplo pares de enantiómeros.
"Mentol" comprende todas las formas estereoisoméricas tal como (+)-mentol, (+)-isomentol, (+)-neomentol, (+)-neoisomentol, (-)-mentol, (-)-isomentol, (-)-neomentol, (-)-neoisomentol y mezclas discrecionales de los mismos. El citronelal de fórmula (II) puede obtenerse comercialmente tanto como R(+)-citronelal de fórmula (R-II) como también como S(-)-citronelal de fórmula (S-II) como también como racemato de fórmula (II).
Figure imgf000005_0001
El isopulegol de fórmula (I)
Figure imgf000005_0002
tiene en las posiciones 1,3 y 6 en cada caso un centro ópticamente activo, de modo que son concebibles en principio 4 diastereómeros distintos con en cada caso 2 enantiómeros, o sea en total 8 estereoisómeros, cuando se parte del racemato del citronelal de fórmula (I).
Figure imgf000005_0003
El isopulegol se designa también como isopulegol I, neo-isopulegol se designa también como isopulegol II; isoisopulegol se designa también como isopulegol III; epi-isopulegol o neoiso-isopulegol se designa también como isopulegol IV;
Siempre que no se realicen indicaciones diferentes, se aplican en el presente documento las siguientes definiciones químicas generales:
Alquilo así como todas las partes de alquilo en restos derivados de esto, tal como por ejemplo hidroxialquilo: restos de hidrocarburo saturados, de cadena lineal o ramificados con 1 a 4, de 1 a 6, de 1 a 8 o de 1 a 10 átomos de carbono, por ejemplo
- alquilo C 1 -C 6 : tal como metilo, etilo, propilo, 1-metiletilo, butilo, 1-metil-propilo, 2-metilpropilo, y 1,1-dimetiletilo como representante a modo de ejemplo para alquilo C1-C4 ; así como pentilo, 1-metilbutilo, 2-metilbutilo, 3-metilbutilo, 2,2-dimetilpropilo, 1 -etilpropilo, hexilo, 1,1 -dimetilpropilo, 1,2-dimetilpropilo, 1 -metilpentilo, 2-metilpentilo, 3-metilpentilo, 4-metilpentilo, 1,1 -dimetilbutilo, 1,2-dimetilbutilo, 1,3-dimetilbutilo, 2,2-dimetilbutilo, 2,3-dimetilbutilo, 3,3-dimetilbutilo, 1 -etilbutilo, 2-etilbutilo, 1,1,2-trimetilpropilo, 1,2,2-trimetilpropilo, 1 -etil-1 -metilpropilo y 1 -etil-2-metilpropilo.
- Hidroxi-alquilo C 1 -C 6 , que comprende hidroxi-alquilo C 1 -C 4 , tal como por ejemplo hidroximetilo, 1-o 2-hidroxietilo, 1-, 2-o 3-hidroxipropilo, 1 -hidroximetiletilo, 1-, 2-, 3- o 4-hidroxibutilo, 1-hidroximetilpropilo y 2-hidroximetilpropilo.
Alquenilo representa restos de hidrocarburo mono- o poliinsaturados, en particular monoinsaturados, de cadena lineal o ramificados con de 2 a 4, de 2 a 6, de 2 a 8, de 2 a 10 o de 2 a 20 átomos de carbono y un doble enlace en una posición discrecional, por ejemplo alquenilo C2-C6 tal como etenilo, 1-propenilo, 2-propenilo, 1-metiletenilo, 1 -butenilo, 2-butenilo, 3-butenilo, 1-metil-1-propenilo, 2-metil-1-propenilo, 1-metil-2-propenilo, 2-metil-2-propenilo, 1- pentenilo, 2-pentenilo, 3-pentenilo, 4-pentenilo, 1 -metil-1-butenilo, 2-metil-1-butenilo, 3-metil-1-butenilo, 1-metil-2- butenilo, 2-metil-2-butenilo, 3-metil-2-butenilo, 1-metil-3-butenilo, 2-metil-3-butenilo, 3-metil-3-butenilo, 1,1-dimetil-2-propenilo, 1,2-dimetil-1-propenilo, 1,2-dimetil-2-propenilo, 1 -etil-1 -propenilo, 1 -etil-2-propenilo, 1-hexenilo, 2-hexenilo, 3-hexenilo, 4-hexenilo, 5-hexenilo, 1-metil-1-pentenilo, 2-metil-1-pentenilo, 3-metil-1-pentenilo, 4-metil-1-pentenilo, 1-metil-2-pentenilo, 2-metil-2-pentenilo, 3-metil-2-pentenilo, 4-metil-2-pentenilo, 1-metil-3-pentenilo, 2-metil-3-pentenilo, 3-metil-3-pentenilo, 4-metil-3-pentenilo, 1-metil-4-pentenilo, 2-metil-4-pentenilo, 3-metil-4-pentenilo, 4-metil-4-pentenilo, 1,1-dimetil-2-butenilo, 1,1 -dimetil-3-butenilo, 1,2-dimetil-1-butenilo, 1,2-dimetil-2-butenilo, 1,2-dimetil-3-butenilo, 1,3-dimetil-1-butenilo, 1,3-dimetil-2-butenilo, 1,3-dimetil-3-butenilo, 2,2-dimetil-3-butenilo, 2,3-dimetil-1 -butenilo, 2,3-dimetil-2-butenilo, 2,3-dimetil-3-butenilo, 3,3-dimetil-1-butenilo, 3,3-dimetil-2-butenilo, 1 -etil-1 -butenilo, 1 -etil-2-butenilo, 1 -etil-3-butenilo, 2-etil-1-butenilo, 2-etil-2-butenilo, 2-etil-3-butenilo, 1,1,2-trimetil-2-propenilo, 1 -etil-1 -metil-2-propenilo, 1-etil-2-metil-1-propenilo y 1 -etil-2-metil-2-propenilo.
"Oxo" representa por ejemplo un resto, que junto con el átomo de carbono al que está unido forma un grupo ceto (C=O).
"Metileno" (=CH2) representa por ejemplo un resto, que junto con el átomo de carbono al que está unido forma un resto vinilo (-CH=CH2).
B. Configuraciones especiales de la invención
La presente invención se define en detalle en las reivindicaciones adjuntas.
La presente invención se refiere en particular a las siguientes formas de realización especiales:
Un primer objeto de la invención se refiere a un mutante de enzima con actividad ciclasa, seleccionado entre mutantes de una enzima de tipo natural que comprende una secuencia de aminoácidos de acuerdo con SEQ ID NO:2 o una secuencia de aminoácidos derivada de la misma con un grado de identidad de al menos el 75 % con la SEQ ID NO:2; en donde el mutante cataliza al menos la ciclación de un isómero de citronelal para dar al menos un isómero de isopulegol, y comprende una mutación en una posición de acuerdo con F486 de SEQ ID NO:2.
A este respecto, mediante la mutación se permite al menos la ciclación al menos de un isómero de citronelal para dar al menos un isómero de isopulegol (es decir que la correspondiente proteína de partida o de tipo natural no catalizó esta reacción) o se modifica, (es decir que la correspondiente proteína de partida o de tipo natural catalizó esta reacción, sin embargo por ejemplo con rendimiento de producto, tasa de conversión y/o estereoespecificidad más bajos). También la forma corta existente de la ciclasa presenta a este respecto esta mutación típica de la ciclasa en una posición que se corresponde con F486 de SEQ ID NO: 2. por ejemplo, una versión acortada en el extremo N-terminal de la ciclasa de acuerdo con SEQ ID NO: 2 representa un ejemplo de una versión corta de este tipo. Ésta está caracterizada por el siguiente extremo N-terminal: (M)KIFGAEKTSy KpASDTIIGTDTLKRPN correspondiéndose la K en el extremo N-terminal con la posición 16 de SEQ ID NO:2.
En el caso de los mutantes de este tipo, puede haberse modificado hasta el 25 % o hasta el 20, 15, 10, 9, 8, 7, 6, 54, 3, 2 o 1 % de los restos de aminoácido, tal como por ejemplo de 1 a 30, de 2 a 25, de 3 a 20 o de 4 a 15 o de 5 a 10 de los restos de aminoácido, en cada caso en comparación con la secuencia de tipo natural o mutada de acuerdo con SEQ ID NO: 2, mediante deleción, inserción, sustitución, adición, inversión o una combinación de los mismos.
Además se describen en el presente documento mutantes de enzima en los que la mutación de acuerdo con la posición F486 de SEQ ID NO:2 se encuentra en una posición correspondiente a estas posiciones en una de las secuencias de acuerdo con SEQ ID NO: 3 a 326, y es una sustitución que corresponde a F486N, F486Q, F486L, F486M, F486E, F486G, F486S, F486V, F486T, F486C, F486I y F486A o, dado el caso, que corresponde a F486H, F486Y, F486W y F486D. En cambio, estos no son objeto de la presente invención.
En otra configuración especial, la invención se refiere a un mutante de enzima en el que adicionalmente (o como alternativa, pero en particular adicionalmente) al menos una, tal como, por ejemplo, 1, 2, 3, 4, 5, 6, 7 u 8, mutaciones se encuentra en una de las posiciones W374, D437, D440, F428, W555, Y5 6 1 , Y702, Y705 (los denominados “restos del primer dominio”) de la SEQ ID NO: 2.
En otra configuración especial la invención se refiere a un mutante de enzima en el que no está presente ninguna mutación en la posición D437 y/o D439 y/o D440 de la SEQ ID NO: 2 (motivo DXDD).
En otra configuración especial la invención se refiere a un mutante de enzima en el que no está presente ninguna mutación en la posición Y702 de la SEQ ID NO: 2 o en caso de que esté presente una mutación, esta es una sustitución Y702F o dado el caso Y702E o Y702D o sustitución correspondiente.
En otra configuración especial la invención se refiere a un mutante de enzima, que dado el caso además está mutado en al menos una, tal como, por ejemplo, de 1 a 15, de 1 a 10 o de 1 a 5, tal como 1, 2, 3 o 4, de las posiciones P229, D439, D508, E601, G553, G556, N432, P436, P499, R224, S371, T376, T563, W414 o W624 (los denominados “restos del segundo dominio”) de la SEQ ID NO: 2; así como dado el caso una mutación adicional en la posición E429, L700 y R554 de la SEQ ID NO: 2.
En otra configuración especial, la invención se refiere a un mutante de enzima, seleccionado entre
a) los mutantes sencillos
F486X con X = N, Q, L, M, E, G, S, V, T, C, I o A de acuerdo con SEQ ID NO: 2 o una versión corta de la misma; Y702X con X = F, A, C o S de acuerdo con SEQ ID NO: 2 o una versión corta de la misma;
Y561X con X= A o S de acuerdo con SEQ ID NO: 2 o una versión corta de la misma;
en el que la versión corta comprende por ejemplo la siguiente secuencia en el extremo N-terminal: (M)KIFGAEKTSYKPASDTIIGTDTLKRPN
y
b) los mutantes múltiples F486A / Y702A, F486A / Y561A o F486A / Y705A de acuerdo con SEQ ID NO: 2 En otra configuración especial la invención se refiere a un mutante de enzima que comprende al menos el 50 %, tal como por ejemplo del 50 al 100% o más del 100%, tal como por ejemplo >100 al 1000%, en cada caso determinado en condiciones estándar usando un sustrato de referencia, de la actividad citronelal-isopulegol-ciclasa de una enzima, que comprende una secuencia de aminoácidos de acuerdo con SEQ ID NO: 2 de posición 1 a 725, de 2 a 725 o de 16 a 725, dado el caso alargada en el extremo N-terminal mediante un resto de metionina.
En el caso de mutantes de enzima de este tipo, la actividad citronelal-isopulegol-ciclasa se determina usando un citronelal, tal como por ejemplo el racimito o la forma R(+), como sustrato de referencia en condiciones estándar. En otra configuración especial la invención se refiere a un mutante de enzima, en el que se realiza la mutación en una enzima, que comprende una secuencia de aminoácidos de acuerdo con SEQ ID NO: 2 de posición 1 a 725, de 2 a 725 o de 16 a 725, dado el caso alargada en el extremo N-terminal mediante un resto de metionina.
En otra configuración especial la invención se refiere a una secuencia de ácido nucleico, que codifica para un mutante de enzima tal como se describe anteriormente.
En otra configuración especial la invención se refiere a un casete de expresión que comprende una secuencia de ácido nucleico de este tipo.
En otra configuración especial la invención se refiere a un vector recombinante que comprende bajo el control de al menos un elemento regulador al menos una secuencia de ácido nucleico tal como se describe anteriormente o al menos un casete de expresión.
En otra configuración especial la invención se refiere a un microorganismo recombinante que contiene al menos una secuencia de ácido nucleico tal como se describe anteriormente o al menos un casete de expresión tal como se describe anteriormente o al menos un vector tal como se describe anteriormente.
Otro objeto de la invención se refiere a un procedimiento biocatalítico para la preparación de isopulegol de la fórmula general (I)
Figure imgf000008_0001
en donde citronelal de la fórmula general (II)
Figure imgf000008_0002
se cicla para dar isopulegol de la fórmula (I) por medio de un mutante de enzima tal como se describe anteriormente, o en presencia de un microorganismo que expresa este mutante de enzima tal como se describe anteriormente. Otro objeto de la invención se refiere a un procedimiento para la preparación de mentol, de la fórmula III
Figure imgf000008_0003
en donde
a) se cicla citronelal para dar isopulegol según un procedimiento tal como se describe anteriormente y b) isopulegol se hidrogena de manera catalítica para dar mentol.
En particular, a este respecto la hidrogenación tiene lugar en presencia de hidrógeno y un catalizador, que comprende - del 30 al 70 % en peso de compuestos de níquel que contienen oxígeno, calculado como NiO,
- del 15 al 45 % en peso de compuestos de zirconio que contienen oxígeno, calculado como ZrO2,
- del 5 al 30 % en peso de compuestos de cobre que contienen oxígeno, calculado como CuO y
- del 0,1 al 10 % en peso de compuestos de molibdeno que contienen oxígeno, calculado como MoO3, en donde los datos de % en peso se refieren al catalizador seco, no reducido.
En este sentido se describen también procedimientos para reacciones enzimáticas o biocatalíticas de compuestos de la fórmula general IV
Figure imgf000009_0001
en la que
“a”, “b”, “c” y “d”, en cada caso independientemente entre sí, representan un enlace C-C simple o doble, con la condición de que se excluyan dobles enlaces acumulados; y las siguientes condiciones:
R1 tiene los siguientes significados:
(1) cuando “a” es un doble enlace:
R1 se selecciona entre
oxo (=O) o
CH-(CH2)n-Z,
en la que n representa 0 , 1 o 2 y
Z representa OH, CHO, C(O) alquilo, tal como C(O)-alquilo C1-C4 , en particular C(O)-CH3 o C(O)-CH2CH3 ; COOH, C(CH2)-CH=CH2;
C(OH)(CH3)-CH=CH2; C(CH3)=CH-CH=CH2 ; o un resto de la fórmula
C(CH3)=CH-CH2Y
en la que
Y representa OH, CH2OH, COOH, o CH2C(O)CH3 ; o
(2 ) cuando “a” es un enlace simple:
R1 se selecciona entre
CH3 ; CHO; CH2CH2OH; CH=CH2 ; CH2C(O)OH; CH2CHO o C3HeCH(CH3)CHO;
en donde, cuando “a” es un doble enlace, presenta configuración E o Z;
R2 y R3 tienen los siguientes significados:
(1) cuando “a” y “b” son en cada caso un enlace simple:
R2 y R3 independientemente entre sí representan H, alquilo, tal como alquilo C1-C4, u OH o R2 y R3 representan juntos un grupo metileno (=CH2)- o grupo oxo (=O); o
(2) cuando “a” o “b” es un doble enlace, falta uno de los restos R2 y R3 y el otro de los dos restos representa H, alquilo C1-C4 , en particular metilo u OH;
R4 representa H o hidroxi-C1-C4-alquilo, en particular hidroximetilo;
R5 y Retienen los siguientes significados:
(1) cuando “c” es un enlace simple: R5 y R5 representan en cada caso H o R5 y R5 representan juntos un grupo oxo (=O); o
(2) cuando “c” es un doble enlace, falta uno de los restos R5 y R6 y el otro de los dos restos representa H;
R7 , R8 y R9 tienen los siguientes significados:
(1) cuando “d” es un enlace simple:
dos de los restos R7 , R8 y R9 en cada caso independientemente entre sí representan H o alquilo, tal como alquilo C1-C4 , en particular metilo o etilo, y el otro de los restos representa OH; o
(2 ) cuando “d” es un doble enlace, falta uno de los restos R7 , R8 y R9 y el otro de los dos restos representa en cada caso independientemente entre sí H o alquilo, tal como C1-C4-alquilo, en particular metilo o etilo, y en particular dos restos representan metilo;
R10 representa H o hidroxi-alquilo C1-C6 , tal como hidroxi-alquilo C1-C4 , o un alquenilo C2-C6 mono- o poliinsaturado, tal como en particular H o CH=CH-C(CH3)=CH2 ,
en donde se hace reaccionar un compuesto de la fórmula IV en forma estereoisoméricamente pura o una mezcla estereoisomérica del mismo con el uso de una enzima de la clase EC 5.4.99, en particular de la clase EC 5.4.99.17, o un mutante de enzima descrito anteriormente en el presente documento o en presencia de un microorganismo que expresa estas enzimas o mutantes de enzima descrito anteriormente.
A este respecto se hace reaccionar en particular un compuesto que se selecciona entre compuestos de la fórmula Iva
Figure imgf000010_0001
en la que R1 tiene los significados indicados anteriormente y en particular representa el resto CH-(CH2)n-Z en el que
n = 0 y Z = CHO o COOH; o
n = 1 y Z = OH; o
n = 2 y Z = C(O)CHa; COOH, C(CH2)-CH=CH2; C(CHa)=CH-CH=CH2 ;
o es un resto de la fórmula C(CH3)=CH-CH2Y
en la que Y representa OH, CH2OH, COOH o CH2C(O)CH3 ;
y “a” dado el caso presenta configuración E o Z;
o de la fórmula IVb
Figure imgf000010_0002
en la que R1 tiene los significados indicados anteriormente; y en particular representa CH2CHO;
o de la fórmula IVc
Figure imgf000010_0003
en la que
R1 tiene los significados indicados anteriormente, y en particular representa CH-CHO; y uno de los restos R7 y R8 representa H y el otro representa alquilo C1-C4 , en donde en particular R7 representa etilo y el doble enlace “a” y “d” presenta configuración Z.
Compuestos de la fórmula IV se seleccionan en particular entre citronelal; citral; farnesol; homofarnesol; derivados de homofarnesol, tales como ácido homofarnesílico; geranilacetona, nonadienal; y trimetildecatetraeno.
Otro objeto de la invención se refiere al uso de un mutante de enzima tal como se describe anteriormente, de un ácido nucleico tal como se describe anteriormente, de un constructo de expresión tal como se describe anteriormente, de un vector recombinante tal como se describe anteriormente o de un microorganismo tal como se describe anteriormente para la ciclación de terpenos y/o terpenoides, así como para la reacción de compuestos de la fórmula general anterior IV; en particular para la reacción de citronelal para dar isopulegol; o para la reacción de escualeno para dar hopeno.
En un procedimiento descrito en el presente documento la enzima se encuentra en una forma seleccionada del grupo que consiste en:
a) polipéptido libre, dado el caso purificado o parcialmente purificado con la actividad de una citronelal-isopulegolciclasa;
b) polipéptido inmovilizado con la actividad de una citronelal-isopulegol-ciclasa;
c) polipéptido aislado a partir de células de acuerdo con a) o b);
d) célula completa, dado el caso células inactivas o abiertas, que contiene al menos un polipéptido con la actividad de una citronelal-isopulegol-ciclasa;
e) lisado celular o homogeneizado celular de las células descritas en d).
En particular las células son microorganismos, preferentemente microorganismos transgénicos que expresan al menos una molécula de ácido nucleico heteróloga que codifica para un polipéptido de este tipo con la actividad de una citronelal-isopulegol-ciclasa.
En particular a este respecto tienen lugar la preparación de isopulegol en sistemas acuosos monofásicos o en sistemas bifásicos.
En particular la reacción de citronelal para dar isopulegol tiene lugar a una temperatura en el intervalo de 20 a 40 °C y/o un valor de pH en el intervalo de 4 a 8.
En particular, la enzima con la actividad de una citronelal-isopulegol-ciclasa se deriva de un gen que se aisló a partir de un microorganismo de las especies Rhodopseudomonas palustris, Bradyrhizobium japonicum.
En particular, en un procedimiento de este tipo, la enzima con la actividad de una citronelal-isopulegol-ciclasa se genera por un microorganismo que sobreproduce la enzima con la actividad de una citronelal-isopulegol-ciclasa y que se seleccionó del grupo de los microorganismos que consiste en los géneros Escherichia, Corynebacterium, Ralstonia, Clostridium, Pseudomonas, Bacillus, Zymomonas, Rhodobacter, Streptomyces, Burkholderia, Lactobacillus y Lactococcus y en particular que se generó por microorganismos transgénicos de las especies Escherichia coli, Pseudomonas putida, Burkholderia glumae, Corynebacterium glutamicum, Saccharomyces cerevisiae, Pichia pastoris, Streptomyces lividans, Streptomyces coelicolor, Bacillus subtilis o Zymomonas mobilis, que sobreproducen la enzima con la actividad de una citronelal-isopulegol-ciclasa.
C. Otras configuraciones de la invención
1. Secuencias de tipo natural especialmente adecuadas
Las secuencias de tipo natural de SCH que pueden usarse de acuerdo con la invención, así como otras secuencias que no son objeto de la invención (SEQ ID NO:3 bis 326), su SEQ ID NO, organismo fuente, número de referencia de Genbank, el resto de aminoácido ("Aa") "que se corresponde con" la posición F486 de SEQ ID NO:2, es decir análogo a F486, y su posición de secuencia están resumidos en la siguiente tabla. Las indicaciones se basan a este respecto en una alineación de secuencias, que se construyó de la siguiente manera:
programa: CLUSTALW,
parámetros por defecto:
penalización de apertura de huecos de proteína 10.0
penalización de extensión de huecos de proteína 0.2
matriz de peso de proteína: series Gonnet
Figure imgf000011_0001
continuación
Figure imgf000012_0001
continuación
Figure imgf000013_0001
continuación
Figure imgf000014_0001
continuación
Figure imgf000015_0001
continuación
Figure imgf000016_0001
continuación
Figure imgf000017_0001
Partiendo de esto pueden prepararse por medio del hallazgo de mutantes de Zm-SHC-1, otros posibles mutantes de ciclasa con las propiedades de sustrato deseadas.
2. Otras proteínas/mutantes de enzima de acuerdo con la invención
La presente invención no está limitada a los mutantes divulgados de manera concreta en el presente documento, con actividad ciclasa, sino que se extiende más bien también a equivalentes funcionales de los mismos.
Los "equivalentes funcionales" o análogos de los mutantes de enzima divulgados de manera concreta (mutantes de F486, derivados de SEQ ID NO:2) son en el marco de la presente invención polipéptidos distintos de esto, que tienen además la actividad biológica deseada, tal como por ejemplo actividad ciclasa.
De este modo, por ejemplo por "equivalentes funcionales" se entienden enzimas y mutantes, que presentan en un ensayo usado para determinar la "actividad ciclasa" en el sentido de la invención (es decir con un sustrato de referencia en condiciones estándar) una actividad de una enzima más alta o más baja en al menos el 1%, en particular en al menos aproximadamente del 5 al 10 % tal como por ejemplo al menos el 10% o al menos el 20 %, tal como por ejemplo al menos el 50 % o 75% o 90 %, que comprende una secuencia de aminoácidos definida de manera concreta en el presente documento (por ejemplo un mutante F486 , derivado de SEQ ID NO:2).
Las indicaciones de actividad para equivalentes funcionales se refieren en el presente documento, cuando no se indique lo contrario, a determinaciones de actividad, realizadas por medio de un sustrato de referencia en condiciones estándar, tal como se define en el presente documento.
La "actividad ciclasa" en el sentido de la invención puede detectarse con ayuda de distintos ensayos conocidos. Sin estar limitado a esto, puede mencionarse un ensayo usando sustrato de referencia, tal como por ejemplo racemato de citronelal o forma R(+), en condiciones estándar, tal como se ha descrito anteriormente y es explica en la parte experimental.
Los equivalentes funcionales son estables además por ejemplo entre pH 4 a 11 y tienen ventajosamente un valor óptimo de pH en un intervalo de pH 5 a 10, tal como en particular de 6,5 a 9,5 o de 7 a 8 o aproximadamente en 7,5, así como un valor óptimo de temperatura en el intervalo de 15°C a 80°C o de 20°C a 70°C, tal como por ejemplo aproximadamente de 30 a 60°C o aproximadamente de 35 a 45°C, tal como aproximadamente en 40°C.
Por "equivalentes funcionales" se entiende de acuerdo con la invención en particular también "mutantes", que, además de la(s) mutación (mutaciones) mencionada(s) de manera concreta (por ejemplo un mutante F486 , derivados de SEQ ID NO:2), en al menos una posición de secuencia de las secuencias de aminoácidos mencionadas anteriormente presentan un aminoácido distinto del aminoácido mencionado en concreto pero, a pesar de ello, tienen una de las actividades biológicas mencionadas anteriormente.
Los "equivalentes funcionales" comprenden los mutantes que pueden obtenerse mediante una o varias, tal como por ejemplo de 1 a 50, de 2 a 30, de 2 a 15, de 4 a 12 o de 5 a 10 "mutaciones adicionales", tal como adiciones, sustituciones, deleciones y/o inversiones de aminoácidos, pudiéndose producir las modificaciones mencionadas en cualquier posición de secuencia, siempre que conduzcan a un mutante con el perfil de propiedades de acuerdo con la invención. Equivalencia funcional se da en particular también entonces cuando los patrones de reactividad entre mutante y polipéptido no modificado coinciden cualitativamente, es decir, por ejemplo se hacen reaccionar sustratos iguales con diferente velocidad.
Las "mutaciones adicionales" de este tipo se realizan a este respecto en una posición de la respectiva secuencia de aminoácidos distinta de la posición F486 de acuerdo con SEQ ID NO:2.
Ejemplos no limitativos de sustituciones de aminoácidos adecuadas están resumidas en la siguiente tabla:
Resto original Ejemplos de sustitución
Ala Ser
Arg Lys
Asn Gln; His
Asp Glu
Cys Ser
Gln Asn
Glu Asp
Gly Pro
His Asn; Gln
Ile Leu; Val
Leu Ile; Val
Lys Arg; Gln; Glu
Met Leu; Ile
Phe Met; Leu; Tyr
Ser Thr
Thr Ser
Trp Tyr
Tyr Trp; Phe
Val Ile; Leu
"Equivalentes funcionales" en el sentido anterior son también "precursores" de los polipéptidos descritos así como "derivados funcionales" y "sales" de los polipéptidos.
"Precursores" son a este respecto etapas previas naturales o sintéticas de los polipéptidos con o sin la actividad biológica deseada.
Por la expresión "sales" se entiende tanto sales de grupos carboxilo como también sales de adición de ácido de grupos amino de las moléculas de proteína de acuerdo con la invención. Las sales de grupos carboxilo pueden prepararse de manera en sí conocida y comprenden sales inorgánicas, tal como por ejemplo sales de sodio, calcio, amonio, hierro y cinc, así como sales con bases orgánicas, tal como por ejemplo aminas, tal como trietanolamina, arginina, lisina, piperidina y similares. Las sales de adición de ácido, tal como por ejemplo sales con ácidos minerales, tal como ácido clorhídrico o ácido sulfúrico y sales con ácidos orgánicos, tal como ácido acético y ácido oxálico son igualmente objeto de la invención.
"Derivados funcionales" de los polipéptidos de acuerdo con la invención pueden prepararse asimismo en grupos laterales de aminoácido funcionales o en sus extremos N o C terminales con ayuda de técnicas conocidas. Los derivados de este tipo comprenden por ejemplo ésteres alifáticos de grupos ácido carboxílico, amidas de grupos ácido carboxílico, que pueden obtenerse mediante reacción con amoniaco o con una amina primaria o secundaria; derivados de N-acilo de grupos amino libres, preparados mediante reacción con grupos acilo; o derivados de O-acilo de grupos hidroxi libres, preparados mediante reacción con grupos acilo.
Los "equivalentes funcionales" abarcan naturalmente también polipéptidos a los que puede accederse a partir de otros organismos, así como variantes que existen naturalmente. Por ejemplo, mediante comparación de secuencias puede establecerse zonas de regiones de secuencia homólogas y siguiendo las especificaciones de la invención pueden averiguarse enzimas equivalentes.
Los "equivalentes funcionales" abarcan asimismo fragmentos, preferentemente dominios o motivos de secuencia individuales, de los polipéptidos de acuerdo con la invención, que presentan por ejemplo la función biológica deseada.
Los "equivalentes funcionales" son además proteínas de fusión que presentan una de las secuencias de polipéptidos mencionadas anteriormente o equivalentes funcionales derivados de las mismas y al menos otra secuencia heteróloga, funcionalmente distinta de esto, en enlace N o C terminal funcional (es decir, sin alteración funcional esencial recíproca de las partes de proteína de fusión). Ejemplos no limitativos de secuencias heterólogas de este tipo son por ejemplo péptidos señal, ancla de histidina o enzimas.
Los "equivalentes funcionales" comprendidos de manera conjunta de acuerdo con la invención son homólogos a las proteínas divulgadas de manera concreta. Éstas tienen al menos el 60 %, preferentemente al menos el 75 %, en particular al menos el 85 %, tal como por ejemplo el 90, 91, 92, 93, 94, 95, 96, 97,98 o 99 %, de homología (o bien identidad) con respecto a una de las secuencias de aminoácidos divulgadas de manera concreta, calculada según el algoritno de Pearson y Lipman, Proc. Natl. Acad, Sci. (USA) 85(8), 1988, 2444-2448. Una homología o bien identidad porcentual de un polipéptido homólogo de acuerdo con la invención significa en particular identidad porcentual de los restos de aminoácido con respecto a la longitud total de una de las secuencias de aminoácidos descritas de manera concreta en el presente documento. En particular presentan estos homólogos sin embargo además la mutación de F486 , derivados de SEQ ID NO:2.
Los valores de identidad porcentual pueden determinarse también por medio de alineaciones BLAST, algoritmo blastp (proteinprotein BLAST), o mediante aplicación de los ajustes en clustal indicado.
En el caso de una posible glicosilación de proteína, los "equivalentes funcionales" de acuerdo con la invención abarcan proteínas del tipo designado anteriormente en forma desglicosilada o glicosilada así como formas diferentes que pueden obtenerse mediante modificación del patrón de glicosilación.
Los homólogos de las proteínas o polipéptidos de acuerdo con la invención pueden generarse mediante mutagénesis, por ejemplo mediante mutación puntual, alargamiento o acortamiento de la proteína.
Los homólogos de las proteínas de acuerdo con la invención pueden identificarse mediante selección de bancos combinatorios de mutantes, tal como por ejemplo mutantes de acortamiento. Por ejemplo puede generarse un banco variado de variantes de proteína mediante mutagénesis combinatoria en el plano de ácido nucleico, tal como por ejemplo mediante ligación enzimática de una mezcla de oligonucleótidos sintéticos. Existe una pluralidad de procedimientos que pueden usarse para la preparación de bancos de homólogos potenciales a partir de una secuencia de oligonucleótidos degenerada. La síntesis química de una secuencia génica generada puede llevarse a cabo en un sintetizador automático de ADN, y el gen sintético puede ligarse entonces en un vector de expresión adecuado. El uso de un conjunto de genes degenerado permite la provisión de todas las secuencias en una mezcla, que codifican el conjunto deseado de secuencias de proteína potenciales. Procedimientos para la síntesis de oligonucleótidos degenerados son conocidos por el experto en la materia (por ejemplo Narang, S.A. (1983) Tetrahedron 39:3; Itakura y col. (1984) Annu. Rev. Biochem. 53:323; Itakura y col., (1984) Science 198:1056; Ike y col. (1983) NucleicAcids Res.
11:477).
En el estado de la técnica se conocen varias técnicas para la selección de productos génicos de bancos combinatorios, que se han preparado mediante mutaciones puntuales o acortamiento, y para la selección de bancos de ADNc con respecto a productos génicos con una propiedad seleccionada. Estas técnicas pueden adaptarse a la selección rápida de los bancos de genes, que se han generado mediante mutagénesis combinatoria de homólogos de acuerdo con la invención. Las técnicas usadas con la mayor frecuencia para la selección de grandes bancos de genes, que están sujetas a un análisis con alto rendimiento, comprenden la clonación del banco de genes en vectores de expresión replicables, transformación de células adecuadas con el banco de vectores resultante y expresión de los genes recombinantes en condiciones en las que la detección de la actividad deseada facilita el aislamiento del vector que codifica el gen cuyo producto se detectó. La Recursive-Ensemble-Mutagenese (REM) (mutagénesis de conjunto recursiva), una técnica que amplía la frecuencia de mutantes funcionales en los bancos, puede usarse en combinación con las pruebas de selección para identificar homólogos (Arkin y Yourvan (1992) PNAS 89:7811-7815; Delgrave y col. (1993) Protein Engineering 6(3):327-331).
3. Ácidos nucleicos y constructos
3.1 Ácidos nucleicos
Son objeto de la invención también secuencias de ácido nucleico, que codifican una enzima tal como se ha descrito anteriormente o bien un mutante de la misma descrito anteriormente con actividad ciclasa.
La presente invención se refiere también a ácidos nucleicos con un grado de identidad determinado con respecto a las secuencias concretas descritas en el presente documento.
Por "identidad" entre dos ácidos nucleicos se entiende la identidad de los nucleótidos por la longitud del ácido nucleico en cada caso total, en particular la identidad, que se calcula mediante comparación con ayuda del software Vector NTI Suite 7.1 de la empresa Informax (EE.UU.) con aplicación del procedimiento Clustal (Higgins DG, Sharp PM. Fast and sensitive multiple sequence alignments on a microcomputer. Comput Appl. Biosci. 1989 Apr;5(2):151-1) con ajuste de los siguientes parámetros:
Parámetros de alineación múltiple:
penalización de apertura de huecos 10
penalización de extensión de huecos 10
intervalo de penalización de separación de huecos 8
penalización de separación de huecos apagado
% de identidad para el retraso de alineación 40
huecos específicos de residuo apagado
hueco de residuo hidrofílico apagado
ponderación de transición 0
Parámetros de alineación por parejas:
algoritmo FAST encendido
tamaño K-túple 1
penalización de huecos 3
tamaño de ventana 5
número de mejores diagonales 5
Como alternativa a esto puede determinarse la identidad también según Chenna, Ramu, Sugawara, Hideaki, Koike,Tadashi, Lopez, Rodrigo, Gibson, Toby J, Higgins, Desmond G, Thompson, Julie D. Multiple sequence alignment with the Clustal series of programs. (2003) Nucleic Acids Res 31 (13):3497-500, de acuerdo con la dirección de internet: http://www.ebi.ac.uk/Tools/clustalw/index.html# y con los siguientes parámetros:
penalización de apertura de huecos de ADN 15.0
penalización de extensión de huecos de ADN 6.66
matriz de ADN identidad
penalización de apertura de huecos de proteína 10.0
penalización de extensión de huecos de proteína 0.2
matriz de proteína Gonnet
proteína/ADN ENDGAP -1
proteína/ADN GAPDIST 4
Todas las secuencias de ácido nucleico mencionadas en el presente documento (secuencias de ADN y ARN mono- y bicatenarios, tales como por ejemplo ADNc y ARNm) pueden prepararse de manera en sí conocida mediante síntesis química de los módulos de nucleótidos, tal como por ejemplo mediante condensación de fragmentos de módulos de ácido nucleico individuales, solapantes, complementarios de la doble hélice. La síntesis química de oligonucleótidos puede realizarse por ejemplo, de manera conocida, según el procedimiento de fosfoamidita (Voet, Voet, 2a edición, Wiley Press New York, páginas 896-897). La adición de oligonucleótidos sintéticos y la compleción de huecos con ayuda del fragmento de la ADN polimerasa y reacciones de ligación así como procedimientos de clonación generales se describen en Sambrook y col. (1989), Molecular Cloning: A laboratory manual, Cold Spring Harbor Laboratory Press.
Son objeto de la invención también secuencias de ácido nucleico (secuencias de ADN y ARN mono- y bicatenarios, tales como por ejemplo ADNc y ARNm), que codifican uno de los polipéptidos anteriores y sus equivalentes funcionales, que son accesibles por ejemplo usando análogos sintéticos de nucleótidos.
La invención se refiere tanto a moléculas de ácido nucleico aisladas, que codifican polipéptidos o bien proteínas de acuerdo con la invención o fragmentos biológicamente activos de los mismos, como también fragmentos de ácido nucleico, que pueden usarse por ejemplo para su uso como sondas de hibridación o cebadores para la identificación o amplificación de ácidos nucleicos codificantes de acuerdo con la invención.
Las moléculas de ácido nucleico de acuerdo con la invención pueden contener además secuencias no traducidas del extremo 3' y/o 5' de la región génica codificante.
La invención abarca además las moléculas de ácido nucleico complementarias a las secuencias de nucleótidos descritas de manera concreta o un fragmento de las mismas.
Las secuencias de nucleótidos de acuerdo con la invención permiten la generación de sondas y cebadores, que pueden usarse para la identificación y/o clonación de secuencias homólogas en otros tipos de célula y organismos.
Tales sondas o bien cebadores comprenden habitualmente una región de secuencia de nucleótidos, que en condiciones "rigurosas" (véase a continuación) se híbrida en al menos aproximadamente 12, preferentemente al menos aproximadamente 25, tal como por ejemplo aproximadamente 40, 50 o 75 nucleótidos sucesivos de una cadena sentido de una secuencia de ácido nucleico de acuerdo con la invención o de una cadena antisentido correspondiente.
Una molécula de ácido nucleico "aislada" se separa de otras moléculas de ácido nucleico, que están presentes en la fuente natural del ácido nucleico y además puede estar esencialmente libre de otro material celular o medio de cultivo, cuando se prepara mediante técnicas recombinantes, o puede estar libre de precursores químicos u otros productos químicos, cuando se sintetiza químicamente.
Una molécula de ácido nucleico de acuerdo con la invención puede aislarse por medio de técnicas convencionales de biología molecular y de la información de secuencia facilitada de acuerdo con la invención. Por ejemplo puede aislarse ADNc de un banco de ADNc adecuado, usándose una de las secuencias completas divulgadas en concreto o un fragmento de las mismas como sonda de hidridación y técnicas de hibridación convencionales (tal como se describe por ejemplo en Sambrook, J., Fritsch, E.F. y Maniatis, T. Molecular Cloning: A Laboratory Manual. 2a ed., Cold Spring Harbor Laboratory, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY, 1989). Además puede aislarse una molécula de ácido nucleico, que comprende una de las secuencias divulgadas o un fragmento de las mismas, mediante reacción en cadena de la polimerasa, usándose los cebadores de oligonucleótidos que se han creado a base de esta secuencia. El ácido nucleico así amplificado puede clonarse en un vector adecuado y puede caracterizarse mediante análisis de secuencia de ADN. Los oligonucleótidos de acuerdo con la invención pueden prepararse además mediante procedimientos de síntesis convencionales, por ejemplo con un aparato de síntesis de ADN automático.
Las secuencias de ácido nucleico de acuerdo con la invención o derivados de las mismas, homólogos o partes de estas secuencias, pueden aislarse por ejemplo con procedimientos de hibridación habituales o la técnica de PCR de otras bacterias, por ejemplo a través de bancos genómicos o de ADNc. Estas secuencias de ADN hibridan en condiciones estándar con las secuencias de acuerdo con la invención.
Por "hibridación" se entiende la capacidad de un poli- u oligonucleótido de unirse a una secuencia casi complementaria en condiciones estándar, mientras que en estas condiciones no tienen lugar uniones inespecíficas entre asociados no complementarios. Para esto pueden ser complementarias las secuencias en el 90-100 %. La propiedad de secuencias complementarias, de poder unirse una a otra de manera específica, se aprovecha por ejemplo en la técnica de inmunotransferencia tipo Northern o Southern o en la unión a cebadores en PCR o RT-PCR.
Para la hibridación se usan ventajosamente oligonucleótidos cortos de las regiones conservadas. Sin embargo pueden usarse también fragmentos más largos de los ácidos nucleicos de acuerdo con la invención o las secuencias completas para la hibridación. En función del ácido nucleico usado (oligonucleótido, fragmentos más largo o secuencia completa) o según qué tipo de ácido nucleico ADN o ARN se usan para la hibridación, varían las condiciones estándar. De este modo, por ejemplo las temperaturas de fusión para híbridos de ADN:ADN es aproximadamente 10 °C menor que la de híbridos de ADN:ARN de igual longitud.
Por condiciones estándar ha de entenderse, por ejemplo, dependiendo del ácido nucleico temperaturas entre 42 y 58 °C en una solución tampón acuosa con una concentración entre 0,1 y 5 x SSC (1 X SSC = NaCl 0,15 M, citrato de sodio 15 mM, pH 7,2) o adicionalmente en presencia del 50 % de formamida tal como por ejemplo 42 °C en 5 x SSC, 50 % de formamida. Ventajosamente, las condiciones de hibridación para ADN:híbridos de ADN son 0,1 x SSC y temperaturas entre aproximadamente 20 °C y 45 °C, preferentemente entre aproximadamente 30 °C y 45 °C. Para ADN:híbridos de ARN, las condiciones de hibridación son ventajosamente 0,1 x SSC y temperaturas entre aproximadamente 30 °C y 55 °C, preferentemente entre aproximadamente 45 °C y 55 °C. Estas temperaturas indicadas para la hibridación son valores de temperatura de fusión calculados a modo de ejemplo para un ácido nucleico con una longitud de aproximadamente 100 nucleótidos y un contenido en G C del 50 % en ausencia de formamida. Las condiciones experimentales para la hibridación de ADN se han descrito en correspondientes libros de texto de genética, tal como por ejemplo Sambrook y col., "Molecular Cloning", Cold Spring Harbor Laboratory, 1989, y pueden calcularse según fórmulas conocidas por el experto por ejemplo dependiendo de la longitud de los ácidos nucleicos, del tipo de los híbridos o del contenido en G C. El experto puede extraer informaciones adicionales para la hibridación de los siguientes libros de texto: Ausubel y col. (eds), 1985, Current Protocols in Molecular Biology, John Wiley & Sons, Nueva York; Hames and Higgins (eds), 1985, Nucleic Acids Hybridization: A Practical Approach, IRL Press at Oxford University Press, Oxford; Brown (ed), 1991, Essential Molecular Biology: A Practical Approach, IRL Press at Oxford University Press, Oxford.
La "hibridación" puede realizarse en particular en condiciones rigurosas. Tales condiciones de hibridación se han descrito por ejemplo en Sambrook, J., Fritsch, E.F., Maniatis, T., en: Molecular Cloning (A Laboratory Manual), 2a edición, Cold Spring Harbor Laboratory Press, 1989, páginas 9.31-9.57 o en Current Protocols in Molecular Biology, John Wiley & Sons, N.Y. (1989), 6.3.1-6.3.6.
Por condiciones de hibridación "rigurosas" se entiende en particular: La incubación a 42°C durante la noche en una solución que está constituida por el 50 % de formamida, 5 x SSC (NaCl 750 mM, citrato de trisodio 75 mM), fosfato de sodio 50 mM (pH 7,6), 5x solución de Denhardt, 10 % dextranosulfato y 20 g/ml de ADN de esperma de salmón cortado, desnaturalizado, seguido de una etapa de lavado del filtro con 0,1x SSC a 65°C.
Son objeto de la invención también derivados de las secuencias de ácido nucleico divulgadas en concreto o que pueden derivarse.
Así pueden estar derivadas otras secuencias de ácido nucleico de acuerdo con la invención, que codifican mutantes de ciclasa por ejemplo de SEQ ID NO:1 o de las secuencias codificantes con respecto a SEQ ID NO: 2, mediante una mutación de f486 y se diferencian de éstas mediante adición, sustitución, inserción o deleción de nucleótidos individuales o de varios nucleótidos, pero codifican además polipéptidos con el perfil de propiedades deseado.
De acuerdo con la invención están comprendidas también aquellas secuencias de ácido nucleico que comprenden las denominadas mutaciones mudas o se han modificado de manera correspondiente al uso de codón de un organismo de origen o huésped especial, en comparación con una secuencia mencionada de manera concreta, al igual que las variantes que se producen de manera natural, tal como por ejemplo variantes de corte y empalme o variantes de alelo, de las mismas.
Igualmente son objeto secuencias que pueden obtenerse mediante sustituciones de nucleótidos conservadoras (es decir el respectivo aminoácido se sustituye por un aminoácido de igual carga, tamaño, polaridad y/o solubilidad).
También son objeto de la invención las moléculas derivadas mediante polimorfismo de secuencia de los ácidos nucleicos divulgados en concreto. Estos polimorfismos genéticos pueden existir entre individuos dentro de una población debido a la variación natural. Estas variaciones naturales provocan habitualmente una varianza del 1 al 5 % en la secuencia de nucleótidos de un gen.
Por derivados de las secuencias de ácido nucleico de acuerdo con la invención, que codifican mutantes de ciclasa, derivadas de la secuencia SEQ ID NO: 1 o de una de las secuencias codificantes con respecto a SEQ ID NO: 2, ha de entenderse por ejemplo variantes de alelo que presentan al menos el 60 % de homología en el plano de aminoácidos derivados, preferentemente al menos el 80 % de homología, de manera muy especialmente preferente al menos el 90 % de homología por toda la región de secuencia (con respecto a la homología en el plano de aminoácidos se remite a las realizaciones anteriores con respecto a los polipéptidos). Por regiones parciales de las secuencias pueden encontrarse las homologías ventajosamente más altas.
Además ha de entenderse por derivados también homólogos de las secuencias de ácido nucleico de acuerdo con la invención, por ejemplo homólogos fúngicos o bacterianos, secuencias acortadas, ADN o ARN monocatenario de la secuencia de a Dn codificante y no codificante.
Además ha de entenderse por derivados por ejemplo fusiones con promotores. Los promotores, que se han conectado previamente a las secuencias de nucleótidos indicadas, pueden estar modificados mediante al menos un intercambio de nucleótidos, al menos una inserción, inversión y/o deleción, sin que se vean alteradas sin embargo la funcionalidad o bien actividad de los promotores. Además, los promotores pueden elevar su actividad mediante modificación de su secuencia o pueden intercambiarse completamente por promotores más eficaces también de organismos foráneos.
3.2 Generación de mutantes funcionales
El experto conoce además procedimientos para la generación de mutantes funcionales de enzimas de acuerdo con la invención.
Dependiendo de la técnica usada puede introducir el experto mutaciones completamente al azar o también más dirigidas en genes o también regiones de ácido nucleico no codificantes (que por ejemplo son importantes para la regulación de la expresión) y a continuación crear bancos de genes. Los procedimientos de biología molecular necesarios para ello los conoce el experto y por ejemplo se han descrito en Sambrook y Russell, Molecular Cloning.
3a edición, Cold Spring Harbor Laboratory Press 2001.
Los procedimientos para la modificación de genes y por consiguiente para la modificación de las proteínas codificadas por éstos son familiares para el experto desde hace tiempo, tal como por ejemplo
- la mutagénesis específica de sitio, en la que se intercambian de manera dirigida nucleótidos individuales o varios nucleótidos de un gen (Trower MK (Hrsg.) 1996; In vitro mutagenesis protocols. Humana Press, New Jersey), - la mutagénesis de saturación, en la que puede intercambiarse o añadirse en cualquier sitio discrecional de un gen un codón para un aminoácido discrecional (Kegler-Ebo DM, Docktor CM, DiMaio D (1994) Nucleic Acids Res 22:1593; Barettino D, Feigenbutz M, Valcárel R, Stunnenberg HG (1994) Nucleic Acids Res 22:541; Barik S (1995) Mol Biotechnol 3:1),
- la reacción en cadena de la polimerasa propensa a fallos (error-prone PCR), en la que se mutan secuencias de nucleótidos mediante ADN-polimerasas que trabajan de manera defectuosa (Eckert kA, Kunkel TA (1990) Nucleic Acids Res 18:3739);
- el procedimiento SeSaM (Sequence Saturation Method), en el que se impiden intercambios preferentes mediante la polimerasa. Schenk y col., Biospektrum, vol. 3, 2006, 277-279
- el pasaje de genes en cepas mutadoras, en las que por ejemplo debido a mecanismos de reparación de ADN defectuosos se produce una elevada tasa de mutación de secuencias de nucleótidos (Greener A, Callahan M, Jerpseth B (1996) An efficient random mutagenesis technique using an E.coli mutator strain. En: Trower MK (Hrsg.) In vitro mutagenesis protocols. Humana Press, New Jersey), o
- el barajado de ADN, en el que una combinación de genes casi afines se forma y se digiere y los fragmentos de ruptura se usan como moldes para una reacción en cadena de la polimerasa, en la que se generan mediante repetida separación de cadena y nueva aproximación finalmente genes de mosaico de longitud completa (Stemmer WPC (1994) Nature 370:389; Stemmer WPC (1994) Proc Natl Acad Sci USA 91:10747).
Usando la denominada evolución dirigida ("directed evolution"; descrita entre otros en Reetz MT y Jaeger K-E (1999), Topics Curr Chem 200:31; Zhao H, Moore JC, Volkov AA, Arnold FH (1999), Methods for optimizing industrial enzymes by directed evolution, en: Demain AL, Davies JE (Hrsg.) Manual of industrial microbiology and biotechnology. American Society for Microbiology) puede generar el experto también de manera dirigida y también a gran escala mutantes funcionales. A este respecto se generan en una primera etapa en primer lugar bancos de genes de las respectivas proteínas, pudiéndose usar por ejemplo los procedimientos indicados anteriormente. Los bancos de genes se expresan de manera adecuada, por ejemplo mediante bacterias o mediante sistemas de presentación en fagos.
Los respectivos genes de organismos huéspedes, que expresan mutantes funcionales con propiedades que se corresponden con las propiedades deseadas, pueden someterse a otra ronda de mutación. Las etapas de la mutación y de la selección o del cribado pueden repetirse de manera iterativa hasta que los mutantes funcionales existentes presenten las propiedades deseadas en medida suficiente. Mediante este modo de trabajo iterativo pueden realizarse gradualmente un número limitado de mutaciones, tal como por ejemplo 1, 2, 3, 4 o 5 mutaciones, y pueden evaluarse para determinar su influencia sobre la respectiva propiedad de enzima y pueden seleccionarse. El mutante seleccionado puede someterse entonces de igual manera a otra etapa de mutación. Mediante esto puede reducirse significativamente el número de mutantes individuales que van a someterse a estudio.
Los resultados de acuerdo con la invención proporcionan también importante información en relación a la estructura y secuencia de las respectivas enzimas, que son necesarias para generar de manera dirigida otras enzimas con propiedades modificadas deseadas. En particular pueden definirse los denominados "hot spots", es decir fragmentos de secuencia que son potencialmente adecuados para modificar una propiedad de enzima a través de la introducción de mutaciones dirigidas.
Igualmente puede deducirse información con respecto a posiciones de secuencias de aminoácidos, en cuya región pueden realizarse mutaciones que debían tener previsiblemente poca influencia sobre la actividad enzimática, y pueden designarse como mutaciones potencialmente "silenciosas".
3.3 Constructos
Además son objeto de la invención constructos de expresión, en particular recombinantes, que contienen bajo el control genético de secuencias de ácido nucleico reguladoras una secuencia de ácido nucleico que codifica un polipéptido de acuerdo con la invención; así como vectores, en particular recombinantes, que comprenden al menos uno de estos constructos de expresión.
Por una "unidad de expresión" se entiende de acuerdo con la invención un ácido nucleico con actividad de expresión, que comprende un promotor, tal como se ha definido en el presente documento, y tras unión funcional con un ácido nucleico que va a expresarse o un gen, regula la expresión, o sea la transcripción y la traducción de este ácido nucleico o de este gen. Por tanto se habla también en este contexto de una "secuencia de ácido nucleico reguladora". Adicionalmente al promotor pueden estar contenidos otros elementos reguladores, tales como por ejemplo potenciadores.
Por un "casete de expresión" o "constructo de expresión" se entiende de acuerdo con la invención una unidad de expresión que se une funcionalmente con el ácido nucleico que va a expresarse o el gen que va a expresarse. A diferencia de una unidad de expresión comprende un casete de expresión por consiguiente no solo secuencias de ácido nucleico, que regulan la transcripción y traducción, sino también las secuencias de ácido nucleico que deben expresarse como proteína como consecuencia de la transcripción y traducción.
Los términos "expresión" o "sobreexpresión" describen en el contexto de la invención la producción o bien el aumento de la actividad intracelular de una o varias enzimas en un microorganismo, que se codifican por el correspondiente ADN. Para ello puede introducir por ejemplo un gen en un organismo, puede sustituirse un gen existente por otro gen, puede elevarse el número de copias del gen o bien de los genes, puede usarse un promotor fuerte o puede usarse un gen que codifica una correspondiente enzima con una alta actividad y pueden combinarse dado el caso estas medidas.
Preferentemente tales constructos de acuerdo con la invención comprenden en el sentido de 5' de la respectiva secuencia codificante un promotor y en el sentido 3' una secuencia de terminación así como dado el caso otros elementos reguladores habituales, y concretamente en cada caso enlazados de manera operativa con la secuencia codificante.
Por un "promotor", un "ácido nucleico con actividad de promotor" o una "secuencia de promotor" se entiende un ácido nucleico de acuerdo con la invención, que en enlace funcional con un ácido nucleico que va a transcribirse regula la transcripción de este ácido nucleico.
Por un enlace "funcional" u "operativo" se entiende en este contexto por ejemplo la disposición secuencial de uno de los ácidos nucleicos con actividad de promotor y una secuencia de ácido nucleico que va a transcribirse y dado el caso otros elementos reguladores, tal como por ejemplo secuencias de ácido nucleico que garantizan la transcripción de ácidos nucleicos, así como por ejemplo un terminador, de manera que cada uno de los elementos reguladores pueda cumplir su función en la transcripción de la secuencia de ácido nucleico. Para ello no es realmente necesario un enlace directo en el sentido químico. Las secuencias de control genéticas, tal como por ejemplo secuencias de potenciador, pueden ejercer su función también desde posiciones más alejadas o incluso desde otras moléculas de ADN sobre la secuencia diana. Se prefieren disposiciones, en las que la secuencia de ácido nucleico que va a transcribirse se posiciona detrás (es decir en el extremo 3') de la secuencia de promotor, de modo que ambas secuencias están unidas entre sí de manera covalente. A este respecto, la distancia entre la secuencia de promotor y la secuencia de ácido nucleico que va a expresarse de manera transgénica puede ser inferior a 200 pares de bases, o inferior a 100 pares de bases o inferior a 50 pares de bases.
Además de los promotores y terminador pueden mencionarse como ejemplos de otros elementos reguladores secuencias de selección como diana, potenciadores, señales de poliadenilación, marcadores que pueden seleccionarse, señales de amplificación, orígenes de replicación y similares. Las secuencias reguladoras adecuadas se han descrito por ejemplo en Goeddel, Gene Expression Technology: Methods in Enzymology 185, Academic Press, San Diego, CA (1990).
Los constructos de ácido nucleico de acuerdo con la invención comprenden en particular una secuencia que codifica un mutante de ciclasa, por ejemplo derivada de SEQ ID NO: 1 o que codifica un mutante de SEQ ID NO: 2 a 326 o derivados y homólogos del mismo, así como las secuencias de ácido nucleico que pueden derivarse de esto, que se enlazan operativa o funcionalmente con una o varias señales de regulación ventajosamente para el control, por ejemplo aumento, de la expresión génica.
Adicionalmente a estas secuencias de regulación puede estar presente aún la regulación natural de estas secuencias delante de los verdaderos genes estructurales y dado el caso puede haberse modificado genéticamente, de modo que se haya desconectado la regulación natural y se haya elevado la expresión de los genes. El constructo de ácido nucleico puede estar constituido sin embargo también de manera más sencilla, es decir no se insertaron señales de regulación adicionales delante de la secuencia codificante y no se separó el promotor natural con su regulación. En lugar de esto se muta la secuencia de regulación natural de modo que ya no se realice ninguna regulación y aumente la expresión génica.
Un constructo de ácido nucleico preferente contiene ventajosamente también una o varias de las secuencias de "potenciador" ya mencionadas, enlazadas funcionalmente con el promotor, que permiten una expresión elevada de la secuencia de ácido nucleico. También en el extremo 3' de las secuencias de ADN pueden insertarse secuencias ventajosas adicionales, tal como otros elementos reguladores o terminadores. Los ácidos nucleicos de acuerdo con la invención pueden estar contenidos en una o varias copias en el constructo. En el constructo pueden estar contenidos aún otros marcadores, tal como genes que complementan las resistencias a antibióticos o auxotrofias, dado el caso para la selección en el constructo.
Ejemplos de secuencias de regulación adecuadas están contenidas en promotores tal como cos-, tac-, trp-, tet-, trptet-, lpp-, lac-, lpp-lac-, lacIq- T7-, T5-, T3-, gal-, trc-, ara-, rhaP (rhaPBAD)SP6-, lambda-PR- o en promotor lambda-PL, que se usan ventajosamente en bacterias gram-negativas. Otras secuencias de regulación ventajosas están contenidas por ejemplo en los promotores gram-positivos amy y SPO2, en los promotores de levadura u hongo ADC1, MFalpha, AC, P-60, CYC1, GAPDH, TEF, rp28, Ad H. Pueden usarse también promotores sintéticos para la regulación.
El constructo de ácido nucleico se inserta para la expresión en un organismo huésped ventajosamente en un vector, tal como por ejemplo un plásmido o un fago, que permite una expresión óptima de los genes en el huésped. Por vectores ha de entenderse aparte de plásmidos y fagos también todos los otros vectores conocidos por el experto, o sea por ejemplo virus, tal como SV40, CMV, baculovirus y adenovirus, transposones, elementos IS, fásmidos, cósmidos y a Dn lineal o circular. Estos vectores pueden replicarse de manera autónoma en el organismo huésped o pueden replicarse de manera cromosómica. Estos vectores representan otra configuración de la invención.
Los plásmidos adecuados son por ejemplo en E. coli pLG338, pACYC184, pBR322, pUC18, pUC19, pKC30, pRep4, pHS1, pKK223-3, pDHE19.2, pHS2, pPLc236, pMBL24, pLG200, pUR290, pIN-III113-B1, Agt11 o pBdCI, en Streptomyces pIJ101, pIJ364, pIJ702 o pIJ361, en Bacillus pUB110, pC194 o pBD214, en Corynebacterium pSA77 o pAJ667, en hongos pALS1, p Ó o pBB116, en levaduras 2alphaM, pAG-1, YEp6, YEp13 o pEMBLYe23 o en plantas pLGV23, pGHlac+, pBIN19, pAK2004 o pDH51. Los plásmidos mencionados representan una pequeña selección de los posibles plásmidos. Otros plásmidos se conocen bien por el experto y pueden deducirse por ejemplo del Buch Cloning Vectors (Eds. Pouwels P. H. y col. Elsevier, Amsterdam-New York-Oxford, 1985, ISBN 0444904018).
En otra forma de configuración del vector puede introducirse el vector que contiene el constructo de ácido nucleico de acuerdo con la invención o el ácido nucleico de acuerdo con la invención también ventajosamente en forma de un ADN lineal en los microorganismos y puede integrarse a través de recombinación heteróloga u homóloga en el genoma del organismo huésped. Este ADN lineal puede estar constituido por un vector linealizado tal como un plásmido o solo por el constructo de ácido nucleico o el ácido nucleico de acuerdo con la invención.
Para una expresión óptima de genes heterólogos en organismos es ventajoso modificar las secuencias de ácido nucleico de manera correspondiente al "uso de codón" específico usado en el organismo. El "uso de codón" puede determinarse fácilmente por medio de evaluaciones informáticas de otros genes conocidos del respectivo organismo.
La preparación de un casete de expresión de acuerdo con la invención se realiza mediante fusión de un promotor adecuado con una secuencia de nucleótidos codificante adecuada así como una señal de terminador o de poliadenilación. Para ello se usan técnicas de recombinación y clonación habituales, tal como se describen por ejemplo en T. Maniatis, E.F. Fritsch y J. Sambrook, Molecular Cloning: A Laboratory Manual, Cold Spring Harbor Laboratory, Cold Spring Harbor, NY (1989) así como en T.J. Silhavy, M.L. Berman y L.W. Enquist, Experiments with Gene Fusions, Cold Spring Harbor Laboratory, Cold Spring Harbor, NY (1984) y en Ausubel, F.M. y col., Current Protocols in Molecular Biology, Greene Publishing Assoc. and Wiley Interscience (1987).
El constructo de ácido nucleico o bien constructo de gen recombinante se inserta para la expresión en un organismo huésped adecuado ventajosamente en un vector específico del huésped, que permite una expresión óptima de los genes en el huésped. Los vectores se conocen bien por el experto y pueden deducirse por ejemplo de "Cloning Vectors" (Pouwels P. H. y col., Hrsg, Elsevier, Amsterdam-New York-Oxford, 1985).
4. Microorganismos
Dependiendo del contexto puede entenderse por el término "microorganismo" el microorganismo de tipo natural o un microorganismo recombinante, genéticamente modificado o ambos.
Con ayuda de los vectores de acuerdo con la invención pueden prepararse microorganismos recombinantes, que están transformados por ejemplo con al menos un vector de acuerdo con la invención y pueden usarse para la producción de los polipéptidos de acuerdo con la invención. Ventajosamente se introducen los constructos recombinantes de acuerdo con la invención descritos anteriormente en un sistema huésped adecuado y se expresa. A este respecto se usan preferentemente procedimientos de clonación y transfección habituales para el experto, tal como por ejemplo co-precipitación, fusión de protoplastos, electroporación, transfección retroviral y similares, para expresar los mencionados ácidos nucleicos en el respectivo sistema de expresión. Se describen sistemas adecuados por ejemplo en Current Protocols in Molecular Biology, F. Ausubel y col., ed., Wiley Interscience, Nueva York 1997, o Sambrook y col. Molecular Cloning: A Laboratory Manual. 2a ed., Cold Spring Harbor Laboratory, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY, 1989.
Como organismos huéspedes recombinantes para el ácido nucleico de acuerdo con la invención o el constructo de ácido nucleico se tienen en cuenta principalmente todos los organismos procariotas o eucariotas. Ventajosamente se usan como organismos huéspedes microorganismos tal como bacterias, hongos o levaduras. Ventajosamente se usan bacterias gram-positivas o gram-negativas, preferentemente bacterias de las familias Enterobacteriaceae, Pseudomonadaceae, Rhizobiaceae, Streptomycetaceae o Nocardiaceae, de manera especialmente preferente bacterias de los géneros Escherichia, Pseudomonas, Streptomyces, Nocardia, Burkholderia, Salmonella, Agrobacterium, Clostridium o Rhodococcus. Se prefiere muy especialmente el género y especie Escherichia coli. Otras bacterias ventajosas se encuentran además en el grupo de las alfa-proteobacterias, beta-proteobacterias o gammaproteobacterias.
El organismo huésped de acuerdo con la invención o los organismos huéspedes de acuerdo con la invención contienen a este respecto preferentemente al menos una de las secuencias de ácido nucleico descritas en esta invención, constructos de ácido nucleico o vectores, que codifican una enzima con actividad feniletanol deshidrogenasa de acuerdo con la definición anterior.
Los organismos usados en el procedimiento de acuerdo con la invención se colocan o se cultivan dependiendo del organismo huésped de manera conocida para el experto. Los microorganismos se colocan por regla general en un medio líquido, que contiene una fuente de carbono en la mayoría de los casos en forma de azúcares, una fuente de nitrógeno en la mayoría de los casos en forma de fuentes de nitrógeno orgánicas tal como extracto de levadura o sales tal como sulfato de amonio, oligoelementos tal como sales de hierro, manganeso, magnesio y dado el caso vitaminas, a temperaturas entre 0 °C y 100 °C, preferentemente entre 10 °C a 60 °C con gasificación con oxígeno. A este respecto puede mantenerse el pH del líquido nutriente a un valor fijo, es decir, puede regularse durante el cultivo o no. El cultivo puede realizarse de manera "discontinua", de manera "semi continua" o de manera continua. Los nutrientes pueden disponerse al comienzo de la fermentación o pueden alimentarse posteriormente de manera semicontinua o de manera continua.
5. Preparación recombinante de enzimas de acuerdo con la invención
Son objeto de la invención además procedimientos para la preparación recombinante de polipéptidos de acuerdo con la invención o fragmentos funcionales, biológicamente activos de los mismos, cultivándose un microorganismo que produce polipéptidos, dado el caso induciéndose la expresión de los polipéptidos y aislándose éstos del cultivo. Los polipéptidos pueden producirse así también a escala técnica, en el caso de que esto sea necesario.
Los microorganismos preparados de acuerdo con la invención pueden cultivarse de manera continua o de manera discontinua en un procedimiento por lotes (cultivos de juegos) o en alimentación discontinua (procedimiento de alimentación) o procedimiento discontinuo de alimentación repetida (procedimiento de alimentación repetitiva). Una resumen de procedimientos de cultivo conocidos puede encontrarse en el libro de texto de Chmiel (BioprozelJtechnik 1. Einführung in die Bioverfahrenstechnik (Gustav Fischer Verlag, Stuttgart, 1991)) o en el libro de texto de Storhas (Bioreaktoren und periphere Einrichtungen (Vieweg Verlag, Braunschweig/Wiesbaden, 1994)).
El medio de cultivo que va a usarse ha de cumplir de manera adecuada los requerimientos de las respectivas cepas. Descripciones de medios de cultivo de distintos microorganismos están contenidos en el manual "Manual of Methods für General Bacteriology" der American Society für Bacteriology (Washington D. C., USA, 1981).
Estos medios que pueden usarse de acuerdo con la invención comprenden habitualmente una o varias fuentes de carbono, fuentes de nitrógeno, sales inorgánicas, vitaminas y/u oligoelementos.
Las fuentes de carbono preferentes son azúcares, tal como nono-, di- o polisacáridos. Fuentes de carbono muy buenas son por ejemplo glucosa, fructosa, manosa, galactosa, ribosa, sorbosa, ribulosa, lactosa, maltosa, sacarosa, rafinosa, almidón o celulosa. Pueden añadirse a los medios azúcares también a través de compuestos complejos, tal como melazas, u otros productos secundarios del refinado de azúcar. Puede ser ventajoso también añadir mezclas de distintas fuentes de carbono. Otras fuentes de carbono posibles son aceites y grasas tal como por ejemplo aceite de soja, aceite de girasol, aceite de cacahuete y grasa de coco, ácidos grasos tal como por ejemplo ácido palmítico, ácido esteárico o ácido linoleico, alcoholes tal como por ejemplo glicerina, metanol o etanol y ácidos orgánicos tal como por ejemplo ácido acético o ácido láctico.
Las fuentes de nitrógeno son habitualmente compuestos de nitrógeno orgánicos o inorgánicos o materiales que contienen estos compuestos. Las fuentes de nitrógeno a modo de ejemplo comprenden gas amoníaco o sales de amonio, tales como sulfato de amonio, cloruro de amonio, fosfato de amonio, carbonato de amonio o nitrato de amonio, nitratos, urea, aminoácidos o fuentes de nitrógeno complejas, tal como licor de maíz fermentado, harina de soja, proteína de soja, extracto de levadura, extracto de pescado y otros. Las fuentes de nitrógeno pueden usarse individualmente o como mezcla.
Los compuestos de sal inorgánicos, que pueden estar contenidos en los medios, comprenden las sales de cloruro, fósforo o sulfato de calcio, magnesio, sodio, cobalto, molibdeno, potasio, manganeso, zinc, cobre y hierro.
Como fuente de azufre pueden usarse compuestos que contienen azufre inorgánicos tal como por ejemplo sulfatos, sulfitos, ditionitos, tetrationatos, tiosulfatos, sulfuros sin embargo también compuestos de azufre orgánicos, tal como mercaptanos y tioles, .
Como fuente de fósforo pueden usarse ácido fosfórico, dihidrogenofosfato de potasio o hidrogenofosfato de dipotasio o las correspondientes sales que contienen sodio.
Los agentes formadores de quelato pueden añadirse al medio, para mantener los iones metálicos en solución. Los agentes formadores de quelato especialmente adecuados comprenden dihidroxifenoles, tal como catecol o protocatecuat, o ácidos orgánicos, tal como ácido cítrico.
Los medios de fermentación usados de acuerdo con la invención contienen habitualmente también otros factores de crecimiento, tal como vitaminas o agentes favorecedores del crecimiento, a los que pertenecen por ejemplo biotina, riboflavina, tiamina, ácido fólico, ácido nicotínico, pantotenato y piridoxina. Los factores de crecimiento y sales proceden con frecuencia de componentes de medios complejos, tal como extracto de levadura, melazas, licor de maíz fermentado y similares. Al medio de cultivo pueden añadirse además precursores adecuados. La composición exacta de los compuestos de medios depende mucho del respectivo experimento y se decide individualmente para cada caso específico. La información sobre la optimización de medios puede obtenerse del libro de texto "Applied Microbiol. Physiology, A Practical Approach" (Hrsg. P.M. Rhodes, P.F. Stanbury, IRL Press (1997) S. 53-73, ISBN 019963577 3). Los medios de crecimiento pueden adquirirse también de proveedores comerciales, tal como Standard 1 (Merck) o BHI (Brain heart infusion, DIFCO) y similares.
Todos los componentes de medios se esterilizan, o bien mediante calor (20 min a 150 kPa y 121°C) o mediante esterilización por filtración. Los componentes pueden esterilizarse o bien juntos o en caso necesario por separado. Todos los componentes de medios pueden estar presentes al comienzo del cultivo o pueden opcionalmente de manera continua o a modo de cargas.
La temperatura del cultivo se encuentra normalmente entre 15°C y 45°C, preferentemente a de 25°C a 40°C y puede mantenerse constante o modificarse durante el experimento. El valor de pH del medio debía encontrarse en el intervalo de 5 a 8,5, preferentemente en 7,0. El valor de pH para el cultivo puede controlarse durante el cultivo mediante adición de compuestos básicos tal como hidróxido de sodio, hidróxido de potasio, amoníaco o bien agua amoniacal o compuestos ácidos tal como ácido fosfórico o ácido sulfúrico. Para el control del desarrollo de espuma pueden usarse agentes antiespumantes, tal como por ejemplo éster de poliglicol de ácido graso. Para el mantenimiento de la estabilidad de plásmidos pueden añadirse al medio sustancias de acción selectiva adecuadas, tal como por ejemplo antibióticos. Para mantener condiciones aeróbicas, se introducen en el cultivo oxígeno o mezclas de gases que contienen oxígeno, tal como por ejemplo aire ambiente. La temperatura del cultivo se encuentra normalmente a de 20°C a 45°C. El cultivo se continúa hasta que se haya formado un máximo del producto deseado. Este objetivo se alcanza normalmente en el intervalo de 10 horas a 160 horas.
Los caldos de fermentación se procesan a continuación. Dependiendo del requerimiento puede separarse la biomasa total o parcialmente mediante procedimientos de separación, tal como por ejemplo centrifugación, filtración, decantación o una combinación de estos procedimientos del cal de fermentación o puede dejarse completamente en éste.
Las células pueden disgregarse también, en el caso de que no se segreguen los polipéptidos en el medio de cultivo, y puede obtenerse el producto según procedimientos de aislamiento de proteínas conocido a partir del lisado. Las células pueden disgregarse opcionalmente mediante ultrasonido de alta frecuencia, mediante alta presión, tal como por ejemplo en una célula de presión francesa, mediante osmólisis, mediante acción de detergentes, enzimas líticas o disolventes orgánicos, mediante homogeneizadores o mediante combinación de varios de los procedimientos expuestos.
Una purificación de los polipéptidos puede conseguirse con procedimientos cromatográficos conocidos, tal como cromatografía de tamiz molecular (filtración en gel), tal como cromatografía de Q-Sepharose, cromatografía de intercambio iónico y cromatografía hidrófoba, así como con otros procedimientos habituales tal como ultrafiltración, cristalización, precipitación mediante sales, diálisis y electroforesis en gel nativa. Procedimientos adecuados se describen por ejemplo en Cooper, T. G., Biochemische Arbeitsmethoden, Verlag Walter de Gruyter, Berlin, New York o en Scopes, R., Protein Purification, Springer Verlag, Nueva York, Heidelberg, Berlin.
Puede ser ventajoso, para el aislamiento de la proteína recombinante, usar sistemas de vector u oligonucleótidos que alarguen el ADNc en determinadas secuencias de nucleótidos y con ello codifiquen polipéptidos modificados o proteínas de fusión, que sirven por ejemplo para una purificación más sencilla. Las modificaciones adecuadas de este tipo son por ejemplo las denominadas "etiquetas" que actúan como ancla, tal como por ejemplo la modificación o epítopo conocidos como ancla de hexa-histidina, que pueden reconocerse como antígenos por anticuerpos (se describen por ejemplo en Harlow, E. and Lane, D., 1988, Antibodies: A Laboratory Manual. Cold Spring Harbor (N.Y.) Press). Estas anclas pueden servir para el anclaje de las proteínas en un soporte sólido, tal como por ejemplo una matriz polimérica, que puede introducirse por ejemplo en una columna de cromatografía, o puede usarse en una placa de microtitulación o en otro soporte.
Al mismo tiempo pueden usarse estas anclas también para el reconocimiento de las proteínas. Para el reconocimiento de las proteínas pueden usarse además marcadores habituales, tal como colorantes de fluorescencia, marcadores enzimáticos, que tras la reacción con un sustrato forman un producto de reacción que puede detectarse, o marcadores radiactivos, solos o en combinación con las anclas para la derivatización de las proteínas.
Para la expresión de mutantes de acuerdo con la invención puede recurrirse a la descripción de la expresión de la enzima de tipo natural EbN1 y de los sistemas de expresión que pueden usarse para ello en el documento WO2005/108590 y el documento WO2006/094945.
6. Inmovilización de enzimas
Las enzimas de acuerdo con la invención pueden usarse en los procedimientos descritos en el presente documento de manera libre o inmovilizadas. Por una enzima inmovilizada se entiende una enzima que está fijada a un soporte inerte. Los materiales de soporte adecuados así como las enzimas inmovilizadas sobre éstos se conocen por los documentos EP-A-1149849, EP-A-1 069 183 y el documento DE-OS 100193773 así como por las citas bibliográficas citadas en los mismos. A este respecto se hace referencia a la divulgación de estos documentos en su totalidad. A los materiales de soporte adecuados pertenecen por ejemplo arcillas, minerales de arcilla, tales como caolinita, tierras de diatomeas, perlita, dióxido de silicio, óxido de aluminio, carbonato de sodio, carbonato de calcio, polvos de celulosa, materiales de intercambio aniónico, polímeros sintéticos, tales como poliestireno, resinas acrílicas, resinas de fenolformaldehído, poliuretanos y poliolefinas, tales como polietileno y polipropileno. Los materiales de soporte se emplean para la preparación de las enzimas soportadas habitualmente en una forma particulada, finamente dividida, prefiriéndose formas porosas. El tamaño de partícula del material de soporte asciende habitualmente a no más de 5 mm, en particular no más de 2 mm (curva granulométrica). De manera análoga, en el caso del uso de la deshidrogenasa como catalizador de célula completa, puede seleccionarse una forma libre o inmovilizada. Materiales de soporte son por ejemplo alginato de Ca, y carragenano. Enzimas como también células pueden reticularse también directamente con glutaraldehído (reticulación para dar CLEA). Correspondientes procedimientos de inmovilización y otros se describen por ejemplo en J. Lalonde y A. Margolin "Immobilization of Enzymes" " en K. Drauz y H. Waldmann, Enzyme Catalysis in Organic Synthesis 2002, vol. III, 991-1032, Wiley-VCH, Weinheim. Se encuentra información adicional con respecto a las biotransformaciones y bioreactores para la realización de procedimientos de acuerdo con la invención por ejemplo también en Rehm y col.(Ed) Biotechology, 2a ed., vol 3, capítulo 17, VCH, Weinheim.
7. Ciclación enzimática de terpenos
7.1 Descripción general
En particular se realiza el procedimiento de ciclación de acuerdo con la invención en presencia de un mutante de enzima, codificándose la enzima por una secuencia de ácido nucleico, siendo parte constituyente de un constructo génico o vector. Tales constructos génicos o vectores se describen en detalle en la solicitud internacional PCT/EP2010/057696 en las páginas 16 a 20, a lo que se hace referencia expresamente en el presente documento. Los equivalentes funcionales de este tipo, en particular aquéllos con actividad citronelal-isopulegol-ciclasa, comprenden en particular una mutación de F486 o análoga a F486, tal como se define en el presente documento.
La célula huésped, que contiene un constructo génico o un vector, en el que está contenida la secuencia de ácido nucleico, que codifica la enzima con la actividad deseada, se designa también como organismo transgénico. La preparación de tales organismos transgénicos se conoce en principio y se discute por ejemplo en la solicitud internacional PCT/EP2010/057696 en la página 20.
Como organismos transgénicos se seleccionan preferentemente células del grupo que está constituido por bacterias, cianobacterias, hongos y levaduras. Preferentemente la célula se selecciona de hongos del género Pichia o bacterias de los géneros Escherichia, Corynebacterium, Ralstonia, Clostridium, Pseudomonas, Bacillus, Zymomonas, Rhodobacter, Streptomyces, Burkholderia, Lactobacillus o Lactococcus. De manera especialmente preferente, la célula se selecciona de bacterias de las especies Escherichia coli, Pseudomonas putida, Burkholderia glumae, Streptomyces lividans, Streptomyces coelicolor o Zymomonas mobilis.
Se prefiere un procedimiento de acuerdo con la invención, caracterizado porque la enzima con la actividad de una citronelal-isopulegol-ciclasa se codifica por un gen, se aisló de un microorganismo, seleccionado entre Zymomonas mobilis, Methylococcus capsulatus, Rhodopseudomonas palustris, Bradyrhizobium japonicum, Frankia spec, Streptomyces coelicolor así como Acetobacter pasteurianus. Especialmente pueden mencionarse los respectivos genes aislados de Zymomonas mobilis, Streptomyces coelicolor, Bradyrhizobium japonicum y Acetobacter pasteurianus.
Además se prefiere un procedimiento de acuerdo con la invención, caracterizado porque la enzima con la actividad ciclasa se generó por un microorganismo que sobreproduce la enzima y que se seleccionó del grupo de los microorganismos que está constituido por los géneros Escherichia, Corynebacterium, Ralstonia, Clostridium, Pseudomonas, Bacillus, Zymomonas, Rhodobacter, Streptomyces, Burkholderia, Lactobacillus y Lactococcus.
Especialmente ha de mencionarse un procedimiento de acuerdo con la invención, caracterizado porque la enzima con la actividad ciclasa se generó por microorganismos transgénicos de las especies Escherichia coli, Pseudomonas putida, Burkholderia glumae, Corynebacterium glutamicum, Saccharomyces cerevisiae, Pichia pastoris, Streptomyces lividans, Streptomyces coelicolor, Bacillus subtilis o Zymomonas mobilis, que sobreproducen la enzima con la actividad ciclasa.
Otras configuraciones para la realización del procedimiento de ciclación biocatalítico de acuerdo con la invención, tal como por ejemplo del procedimiento para la preparación de isopulegol:
El procedimiento de acuerdo con la invención está caracterizado porque la enzima se encuentra en al menos una de las siguientes formas:
a) polipéptido libre, dado el caso purificado o parcialmente purificado;
b) polipéptido inmovilizado;
c) polipéptido aislado a partir de células de acuerdo con a) o b);
d) célula completa, dado el caso células quiescentes o crecientes, que contienen al menos un polipéptido de este tipo;
e) lisado u homogeneizado de las células de acuerdo con d).
Otra forma de realización del procedimiento de acuerdo con la invención está caracterizada porque las células son microorganismos, preferentemente microorganismos transgénicos que expresan al menos una molécula heteróloga de ácido nucleico que codifica un polipéptido con la actividad ciclasa.
Una forma de realización preferente del procedimiento de acuerdo con la invención comprende al menos las siguientes etapas a), b) y d):
a) aislar un microorganismo que produce una enzima con actividad ciclasa a partir de una fuente natural o prepararlo de manera recombinante,
b) multiplicar estos microorganismos,
c) dado el caso aislar de los microorganismos la enzima con actividad ciclasa o preparar una fracción de proteína que contiene esta enzima, y
d) transferir el microorganismo de acuerdo con la etapa b) o la enzima de acuerdo con la etapa c) a un medio que contiene sustrato, por ejemplo citronelal de fórmula general (I).
En el procedimiento de acuerdo con la invención se lleva a contacto el sustrato, tal como por ejemplo citronelal, con la enzima que tiene la actividad de una citronelal-isopulegol-ciclasa, en un medio y/o se incuba de modo que se realice una reacción del sustrato, tal como por ejemplo de citronelal, para dar isopulegol, en presencia de la enzima. Preferentemente, en el caso del medio se trata de un medio de reacción acuoso.
El valor de pH del medio de reacción acuoso, en el que se realiza preferentemente el procedimiento de acuerdo con la invención, se mantiene a este respecto ventajosamente entre pH 4 y 12, preferentemente entre pH 4,5 y 9, de manera especialmente preferente entre pH 5 y 8.
En el caso de los medios de reacción acuosos se trata preferentemente de soluciones tamponadas, que por regla general presentan un valor de pH de preferentemente de 5 a 8. Como tampón puede usarse un tampón citrato, fosfato, TRIS-(tris(hidroximetil)-aminometano) o MES (ácido 2-(N-morfolino)etanosulfónico). Asimismo el medio de reacción puede contener también aditivos adicionales, tales como por ejemplo detergentes (por ejemplo taurodesoxicolato).
El sustrato, tal como por ejemplo citronelal, se usan preferentemente en una concentración de 2 - 200 mM, de manera especialmente preferente de 5 - 25 mM en la reacción enzimática y puede seguirse de manera continua o discontinua.
La ciclación enzimática tiene lugar por regla general a una temperatura de reacción por debajo de la temperatura de desactivación de la enzima usada y por encima de -10°C. Preferentemente se realiza el procedimiento de acuerdo con la invención a una temperatura entre 0°C y 95°C, de manera especialmente preferente a una temperatura entre 15°C y 60°C, en particular entre 20 y 40°C, por ejemplo a de aproximadamente 25 a 30 °C.
Se prefiere especialmente un procedimiento de acuerdo con la invención, en el que la reacción de citronelal para dar isopulegol tiene lugar a una temperatura en el intervalo de 20 a 40 °C y/o un valor de pH en el intervalo de 4 a 8.
Junto a estos sistemas acuosos de una sola fase, en otra variante de la invención se emplean también sistemas de dos fases. A este respecto se usan además de una fase acuosa como segunda fase, medios de reacción orgánicos, no miscibles en agua. De esta manera los productos de reacción se acumulan en la fase orgánica. Tras la reacción puede separarse el producto, tal como por ejemplo isopulegol, en la fase orgánica fácilmente de la fase acuosa que contiene el biocatalizador.
Se prefiere un procedimiento de acuerdo con la invención, caracterizado porque la preparación de isopulegol tiene lugar en sistemas acuosos de una sola fase o en sistemas de dos fases.
El producto de reacción, tal como por ejemplo isopulegol, puede extraerse con disolventes orgánicos y dado el caso puede destilarse para la purificación.
Disolventes orgánicos adecuados son por ejemplo hidrocarburos alifáticos, preferentemente con 5 a 8 átomos de carbono, tales como pentano, ciclopentano, hexano, ciclohexano, heptano, octano o ciclooctano, hidrocarburos alifáticos halogenados, preferentemente con uno o dos átomos de carbono, tales como diclorometano, cloroformo, tetracloruro de carbono, dicloroetano o tetracloroetano, hidrocarburos aromáticos, tales como benceno, tolueno, los xilenos, clorobenceno o diclorobenceno, éteres alifáticos acíclicos y cíclicos o alcoholes, preferentemente con 4 a 8 átomos de carbono, tales como etanol, isopropanol, dietil éter, metil-terc-butil éter, etil-terc-butil éter, dipropil éter, diisopropil éter, dibutil éter, tetrahidrofurano o ésteres tales como acetato de etilo o acetato de n-butilo o cetonas tales como metilisobutil cetona o dioxano o mezclas de los mismos. De manera especialmente preferente se usan el heptano, metil-tercbutiléter, diisopropil éter, tetrahidrofurano, acetato de etilo mencionados anteriormente.
Las ciclasas usadas de acuerdo con la invención pueden usarse en el procedimiento de acuerdo con la invención como enzima libre o inmovilizada, tal como se ha descrito ya anteriormente .
Para el procedimiento de acuerdo con la invención pueden usarse células quiescentes o crecientes, libres o inmovilizadas, que contienen ácidos nucleicos, constructos de ácido nucleico o vectores que codifican la ciclasa. También pueden usarse células disgregadas, tal como lisados celulares o homogeneizados celulares. Por células disgregadas se entienden por ejemplo células que se han hecho permeables a través de un tratamiento con por ejemplo disolventes, o células que se han roto a través de un tratamiento enzimático, a través de un tratamiento mecánico (por ejemplo prensa francesa o ultrasonidos) o a través de otro método. Los extractos brutos así obtenidos son adecuados de manera ventajosa para el procedimiento de acuerdo con la invención. También pueden usarse para el procedimiento enzimas purificadas o parcialmente purificadas.
Si se usan para el procedimiento de acuerdo con la invención organismos o enzimas libres, entonces se separan éstos antes de la extracción de manera conveniente, por ejemplo a través de una filtración o centrifugación.
El procedimiento de acuerdo con la invención puede hacerse funcionar de manera discontinua, de manera semicontinua o de manera continua.
7.2. Ciclación enzimática de citronelal
El citronelal de fórmula (II) usado de acuerdo con la invención, que se hace reaccionar por medio de un mutante de enzima con actividad citronelal-isopulegol-ciclasa, puede obtenerse comercialmente tanto como R(+)-citronelal de fórmula (R-II) como también como S(-)-citronelal de fórmula (S-II) como también como racemato de fórmula (II).
Figure imgf000030_0001
El isopulegol de fórmula (I) formado de acuerdo con la invención
Figure imgf000030_0002
tiene en las posiciones 1, 3 y 6 en cada caso un estereocentro, de modo que son concebibles en principio 4 diastereómeros distintos con en cada caso 2 enantiómeros, o sea en total 8 estereoisómeros, cuando se parte del racemato del citronelal de fórmula (I).
Figure imgf000030_0003
Como enzimas con la actividad de una citronelal-isopulegol-ciclasa se mencionan las transferasas intramoleculares de la subclase de las isomerasas; o sea proteínas con el código enzimático EC 5.4 (código enzimático de acuerdo con Eur. J. Biochem. 1999, 264, 610-650). En particular se trata de representantes con el código enzimático 5.4.99.17. Como enzimas con la actividad de una citronelal-isopulegol-ciclasa se mencionan en particular también aquellas ciclasas que provocan también la ciclación de homofarnesol para dar ambroxano o de escualeno para dar hopeno y que se describen en detalle en la solicitud internacional PCT/EP2010/057696. De acuerdo con la invención son adecuados los mutantes de enzima descritos en este caso.
Una forma de realización especialmente adecuada del procedimiento de acuerdo con la invención consiste en que el mutante de enzima usado en el procedimiento de acuerdo con la invención con la actividad de una citronelalisopulegol-ciclasa tiene una secuencia de polipéptidos en la que hasta el 25 % de los restos de aminoácido están modificados en comparación con SEQ ID NO:2 mediante deleción, inserción, sustitución o una combinación de los mismos, y que presenta aún al menos el 50 % de la actividad enzimática de SEQ ID NO:2.
Enzimas con actividad citronelal-isopulegol-ciclasa, que comprenden una secuencia de aminoácidos de acuerdo con SEQ ID NO: 2, así como "equivalentes funcionales" o análogos de las enzimas (E) divulgadas de manera concreta con actividad citronelal-isopulegol-ciclasa, se describen, tal como se ha mencionado ya anteriormente, en detalle en la solicitud internacional p Ct /EP2010/057696.
En una forma de realización especialmente preferente del procedimiento, la enzima con actividad citronelal-isopulegolciclasa se selecciona entre enzimas que comprenden una secuencia de aminoácidos derivada de SEQ ID NO:2, en la que se han modificado hasta el 25 %, preferentemente hasta el 20 %, de manera especialmente preferente hasta el 15 %, en particular hasta el 10, 9, 8, 7, 6, 5, 4, 3, 2, 1 % de los restos de aminoácido mediante una deleción, una sustitución, una inserción o una combinación de deleción, sustitución e inserción, teniendo las secuencias de polipéptidos modificadas en comparación con SEQ ID NO: 2 aún al menos el 50 %, preferentemente el 65 %, de manera especialmente preferente el 80 %, en particular más del 90 % de la actividad enzimática de SEQ ID NO:2. En este contexto debe entenderse por actividad enzimática de SEQ ID NO:2 la capacidad de ciclar citronelal de fórmula general (II) de manera biocatalítica para dar el correspondiente isopulegol de fórmula (I).
El procedimiento de acuerdo con la invención se realiza preferentemente en presencia de un mutante de enzima, codificándose la enzima por una secuencia de ácido nucleico mutada de manera correspondiente de acuerdo con SEQ ID NO:1 o un equivalente funcional de la misma.
Los equivalentes funcionales describen en principio en este caso secuencias de ácido nucleico que en condiciones estándar hibridan con una secuencia de ácido nucleico o partes de una secuencia de ácido nucleico y son capaces de provocar la expresión de una proteína con las mismas propiedades que las de la enzima con actividad citronelalisopulegol-ciclasa en una célula o un organismo.
Por un equivalente funcional se entienden además también secuencias de ácido nucleico que con una secuencia de ácido nucleico determinada ("secuencia de ácido nucleico original) son homólogas o idénticas hasta un porcentaje definido y que presentan la misma actividad que las secuencias de ácido nucleico originales, asimismo en particular también mutaciones naturales o artificiales de estas secuencias de ácido nucleico.
Las secuencias de ácido nucleico, que pueden usarse para la codificación de las enzimas que pueden usarse en el procedimiento de acuerdo con la invención con actividad citronelal-isopulegol-ciclasa, se describen igualmente en detalle en la solicitud internacional PCT/EP2010/057696.
En particular a este respecto, la secuencia de ácido nucleico es parte constituyente de un constructo génico o vector. Tales constructos génicos o vectores se describen en detalle en la solicitud internacional PCT/EP2010/057696 en las páginas 16 a 20.
De manera muy especialmente preferente se codifica la secuencia de ácido nucleico de acuerdo con SEQ ID NO:1 o un equivalente funcional de la misma, siendo la secuencia de ácido nucleico parte constituyente de un constructo génico o vector, que están contenidos en una célula huésped.
La célula huésped, que contiene un constructo génico o un vector, en el que está contenida la secuencia de ácido nucleico, que codifica la enzima con la actividad citronelal-isopulegol-ciclasa, se designa también como organismo transgénico. La preparación de tales organismos transgénicos se conoce en principio y se discute por ejemplo en la solicitud internacional PCT/EP2010/057696 en la página 20.
Como organismos transgénicos se seleccionan preferentemente células del grupo que está constituido por bacterias, cianobacterias, hongos y levaduras. Preferentemente la célula se selecciona de hongos del género Pichia o bacterias de los géneros Escherichia, Corynebacterium, Ralstonia, Clostridium, Pseudomonas, Bacillus, Zymomonas, Rhodobacter, Streptomyces, Burkholderia, Lactobacillus o Lactococcus. De manera especialmente preferente, la célula se selecciona de bacterias de las especies Escherichia coli, Pseudomonas putida, Burkholderia glumae, Streptomyces lividans, Streptomyces coelicolor o Zymomonas mobilis.
Se prefiere un procedimiento de acuerdo con la invención, caracterizado porque la enzima con la actividad de una citronelal-isopulegol-ciclasa se codifica por un gen, se aisló de un microorganismo, seleccionado del grupo de los microorganismos que está constituido por Zymomonas mobilis, Methylococcus capsulatus, Rhodopseudomonas palustris, Bradyrhizobium japonicum, Frankia spec. y Streptomyces coelicolor. De manera especialmente preferente se aisló el respectivo gen de Zymomonas mobilis.
Además se prefiere un procedimiento de acuerdo con la invención, caracterizado porque la enzima con la actividad de una citronelal-isopulegol-ciclasa se generó por un microorganismo que sobreproduce la enzima con la actividad de una citronelal-isopulegol-ciclase y que se seleccionó del grupo de los microorganismos que está constituido por los géneros Escherichia, Corynebacterium, Ralstonia, Clostridium, Pseudomonas, Bacillus, Zymomonas, Rhodobacter, Streptomyces, Burkholderia, Lactobacillus y Lactococcus.
Se prefiere especialmente un procedimiento de acuerdo con la invención, caracterizado porque la enzima con la actividad de una citronelal-isopulegol-ciclasa se generó por microorganismos transgénicos de las especies Escherichia coli, Pseudomonas putida, Burkholderia glumae, Corynebacterium glutamicum, Saccharomyces cerevisiae, Pichia pastoris, Streptomyces lividans, Streptomyces coelicolor, Bacillus subtilis o Zymomonas mobilis, que sobreproducen la enzima con la actividad de una citronelal-isopulegol-ciclasa.
Las otras configuraciones descritas anteriormente para la realización del procedimiento biocatalítico de acuerdo con la invención para la ciclación de terpenos se aplican de manera correspondiente para la preparación de isopulegol.
Otro objeto de la presente invención es también el uso de un mutante de enzima con la actividad de una citronelalisopulegol-ciclasa para la reacción biocatalítica de citronelal para dar isopulegol.
Se prefiere el uso de un mutante de enzima con la actividad de una citronelal-isopulegol-ciclasa para la reacción biocatalítica de citronelal para dar isopulegol, caracterizado porque la enzima tiene una secuencia de polipéptidos, en la que hasta el 25% de los restos de aminoácido están modificados con respecto a SEQ ID NO:2 mediante deleción, inserción, sustitución o una combinación de los mismos, y que presenta aún al menos el 50 % de la actividad enzimática de SEQ ID NO:2.
Se prefiere también el uso de una enzima con la actividad de una citronelal-isopulegol-ciclasa para la reacción biocatalítica de citronelal para dar isopulegol, caracterizado porque la enzima se codifica por una secuencia de ácido nucleico mutada de manera correspondiente de acuerdo con SEQ ID NO:1 o un equivalente funcional de la misma.
Otro objeto de la presente invención es también el uso de un constructo génico o vector que comprende una secuencia de ácido nucleico de este tipo un equivalente funcional de la misma, que codifican un polipéptido con la actividad de una citronelal-isopulegol-ciclasa, que sirve para la reacción biocatalítica de citronelal para dar isopulegol, en un procedimiento para la preparación de isopulegol mediante ciclación de citronelal.
Igualmente es otro objeto de la presente invención también el uso de una célula huésped, que contiene un constructo génico o un vector, que comprenden una secuencia de ácido nucleico de este tipo o un equivalente funcional de la misma, para la preparación de una enzima con la actividad de una citronelal-isopulegol-ciclasa para la reacción biocatalítica de citronelal para dar isopulegol.
El procedimiento descrito anteriormente abre por primera vez la posibilidad de ciclar citronelal con ayuda de una enzima para dar isopulegol.
8. Procedimiento para la preparación de mentol
El isopulegol preparado de la manera de acuerdo con la invención puede transformarse en mentol de manera en sí conocida mediante hidrogenación catalítica. Para ello son adecuados además de los procedimientos de hidrogenación convencionales, en particular un procedimiento catalítico, tal como se describe en el documento WO 2009/013192.
En particular se usan para la realización del procedimiento de acuerdo con la invención aquellos catalizadores que comprenden
- del 45 al 55 % en peso de compuestos del níquel que contienen oxígeno, calculado como NiO,
- del 25 al 35 % en peso de compuestos del zirconio que contienen oxígeno, calculado como ZrO2 ,
- del 5 al 20 % en peso de compuestos del cobre que contienen oxígeno, calculado como CuO, -- del 1 al 3 % en peso de compuestos del molibdeno que contiene oxígeno, calculado como MoO3 y
- del 0 al 5 % en peso de otros componentes,
complementándose las indicaciones en % en peso para dar el 100 % en peso y refiriéndose al catalizador seco, no reducido.
Un catalizador especialmente preferente está constituido en del 49 al 53 % en peso por NiO, en del 15 al 19 % en peso por CuO, en del 28 al 32 % en peso por ZrO2 y en del 1 al 2 % en peso por MoO3 así como dado el caso en del 0 al 3 % en peso por otros componentes tal como por ejemplo grafito, refiriéndose las proporciones en peso seleccionadas en cada caso de los componentes individuales al catalizador seco, no reducido y complementándose hasta el 100 % en peso. Los catalizadores de este tipo se conocen y pueden prepararse por ejemplo tal como se describe en el documento EP 0696572 o en el documento WO 2009/013192.
En general se usan los catalizadores preferentemente en forma de catalizadores completos. Con el término "catalizador completo" se designa un catalizador que a diferencia con un catalizador de soporte está constituido solo por masa catalíticamente activa. Los catalizadores completos pueden usarse de manera que la masa catalíticamente activa, molida para dar polvo se introduce en el recipiente de reacción o, de manera que la masa catalíticamente activa tras molienda, mezclado con coadyuvantes de moldeo, moldeo y curado posterior como cuerpo moldeado de catalizador - por ejemplo como esferas, cilindros, comprimidos, anillos, espirales, cordones y similares - se dispone en el reactor.
En el contexto de una forma de realización preferentemente del procedimiento de hidrogenación de acuerdo con la invención se usa el catalizador heterogéneo seleccionado en forma de un catalizador de lecho sólido.
Para la realización del procedimiento de acuerdo con la invención se lleva a contacto la sustancia de partida, tal como se ha descrito anteriormente, isopulegol con agua y el catalizador seleccionado. El hidrógeno puede usarse a este respecto de manera no diluida, habitualmente en una pureza de aproximadamente el 99,9 % en volumen o en forma diluida, es decir en forma de mezclas con gases inertes tal como por ejemplo nitrógeno o argón. Preferentemente se usa hidrógeno en forma no diluida. La reacción puede realizarse con buen éxito sin adición de disolventes o en presencia de disolventes orgánicos inertes en las condiciones de reacción, tal como por ejemplo metanol, etanol, isopropanol, hexano, heptano, ciclohexano y similares. Preferentemente se realiza la reacción sin adición de disolventes.
La hidrogenación de acuerdo con la invención de isopulegol puede realizarse con una presión de hidrógeno (absoluta) en el intervalo de 100 a 20.000 kPa, tal como de 200 o 300 a 20.000 kPa, sobre todo de 400 o 500 a 15.000 kPa, tal como de 500 a 10.000 kPa o en el intervalo de 500 a 5.000 kPa. Como temperatura de reacción para la realización de acuerdo con la invención de la hidrogenación se selecciona ventajosamente una temperatura en el intervalo de 20 a 150°C, tal como de 40 a 130°C, o de 60 a 110°C y en particular de 70 a 100°C.
Prácticamente se procede en la realización en general de modo que se alimente el isopulegol que va a reaccionar al catalizador que se encuentra habitualmente en un reactor de lecho sólido en particular calentado desde fuera tal como por ejemplo un reactor tubular, autoclaves o reactor de haz tubular, a la temperatura de reacción deseada y la presión deseada. A este respecto se carga el catalizador en general con 0,1 a 1,0, tal como con 0,1 a 0,6 o con 0,2 a 0,4 kg de isopulegol por kg de catalizador y por hora. En este sentido puede ser conveniente calentar el isopulegol que va a usarse ya antes de la alimentación en el recipiente de reacción o bien el reactor y concretamente de manera preferente hasta la temperatura de reacción.
El reactor puede hacerse funcionar tanto en el modo de conducción de fondo como también en el modo de conducción de goteo, es decir pueden conducirse las sustancias de partida tanto de abajo arriba como también de arriba a abajo por el reactor. El procedimiento de hidrogenación de acuerdo con la invención puede realizarse tanto de manera discontinua como también de manera continua. En ambos casos puede conducirse al circuito el producto de partida que no ha reaccionado junto con el hidrógeno.
La hidrogenación de acuerdo con la invención puede realizarse también gradualmente en una cascada de varios, es decir de 2 a por regla general 4, tal como por ejemplo 2 o 3 reactores conectados uno detrás de otro, preferentemente reactores de lecho sólido. A este respecto, en el primer reactor, designado habitualmente como reactor principal se consigue en las condiciones de reacción descritas anteriormente la conversión principal de la reacción y se alimenta el producto bruto obtenido a un segundo reactor, designado habitualmente como reactor secundario, en el que el material de partida que aún no ha reaccionado se transforma de la manera de acuerdo con la invención al menos en gran parte en L-mentol. A este respecto pueden seleccionarse las condiciones de reacción de manera independiente entre sí preferentemente en los intervalos mencionados anteriormente.
El procedimiento de acuerdo con la invención puede realizarse de manera discontinua, de manera semi-continua o de manera totalmente continua. Preferentemente se realiza el procedimiento de manera continua, en particular de manera totalmente continua, introduciéndose las sustancias de partida continuamente en el reactor y descargándose la mezcla de reacción o bien producto de reacción obtenidos continuamente del reactor. Ha resultado además ventajoso, debido a la posición del punto de fusión del producto de reacción de acuerdo con la invención mentol, especialmente L-mentol, proporcionar un calentamiento de los conductos de transporte usados.
El procedimiento de acuerdo con la invención permite la preparación de mentol mediante hidrogenación catalítica de isopulegol, produciéndose habitualmente solo en baja medida la formación de diastereómeros indeseados del mentol. El procedimiento de acuerdo con la invención proporciona de manera correspondiente a esto, con el uso de isopulegol con una pureza correspondiente, mentol de fórmula (III) en una pureza química del 97 % en peso o superior, preferentemente del 98 al 100 % en peso, de manera especialmente preferente del 98,5 al 99,9 % en peso, de manera muy especialmente preferente de al menos el 99 al 99,9 % en peso. A este respecto comprende el término pureza química también la pureza de diastereómeros del mentol obtenido con respecto a los diastereómeros neoiso-mentol de fórmula (IIIa), neo-mentol de fórmula (IIIb) e iso-mentol de fórmula (IIIc). De manera correspondiente a esto proporciona el procedimiento de acuerdo con la invención en el contexto preferentemente mentol con una pureza de diastereómeros del 97 % en peso o superior, preferentemente del 98 al 100 % en peso, de manera especialmente preferente del 98,5 al 99,9 % en peso y de manera muy especialmente preferente de al menos el 99 al 99,9 % en peso.
Figure imgf000033_0001
Si se usa isopulegol en forma ópticamente activa, preferentemente de acuerdo con la invención aquellas mezclas que contienen en parte predominante el enantiómero L-isopulegol, se obtiene como producto del procedimiento de acuerdo con la invención por regla general mentol en forma ópticamente activa, preferentemente en forma del (-)- o bien Lmentol. La hidrogenación de acuerdo con la invención discurre generalmente en gran parte sin racemización notable del material usado. Según esto se obtiene, dependiendo del exceso enantiomérico del isopulegol ópticamente activo usado, L-mentol ópticamente activo, preferentemente con el uso de L-isopulegol como producto, con un exceso enantiomérico (ee) del 80 % de ee o superior, preferentemente del 85 o el 90 % de ee o superior, de manera especialmente preferente del 95 al 100 % de ee, de manera especialmente preferente del 96 al 99,9% de ee, de manera muy especialmente preferente del 97 al 99,8 % de ee, aún más preferentemente del 98 al 99,7 % de ee y en particular preferentemente del 98,5 al 99,6 % de ee.
El mentol obtenido de acuerdo con la invención se caracteriza además por un contenido especialmente bajo de los productos secundarios indeseados mentona de fórmula (IIId) e isomentona de fórmula (IIIe) e neo-iso-mentol de fórmula (IIIa).
Figure imgf000034_0001
Estos productos secundarios se obtienen generalmente en el contexto del procedimiento de acuerdo con la invención solo en una proporción, con respecto a la cantidad de mentol obtenido, de hasta el 0,5 % en peso, preferentemente el 0,4 % en peso, de manera especialmente preferente el 0,3 % en peso, en particular el 0,2 % en peso y de manera muy especialmente preferente del 0,1 al 0 % en peso.
9. Ejemplos de sustratos que pueden usarse para reacciones enzimáticas o biocatalíticas de acuerdo con la invención:
Las enzimas y microorganismos descritos en el presente documento son adecuados en particular para la reacción de compuestos de fórmula general IV anterior. Ejemplos no limitativos de esto están resumidos en la siguiente tabla A con la indicación de la fórmula estructural y del nombre químico.
Figure imgf000034_0002
(continuación)
Figure imgf000035_0001
(continuación)
Figure imgf000036_0001
(continuación)
Figure imgf000037_0001
(continuación)
Figure imgf000038_0001
(continuación)
Figure imgf000039_0001
(continuación)
Figure imgf000040_0001
Los productos de reacción que se producen en su reacción pueden detectarse y cuantificarse de manera en sí conocida con uso de procedimientos convencionales analíticos, tal como cromatografía, HPLC, cromatografía de gases, espectrometría de masas, CG/EM o MALDI-TOF y combinaciones de los mismos.
Si se usan para el procedimiento de acuerdo con la invención organismos o enzimas no inmovilizados, entonces se separan éstos antes de la extracción de manera conveniente, por ejemplo a través de una filtración o centrifugación. El procedimiento de acuerdo con la invención puede hacerse funcionar de manera discontinua, de manera semicontinua o de manera continua.
Parte experimental
Siempre que no se realicen indicaciones especiales en los siguientes ejemplos, se aplican las siguientes indicaciones generales.
A. Indicaciones generales
Todos los materiales y microorganismos usados son productos que pueden obtenerse en el comercio.
En tanto que no se indique de otra manera, se realiza la clonación y expresión de proteínas recombinantes según procedimientos convencionales, tal como se describen por ejemplo en Sambrook, J., Fritsch, E.F. y Maniatis, T., Molecular cloning: A Laboratory Manual, 2a edición, Cold Spring Harbor Laboratory, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY, 1989.
a) Cepas bacterianas, plásmidos y condiciones de crecimiento
Todos los experimentos se realizaron con E. coli. Las proteínas SHC se expresaron en E. coli BL21 (DE3) pLysS o E. coli Rosetta pLysRAR62, que contienen constructos pET16b con el respectivo gen shc, mediante crecimiento en medio de Luria-Bertani, complementado con ampicilina (l0o pg/ml), cloranfenicol (34 pg/ml), y 0,5 mM de isopropiltio-13-D-galactósido con una DO600 de 0,4 y crecimiento adicional durante 4 horas a 30 °C.
b) Constructos de vector
El respectivo gen de escualeno-hopeno ciclasa (por ejemplo Zymomonas mobilis ZMO1548 [NC_006526.2, región: 1578816..1580993]) se amplificó por PCR a partir de ADN cromosómico, usándose correspondientes pares de cebadores (por ejemplo ZMO1548-fwd (5'-gcgctgtttcatatgggtattgaca-3') (SEQ ID NO: 327) y ZMO1548-rev (5'-gcgcttaccctggatcctcgaaaat-3') (SEQ ID NO: 328)). El producto de PCR digerido por enzimas de restricción (por ejemplo con Ndel/BamHI) se introdujo mediante clonación en pET16b, obteniéndose por ejemplo pET1584. Los constructos se examinaron mediante secuenciación de ADN y se transformaron en E. coli XL1-blue.
El gen shc de otros microorganismos (por ejemplo de A. acidocaldarius) se clonó de manera análoga.
Todos los plásmidos se transformaron de manera individual en E. coli BL21 (DE3) pLysS o E. coli Rosetta pLysRAR62.
c) Ensayo de ciclación con distintos sustratos (condiciones estándar)
Se suspendieron células E. coli recombinantes en Tris-HCl 20 mM pH 8,0 (3 ml por g de células húmedas). La mezcla de ciclación contenía 250 pl de suspensión celular, 50 pl de tampón citrato 1 M (pH 4,5), sustrato 20 mM (concentración final) y agua hasta 500 pl. Durante la ciclación de escualeno se añadió el 1 % (v/v) de Triton-X100. Para la ciclación de homofarnesol se suspendieron células E. coli (6 g de células húmedas) en tampón de solubilización (fosfato 50 mM, MgCl2 10 mM (pH 6,5; volumen total: 25 ml). Las células se disgregaron con 150.000 kPa usando un homogeneizador de Manton-Gaulin. Los residuos celulares insolubles se separaron por centrifugación (15 min a 4°C y 7150*g). La mezcla de ciclación contenía 1 ml de extracto celular bruto y homofarnesol 20 mM en 1,25 ml de tampón (fosfato de calcio 50 mM, MgCh 45 mM (pH 6,5). La mezcla de reacción se agitó a 30 °C por medio de un agitador magnético. La reacción se finalizó mediante extracción con heptano. La fase orgánica se analizó por medio de cromatografía de gases. Se realizaron controles con células E. coli que llevaban un vector vacío así como con células que expresan SCH inactivadas con calor. La formación de productos de ciclación nunca se observó en los controles (datos no mostrados).
d) Cromatografía de gases
Los terpenoides se analizaron cualitativa y cuantitativamente mediante cromatografía de gases usando un aparato de CG Agilent 7890A, equipado con una columna DB-5 (20 m x 0,1 mm x 0,1 pm) y un detector de ionización. Se aplicaron 3 pl del extracto de disolvente en la columna (relación de separación 1:5, velocidad de flujo de helio 0,25 o 0,5 ml/min, temperatura de inyector 250 °C).
Para la separación de monoterpenoides lineales y cíclicos se elevó la temperatura de horno inicial (60 °C) hasta 130 °C con 40 °C/min, con 2 °C/min hasta 150 °C y entonces con 40 °C/min hasta 200 °C. Los tiempos de retención de los terpenoides eran tal como sigue: (R, S)-citronelal (7,55 min), isopulegol (7,70 min), neo-isopulegol (7,90 min), isoisopulegol (8,10 min), neoiso-isopulegol (8,25 min), 1-decanol (9,91 min).
Para la detección de triterpenos se ajustó la temperatura de inyector hasta 300 °C. La temperatura del horno ascendía originariamente a 60 °C, se elevó con 40 °C/min hasta 220 °C y a continuación con 6 °C/min hasta 310°C y allí se mantuvo constante durante 10 min. El escualeno y hopeno eluyeron tras 19,2 min o bien 26,9 min.
Se analizaron homofarnesol y ambroxano en una columna Optima 1 de 10 m (Macherey&Nagel, Düren, Alemania). La temperatura del horno inicial (100 °C) se elevó con 5 °C/min hasta 200 °C y se mantuvo a esta temperatura durante 5 min. A continuación se elevó ésta con 30 °C/min hasta 320 °C. Un análisis duró 40 min. Los tiempos de retención eran tal como sigue: homofarnesol (10,8 min), ambroxano (9,9 min).
Como alternativa a esto se usó un sistema de CG-EM de Shimadzu QP 2010 con una columna FS Supreme 5 (30 m x 0,25 mm x 0,25 pm) para un análisis de CG/EM acoplado (relación de separación 1:20; 3 min 120 °C, aumento hasta 135 °C con 2 °C/min y aumento adicional hasta 365 °C con 10 °C/min, seguido de un enfriamiento hasta 300 °C con 70 °C/min). Los datos de CG-EM se analizaron usando un software LabSolutions GCsolutions Postrun. Debería observarse que los sustratos racemato de citronelal, (R)-citronelal y (S)-citronelal, contienen siempre bajas cantidades de isopulegol y neo-isopulegol como impurezas. Los valores de superficie de CG para estos terpenoides lineales se fijaron como el 100 %. Los valores de superficie para los isómeros de isopulegol en el producto se corrigieron mediante la cantidad de isómero de isopulegol que ya existía en el sustrato. La desviación estándar se calculó por medio de 24 ensayos individuales usando dos cultivos de E. coli cultivados de manera separada.
B. Ejemplos
Ejemplo 1: Preparación de mutantes del tipo F486X de las escualeno-hopeno-ciclasas mediante diseño de proteína racional por medio de mutagénesis de cambio rápido
Los mutantes de distintas escualeno-hopeno-ciclasas se incorporaron por medio de mutagénesis de cambio rápido "Quick Change" en el correspondiente gen. A este respecto se procedió en gran parte según las indicaciones del fabricante (empresa Agilent Technologies, Waldbronn). En primer lugar se realizó una PCR:
Mezcla de reacción de PCR: 1,8 pl DMSO
2 pl dNTP's (en cada caso 2,5 mM)
1.5 pl cebador directo (10 pmol/pl)
1.5 pl cebador inverso (10 pmol/pl)
molde (1 pg/pl; plásmido recombinante, que lleva el gen SHC, tal 1 pl como por ejemplo pETZmSHC_1)
0,2 ml polimerasa Prime-Star (Takara, 2,5 unidades/pl)
6 ml 5x tampón
16 pl H2O
Programa de PCR
(1) 95 °C 3 minutos
(2) 95 °C 45 segundos
(3) 53 °C 1 minuto
(4) 68 °C 17 minutos
5x repetición de las etapas (2), (3) y (4)
A continuación de la PCR se digirieron 10 pl de la mezcla de reacción con la enzima de restricción Dpnl durante al menos 1 hora a 37 °C. Después se realizó la transformación en células E. coli XL1-blue. Tras la secuenciación de ADN tuvo lugar la transformación en la cepa de expresión, por ejemplo, E. coli Rosetta pLysRAR62. De manera análoga puede modificarse el gen también en otros plásmidos de expresión.
Los siguientes cebadores se usaron para la PCR Quick-Change. El intercambio respectivo es evidente por medio de la impresión en negrita en el nombre del cebador. Los genes, que se modifican mediante los respectivos cebadores, están marcados en cursiva en el nombre del cebador; a este respecto corresponde
ZmSHC_1 SEQ ID NO: 2;
ZmSHC_2 SEQ ID NO: 6;
Ap SEQ ID NO: 4;
Bj SEQ ID NO: 5 y
Sc SEQ ID NO: 3.
Nombre del cebador Secuencia SEQ ID NO ZmSHC_1 F486Ilefor GTTATTATCCTTATCGATGGCTCCCCAACCG 329
ZmSHC_1 F486Ilerev GGTTGGGGAGCCATCGATAAG G AT AATAAC AG 330 ZmSHC_1F486Metfor GTTATTATCCTTATCCATGGCTCCCCAACCG 331
ZmSHC_1 F486Metrev GGTTGGG G AG CC ATG GATAAG G ATAATAAC AG 332 ZmSHC_1F486Thrfor GTTATTATCCTTATCGGTGGCTCCCCAACCG 333
ZmSHC_1 F486Thrrev GGTTGGGGAGCCACCGAT AAG G AT AAT AAC AG 334
ZmSHC_1 F486Glnfor GTTATTATCCTTATCCTGGGCTCCCCAACCG 335
ZmSHC_1 F486Glnrev GGTTGGGGAGCCCAGGAT AAG G AT AATAAC AG 336
ZmSHC_1 F486Asnfor GTTATTATCCTTATCGTTGGCTCCCCAACCG 337
ZmSHC_1 F486Asn rev GGTTGGGGAGCCAACGATAAGGATAATAACAG 338
ZmSHC_1 F486Lysfor GTTATTATCCTTATCTTTGGCTCCCCAACCG 339
ZmSHC_1 F486Lysrev GGTTGGGGAGC C AAAG ATAAG G ATAATAAC AG 340
(continuación)
Nombre del cebador Secuencia SEQ ID NO ZmSHC_1 F486Aspfor GTTATTATCCTTATCATCGGCTCCCCAACCG 341
ZmSHC_1 F486Asprev GGTTGGGGAGCCGATGATAAGGATAATAACAG 342
ZmSHC_1 F486Glufor GTTATTATCCTTATCTTCGGCTCCCCAACCG 343
ZmSHC_1 F486Glurev GGTTGGGGAGCCGAAGATAAGGATAATAACAG 344
ZmSHC_1 F486Trpfor GTTATTATC CTTATC CCAGGCTCCC CAAC C G 345
ZmSHC_1 F486Trprev GGTTGGGGAGCCTGGGATAAGGATAATAACAG 346
ZmSHC_1 F486Argfor GTTATTATCCTTATCACGGGCTCCCCAACCG 347
ZmSHC_1 F486Argrev GGTTGGGGAGCCCGTGATAAGGATAATAACAG 348
ZmSHC_1 F486Cysfor GTTATTATCCTTATCGCAGGCTCCCCAACCG 349
ZmSHC_1 F486Cysrev GGTTGGGGAGCCTGCGATAAGGATAATAACAG 350
ZmSHC_1 F486Gfor GTTATTATCCTTATCACCGGCTCCCCAACCG 351
ZmSHC_1 F486Grev GGTTGGGGAGCCGGTGATAAGGATAATAACAG 352
ZmSHC_1 F486Sfor GTTATTATCCTTATCGCTGGCTCCCCAACCG 353
ZmSHC_1 F486Srev GGTTGGGGAGCCAGCGAT AAG G AT AAT AAC AG 354
ZmSHC_1 F486Pfor GTTATTATCCTTATCCGGGGCTCCCCAACCG 355
ZmSHC_1 F486Prev GGTTGGGGAGCCCCGGATAAGGATAATAACAG 356
ZmSHC_1 F486Hfor GTTATTATCCTTATCATGGGCTCCCCAACCG 357
ZmSHC_1 F486Hrev GGTTGGGGAGCCCATGATAAGGATAATAACAG 358
ZmSHC_1 F486Lfor GTTATTATCCTTATCCAGGGCTCCCCAACCG 359
ZmSHC_1 F486Lrev GGTTGGGGAGCCCTGGATAAGGATAATAACAG 360
ZmSHC_1 F486Vfor GTTATTATCCTTATCAACGGCTCCCCAACCG 361
ZmSHC_1 F486Vrev GGTTGGGGAGCCGTTGATAAGGATAATAACAG 362
ZmSHC_1 F486Afor GTTATTATCCTTATCCGCGGCTCCCCAACCG 363
ZmSHC_1 F486Arev GGTTGGGGAGCCGCGGATAAGGATAATAACAG 364
ZmSHC_1 F486Yfor GTTATTATCCTTATCATAGGCTCCCCAACCG 365
ZmSHC_1 F486Yrev GGTTGGGGAGCCTATGATAAGGATAATAACAG 366
ZmSHC_ 1Y702Cfor GCCGATAAAAATCGCAACGCAGCATAAACG 367
ZmSHC_ 1Y702Crev CGTTTATGCTGCGTTGCGATTTTTATCGGC 368
ZmSHC_ 1Y702Ffor G C C G AT AAAAAT CTTTACGCAGCAT AAAC G 369
ZmSHC_ 1Y702Frev CGTTTATGCTGCGTAAAGATTTTTATCGGC 370
ZmSHC_ 1Y702Afor GCCGATAAAAATCCGCACGCAGCATAAACG 371
ZmSHC_ 1Y702Arev CGTTTATGCTGCGTGCGGATTTTTATCGGC 372
ZmSHC_ 1Y702Sfor GCCGATAAAAATCGCTACGCAGCATAAACG 373
ZmSHC_ 1Y702Srev CGTTTATGCTGCGTAGCGATTTTTATCGGC 374 ZmSHC_1 Y561Afor GAACCGCACCGGTGCCATAGATCGCATTAACG 375
ZmSHC_1 Y561Arev GGTTTGGTCGTTGGGGCGTTAATGCGATCTATGG 376
ZmSHC_ 1Y705Afor CCATAATCGGGAAGAATTGCCGCGCAAAATC 377
ZmSHC_ 1Y705Arev CTGCGTTATGATTTTGCGCGGCAATTCTTC 378 ZmSHC_2F486Cfor GGCGGTTGGGGCGCTTGCGATGCCAATAACAG 379 ZmSHC_2F486Crev CTGTTATTGGCATCGCAAGCGCCCCAACCGCC 380
ApF486Crev CATTATCTTTATCGCATGCACCCCAACCACC 381
ApF486Cfor GGTGGTTGGGGTGCA TGCGATAAAGATAATG 382
B/F486Cfor CGGCTGGGGCGCGTGCGATAAAGATAAC 383
B/F486Crev GTTATCTTTATCGCACGCGCCCCAGCCG 384
ScF486Cfor CGGCGCCTGGGGCGCCTGCGACGTCGACAAC 385
ScF486Crev GTTGTCGACGTCGGAGGCGCCCCAGGCGCCG 386
Ejemplo 2: Ensayos de actividad con mutantes de la escualeno-hopeno-ciclasa-1 (SHC-1) de Zymomonas mobilis
La influencia de distintas mutaciones sencillas, preparadas de acuerdo con el ejemplo 1, en la posición de secuencia que se corresponde con F486 sobre la actividad ciclasa se determinó para distintos sustratos.
a) Citronelal
Tras la detección general de una baja actividad de ciclación de la escualeno-hopeno-ciclasa-1 de Zymomonas mobilis (SEQ ID NO:2) frente a citronelal, se mejoró claramente la tasa de conversión mediante diseño de proteína racional. El intercambio del resto de fenilalanina F486 por alanina, condujo en primeros ensayos (véase la figura 2) a una producción claramente aumentada de isopulegol (2) partiendo del citronelal (1).
Figure imgf000044_0001
La actividad aumentada del mutante SHC_1-F486A se sometió a estudio de manera más detallada a continuación. A este respecto, además de una reacción esencialmente mejor del sustrato citronelal pudo determinarse también que ésta prefiere el isómero R(+) como sustrato y en comparación con el tipo natural éste reacciona también en tiempo esencialmente más corto (véase la figura 2). Mientras que con la enzima de tipo natural puede medirse la reacción con R(+)-citronelal solo después de incubación más larga, muestra el mutante F486A altas conversiones en particular al comienzo de la reacción. Este efecto no puede observarse en el caso de S(-)-citronelal como sustrato. Es llamativo que el mutante F486A forma solo isopulegol I y II, independientemente de la estereoconfiguración del sustrato. El tipo natural, por el contrario, depende de la estereoconfiguración del sustrato y forma además de isopulegol I predominantemente isopulegol II a partir de R(+)-citronelal y casi exclusivamente isopulegol III a partir de S(-)-citronelal.
Basándose en estos resultados se sometió a estudio en experimentos de continuación la importancia del resto de aminoácido en la posición 486 de manera más exacta. Para ello se intercambió por medio de mutagénesis el resto de fenilalanina por cualquier otro aminoácido y se sometió a ensayo la actividad de las distintas muteínas con citronelal como sustrato (secuencias véase la figura 1a y b). Se determinó que algunos aminoácidos en esta posición mejoran no solo la conversión de citronelal mediante la enzima, sino que adicionalmente conducen a una especificidad de producto más alta en la reacción, de manera que se producen menos isómeros del isopulegol (véase la figura 3).
El intercambio por arginina, prolina y lisina conduce a una pérdida de la actividad frente a citronelal. Las cantidades de producto determinadas pueden encontrarse en igual distribución también como impureza en el control negativo ('K' véase la figura 3). La máxima actividad se observó tras el intercambio por valina, treonina, cisteína, isoleucina y alanina. En total es llamativo el espectro de producto modificado de algunas muteínas. No todas muestran la formación de tres picos de isopulegol tal como el tipo natural y también se diferencia la distribución de cantidad.
Existen en total 23 isómeros de isopulegol:
Figure imgf000044_0002
Hasta ahora pudo asignarse el producto principal (isopulegol I) al par de enantiómeros(1R,3R,6S)-isopulegol o bien (1S,3S,6R)-isopulegol.
El rendimiento más alto de isopulegol con los mínimos productos secundarios (que están constituidos por otros isómeros) acompañados de alta actividad enzimática lo muestra el mutante Zm-SHC-1 F486C.
b) Escualeno
Las claras modificaciones en la actividad tras la mutación en la posición F486 se muestran también con escualeno como sustrato. De manera interesante proporciona en este caso el intercambio de la fenilalanina por tirosina casi una duplicación de la conversión (véase la figura 4).
Ejemplo 3: Ensayos de actividad con mutantes de otras escualeno-hopeno-ciclasas (no objeto de la invención) La influencia de distintas mutaciones sencillas, preparadas de acuerdo con el ejemplo 1, en la posición de secuencia que se corresponde con F486 sobre la actividad ciclasa de distintas otras SHC se determinó para distintos sustratos de citronelal (en cada caso incubación de 20 mM durante la noche):
Se trata a este respecto de los siguientes mutantes:
Ap-SHC: F481C,
Bj-SHC: F447C,
Sc-SHC: F449C,
Zm SHC-2: F438C
Los restos de fenilalanina se encuentran a este respecto en posiciones que son análogas a F486 de Zm-SHC-1 (SEQ ID NO:2).
Los resultados pueden deducirse de la figura 5 (racemato de citronelal como sustrato), de la figura 6 (R(+)-citronelal como sustrato), y de la figura 7 (S(-)-citronelal como sustrato). Como control sirvió una mezcla de reacción sin biocatalizador activo.
Se observó que las enzimas de tipo natural mediante mutación en la correspondiente posición F486 (de Zm SHC-1) indicada pueden ciclar ahora citronelal para dar isopulegol y además hacer reaccionar la forma R(+) con elevada selectividad en comparación con la forma S(-).
Ejemplo 4: Reacción de compuestos de fórmula IV
Estas sustancias se hicieron reaccionar en condiciones que se corresponden con aquéllas que se usaron para la reacción de citronelal, tal como se ha descrito anteriormente.
Ejemplo 5: Aislamiento y caracterización de la escualeno-hopeno-ciclasa de Zymomonas mobilis (Zm-SHC) En la solicitud internacional PCT/EP2010/057696 se describe, cómo pudo amplificarse, con ayuda de oligonucleótidos específicos, el gen de Zm-SHC a partir del ADN genómico de Zymomonas mobilis y cómo pudo expresarse en Escherichia coli.
a) Material y procedimientos:
A continuación se ocupa solo del material y procedimientos, que no se mencionaron en la solicitud internacional PCT/EP2010/057696 en esta forma.
b) Cepas, plásmidos y condiciones de cultivo:
Se usó la cepa de E. coli DH5a, la cepa de E. coli BL21 (DE3)pLysS (Novagen) y la cepa E. coli Rosetta. El plásmido pET16b (Novagen) se usó para la clonación. Para la sobreexpresión de la SHC se transformó además el plásmido pLysRAR62 adicionalmente para la adaptación del uso de codón en E. coli. Además se usó el plásmido pDHE+ZmSHC-1 de E. coli Lu15568 (solicitud internacional PCT/EP2010/057696). El cultivo de las cepas tuvo lugar con medio LB a 30 °C.
c) Productos químicos:
Se adquirieron escualeno, (+/-)-citronelal, (+)-R-citronelal y (-)-S-citronelal de Sigma (Sigma-Aldrich Chemie GmbH, München). Las enzimas de restricción, T4-ligasa, ADN-polimerasa procedían de New England Biolabs (New England Biolabs GmbH, Frankfurt).
d) Aislamiento del ADN y transformación:
Se aislaron plásmidos de E. coli por medio del kit Qiaprep Spin Miniprep de Qiagen (Qiagen, GmbH, Hilden). Para extracciones en gel o purificaciones por PCR se usó el kit de extracción en gel Qiaquick de Qiaget. Todas las cepas de E. coli usadas se transformaron por medio del procedimiento de CaCh.
e) PCR y secuenciación:
El ADN de Zymomonas mobilis subspec. mobilis CP4 se proporcionó por Herrn Prof. Dr. Sprenger (Institut für Mikrobiologie, Universitat Stuttgart). La PCR se realizó con la polimerasa Prime Star. Se usaron los siguientes cebadores para la síntesis del gen escualeno-hopeno-ciclasa de Zymomonas mobilis:
SHC_1: SHC-for TATGCATATGGGTATTGACAGAAT (SEQ ID NO: 387)
SHC-rev CCGGATCCTCAATTATTCAAATCAATC (SEQ ID NO: 388)
La corrección de los genes clonados se sometió a prueba por medio de secuenciación mediante la empresa GATC Biotech. Los análisis de secuencia se realizaron por medio del programa Clone Manager7.0. Tras la restricción de los correspondientes materiales amplificados se clonaron éstos en marco en el vector pET16b con etiqueta de His codificada en el extremo N terminal. Los plásmidos se transformaron a continuación en primer lugar en E. coli DH5a y a continuación en E. coli BL21 (DE3)pLysS y E. coli Rosetta. Para la mejor expresión se transformó en las cepas E. coli Rosetta, adicionalmente a los constructos pET16b, el plásmido pLysRAR62. De manera paralela se realizaron correspondientes clonaciones con vectores vacíos. Además se transformó el plásmido pDHE+ZmSHC_1 (corresponde a SHC_1 con uso de codón adaptado a E. coli) en E. coli BL21 (DE3)pLysS.
f) Expresión y disgregación celular:
Los correspondientes transformados de E. coli BI21 (DE3) pLysS o bien de E. coli Rosetta se cultivaron en medio LB con ampicilina y cloranfenicol (100 pg/ml o bien 32 pg/ml) a 3o °C. La síntesis de las escualeno-hopeno-ciclasas se indujo mediante adición de IPTG 0,5-1 mM o bien 0,1 % de ramnosa (en el caso del uso de los derivados de pDHE) con un DO600 de 0,4-0,6. Las células se dejaron crecer posteriormente durante 4-6 h y a continuación se recogieron. Para ello se separaron por centrifugación las células y se suspendieron en 5 ml/g de peso en húmedo de Tris/HCl 25 mM con el 40 % de glicerol. Si no se usaron las células de manera inmediatamente posterior, tuvo lugar un almacenamiento a -20 °C. Para la disgregación de las células se añadieron éstas en cada caso 2x con mediante la prensa francesa y se usaron o bien directamente o tras separación de los residuos celulares mediante centrifugación para las determinaciones de la actividad. Como alternativa tuvo lugar la disgregación de células con ultrasonido. Tras la centrifugación se disolvieron las proteínas SHC a continuación con tampón de solubilización (Tris/HCl 50 mM pH 8, MgCl2 10 mM, 1 % de Triton X-100) de los residuos celulares y por consiguiente se enriquecieron parcialmente.
g) Determinaciones de la actividad:
Cada mezcla de reacción para la determinación de la actividad de las escualeno-hopeno-ciclasas tenía un volumen final de 1 ml. Éste se componía de 600 pl de células disgregadas por medio de prensa francesa (como alternativa 800 pl tras solubilización de la membrana celular), tampón citrato de Na 100 mM con distintos valores de pH (se sometieron a ensayo de pH 4,0 a pH 8,0) y solución de sustrato 10 mM [(+/-)citronelal, (+)-R-citronelal y (-)-S-citronelal]. Además del sustrato y H2O contenía la solución de sustrato aún Triton X-100, que se encontraba en la mezcla de reacción de actividad en cada caso en una concentración del 0,2 %. Las mezclas de reacción se incubaron durante de 6 h a 24 h a temperaturas de 22 °C, 30 °C y 37 °C con agitación. La extracción del sustrato y posibles productos se realizó con un volumen de cloroformo o hexano/propanol en la relación 2:3. El extracto se usó directamente para el análisis de cromatografía de gases.
h) Mediciones de CG:
Las mediciones mediante cromatografía de gases tuvieron lugar en un cromatógrafo de gases Agilent 7890A con detector de ionización a la llama. Como columnas se usó una DB-5 (Agilent Technologies) con una longitud de 20 m, un diámetro de 0,1 mm y 0,25 pm de revestimiento. Una identificación se realizó a través de la comparación de los tiempos de retención con soluciones estándar existentes.
Para la seguridad se sometieron a estudio de manera paralela las muestras en un cromatógrafo de gases Shimadzu con espectrómetro de masas. Usando la columna FS Supreme Colum con 30 m de longitud, diámetro interno de 0,25 mm y 0,25 pm de revestimiento pudieron ajustarse los tiempos de retención de nuevo con soluciones estándar y pudieron analizarse los respectivos espectros de masas de las sustancias constitutivas.
El diastereómero designado a continuación con isopulegol I pudo asignarse con ayuda de un patrón al (1R,3R,6S) o bien (1S,3S,6R) isopulegol, mientras que para los isómeros designados como isopulegol II e isopulegol III no pudo encontrarse ninguna asignación.
i) Resultados de las determinaciones de actividad:
1. Ensayo 1a: (comparación) (controles, es decir resultados con proteína hervida, con vector vacío y sin proteína)
Figure imgf000047_0003
E indicaciones para el sustrato rac-citronelal se realizan ya descontando las cantidades de isopulegol detectadas en los controles.
2. Ensayo 1b: Comparación de las dos proteínas SHC_1 sobreexpresadas (a partir del vector pDHE y pET16b e influencia de la etiqueta de His sobre la actividad a pH 4,5)
Figure imgf000047_0001
3. Ensayo 1c: Dependencia de pH
Figure imgf000047_0004
4. Ensayo 1d: Influencia de sales a pH 4,5
Figure imgf000047_0005
5. Ensayo 1e: Influencia de la temperatura a pH 4,5
Figure imgf000047_0006
6. Ensayo 2: S(-)-citronelal como sustrato
Figure imgf000047_0002
7. Ensayo 3: R-(+)-citronelal como sustrato
Figure imgf000048_0001
j) Resumen de los resultados:
La escualeno-hopeno-ciclasa de Zymomonas mobilis pudo prepararse de manera recombinante en E. coli. La enzima puede hacer reaccionar citronelal para dar isopulegol.
A este respecto no mostraron las dos proteínas Zm-SHC-1 sobreproducidas, una vez sin y una vez con etiqueta de His colgada en el extremo N terminal, diferencias en su actividad en las condiciones sometidas a ensayo (véase el ensayo 1b).
Esta reacción se detectó tras 12 h con los procedimientos descritos. A este respecto tenía la reacción una baja dependencia del valor de pH. En un intervalo de pH de pH 4 a pH 6 pudieron medirse tras incubación de 20 horas, tasas de conversión de en total aproximadamente el 5 % con respecto a distintos isómeros de isopulegol.
A este respecto no era decisivo si las mezclas de reacción se incubaron a TA, 30 °C o 37°C. Tampoco la adición de iones divalentes, tal como por ejemplo MgCh, elevó la conversión (véase el ensayo 1d). Sin embargo era decisivo que se dializaran los extractos de células en mediciones por un valor de pH de pH 5 o bien antes de la adición del sustrato o se añadiera EDTA a las mezclas de reacción, para suprimir una reducción del sustrato citronelal en citronelol mediante las enzimas del huésped. Una influencia sobre la actividad de Zm-SHC-1 mediante este tratamiento no pudo mostrarse. Si estaba ausente este tratamiento, entonces se redujo el sustrato en el intervalo de 20 h casi completamente en citronelol y ya no tuvo lugar ninguna ciclación medible para dar isopulegol. La Zm-SHC-1 no puede ciclar por consiguiente citronelol, pero sí citronelal para dar isopulegol. Muy probablemente son las deshidrogenasas inespecíficas las responsables de la reacción de reducción.
Para excluir que una reacción química sea responsable de la ciclación, se usaron extractos celulares hervidos. En estos controles y controles con extractos celulares procedentes de cultivos con vectores vacíos no pudo determinarse sin embargo ninguna conversión correspondiente (véase el ensayo 1a).
Con (+/-)-citronelal como sustrato pudieron detectarse a continuación de la reacción distintos isómeros, aún no identificados de manera exacta, de isopulegol (véase el ensayo 2 y 3). Para el control de si estos isómeros se producían a partir de los distintos isómeros del sustrato de partida o solo se aceptaba un isómero como sustrato y se hacía reaccionar de manera diferente, se realizaron los mismos estudios con (+)-R-citronelal y (-)-S-citronelal. A este respecto se mostró que dependiendo del sustrato se forman diferentes isómeros de isopulegol. La reacción de (+)-R-citronelal tuvo lugar a este respecto de manera interesante de pH 4 a pH 7 sin diferencias claras con una tasa de aproximadamente el 5 %. El enantiómero se hizo reaccionar, por el contrario, solo hasta un valor de pH de pH 6 con tasas de conversión de aprox. el 4,5 %. También en este caso apenas oscilaba la tasa de conversión en los valores de pH individuales entre pH 4 y pH 6.
Secuencias:
SEQ ID NO: 1- 326 secuencias de ácido nucleico/aminoácidos de distintos genes SHC
SEQ ID NO: 327-388 cebador de PCR
Sigue un listado de secuencias de enzimas SHC mencionadas en el presente documento:
Secuencias de enzimas
>seqLlD 4
MNMASRFSLKKILRSGSDTQGTNVNTLIQSGTSDIVRQKPAPQEPADLSALKAMGNSLTHTLS SACEWLMKQQKPDGHWVGSVGSNASMEAEWCLALWFLGLEDHPLRPRLGKAL-L EM Q RP D GS WGTY YGAGSGDIN ATVESYAALRS LGYAE D DP AVS KAAA-WIISKGGLKNVRVFTRYW LALIGEWPWEKTPNLPPEIIWFPDNFVFSIYNFAQWARATMM-PLAILSARRPSRPLRPQDRLDALFPGGRANFDYELPTKEGRDVIADFFRLADKGLHWLQSS-FLKRAPSREAAIKYVLEWIIWHQDADGGWGGIQPPWVYGLMALHGEGYQFHHPVMAKAL-DALNDPGWRHDKGDASWIQATNSPVWDTMLSLMALHDANAEERFTPEMDKALD-WLLSRQVRVKGDWSVKLPNTEPGGWAFEYANDRYPDTDDTAVALIAIASCRNRPEWQAKG-VEEAIGRGVRWLVAMQSSCGGWGAFDKDNNKSILAKIPFCDFGEALDPPSVDVTAHVLEAF-GLLGLPRDLPCIQRGLAYIRKEQDPTGPWFGRWGVNYLYGTGAVLPALAALGEDMTQPYIS-KACDWLINCQQENGGWGESCASYMEVSSIGHGATTPSQTAWALMGLIAANRPQDYEAI-AKGCRYLIDLQEEDGSWNEEEFTGTGFPGYGVGQTIKLDDPAISKRLMQGAELSRAF-MLRYDLYRQLFPIIALSRASRLIKLGN
>seq_ID 2
MGIDRMNSLSRLLMKKIFGAEKTSYKPASDTIIGTDTLKRPNRRPEPTAKVDKTI-FKTMGNSLNNTLVSACDWLIGQQKPDGHWVGAVESNASMEAEWCLALWFLGLEDH-PLRPRLGNALLEMQREDGSWGVYFGAGNGDINATVEAYAALRSLGYSADNPVLKKAAA-WIAEKGGLKNIRVFTRYWLALIGEWPWEKTPNLPPEIIWFPDNFVFSIYNFAQWA-RATMVPIAILSARRPSRPLRPQDRLDELFPEGRARFDYELPKKEGIDLWSQFFRTT-DRGLHWVQSNLLKRNSLREAAIRHVLEWIIRHQDADGGWGGIQPPWVYGLMALH-GEGYQLYHPVMAKALSALDDPGWRHDRGESSWIQATNSPVWDTMLALMALKDAKAEDRFT-PEMDKAADWLLARQVKVKGDWSIKLPDVEPGGWAFEYANDRYPDTDDTAVALIALSSYRD-KEEWQKKGVEDAITRGVNWLIAMQSECGGWGAFDKDNNRSILSKIPFCDFGESI-DPPSVDVTAHVLEAFGTLGLSRDMPVIQKAIDYVRSEQEAEGAWFGRWGVNYIYGTGAVLPA-LAAIGEDMTQPYITKACDWLVAHQQEDGGWGESCSSYMEIDSIGKGPTTPSQTAWALM-GLIAANRPEDYEAIAKGCHYLIDRQEQDGSWKEEEFTGTGFPGYGVGQTIKLD-DPALSKRLLQGAELSRAFMLRYDFYRQFFPIMALSRAERLIDLNN
>seqJD 5
MTVTSSASARATRDPGNYQTALQSTVRAAADWLI-ANQKPDGHWVGRAESNACMEAQWCLALWFMGLEDHPLRKRLGQSLLDSQRPD-GAWQVYFGAPNGDINATVEAYAALRSLGFRDDEPAVRRAREWIEAKGGLRNIRVFTRYWLA-LIGEWPWEKTPNIPPEVIWFPLWFPFSIYNFAQWARATLMPIAVLSARRPSRPLPPEN-RLDALFPHGRKAFDYELPVKAGAGGWDRFFRGADKVLHKLQNLGNRLNLGLFRPAATSRV-LEWMIRHQDFDGAWGGIQPPWIYGLMALYAEGYPLNHPVLAKGLDALND-PGWRVDVGDATYIQATNSPVWDTILTLLAFDDAGVLGDYPEAVD-KAVD WV LQRQ VRVPG D WSM KLPHVKPGGWAF EYAN N YYPDT D DTAVALIAL-APLRHDPKWKAKGIDEAIQLGVDWLIGMQSQGGGWGAFDKDNNQKILTKIPFCDYGEALD-
PPSVDVTAHIIEAFGKLGISRNHPSMVQALDYIRREQEPSGPWFGRWGVNYVYGTGAVLPA-LAAIGEDMTQPYIGRACDWLVAHQQADGGWGESCASYMDVSAVGRGTTTASQTAWAL-MALLAANRPQDKDAIERGCMWLVERQSAGTWDEPEFTGTGFPGYGVGQTIKLND-PALSQRLMQGPELSRAFMLRYGMYRHYFPLMALGRALRPQSHS
>seqJD 78
MTLTSSASARAPRDPGNYQTALQSTVRAAADWLI-ANQKPDGHWVGRAESNACMEAQWCLALWFMGLEDHPLRKRLGQSLLDTQRPDGAWQVYF-NAPNGDINATVEAYAALRSLGYPDSEPAVRRAREWIEAKGGLRNIRVFTRYWLALIGE-WPWEKTPNIPPEVIWFPLWFPFSIYNFAQWARATLMPIALLSARRPSRPLPPENRLDTLF-PRGRDAFDYELPVKANAGGWDKFFRGADKVLHALQNFGNRLNLGLFRPAATSRV-LEWMIRHQDFDGAWGGIQPPWIYGLMALYAEGYPLNHPVLAKGLDALND-PGWRVDVGEATYIQATNSPVWDTILTLLAFDDAGVLGDYPDAVD-KAVN WVLARQVRVPG D WSM KLP H VKPGGWAF E YAN N HYPDTDDTAVALIAL-APLRHDPKWKAKGIDEAIQLGVDWLIGMQSQGGGWGAFDKDNNQQILTKIPFCDYGEALD-PPSVDVTAHIVEAFGKLGISRNHPSMVQALDYIRKEQEPSGPWFGRWGVNYVYGTGAVLPA-LAAIGEDMTQPYIGRACDWLVAHQQPDGGWGESCASYMDISAVGRGTTTASQTAWAL-MALLAANRPQDKDAIERGCMWLVERQSAGTWDEPEFTGTGFPGYGVGQTIKLTDPS-LQERLMQGPELSRAFMLRYGMYRHYFPLMALGRALRPQGHG
>seq_ID 209
MDSILAPRADAPRNIDGALRESVQQAADWLVANQKPDGHWVGRAETNAT-MEAQWCLALWFLGLEDHPLRVRLGRALLDTQRPDGAWHVFYGAPNGDINATVEAYAAL-RSLGHRDDEEPLRKARDWILSKGGLANIRVFTRYWLALIGEWPWEKTPNILPEVIWLPTWF-PFSIYNFAQWARATLMPIAVLSAHRPSRPLAPQDRLDALFPQGRDSFNYDL-PARLGAGVWDVIFRKIDTILHRLQDWGARRGPHGIMRRGAIDHVLQWIIRHQDYDGSWG-GIQPPWIYGLMALHTEGYAMTHPVMAKALDALNEPGWRIDIGDATFIQATNSPVWDTMLSLL-AFDDAGLGERYPEQVERAVRWVLKRQVLVPGDWSVKLPDVKPGGWAFEYANNFYPDTDDT-SVALMALAPFRHDPKWQAEGIEDAIQRGIDWLVAMQCKEGGWGAFDKDNDKKILA-Kl PFCDFGEALDPPSAD VTAH11EAFAKVGLDRN H PSIVRALD YLKREQEPEGPWF-G RWGVN YVYGTG AVLPALAAIG E D M RQ P Yl ARACD WLIARQQ AN GG WGESC VSYM DAKQA-GEGTATASQTAWALMALIAADRPQDRDAIERGCLYLTETQRD-GTWQEVHYTGTGFPGYGVGQTIKLND-PLLSKRLMQGPELSRSFMLRYDLYRHYFPMMAIGRVLRQRGDRSGH
>seq_ID 193
MNVIRQLNSGVNAAKSLDDGIESAIEWLAENQDKEGFWVGMLESNSCIEAEWILAMHLL-GVKDDPKYDKWQAILNEQREDGSWAVYYDAPAGDINATVEAYAALRTAGFGAGDERLIKAR-NWIFSHGGLKNVRVFTRYWLALIGEWPWDETPALAPEIIYLPAWCPLNIYDFACWARAT-LVPLSVLSVRRPVKPLPAESRLDELFPEGRENADYSLPESEK-GLAERFFLWDWFLKKYNRLPMQFGREKAIRLCLEWIVRHQDYDGGWGGIQPPLIYSLIALN-TEGYGINHPVISKGLDAFNPPWAYEKNGGVYLQCSESPVWDTLFTMLALFES GCSFDDTPMMRPALDWILSKQITSWGDWQVKVRGVRPGGWAFERANTAYPDVDDTALAL-WLAEARRHVKDSAAVDAALERAEEWILGLQCRNGGWAAFDRDNNSAIVTKIPFCDFGEVLD-PPSVDVTAHWEALAALGRDRHDPWARALKYIRSEQEPGGSWFGRWGVNHIYGTCAVLPA-LAAIGEDMRAPYVLRAADWLVRHQNDDGGWGESCASYMDDSQCGQGSSTASQTGWAL-MALVAMSSHDYDEAIRRGLDYLLSHQKSGTWDEPQYTGTGFPGYGVGERTNLKEAGAT-LDQGCELARGFMINYNMYRHYFPLIAMARARRHLGLAANPRHQDSRSSVEVAPEALRGRACG
>seq_ID 246
MRRLDTFPPEIPTGSRDKPPSGEEHSCSTPAEPLRSRLDEGILRAVDWLVCDQHPDGFWAG-M LQSN SC M EAEWVLAM H F LGID D D PKYDGVI RAI LG EQ RADGSWGV F H KAPN G DI NTTVE-CYAALRASG LAPES AP LSSAREWILAGGG LAN IRN FTKYWLALIG EWPWEGTPTIP-PELIFFPPRMPLNIYHFASWARSTIVPLSILSARRPVRPLPEDRRLDELFPQGRSAFD-FRLPRKDGWLSWEGFFHVCDRILRLYARTRRAPFRETAIRVCLEWIIRRQETDGAWSGIQPP-WIYALLALHAEGYGLDHPILRAGLRAFDSHWSYERDGGIYLQASESPVWDTVLSL-RALADCGE E RKASVSI ASALE WLLN RQIS VPGD WAVRVPSVPCGG WAFQ RAN S-FYPDVDDTAVAIEVLARLRPFTANQSAVDRAIRSARDWVLAMQCSNGGWAAFDRDNDF-KLVTKIPFCDFGELLDPPSVDVTAHVIEALAALGWDMTSREIEAAVSFIRREQEAEGSWF-G RWG V N HIYGT ATVLPALFÍAIG ED MSS AYVLRAAD WLAS RQ N ADGG WG ETP ASY M D DS-LRGVG ESTASQTAWAIM GLVAVGSG AH DDTVRRGIDFLL-FAQHGGTWEEPQYTGTGFPGYSVGERIRLRDMGASLKQGTELQRAFMINYNLYRHYFPL-MALGRARYHLQLRRSAREGGNGETTPNGSAL
>seq_ID 151
MKISKNPISHALTSFNDAARETADNSAARKSGKIHHLPATIWKKKESTVSSPLDIAI-ERTQEFFFREQLPAGYWWAELESNATITAEYIMLFHFMGLVNREKERKMANYLLRQQTTE-GYWTIWHGGPGDLSTTIEAYFALKLAGYPADHPSMSKARAFILEHGGILKARVFT-KIFLALFGEFSWLGVPSMPIEMMLLPAGFTFNMYEFSSWSRATIIPLSIVMAERPVRKLPP-WARVQELYVRPPRPTDYTFTKEDGILTWKNIFIGIDHVLKVYEASPIRPGRKKA-MAIAEKWVLEHQEPTGDWGGIQPAMLNSVLALHVLGYANDHPAVAKGLQALANFCIEGEDEL-VLQSCVSPVWDTALGLMAMVDSGVPTDHPSLSKAAQWLLDREVRRPGDWKIKCPDLEPGG-WAFEFMNDWYPDVDDSGIVMMAIKNVKVKDQRAKEDTITRGIAWCLGMQSKNG-GWGAFDKDNTKHILNKIPFADLEALIDPPTADLTGRMLELMGTYGYPKDHPAAVRAL-KFIRETQEPDGPWWGRWGVNYIYGTWSVMSGLAAFGEDMSQPWIRKAVDWLVE-HQNEDGGWGECCESYADPRLAGVGPSTASQTGWALLTLLAAGEVASSSWRGVQYLL-DTQKPDGTWDEDAFTGTGFPKFFMIKYHIYRNCFPLMALGRYRTLAGKGL
>seq_ID 142
MKSRKYPISHALTSFNHTTVAPVEAPAPISVKSPAKVHRLPSSIWKKMEGSAGNPLDKAVEL-TRDFFFREQLPDGYWWAELESNVTITAEYIMLFHFLGMVDKDKERKMANYLLRQQTEE-GYWTVWHNGPGDLSTTIEAYFALKLAGYHADHIALRKARDFILANGGILKSRVFTKT-FLAMFGEFSWLGVPSMPIELMLLPDWAYLNVYEFSSWARATIIPMSVLMAN-RPVYKLPPHARVQELYVRPPRPTDYTFTKEDGIFSLKNFFIGVDHLLKIYESSPIRPFK-
KRATEKVEQWILEHQEKTGDWGGIQPAMLNAILALHCLGYANDHPAVAKGLEALANF-TIEDSDSLVLQSCISPVWDTALVLQAMQEASVPLDHPSLIKASQWLLDREVRIKGDWKIKSPD-LEPGGWAFEFQNDWYPDVDDSTAVMIAIKDIKVKNTKARQDAIRRGIDWCLGMQSENGG-WAAFDKDNTKHMLNKIPFADLEALIDPPTADLTGRMLELMGNFGYTKDHPQAVSALEFLKNE-QEPEGPWFGRWGVNYIYGTWYVLIGLEAIGEDMNSPYIKKSVNWIKSRQNLDGGWGEVCD-SYWDRTLMGCGPSTASGTSWALMALMAAGEVGCQAVERGIQYLLATQNSDGTWDEEAFT-GTGFPKYFMIKYHIYRNCFPLTALGRYRRLTAGTHAQ
>seq_ID 152
MNSCKHPISHALTSFNGETADAAKKQPVKPGAKIHHLPASIWKKKEGESKSPLDIAIENSRD-FFFREQLPDGYWWAELESNCTITAEYLMLYHFMGIVDQERERKMATYLLSKQTAEG-FWTIYFGGPGDLSTTVEAYFALKLAGYPADHPAMAKARAFILDNGGIIKCRVFTKIFLALFGE-FAWFGVPSMPIELILLPNWAYFNMYELSSWSRATIIPLSIVMTER-PVRKLPPSSRVQELYVRPPRPIDYTFSKEDGIITWKNFFIGVDHILKVYESNPIRPFKKRALA-TAENWVLDHQESTGDWGGIQPAMLNSVLALHCLGYANDHPAVAKGLEALANFCIETEDS-LVLQSCISPIWDTALALKALVDSDVPTDHPALVKAAQWLLDKEVRKPGDWKIKCPELESGG-WAFEFLNDWYPDVDDSGFVMMALKDVAVKDRKSMDGAIKRGINWCLGMQSKNG-GWGAFDKDNTKYLLNKIPFADLEALIDPPTADLTGRM-LELMGTFGYSKDYPAAVRALEFIKKNQEPEGSWWGRWGVNYIYGTWSVLGGLAAIGED-LNQPYIRKAVNWLKS RQNMDGGWGETCESYHDTSLAGIGESTPSQTGWALLSLMSAG EANS STVARGIQYLIANQKSDGTWDEEQYTGTGFPKFFMIKYHIYRNCFPLTALGTYRKLTGGMA
>seq_ID 146
MTSPFKHPISNALTSFNGNFAEPEQCVEQQTGAKVHHLPASIWKRKMGKAKSPLDVAIEGS-RDFFFQEQLPKGYWWAELESNVTITAEYIMLFHFLGLVDRERQRKMSNYLLSKQTEEG-FWPIYYGGPGDLSTTIEAYFALKLSGYPADHPALAKARAFILEQGGWKSRVFTKIFLALFGE-FEWQGVPSMPVELNLLPDWAYINIYEFSSWARATIVPLS-WMHSRPVRRVPPSARVQELFVRQPTAADYSFAKNDGIFTWENFFLGLDRV-LKVYEKSPLRPFKNMALAKAEEWVLEHQEPTGDWGGIQPAMLNAVLALNVLGYQNDHPA-VEQGLRALANFCIETEDQLVLQSCVSPVWDTALALKALLDAGVPPDHPSLVKGAQWLLD-KEVTRPGDWRVKSPALEPGGWAFEFLNDWYPDVDDSGFVMIALKGIQVKDRKS-MDAAIKRGINWCLGMQSKNGGWGAFDKDNTRHVLNKIPFADLEALIDPPTADLTGRM-LELMGTFNYPITLPAAQRAIEFLKKNQEPEGPWWGRWGVNYLYGTWSVLCGLAAIGE-D M DQ P Yl RKAVNWIKS RQ NIDGG WGETCQSYH D RTLAG VGESTPSQTGWALLG L LAA-GEMHSATVVRGVQYLISTQNSDGTWDEQQYTGTGFPKYFMIKYHIYRNCFPLMALGTYR-TLTRTQP
>seq_ID 147
MSPCKHPISHALTSFNGETADSVPVQTPKTGAKIHHLPPSIWKKKEGELKSPLDIAIENSRD-FFFREQLPDGYWWAELESNCTITAEYVMLYHFMDLVDRERERKMANYLLSKQTEEG-FWTIYYGGPGDLSTTVEAYFALKLAGYPADHPAMVKARAFILDNGGIIKTRVFTKIFLALFGE-FAWFGVPSMPIELILLPNWAYFNMYELSSWSRATIIPLSIVMTQRPVRKLPPAS-
RVQELYVRPPSPID YTFTKEDGIFTWKN FFIGVDHILKVYESN Pl RPFKKKAM LAAEN-WVLEHQEATGDWGGIQPAMLNSVLALHCLGYANNHPAVAKGLEALENFCIESEDS-LVLQSCISPVWDTALALKALVDSDVPNDHPALVKAAQWLLDKEIRKAGDWKVKSPELEPGG-WAFEFLNDWYPDVDDSGFVMMALKDVAVKDRKSMDTAIKRGISWCLGMQSKNG-GWGAFDKDNTKYLLNKIPFADLEALIDPPTVDLTGRMMELMGTFGYAKDYPPAVRALD-FIKRNQEPDGSWWGRWGVNYIYGTWSVLCGLSAMGEDLNQPYIRKAINWLKSRQNIDGGW-GETCESYHDSSLAGIGASTASQTGWALLALMAVGEENASAVARGVQYLLATQKSDGTWDED LYTGTGFPKFFMIKYHIYRNCFPLTALGTYRRKTGGRAEMQVSEHNK
>seqLlD 144
MKISKHPISHALTSFNETAKETKEEPQKKRGGKVHHLPASIWKKRDVET-TSPLDQAIKRSQEFFLREQLPAGYWWAELESNVTITAEYVILFHFMGLVNRDKDRK-M ATY LLSKQTEEGC WCIW H GG PGDLSTTIEAYF ALKLAG YPADH PAM Q KARTFILGKGGIL-KARVFTKIFLALFGEFSWLGVPSMPIEMMLLPNGFTFNLYEFSSWSRATIIPLSIVMA-ERPVRKLPPWARVQELYVRPPRPMDYTFTKEDGILTWKNIFIGIDHILKVYEASPIRPGMKKA-MAIAEQWVLDHQEPTGDWGGIQPAMLNSVLALHCLGYANDHPAVAKGLQALANFCIESDDEI-VLQSCISPVWDTALALMAMVDSEVPTDHPALVKAAQWLLDREVRKVGDWKIKAPNLEPGG-WAFEFQNDWYPDVDDSGIVMMAIKDVKVKDSKAKAEAIQRGIAWCIGMQSKNG-GWGAFDKDNTKHILNKIPFADLEALIDPPTADLTGRMLELMGTFGYPKDHPAAVRALQFVKEN-QEPDGPWWGRWGVNYIYGTWSVLCGLKAYGEDMGQPYVRKAVEWLAAHQNPDGGWGE-CCESYCDQKLAGTGPSTASQTGWALLSMLAAGDVDHPAVARGIRYLIETQQPDGTWDE-DQFTGTGFPKYFMIKYHIYRNCFPLMAMGRYRALKGHKG
>seqLlD 15
MAEQLVEAPAYARTLDRAVEYLLSCQKDEGYWWGPLLSNVTMEAEYVLL-CHILDRVDRDRMEKIRRYLLHEQREDGTWALYPGGPPDLDTTIEAYVALKYIGMSRDEEP-MQKALRFIQSQGGIESSRVFTRMWLALVGEYPWEKVPMVPPEIMFLGKRMPLNIYEFGSWA-RATWAISIVMSRQPVFPLPERARVPELYDTDVPPRRRGAKGGGGRIFDALDRALHGYQKLS-VHPFRRAAEIRALDWLLERQAGDGSWGGIQPPWFYTLIALKILDMTQHPAFIKGWEGLELY-GVDLDYGGWMFQASISPVWDTGLAVLALRAAGLPADHDRLVKAGEWLLDRQIT-VPGDWAVKRPNLKPGGFAFQFDNVYYPDVDDTAWVWALNSLRLPDERRRRDVMT-KGFRWIVGMQSSNGGWGAYDVDNTSDLPNHIPFCDFGEVTDPPSEDVTAHVLECFGSFGYD-DAWKVIRRAVEYLKREQRPDGSWFGRWGVNYLYGTGAVVPALKAVGIDVREPFIQKALD-WVEQHQNPDGGWGEDCRSYEDPAYAGKGASTPSQTAWALMALIAGGRAESDSVRRG-VQYLVETQRPDGGWDEPYYTGTGFPGDFYLGYTMYRHVFPTLALGRYKQAIERR
>seqUD 16
MAEQLVEAPAYARTLDRAVEYLLSCQKDEGYWWGPLLSNVTMEAEYVLL-CHILDRVDRDRMEKIRRYLLHEQREDGTWALYPGGPPDLDTTIEAYVALKYIGMSRDEEP-MQKALRFIQSQGGIESSRVFTRMWLALVGEYPWEKVPMVPPEIMFLGKRMPLNIYEFGSWA-RATWALSIVMSRQPVFPLPERARVPELYETDVPPRRRGAKGGGGWIFDALDRALHGYQKLS-VHPFRRAAEIRALDWLLERGAGDGSWGGIQPPWFYALIALKILDMTGHPAFIKGWEGLELYG-
VELDYGGWM FQ AS IS PVWDTG LAVLALRAAG LP ADH D RLVKAG EWLL DRQIT-VPGDWAVKRPNLKPGGFAFQFDNVYYPDVDDTAWVWALNTLRLPDERRRRDAMT-KGFRWIVGMQSSNGGWGAYDVDNTSDLPNHIPFCDFGEVTDPPSEDVTAHVLECFGSFGYD-DAWKVIRRAVEYLKREQKPDGSWFGRWGVNYLYGTGAWSALKAVGIDTREPYIQKALD-WVEQHQNPDGGWGEDCRSYEDPAYAGKGASTPSQTAWALMALIAGGRAESEAARRG-VQYLVETQRPDGGWDEPYYTGTGFPGDFYLGYTMYRHVFPTLALGRYKQAIERR
>seq_ID 141
MTSPFKHPISNALTSFNGNVAEPEQSVEQQSGAKVHHLPASIWKRKMGRAKSPLDVAIEGS-RDFFFQEQLPKGYWWAELESNVTITAEYIMLFHFLGLVDPERQRKMSTYLLSKQTEEG-FWTIYYGGPGDLSTTIEAYFALKLSGYPEDHPALAKARAFILEQGGVVKSRVFT-KIFLALFGEFDWQGIPSMPVELNLLPDWAYINIYEFSSWARATIVPLS-VVMHSRPVRRVPPSARVQELFVRQPTAADYSFAKNDGLFTWEKFFLGLDRV-LKVYEKSPLRPFKKTALAKAEEWVLEHQEPTGDWGGIQPAMLNAILALNVLGYRNDHPA-VEQGLRALANFCIETEDQLVLQSCVSPVWDTALALKALLDAGVPPDHPSLVKGAQWLLD-KEVTRAGDWRVKSPNLEAGGWAFEFLNDWYPDVDDSGFVMIALKGIQVKDH-KAMDAAIKRGINWCLGMQSKNGGWGAFDKDNTKHVLNKIPFADLEALIDPPTADLTGRM-LELMGTFDYPVTFPAAQRAIEFLKKNQEPEGPWWGRWGVNYLYGTWSVLCGLAAIGE-DMDQPYIRKAVNWIKSRQNIDGGWGETCQSYHDRTLAGVGESTPSQTGWALLSLLAAGEMH SATVVRGVQYLISTQNSDGTWDEQQYTGTGFPKYFMIKYHIYRNCFPLMALGTYRTLTRTQP
>seq_ID 195
MNPAKYKISSSLTSLNAEPVEQAPLPAKRTGSKVHRLPPSIWKKMVAEAKSPLDKGIERTRD-FFLREQLPDGYWWAELESNVTISAEYVMLFHFLGMVDRERERKLANYILAKQTSEG-FWSLWHNGPGDLSTTIEAYFALKLAGYSADHPAMAKARAFVLANGGIIKARVFTKIFLALFGE-FAWFGVPSMPIELMLLPDWAYFNMYEFSSWSRATIIPLSVVMSERPVRKLPPRA-QVQELFVRPPRPTDYTITREDGLFTWKNFFIGADHUKVYESSPIRPFKKRAVALAEN-WILEHQEQSGDWGGIQPAM LNSILALHCLGYANDHPAVAKGLDALANFCIEDDDCIVLQSCV-SPVWDTALALVALQEADVPADHPALVKAAQWLLNLEVRRKGDWQVKCPELEPGG-WAFEFLNDWYPDVDDSGFVMLSIKNIKVRDRKHREEAIKRGIAWCLGMQSENGGWGAF-DRNNTKYLLNKIPFADLEALIDPPTADLTGRMLELMGNFDYPKSHPAAERALAFLK-KEQESEGPWWGRWGVNYLYGTWSVLCGLEAIGEDMNQPYIRKAVNWIKSRQNNDGGWGE-VCESYFDRSLMGSGPSTASQTGWALLALMAAGEANSRAAAQGVKYLLETQNEDGTWDE-DAFTGTGFPKFFMIKYHIYRNCFPLTALGRYRRLTAAKG
>seq_ID 3
M T ATT DGSTG AS LRP LAASASDTDI TI PAAAAGVPE AAARAT RRATD F L LAKQD AEG WWKG D-LETNVTMDAEDLLLRQFLGIQDEETTRAAALFIRGEQREDGTWATFYGGPGELSTTIE-AYVALRLAGDSPEAPHMARAAEWIRSRGGIASARVFTRIWLALFGWWKWDDLPELP-PELIYFPTWVPLNIYDFGCWARQTIVPLTIVSAKRPVRPAPFPLDELHTDPARPNPPR-PLAPVASWDGAFQRIDKALHAYRKVAPRRLRRAAMNSAARWIIERQENDGCWGGIQPPA-VYSVIALYLLGYDLEHPVMRAGLESLDRFAVWREDGARMIEACQSPVWDTCLATIAL ADAGVPEDHPQLVKASDWMLGEQIVRPGDWSVKRPGLPPGGWAFEFHND-
NYPDIDDTAEWLALRRVRHHDPERVEKAIGRGVRWNLGMQSKNGAWGAFDVDNTSAF-
PNRLPFCDFGEVIDPPSADVTAHWEMLAVEGLAHDPRTRRGIQWLLDAQETDGSWF-
GRWGVN YVYGTGS VIPALTAAGLPTSH P Al RRAV RWL ES VQ N E DGGWGED LRSYRYV-
REWSGRGASTASQTGWALMALLAAGERDSKAVERGVAWLAATQREDGSWDEPYFT-
GTG FPWDFSINYNLYRQVFPLTALG RYVHG E P F AKKPRAAD AP AE AAP AEVKGS
>seq_ID 18
MTKQLLDTPMVQATLEAGVAHLLRRQAPDGYWWAPLLSNVCMEAEYVLLCHCLGKKN-
PEREAQIRKYIISQRREDGTWSIYPGGPSDLNATVEAYVALKYLGEPASDPQMVQAKE-
FIQNEGGIESTRVFTRLWLAMVGQYPWDKLPVIPPEIMHLPKSVPLNIYDFASWARATIVTL-
SYRHESPTCDATSGLCKGSGIVRGEGPPKRRSAKGGDSGFFVALDKFLKAYNKWPIQP-
GRKSGEQKALEWILAHQEADGCWGGIQPPWFYALLALKCLNMTDHPAFVKG-
FEGLEAYGVHTSDGGWMFQASISPIWDTGLTVLALRSAGLPPDHPALIKAGEWLVSKQIL-
KDGDWKVRRRKAKPGGWAFEFHCENYPDVDDTAMWLALNGIQLPDEGKRRDALTRG-
FRWLREMQSSNGGWGAYDVDNTRQLTKSDSIFATSGEVIDPPSEDVTAHVLECFGSFGY-
DEAWKVIRKAVEYLKAQQRPDGSWFGRWGVNYVYGIGAWPGLKAVGVDM-
REPWVQKSLDWLVEHQNEDGGWGEDCRSYDDPRLAGQGVSTPSQTAWALMALI-
AGGRVESDAVLRGVTYLHDTQRADGGWDEEVYTGTGFPGDFYLAYTMYRDIL-PVWALGRYQ EAMQRIRG
>seqJD 245
MNPIRGKRGSAADFLEEEYQWENLADHGESGRTPGGGHPAALKEYEAGSATEHT-GHHCVHHLGVRNSWLRKIEKAIDNACGQLFKTQYEDGYWWSELESNVTITSEYIMLLYL-LEVSRPEQQKSMVKYLLNQQRPDGSWGLYYGDGGNLSTTIEAYFALKLAGEHCESEPMRRA-REFILSKGGIESARVFTKIWLALFSQYDWDKVPSMPVELVLLPSSLYFNIYEFSS-WARGTVVPLSIVMSIRPRCPLPAKCSIKELYVPGSKHKNFASCTHKLFFLFDRIAKA-FERRPVPSLRNKAVGAAETWVLDHQEDSGDWGGIQPPMVYSVLALYYLGYPLDHEVIVKGI-KALDAFCMEDEEGTRMQSCVSPVWDTALTVLSMLDAGVAAEHPGLEKAGRWLLENQVLT-GGDWQIKNDSLPGGWAFEFYNTRYPDVDDSAVVLSTLNRFNAERVEGLEFAKCRG-MEWCLSMQSSNGGWAAFDKDNTLEILNRIPFADQEAMVDYPTADVTGRVLEAM-GYLGYDGSHPRARKAIQFLKKRQERDGCWWGRWGVNYIYGTWSVLKGLISIGED-PRAAYIRAAVRWVKDHQNSDGGWGETCESYENPELRGQGPSTPSQTAWALMSLIACGEM-KSQEASRGIQYLLRTQKRDGTWEELHFTGTGFPKHFYIRYHNYRNCFPLMALGQYLRALER
>seqLlD 221
MTATTDGSTGALPPRAASASEPHDTIPQAAGSVGIQDAAARATQRATDFLLSRQDAEG-WWKGDLETNVTMDAEDLLLRQFLGIQDEKTTRAAGLFIRGEQRADGTWATFYGGPGDLSA-TIEAYVALRLAGDGPDEPHMAKASAWIRERGGIASARVFTRIWLALFGWWKWDDLPELP-PELIYFPKWMPLNIYDFGCWARQTIVPLTWSAKRPVRPAPFPLDELHADANDPNPAK-PLAPMVSWDGLFQRLDVALHTYRKVAPRRLRKAAMNTAARWIIERQENDGCWGGIQPPA-VYSVIALYLLGYDLEHPVMREGLASLDRFAVWRDDGARMIEACGSPVWDTCLATI AL­
AD AGVPADHPQLVRAADWMLGEEIVRPGDWAVKRPQLPPGGWAFEFHND-NYPDIDDTAEWLALRRVKHHDPERLDNAIRRGVRWNLGMQSKDGGWGAFDVDNTSPF-PNRLPFCDFGEVIDPPSADVTAHWEMLAFEGLSHDPRTRRGIQWLLSAQEANGSWF-GRWGVNYVYGTGSWPALVAAGLPASHPAIRRAVTWLETVQNDDGGWGEDLR-SYPEAAEWSGKGASTASQTGWALLALLAAGERESKAVERGIEWLAQTQRPDGSWDEPYFT-GTGFPWDFSINYHLYRQVFPLTALGRYVNGEPLVEVKGG
>seq_ID 160
MKGKEPTREELLSFSSGIQMDSSAENTTPVSTEELQEKVRLAAESLISRQVE-EGYWVEPLEADVTITSEYILLQYLLGRERDEFFRRAAPFILESQGEDGGWPLYHGGPAEI-SATVKAYLALKLLGYDADHPAMQRARALVLERGGAINVNVFTRITLALFGQYDWKGVPALP-PEMILLPRWFPLSIYTVSYWSRTVIVPLLFIYHYKPLLELPPEKGVQELFITPMSEVRVHYA-WDKHWVSWKNLFFVLDRILQAWNRHPPSFLRRKALKKAMEWMIPRLKGEGG-LGAIYPAMANSVLALRLEGYAMDHPLVRRAIQSIDDLVFDLGEQQSVQPCHSPIWDTALALGA-LYEAGLDEGSPFVSRALDWFCRKEVRTVGDWSVRVPGVEAGGWAFQFENDYYPDIDDTS-WLMDFAKWVPEMGAYRDVFRRAIEWTLSMQGTDGGWGAFDKDNDFLFLNNIPFADHGALL-DPSTSDVTGRVTELLGILGYDARTPWRRALRFLRKEQEENGSWYGRWGVNYIYGTWSVV-SALKAVGEDMSAPYVQKAMQFLFSRQNPDGGWGESCYSYFRKDTAGEGVSTSSQTAWALI-ALIHGGHVRHPAVSKGIDFLLSRQQADGKWLEQEYTGTGFPKVFYLRYNMYRDYFSL-WALSLYRNVLLDGQSRVERLARRWKGNPYPVRSRFLA
>seq_ID 161
MEGKDPTREELLSFTSGIQMDSRVGNTNPVSTEELQEKVRLAAESLIS-RQGEEGYWVEPLEADITITSEYVLLQYLLGRERDEFFRRAAPFILESQGEDGGWPLYNGG-PAEISATVKAYLALKLLGYDADHPAMQRARALVLERGGAINVNVFTRIT-LALFGQYDWKGVPALPPEMILLPRWFPLSIYTVSYWSRTVIVPLLFIYHYKPLLEL-PPEKGVQELFITPMSEVRVHYAWDKHWVSWKNLFFVLDRILQAWNRHPPSFLRRKALKKA-MEWMIPRLKGEGGLGAIYPAMANSVLALRLEGYEMDHPLVRRAIQSIDDLVFDLGEQQSVQP-C HS Pl WDT ALALGALYEAG LDEGS P F VS RALD WFCRKEVRTVG D WSVRVPG V EAGG-WAFQFENDYYPDIDDTSWLMDFAKWVPEMGAYRDVFRRAIEWTLS-MQGTDGGWGAFDKDNDFLFLNNIPFADHGALLDPSTSDVTGRVTELLGILGYDART-PWRRALRFLRKEQEENGSWYGRWGVNYIYGTWSWSALKAVGEDMSAPY-VQRAMQFLFSRQNPDGGWGESCYSYFRKDTAGEGVSTASQTAWALIALIHGGHVRHPA-VSKGIDFLLSRQQADGKWLEQEYTGTGFPKVFYLRYNMYRDYFSLWALSLYRNVLLDGQSR-VERLSRRWKGTPYPVRSRFLA
>seqLlD 240
MHEGEAMTATTDGSTGALPPRAAAASETHLDTPVAAGIQEAAVRAVQRATEHLLARQDAEG-WWKGDLETNVTMDAEDLLLRQFLGIRDESTTRAAAKFIRGEQREDGTWAGFYGGPGELSTT-VEAYVALRLDGDAPDAPHMAKASAWIRAQGGIAAARVFTRIWLALFGWWKWEDLPELP-PELIYFPKWAPLNIYDFGCWARQTIVPLTIVSAKRPVRPAPFPLDELHADPADPNPAK-PLAPVASWDGAFQRLDKAMHQLRKVAPRRLRRAAMNSAARWIIERQENDGCWGGIGPPA-
VYSVIALHLLGYDLQHPVMRAGLESLDRFAIWREDGSRMIEACQSPVWDTCLATIAL-VDAGVPADH PQLVKAADWM LG EEIVRPG DWSVKRPQLP PGGWAFEF HND-NYPDIDDTAEWLALRRVRHHDPDRVENAIGRGVRWNLGMQSKNGAWGAFDVDNTSPF-PNRLPFCDFGEVIDPPSADVTAHWEM LAVEGLSHDPRTRRGIEWLLAEQEPDGSWF-GRWGVNYIYGTGSVVPALTAAGLPASHPAIRRAVAWLEKVQNDDGGWGEDLR-SYKYVKEWSGRGASTASQTAWALMALLAAGERDSKAVERGVEWLASTQRADGSWDEPYFT-GTGFPWDFSINYHLYRQVFPLTALGRYVHGEPFSRTEAL
>seqLlD 231
M TATTDGSSG PVRAGAATAGDTmTAARTTAPGTD VRE AAG RAAERAV EH L-LARQDAQGWWKGDLETNVTMDAEDLLLRQFLGIQDAATVEASARFIRGQQRDDGTWAT-FYGGPGELSTTIEAYVALRLAGDRPDDPHMQRAASWVRSRG-GIAAARVFTRIWLALFGWWKWDDLPELPPELILLPKWVPLNIYDFGCWARQTIVPLTW-SAKRPVRPAPFALDELHTDPAMPNPQKRFAPAASWDGFFQRADKALHLYHKVA-PRRLRRAAMNAAARWIIERQENDGCWGGIQPPAVYSVIALHLLGYDLEHPVM-RAGLESLD RFAVH REEEGLPVRMIEACQSPVWDTCLATI AL AD AGLPADH PALVKAAD-WMLSEGIVRPGDWAVRRPGLGPGGWAFEFHNDNYPDIDDTAEVILAL-RRVKHPDPERVEAAVARGTRWNLGMQSLNGAWGAFDADNTSPFPNRLPFCDFGE-VIDPPSADVTAHWEMLAHEGMAEDPRTRRGVRWLLREQEANGAWFGRWGVNYVYGTGA-VVPALIAAGLPASHPSVRRAVTWLESVQNEDGGWGEDLRSYREEQSIGRGASTASQTG-WALLALLSAGERDGRAVERGVAWLARTQRPDGSWDEPYFTGTGFPWDFSINYHLYRQVF-PLTALGRFLHGEKPVGRAAAREGG
>seqLlD 227
MTATTDGSTGAANPSEATAHDPTDTTTAADDLTVAARRAAERSVEHLLGRQDEQGWWKGD-LATNVTMDAEDLLLRQFLSIQDPETTRAAALFIRGEQLGDGTWNTFYGGPGDLSATIE-AYVALRLAGDRPDEPHMARAAGWIRDQGGIAAARVFTRIWLALFGWWKWDDLPELPPELM-FFPKWVPLNIYDFGCWARQTIVPLTIVSAKRPVRPAPFALDELHTDPDHPNPPRKLAPPTS-WDGLFQRLDKGLHLYHKVAPRPLRRVAMNLAARWIIERQENDGCWGGIQPPAVYSVIALHLL-GYDLDHPVMKAGLASLDRFAVRREDGARMIEACQSPVWDTCLATIALADAGLRPDHPAL-VKAADWMLAEEITRPGDWSVRKPELAPGGWAFEFHNDNYPDIDDTAEVVLAL-RRVRHPDPARLQAAIDRGVRWNLGMQSRNGAWGAFDADNTSPFPNRLPFCDFGE-VIDPPSADVTGHVVEMLAVEGLASHPRTREGIEWLLAEQEACGAWF-GRWGVNYVYGTGSWPALITAGLPAGHPAIRRAVAWLESVQNDDGGWGEDLRSYQEEK-WIGHGESTASQTAWALLALLAAGRRDTRPVARGVTWLTEAQQADGSWDEPYFT-GTGFPWD FSIN YH LYRQVFP LTALG RYVH G D PF AD RAM AAEG A
>seqJD 121
MQTQNRVTSTQKVELSNLTKAIIASQNYIMSRQYPEGYWWGELESNITLTAETILLH-
KIWKTDKTRPFHKVETYLRRQQNEQGGWELFYGDGGELSTSVEAYMALRLL-
GVTPEDPALIRAKDFILSQGGISKTRIFTKFHLALIGCYDWKGIPSIPPWIMLFPDNFPFTIY-
EMSSWARESTVPLLIVFDKKPIFEIEPAFNLDELYAEGVENVKYALPRNHNWSDIFLGLD KLFKWTEKNNLVPFHKKSLQAAERWMLNHGQESGDWGGIMPPMVNSLIA-FKVLNYDVADPSVQRGFEAIDRFSIEEEDTYRVQACVSPVWDTAWVIRALVDSGLKPDHPS-LVKAGEWLLDKQILEYGDWAIKNKQGKPGGWAFEFINRFYPDLD-DSAVWMALNGIKLPDENCKKAAINRCLEWMATMQCKPGGWAAFDVDNDQAWINEIPYGDL-KAMIDPNTADVTARVLEMVGSCGLKMDENRVQKALFYLEKEGESDGSWFGRWGVNYIYGTS-GVLSALAVIAPNTHKPQMEKAVNWLISCQNEDGGWGETCWSYNDPSLKGTGVSTASQTAWA-LIGLLDAGEALETLATDAIKRGINYLLDTQTPDGTWEEAEFTGTGFPCHFYIRYHLYRHYF-PLIALGRYWKIGLKNLKG
>seq_ID 120
MQTQNRVTSTQKVELSNLTQAIIASQNYILSRQYPEGYWWGELESNITLTAETVLLH-KIWKTDKTRPFHKVETYLRRQQNEQGGWELFYGDGGELSTSVEAYMALRLL-GVTPEDPALIRAKDFILSKGGISKTRIFTKFHLALIGCYDWKGIPSIPPWIMLFPDNFPFTIY-EMSSWARESTVPLLIVFDKKPIFEIEPAFNLDELYAEGVENVKYALPRNHNWSDIFLGLD-KLFKWTEKNNLVPFHKKSLQAAEKWMLNHQQESGDWGGIMPPMVNSLIA-FKVLNYDVADPSVQRGFEAIDRFSIEEEDTYRVQACVSPVWDTAWVIRALVDSGLKPDHPS-LVKAGEWLLDKQILEYGDWAIKNKQGKPGGWAFEFINRFYPDLDDSAVVVMALNGIKLPDEN-RKKAAINRCLEWMATMQCKPGGWAAFDVDNDQAWINEIPYGDLKAMIDPNTADVTARV-LEMVGSCGLKMDENRVQKALFYLEKEQESDGSWFGRWGVNYIYGTSGVLSALA-VIAPNTHKPGMEKAVNWLISCQNEDGGWGETCWSYNDSSLKGTGISTASQTAWAIIGLLDA-GEALETLATDAIKRGIDYLLATQTPDGTWEEAEFTGTGFPCHFYIRYHLYRHYFPLIALGRY-WKIGLKTPSVIPLN
>seq_ID 132
MFQGSDRPPVTLVMNDMRGPDMNVSDTVSVTRESIPTQTSAGDATARDLTAAVGSELTRAL-RLATDHLLALQDGTGWWKFDLETNTSMDAEDLLLREYLGIRTTEVTAASARFIRSRQSDDGS-WPQYFGGPGELSTTVESYIALRLAGDDASAPHMLSAATWVRD-HGGVPATRVFTRIWLALFGWWRWEDLPALPPEIMLLPRRAPLNIYSFGSWARQTLVSLTVV-SALRPVRPAPFDLDELYPDGPASAWSGAGPSNVLERISTRFTAKEIFLGIDRLLHVYHR-RPVRSMRNHALRAAERWIIARQEADGCFGGIQPPAVYSIIALRLLGYELDHPVLKAALRALD-DYSVTLPDGSRMVEASQSPVWDTALAVNALADAGATAAIAPDHPALVRAAGWLLGQEVRHR-RGDWAVNHPDVPASGWAFEFENDTYPDTDDTAEVLLALRRVRHPARDELDAAER-RAVAWLFGLQSSDGGWGAYDADNTSTIPYQIPFADFGALTDPPSADVTAHVVELLAEA-GLGGDDRTRRGVDWLLDHQEADGSWFGRWGVNYVYGTGSVMPALRAAGLEPSHPAM-RAGADWLLTHQNADGGWGEDLRSYTDPEWSGRGESTASQTAWAM LALLTVGDQPEVS-GALARGARWLADHQRPDGSWDEDQFTGTGFPGDFYINYHGYRLLWPIMALGRYLRG
>seq_l D 116
MLTYKEYRRSVTEIAMQTRDRQTQKPALSLNDAITASQNYLLSLQYPQGYWWAELESNIT-
LTAETVLLHKIWGTDKTRPLHKVEAYLRQQQREQGGWELFYGDGGEISTSVEAYMALRLL-
GVPQDDPALIRAKDFILSKGGISKTRIFTKFHLALIGCYSWKGIPSIPPWIMLFPNSFPFTIY-
EMASWARESTVPLIIVFNDKPVFAVDPIFNLDELYAEGIENVKYELPKNNNWGDIFLGLD-
KVFKFAEQVDLVPFRKKGLQAAERWMLNHQQETGDWGGIMPPMVNSLLAFRVLNYDVND-PSVQRGFEAIDRFSIEENETYRVQACVSPVWDTAWCVRALTNSGLPKDHFSLVKAGKWL-LEKGCLEYGDWAVKNKTGKPGGWAFEFTNRFYPDIDDSAVWMALNGIKLPDEARKQAAIN-RCVKWIETMQCKEGGWAAFDVDNDQAWLNEVPYGDLKAMIDPNTADVTARWEMVGSCD-LEISSKRLNKALNYLYKEQEKDGSWFGRWGVNYIYGTSGVLSALAVINPEKHQPQIEQGIN-WLLSCQNKDGGWGETCWSYNDSNLKGKGISTASQTAWALIGLLDAGEALNHFETDSIQRGI-SYLLNTQTEEGTWEESEFTGTGFPCHFYIRYHFYRHYFPLIALGRYQNLSSEFGIRNSEL
>seq_ID 230
M TATTDGSSGP L RGGAATAG ETTSTS AARTTEPGTDLREAAARAAERAV EH LLARQDAEG-WWKGDLETNVTMDAEDLLLRQFLGIQDPATVGASARFIRGQQRDDGTWATFYGGPGELSTT-VEAYVALRLAGDRPDDPHMQRAASWVRSRGGIAASRVFTRIWLALFGWWKWEDLPELP-PELIFLPKWFPLNIYDFGCWARQTIVPLTWSAKRPVRPAPFALDELHTDPALPNPGKRLA-PAASWDGFFQRADKALHAYHKVAPRRLRRAAMNAAARWIIERQENDGCWGGIQPPAVYSVI-ALHLLGYDLEHPVMRAGLESLDRFAVHHEEEGLPVRMIEACQSPVWDTCLATIALADAGL-PADHPALVKAADWMLSEQIVRPGDWSVRRPGLGPGGWAFEFHNDNYPDIDDTAEWLAL-RRVKHPDPERVDAAVARGTRWNLGMQSRDGAWGAFDADNTSPFPNRLPFCDFGE-VIDPPSADVTAHWEILAHEGMAHDPRTRRGVRWLLAHQEANGAWFGRWGVNYVYGTGA-VVPALTAAGLPGSHPAIRRAVAWLESVQNEDGGWGEDLRSYREEKSIGRGVSTASQTG-WALLALLAAGERESKAVERGVAHLAQTQAPDGSWDEPYFTGTGFPWDFSINYHLYRQVF-PLTALGRYVHGEKLPGRAGAREGR
>seqLlD 234
MHEGEAMTATTDGSTGAATPPATTASAPLHLSPEARETHEATARATRRAVDFLLARQSDEG-WWKGDLATNVTMDAEDLLLRQFLGIRDEATTRAAALFIRGEQQEDGTWNTFYGGPGDLSA-TIEGYVALRLAGDSPEAPHMRKASAFVRAQGGVARARVFTRIWLALFGWWKWEDLPEMP-PELMFFPKWAPLNIYDFGCWARQTIVPLTWCAQRPVRPAPFALEELHTDPADPDPAQPAPP-VVSWDNVFHKLDKLLHGYRRIAPRRVREAAMRAAATWIVERQENDGCWGGIQPPAVYSI-MALNLLGYDLDHPVLRAGLASLDRFAVWREDGARMIEACQSPVWDTCLATVALADAGVPAD-H PQMIKAADWM LAEQIVRPGDW WRRPDLPPGGWAFEFH NDN YPDIDDTAEWLALRR-VAHPDATRVDKAVRRAVDWNVGMQSKNGAWGAFDADNTSPFPNRLPFSDFGEVIDPPSAD-VTAHVVEMLAEEGLAHHPRTRRGIEWLLKNQEGNGSWFGRWGVNYVYGTGAWPAL-VAAGLPASHPAIRRSVSWLGQVQNEDGGWGEDLRSYQDSAWHGRGHSTASQTA-WALLALLAAGERETEQVRRGIAYLVETQTEDGTWDEPWFTGTGFPWDFTI-NYHLYRQVFPVTALGRYLNGTGPGEN
>seq_ID 123
M QTRDRQT H KPALSLN DAITASQ N YLLS LQYPQG YWWAELES NITLTAETVLLH-
KIWGTDKTRPLHKVEAYLRQQQREHGGWELFYGDGGEISTSVEAYMALRLLGVPSND-
PALIRAKNFIISQGGISKTRIFTKFHLALIGCYSWKGIPSIPPWIMLFPNSFPFTIYEMASWA-
RESTVPLIIVFNDKPVFAIDPIFNLDELYAEGIENVKYELPKNNNWGDLFLGLDKVF-
KLAEQVDLVPFRKQGLQAAERWMLDHQQETGDWGGIMPPMVNSLLAFRV-
LNYDVADPSVQRGFEAIDRFSIEENDTYRVQACVSPVWDTAWCIRALTDSGLPKDHFSLVKA-GKWLLEKQVLEYGDWAVKNKTGKPGGWAFEFTNRFYPDIDDSAT-WMALNGIKLPDEALKQAAINRCLKWIETMQCKAGGWAAFDVDNDQAWLNEIFYGDLKA-MIDPNTADVTARWEMVGSCDLEMSSDRLNKALDYLYEEQEKDGSWFGRWGVNYIYGTS-GVLSALAVINPKQHKSQIEQGMNWLLSCQNEDGGWGETCWSYNDLSLKGKGVSTPSQTA-WALIGLLDAGEVLNHFETDSIERGINYLLNTQTEEGTWEESEFTGTGFPCH-FYIRYH FYRH YFPLIALGRYQQM LGS
>seq_ID 10
MTQASVREDAKAALDRAVDYLLSLQDEKGFWKGELETNVTIEAEDLLLREFLGIRT-P DITAETARWIRAKQ RSDGTWATF YDGP PD LSTSV EAYVAL KLAGDD PAAP H M E KAAAYIR-GAGGVERTRVFTRLWLALFGLWPWDDLPTLPPEMIFLPSWFPLNIYDWGCWARQTWPLTIV-SALRPVRPIPLSIDEIRTGAPPPPRDPAWTIRGFFQRLDDLLRGYRRVADHGPARLFRRLAM-RRAAEWIIARQEADGSWGGIQPPWVYSLIALHLLGYPLDHPVLRRGLDGLNGFTIREETAD-GAVRRLEACQSPVWDTALAVTALRDAGLPADHPRVQAAARWLVGEEVR-VAGDWAVRRPGLPPGGWAFEFANDNYPDTDDTAEVVLALRRVRLEDADQQALEAAVR-RATTWVIGMQSTDGGWGAFDADNTRELVLRLPFCDFGAVIDPPSADVTAHIVEW LAALGMRD-HPATVAGVRWLLAHQEPDGSWFGRWGANHIYGTGAVVPALIAAGVSPDTPPIRRAIRW-LEEHQNPDGGWGEDLRSYTDPALWVGRGVSTASQTAWALLALLAAGEEASPAVDRG-VRWLVTTQQPDGGWDEPHYTGTGFPGDFYINYHLYRLVFPISALGRYVNR
>seq_ID 233
MRRRRSPRGPGAGPEADYGPARASAPDRLRGDAARGDAARRVQDATARAIRNLL-GRQDPAGWWKGDLETNVTMDAEDLLLRQFLGIRDEAVTQAAALFIRREQREDGTWAT-FHGGPPELSATIEAYVALRLAGDAPDAPHMATASAWIRAHGGLAAARVFTRIWLALFGWWD-WENLPELPPELVLLPPWVPLNIYDFGCWARQTIVPLTWSAMRPVRPAPFALDELHT-DARVPVPPRRMAPPTTWNGAFQWMDRALHVYRRFAPRRLREAAMASAGRWIIERQEND-GCWGGIQPPAWSVIALHLLGYDLGHPVMRAGLESLDRFAVWREDGSRMIE-ACQSPVWDTCLAAI ALAD AGVRP DH PALVKAAD W M LG E EIV RTGD WAVRRPG LAPGG-W AF E F H N DTYPDID DTAE WLALRRIRH P DPARVE AAIARGVSWN LGMQSRGGAWGAF-DADNTSPFPNRLPFCDFGEVIDPPSADVTAHWEMLAAEGRAADPRTRRGIAWLLAEQEPEG-P WFG RWGTN YVYGTGS WPALTAAG LSPG H PAIRRAVLW LESVQN PDGGWGEDQR-SYQDRAWAGKGESTPSQTAWALMALLSAGERDAKTVERGIAYLVETQLADGGWDEPHFT-GTGFPWDFSINYHLYRHVFPLTALGRYLYGEPFGHDGRHIGAHLGDRTGVPAEGV
>seq_ID 116
MQTQD RLTQ KQPLSLKDAITASQ N YLLSLQ YPQG YW WAE L ES NITLTAETVLLH-KIWGTDKTRPLHKVEAYLRQQQREHGGWELFYGDGGEISTSVEAYMALRLL-GVPQDDPALIRAKDFIISKGGISKTRIFTKFHLALIGCYDWKGIPSIPPWIMLFPDSFPFTIY-EMASWARESTVPLIIVFNDKPVFSVDPVFNLDELYAEGVENVKYELPKNNNWGDIFL-GIDQVFKFAEQVDLVPFRKEGLKAAEKWILNHQQETGDWGGIMPPMLNSLLAFRTLNYDVND-PSVKLGFEAIDRFSIEEDDTYRLQACVSPIWDTAWCVRALTDSGLEKDHFSLVKAGKWLLD-
KQVM EYG DWAVKN KAG KPGGWAFEFTN RFYP DLDDS ATVVM ALNGIKLPDEARKQAAIN-RCLQWIETMQCKEGGWAAFDLNNDQAWLNEVPYGDLKAMIDPNTADVTARWEMLGSCD-LEIESDRLNKSLNYLYKEQEKDGSWFGRWGVNYIYGTSGVLSALAVINPEKHKTQMEQGIN-WLLSCQNKDGGWGETCRSYNDPSLKGKGVSTPSQTAWSLIGLLDAGEALNKFETDAIERG-VNYLLDTQTEEGTWEESEFTGTGFPCHFYIRYHFYRHYFPLIALGRYQNLSSEFGVRS
>seq_ID 124
MQIRATVDTAKLEKAIAASQEHLLSTQYPEGYWWAELESNVTMTAEVVLLHKIWKTDG-TRPMHKAEKYLRSEQREHGGWELFYGDGGDLSTSVETYTALRLLGVPASDPALLKAKD-FILRRGGISKTRIFTKLHLALIGCYDWRGLPSLPPWVMLLPENFPFTIYELSS-WARGSTVPLLIVMDRKPVFSVNPQINVDELYAEGRDRVKFELPRKGDWTDLFIELD-GLFKFTEQNNLVPFREEGLRAAERWVLERQEATGDWGGIIPAMLNSLLALRALGYH-PADPYVRRGMAAVDRFAIETADTYRVQPCVSPVWDTALVMRGLIDSGLPADHPAIVKAGEWL-LEKQILAYGDWAVKNKTGQPGAWAFEFENRFYPDVDDSAVWMALQAAQLPDEDLKQQAI-ERCVKWIATMQCKPGGWAAFDVDNDQDWLNQIPYGDLKAMIDPNTADVTARVLE-MIGRSGVTTGEASVERALAYLRREQEVEGCWFGRWGVNYIYGTSGVLAALALIAPKSDHA-MIQRGADWLVRCQNADGGWGETCRSYNDPHLKGQGPSTASQTAWALIGLLAAGEATGE-FAWGAIDRGINYLLATQQQDGRWDEDWFTGTGFPGHFYLKYHLYQQHFPLTALGRYSSLT-GLKQELKIPLQLKSKPEWMIEDSDLLSDEDAT
>seq_ID 119
MQIQDRNSSPQVTEVLNQVKDAIAASQDYLMSIQYPEGYWWAELESNVTITAEWLLH-KIWGTDKTRPLHKVETYLRRQQREHGGWELFYGDGGDLSTSVEAYMALRLL-GVSIDDPALIRGREFILKRGGISKSRIFTKLHLALIGCYDWRGIPSIPPWIMLLPENFPFTIY-EMSSWARSSTVPLLIVFDKKPVYCCDPTINLDELYSEGIENVKYDLPKTGDWTDIFVWLD-GVFKFAQDYNLVPLRQESLQAAERWVLERQEDSGDWGGIIPAM LNSLLAL-RALNYEAVDPIVHRGLQSVDNFAIETEDTYHVQPCISPVWDTAWAIRALVESGLKADD-PRLVKGAQWLLDKQILDYGDWAVKNKQGTPGGWAFEFDNRWYPDLD-DSAVWMALDQVKMPNEDLKNGAIRRCVRWMATMQCKDGGWGAFDLD-NDQNWLNFLPYADLKAMIDPNTSDVTARVLEMLGTCGLIMDSNRVQKAIAYLEKEQEPDGS-WFGRWG VN Yl YGTSGVLS ALAVIAP ETH Q KE L KKG AAWLVGCQ N ADGG WG ETC FSYN DS-SLKGKGDSTASQTAWGLIGLLAAGEATGEFFKTAIERGVNYLLKTQREDGTWDENYFT-GTGFPCHFYLKYHLYLQYFPLIALSRYQRLLT
>seq_ID 9
MSVSERAQPGGNPIPGSTSQSAVKFGRIDAALEDVKRAIAGAK-
DRVFAQQSKDGWWCGELEADSMLEADYIFAHTLLGTGDAGKMKRALTEMLRYQNEDGS-
WSIYPGGPGNISLTVKCYFSAKLMGMTADNPILVKAREWILAHGGVVECNTFT-
KIYLCFLGQYEYDAVPAIPPEIVLFPNWFYFNIYEISSWSRAILVPLSIAYAKKPFKKIP-
PEQGIDELFVGGREKANLHLRWDSKNLLSWRNFFLALDRVTHWFERVHIRPLRSIALKKA-
EKWMLARFEMSDGLGAIYPAMLNAIIALRCLGYSLDDPQVLRAMDEFEKLGIDEPEG-
TAEYAEPTFRMQ PCVSPVWDTAQ AV FALGEAGVPRN DPRMQKAAD-
WLLSKEVRHKGDWAMKVRNAQPGGWYFEFNNEFYPDVDDSAQVLLALNKVDN-PRERYQYDVCQRAIDWIFAMQCRNGGWASFDKDNTKMIFQYVPFADHNAMLDPPTVDITGRI LEM LATYGYTRKDRRVEKAIKFIYDEQEPDGSWFGRWGVNYLYGTFLVLRGLEAIGVWN-H E PQIQQAAEWIRSVQN ADGG WG ETCGSYDDPNTRGVGPSTPSQTA-WAILGLLSAGDDRSDSVAKGIKWLLAHQKPDGGWDESTGSGSKHQALYTGTGF-PRVFYLAYHQYRDYFPLLALTNYEKAMERGE
>seq_ID 217
MTEEVLQRTAAPAEVLAAAREHLLSLQHERGWWKGELETNVTMDVEDLLLRRFLGILT-TAETEQAARWIRSRQRADGTWAQFHGGPGDLSTTVEAYVGLKLAGDDVDSEHMAAARA-WILERGGIEETRVFTRIWLALFGEWSWDDLPAMPPELVLLPPWVPLNLADWGCWARQTIV-PLTVVCTLRPRRDLGVGLAELRSGRRRRKVPSPSWAGAFQVLDGALHGYQRHPLRGL-REHAMRRAAEWIVARQEADGSWGGIQPPWVYSLLALHLLGYPLDHPVLRQGLAGLERFLI-REETPEGTVRRLEACQSPVWDTVLSMQALRDAGLAADHPALRRAAD-FVLAEEIRVKGDWSVRRPDLAPGGWAFEFDNDGYPDIDDTAEWLALNRVDHERPGA-VNAAIDRGVRWMSGMQSADGGWGAFDADNTRELVNELPFCDFGAVIDPPSADVTAHWEAL-CVLGRGDGEAVRRGVRWLLDHQELDGSWFGRWGANHVYGTGAAVPALVRAGLRRDHLAL-RRAVRWLEVHQNDDGGWGEDLRSYDDPVWVGRGRSTASQTAWALLALLAVDLHDTDA-VRRGVGFLAETQRPDGTWDEPQFTGTGFPGDFYINYHLYRLVFPVTALGRYEQARRE-QSGGSG
>seqLlD 249
MIEKNKVKQSILASQKHLLSLQETEGYWWGQLESNVTITAEIILLHKIWQTDKKIPLNKAKNY-LISQQREHGGWELFYGDGGDLSTSIEAYMALRLLGVSRTDPIMIEAQNFIIKKG-GISCSRIFTKLHLALIGCYSWQGIPSIPSSIMLLPEDFPFTIYEMSSWARSSTVPLLIV-FDKKPIFSVNPTINLDELYAEGINNASFELPRKYDLTDLFLGLDKAFKFAENLNLM-PLQQEGLKAAEKWILERQEVTGDWGGIIPAMLNSMLALKCLEYDVADPVWRGLEAIDRFAIE-NEDSYRVQACVSPVWDTAWVIRSLVDSGISPSHPAMVKAGQWLLQQQILDYGDWVFKNK-FGKPGGWAFEFMNRFYPDIDDTAVWMALDVVELPDEDLKGKAIARGMEWIASMQCEAGG-WAAFDVDNNQDWLNATPYGDLKAMIDPNTADVTGRVLEMVGCCGLAMDSWRVKRGIDFLV-REQEEEGCWFGRWGVNYIYGTSGVILALAVMARESHRGYIERGASWLVGCQNSDGGWGE-SCWSYNDPSLKGKGKSTASQTAWALIGLLAAGEGTGNFARDAIDGGVGFLVSTQNDDGSW-LEDEFTGTGFPGHFYIKYHFYSQYFPLMALGRYESLLSG
>seq_ID 222
MAVRDRVNPKTLEAAIAASQSYLLTQQDETGYWWAELESNVSITSEWLLHKIWGTDRS-RPLEKVETYLRSQQRDHGGWELYFDDGGEISVSVEAYMALKLL-GVPMEDPAMVRARQFILEHGGISRTRVFTKLHLALIGCYEWRGIPSLPPWVMLLPEQFPFTIY-EMSSWARGSTVPLLIVMDREPVYAVEAGFNLDELYVEGRHFtAQFDLPLSNEWTDAFIYLD-GLFKFAESTNLVPFREEGIRAAERWILERQEATGDWGGIIPAMLNSLLGLKALDYDVHDPI-IERGMAALDAFALETEDQYWIQPCISPVWDTALVVRGLAESGLAPDHPALVKA-GEWLLNKQILDYGDWSVKNPGGLPGGWAFEFDNRFYPDVDDTAWVMALNEVQLPDEQAK-
DAAIARAVNWIATMQCRPGGWAAFDINNDQDWLNALPYGDLKAMIDPNTADVTARVLE-
MIGRCHQTTGKNSVDRALRYLRTEQEPEGCWFGRWGVNYIYGTSGVLAALA-
LIDPQGWQSQIQQAAAWLVSCQNTDGGWGETCASYDNPKLKGQGPSTASQTAWAIM-
GLLSAGEATSVYAEAAIERGVNYLTTTQKMDGTWDEDYFTGTGFPGHFYLKYHLYQQHF-
P LTALG RYQAM LQQKS
>seq_ID 186
MRTQDRVQVNSIAEAIAASQKYLLSLQNPAGYWWAELESNVTITAEVVLLH-KIWGTDKTRPLHKVEAYLRSQQKQHGGWELFYGDGGELSTSVEAYMALKLL-GVPATDPAMIQARDFILQRGGISKTRIFTKFHLALIGCYNWRGLPSLPAWVMLLPNQFPVNIY-EMSSWARSSTVPLLIVFDQKPVYQVNPTITLDELYAEGVENVRYELPRSGDWTDLFLTLDEG-FKLAESFNFIPFREEGIKAAEKWIIERQEATGDWGGIIPAMLNSMLALRSLGYDTNDPIVER-GLQALDNFAIETVDCYRVQPCVSPVWDTAWVIRALIDSGIAPDHPAIVKAGEWLLQKQILDY-GDWNVKNRQGKPGAWAFEFENRFYPDVDDTAVWMALHAAKLPNE-QLKQ KAC D RALQWVASM QCKPGG WAAFDL D N DQ DWLNSVPYG D LKAMIDPNTADVTAR-VIEM LGAON LSI DSH N LERALTYLLN EQE AEGCWFGRWGVN YlYGTSG VLSAL ALIN-PQKYQRHIQQGATWLVGCQNPDGGWGETCFSYNDPSLKGQGDSTPSQTAWALIGLIAA-GEATGNFAHDAIERGINHLVSTQQPDGSWFEAYFTGTGFPCHFYLKYHYYQQYFPLIAL-GRYQAIKSL
'-•seqJD 153
MQVQPRIEKKHLDSAIEASQAYLLARQYSPGYWWAELESNVSMTAEVVLLHKIWRTDTGR-PLAKATAHLLAEQRAHGGWELFYGDGGDLNTSIEAYMALKLLGLTADHPALARARAFILAKG-GISRARIFTKIHLALIGCYDWRGVPSIPPWVMLLPEAFPVNIYEMSSWARGSTVPLLIVF-DRKPVFAVEPAITLDELFVEGRAQARFDLPRSSSDWWANLFVDLDWGFKLAESLGAVPL-REEGLKAAERWVLERQEATGDWGGIIPAMLNSLLALRCLDYDPHDPVVERGMAAVDRFAIE-TESTYRLQ PCVS PVWDTALTM RALVDSG LPP DH P ALAAAGTW LLKKQILDYG D WAV KN RT-GPPGGWAFEFDNRFYPDVDDTAVWMALDAVRLADETAKGQAIARAVCWVASMQCRGGG-WAAFDIDNDAHWLNSLPYADLKAMIDPNTADVTARVLEMYGRCRLI-PAAAGAQRALDYLRRTQEPEGCWFGRWGVNYLYGTSGVLSALAAFAPAERTAIER-AAAWLRGCQNTDGGWGETCGSYVDRTLMGQGPSTASQTAWALLGLIDASRVARFSDS-SALERGLAYLVETQKADGSWDEPYFTGTGFPGHFYLKYHLYQQHFPLSALGRYRRLLS
'-•seqJD 122
MQIQARNISTKVTEVFSKVKEAIAASQQYLLSIQYPEGYWWAELESNVTITAEAVLLH-KIWGTDTTRPLHKVETYLRRQQREHGGWELFYGDGGDLSTSVEAYMALRLLGVSASDPALV-RAKAFILSRGGISKSRIFTKMHLALIGCYDWRGVPSIPPWIMLLPENFPFTIYEMSS-WARGSTVPLLIVFDKKPVYQCGITLDELYSEGINHVRYDLPRNGDWTDVFVWLDGVFKFA-ETNNLIPFRNESLKAAERWVLERQEDTGDWGGIIPAM LNSLLALRALDYEVNDPIVHRGFKS-VDNFAIETEETYHVQPCISPVWDTAWVLRALVESGLKPDEPVLVKGAQWLLDKQILDY-GDWAVKNKEGTPGGWAFEFDNRWYPDLDDSAWVMALEQVKMPDEQLKYGAM-RRCVRWMATMQCKAGGWGAFDVNNDQNWLNYLPYADLKAMIDPNTADVTARV-
L E M LGTCELSM D H DRVKRAIAYLEQ EQE ADGSWF G RWGVNYIYGTSGALSA-
LAAIAPVTHQAQIEKGAAWLVGCQNPDGGWGETCFSYNNPALRGKGDSTASQTAWGLIG-
LLAAGEATGKFAKTALERGVNYLLATQRPDGTWDESYFTGTGFPCHFYLKYHLYLQYF-
PLIALSRYQRLLGFN
>seq_ID 129
M SLTSD PS P AAPTAEKS PKRPTIPVPATAD AYGISRSSPPLPAATG RPQ AAG P ASAGVAT-ARARDHLLALQSEEGWWKGDLETNVTMDAEDLFMKQFLGIRGDDETEQTARWIRSQQLAD-GGWPTFYGGPADLSTTIE AYI AL RLAG D AVD AP H MARAAELVRAQGGVAAS-RVFTRIWLAALGQWSWDDVPVIPPELIFLPSWIPLNVYDFACWARQTIVALTIVGSLRP-SHDLGFSIDELKVPAAARKPAALRSWEGAFERLDKLLHRYEKRPIKLLRTLALRRA-TEWVVARQ EADGC WGGIQPP WVYSV M ALH LMGYPLNHPVIATAF RG-MERYVIRRDTPQGPIRQIEACQSPVWDTALAWALADAGVPGDHPAMVKAGRWLVDEEVR-VAGDWAVRRPELAPGGWAFEFDNDFYPDVDDTAEWLALRRLLGAGHVAPPASRQGRAE-APPVNTVEDAD PRLAAAM RAAAARG V D WS VG M RSSN GAWGAF DADNVRTLTT-KIPFCDFGEWDPPSADVTAHIVEMLADLGRSDHPITQRAVQWLLDNQEPGGSWF-GRWGVNH LYGTGAWP ALIGAGVPTD H PAITAAVRWLL E HQSPEGGWGEDL RSYTDPA-WIGRGELTASQTAWALLALLAVDPHSLAVKRGVRWLCETQRPDGTWDEPYFTGTGFPGDFS-LN YH LYRLVFP LTALG RYVS LTGVAT P
>seq_ID 164
MHSGRVFLEKENREENRATFHSSPLILVEESLNLPKKVEETIKKAQRYLL-SIQKEDGHWVGELFVDVTLACDCIHLMHWRGKIDYKKQLRLVKHIVDRQLPDGGW-NIYPGGPSEVNATVKAYFALKLAGFSPDDPLMAKARSTILRLGGIPKCMTYTKLGLALL-GVYPWDRLPVIPPEIILFPNWFPFNIYEISAWSRAMLVPLSVIHHFKPTRNLPEKYQL-HELFPYGTEHGKFSWLKKGARYLSKQGLFLACDKFLQYWDKTSLKPFRKMALKKAEKWLLE-RISAGSDGLGAIFPAMHYAIMALIAMGYTEDNPILKKAIADFEGLEVDDKKNDDL-RIQPCLSPVWDTAVGLVALAESGVARNAKELKRAAYWLLDREIKIKGDWHVRNPHPEPSG-WAFEYNNVYYPDVDDTLMVLLALRLIDIEDKIRKEEVMQRALRWVISFQCKNGG-WAAFDKDVYKKWLEDIPFADHNAILDPPCSDITARALELFGKMGIKKTERFVQKAIAYL-KETQENDGSWMGRWGVNYIYGTWQALRGLQAIGENMNQEWILRARDWLESCQNEDGGW-GETPASYDNPQLKGKGPSTASQTAWAVSGIMACGDIFRPSVSRGIKYLCDRQLSDGS-WAEEFLTGTGFPGVFYLKYDMYRNAWPLLVIGEYHRQYLKAKEQVSYWVDGTIGRKVK-KERLPEI
>seq_ID 20
MRTQDRVQVNSIAEAIAASQKYLLSLQNPTGYWWAELESNVTITAEWLLHKIWGTDKTRPLH-KIEAYLRSQQKQHGGWELFYGDGGELSTSVEAYMALKLLGVPATDPAMIQARDFILQRG-GISKTRIFTKFHLALIGCYNWRGLPSLPAWVMLLPNQFPVNIYEMSSWARSSTVPLLIV-FDQKPVYQVNPAITLDELYAEGVENVRYELPRSGDWTDLFLTLDEGFKLAESFNFIPFREEGI-KAAEKWIIERQEATGDWGGIIPAMLNSMLALRVLGYATNDPIVERGLQAIDN-F Al ETADCYRVQPCVS P VWDTAWVI RALI DSG M APDH P Al VKAGE WL LQ KQIF D Y GDWNVKNRQGQPGAWAFEFDNRFYPDVDDTAWVMAL-HAAKLPHEQLKQKACDRALQWVASMQCKPGGWAAFDIDNDQDWLNAVPYGDLKA-MIDPNTADVTARVIEMLGACNLSIDSHDLERALTYLLNEQEAEGCWFGRWGVNYIYGTS-GVLCALALINPQKYQRHIQQGATWLVGCQNPDGGWGETCFSYNDPSLKGQGDSTPSQTA-WALIGLIAAGEATGNFAHDVIERGINHLVSTQQPDGSWFEAYFTGTGFPCHFYL-KYHYYQQ YFPLIALGRYQ Al N PL
>seq_ID 185
MQTQDRVKVNQVAEAIAASQQYLLSIQNPAGYWWAELESNVTITAETVLLH-KIWGTDQTRPLHKVEAYLRQEQRQHGGWELFYGDGGELSTSVEAYMALRLLGVPATDPAMI-RAQAFILQRGGISKTRIFTKLHLALIGCYNWRGIPSLPPWIMLLPKAFPVNIYEMSSWARS-STVPLLWCDRKPVFITDPTINLDELYAEGIDRVRWELPQSGDWTDLFLTLDQGFK-WAESLN LVPFREEGIKAAE KWI LE RQ EATGDWGGIIP AM LN S M LALRCLD Y D RS D Pl VE R-GLQAIDNFAIETDNSYRVQPCVSPVWDTAWVMRALVESGFVPDHPAVVKA-GEWLLQKQILDYGDWAVKNRQGKPGAWAFEFENRFYPDVDDSAWVMALHLAKLPNE-Kl KQAAIARAVNWI ASM QC KPGGWAAF DLDNDQDWLNSIP YG DLKAMID P N TAD-VTARVVEMLGACDLSIDSDNLERSLTYLLREQETEGCWFGRWGVNYIYGTSGVLSALA-LIDPQRHKLSIERGAAWLLGCQNLDGGWGETCRSYDDPSLKGKGDSTASQTAWALIGLLAA-GEATGKLAVKAIEQGIGYLMATQQPDGTWFEANFTGTGFPCYFYLKYHLYQQYFPLIAL-GRYQAAIKES
>seq_ID 244
MVIAASPSVPCPSTEQVRQAIAASRDFLLSEQYADGYWWSELESNVTITAEVVILHKIWG-TAAQRPLEKAKNYLLQQQRDHGGWELYYGDGGELSTSVEAYTALRILGVPATDPALVKAKN-FIVGRGGISKSRIFTKMHLALIGCYDWRGTPSIPPWVMLLPNNFFFNIYEMSSWARSSTVPL-MIVCDQKPVYDIAQGLRVDELYAEGMENVQYKLPESGTIWDIFIGLDSLFKLQEQAKWPF-REQGLALAEKWILERQEVSGDWGGIIPAMLNSLLALKVLGYDVNDLYVQRGLAAIDNFAVE-TEDSY Al Q ACVS P VWDTAWVVRAL AE AD LGKD H PALV KAGQ WLLDKQILTYGDWQIKNPH-GEPGAWAFEFDNNFYPDIDDTCWMMALQGITLPDEERKQGAINKALQWIATMQCKTGG-WAAFDIDNDQDWLNQLPYGDLKAMIDPSTADITARWEMLGACGLTMDSPRVERGL-TYLLQEQEQDGSWFGRWGVNYLYGTSGALSALAIYDAQRFAPQIKTAIAWLLSCQNADGGW-GETCESYKNKQLKGQGNSTASQTAWALIGLLDALKYLPSLGQDAKLTTAIEGGVAF-LVQGQTPKGTWEEAEYTGTGFPCHFYIRYHYYRQYFPLIALARYSHLQAS
>seq_ID 109
MDDRHIQSEITFGKIDGIRERIQQAMDAAKRYLFSKQDPEGFWCGELEADTTLQSDYIVMHT-LLGTGDPVKMQKAGKQILQHQNPDGGWNIYPDGPSNISAAVKAYFSLKLIGHKPDEPEMTKA-REWILAHGGVTACNTFSKMYLCFFGQYDYDTVPAIPPEIVLFPNWFWFNLYEISSWSRGIL-VPLAICYAKKPFKKIPDEANIDELFVEGRHANLHLTWDKKPFSWRNFFLVLNNMVHF-FERVHVRPLRKLAMKRAEKWMLERLEMSDGLGGIYPAILNSIIALRALGYSTDDPGVIRAMDE-FEKLGIE E D DTFRM Q PC M S PVWDTAYALYALGEAGVPGSD-PRMQKAAEWMLKKQVTHKGDWAVKVRN-
VQPGGWYFEFNNEFYPDVDDTAQVILSLNHVRTSNERYQDDTVKRALDWQLAMQCKNGG-WASFDKDNNKMVFQYIPFADHNAMLDPATVDITGRVLEALSHHGYSLKDKWQRAVKFIQSE-QEPDGSWFGRWGVNYIYGTM LCLRGLAAVGVDHHEPMVQQAAEWLRMVQNPDGGWGES-VGSYDDPKLRGQGPSTASQTAWAVMGLLAANDLRSDSVTRGIAWLLENQKPNGSWWEK-WITGTGFPRVFYLKYTMYAEYFPLIAFAEYLRRLNTPLDEKVKLGPQA
>seq_ID 174
MQIQDKITEIAAKTAKAIELSQNYLLSTQYSEGYWWAELESNVTITSEAILLHKIWKTDK-KRPLDKAATYLRQQQCPNGAWELFYGDGGDLSTTVEAYMGLRLLGIPANDPALEKAREFIL-AKGGISKTRIFTKMHLALIGCYDWQGVPSIPAWIMLLPENFPFTIYEMSSWARGSTVPLLIV-FDKKPWKMGFNLDELYTEGVNNVKYELPKNNNWSDVFLWLDGLFK-WAEKTDLVPFRQESLKAAEKWVIERQEDTGDWGGIIPAM LNSLLALKALDYDVYDPIVARG-LKAVDNFAIETDNTYCVQPCVSPVWDTAWVIRSLIESGLNPAHPAMIKAGQWLIDQQILDY-GDWAIKNKIGTPGGWAFEFDNRWYPDLDDSAVVVMALELIKMPDENIKTSVM-KRAVNWMATMQCKAGGWGAFDIDNDQNWLNSLPYADLKAMIDPNTADVTARV-LEMLGTCDVKMGENRVKKALDYLEKEQEADGSWFGRWGVNYIYGTSGALSALAF-LEPNQYRQQLQKGANWLSSCQNVDGGWGETCFSYNNPKFKGQGNSTASQTAWALIG-LLAVGKVTGNYQREVIE KG VN YLLVTQ KEN GTWD E DYFTGTGFPC HFYLKYH FYQQYF-PLLALGRYRALI
>seq_ID 130
MSLTSDPSPAAPKAAKSSKRVNIPAPATPDAYGISRSSPPLSGGGVSGGGVSGGGAATAD-GTPPTTQTSVDPDLAAAMTAANQARDHLLGLQSEEGWWKGDLETNVTIDAEHLFMKQFLGIR-TEEETEPIARWVRSQQLADGGWATYYGGPAELSTTVEAYIALRLAG-DEPDAPHMAAAAALIRSQGGVAAARVFTRIWLATFGEWSWDDVPVLPPELIFLPSWF-PLNVYDFGCWARQTIVALTIVGSLRPVRDLGFSIDEIKVAAPVTPPKPAPLHSWEG-AFERLDAILHRYERRPIKVLRTLALRRATEWVVARQEADGCWGGIQPPWIYSVMALHL-MGYPLNHPVIATAFRGMERYIIRRETPEGPTAQIEACQSPVWDTALAWALSDAGVPADH-PAMVRAGRWLVDEEVRVAGDWAVRRPALAPGGWAFEFDNDFYPDTDDTAEWLALRRLL-GGSHVTPGGTVTPSGSVTPGGTAELSPAARDRASRGLAAVDPQLAGAMRAAAARG-VDWSVGMRSSDGAWGAFDADNVRTLTAKIPFCDFGEWDPPSADVTAHIVEM-LADLGRSDHPITRRAVQWLLDNQEPGGSWFGRWGINHVYGTGAWPALIAAGVPADH-PAITAAVRWLLEHQSPDGGWGEDPRSYDDPAWIGRGELTASQTAWALLALLAVDPHS-KAVKRGVRWLCETQRPDGTWDEPQFTGTGFPGDFYLNYHLYRLVFPLTALGRYVTLTGVATP
>seq_ID 248
M PTSLATAIDPKQLQQAIRASQDF LFSQQYAEGYWWAELESN VTMTAEVILLH KIWGTEQRL-PLAKAEQYLRNHQRDHGGWELFYGDGGDLSTSVEAYMGLRLLGVPETDPAL-VKARQFILARGGISKTRIFTKLHLALIGCYDWRGIPSLPPWIMLLPEGSPFTIYEMSSWARS-STVPLLIVMDRKPVYGMDPPITLDELYSEGRANVVWELPRQGDWRDVFIGLDRVFKLFETL-NIHPLREQGLKAAEEWVLERQEASGDWGGIIPAMLNSLLALRALDYAVDDPIVQRG-MAAVDRFAIETETEYRVQPCVSPVWDTALVMRAMVDSGVAPDHPALVKAGEWLLSKQILDY-
GDWHIKNKKGRPGGWAFEFENRFYPDVDDTAWVMALHAVTLPNENLKRRAIERAVAWIAS-MQCRPGGWAAFDVDNDQDWLNGIPYGDLKAMIDPNTADVTARVLEMVGRCQLAFDR-VALDRALAYLRNEQEPEGCWFGRWGVNYLYGTSGVLTALSLVAPRYDRWR-IRRAAEWLMQCQNADGGWGETCWSYHDPSLKGKGDSTASQTAWAIIGLLAAGDAT-GDYATEAIERGIAYLLETQRPDGTWHEDYFTGTGFPCHFYLKYHYYQQHFPLTALGRYAR-WRNLLAT
>seq_ID 150
MAKGILNKFAVIAGTKKAGPPAGEERTVIAPIKEISGKAVHCSQAVKKAEEYLLALQN-PEGYWVFELEADVTIPSEYIMLQRFLGREISPELGKRLENYLLDRQLPDGGWPLYAEDGFANI-SATV KAYLALKVLG HSPQAPHMIRAR LMVLSLG-GAARCNVFTRILLALFGQIPWHTPPAMPVEIVLLPQWFFFHLSKVSYWSRTVIVPLLLLYAK-QPVCRLRPEEGIPELFSTPPDKLRHLDGFQPGYWRKNAFIIFDRLLKRFNRFIPSALHR-KAIAEAEQWTRSHMQGSGGIGAIFPAMAYAVMALRVLGCGEGDPDYIRGLQAIDDLLQHRT-PQEADPPRTDGTCIDSGMSAAFALTPSAHAAADGTGSSSICQPCNSPIWDTCLSLSALMEAG-MPASHPAATQAVEWLLSQQILSPGDWSLKVPDLEGGGWAFQFENTLYPDLDDTSKVIMSLL-RAGALENERYRDRIARGVNWVLGMQSSDGGWAAFDIDNNYHYLNDIPFADHGALLDPSTS-DLTGRCIELLSMVGFDRTFPPIARGIGFLRSEGEENGAWFGRWGVNYIYGTWSVLSGLRQA-GEDMQQPYIRKAVGWLASCQNHDGGWGETCYSYDDPSLAGKGASTPSQTAWSLLGLMAA-GEVNSLAVRRGVRYLLDHQNQWGTWEEKHFTGTGFPRVFYLRYHGYRHFFPL-WALGVYSRLSSGQKACQDERRHASPGDLHLPWLERIKKR
>seq_l D 128
MPDLELRDVDRADGRHHAPNLGRTDTLSPSAPTGEPAPASTPAAVATPTPTPTTAPAPAPA-PENALRETVQRAAEHLLRLQDPRGWWKFDLETNPTMDAEDLLLREYLGIRT-VEQTEATAKHIRSRRLDDGSWPTYFGGPGELSTTVECYIALRLAGDSPDDEPLRRSAAWI-RERGGIPATRVFTRIWLALFGWWRWEDLPVLPPEIMFLPPRAPLSIYSFASWARQTIVPLTIV-SAARPQCPAPFDLAELDPDEVPAAQSHGAAQSPDTRSPAGGRTLRGAM-RRLGGDRPNTAKVFFRGLDAALHRYHRHPIGPLRRHALRTAERWIIARQEADGCFGGIQPPA-VYSIIALRLLGYD LDH PVLAAALRSLDAYTLH REDGSRMIE-ASQSPIWDTALAVLALADAGIDAPADVDVAPALPTQRVATGAPAPSAPVPTALERAADWLL-GQEIQHRRGDWAITHPGVAPGGWAFEFDNDTYPDTDDTAEWLALHRLNRLRRLRHPT-NTRIDAALERSTAWLFALQSRDGGWGAYDSDNASTLVYQIPFADFGALTDPSSADVTAH-VVELLCETGRIRDPRTLRGVDWLLRNQEADGSWYGRWGVNYVYGTGSVLPALGAAGLPPTH PAMVAGARWLLSRQNSDGGWGEDIRSYGDPAWSGRGLSTPSQTAWAM-LGLLATDHGGVHADALAAAARWLTEQQRPDGGWDEEMFT-GTGFPGFFYLNYHGYRLVWPVMALGRYLHSRQHPSD
>seq_ID 131
MSLTSDQSSAAPTAAAQSPKIPNPSVARPSADAGSFETAGAVRTDSVSIDSVST-GTPVDPVVGAMRRGRDHLLSLQAEEGWWKGELETNVTMDAEDLMLRQFLGILTPSTATET-GRWIRSQQLSDGGWATFYGGPSDLSTTIEAYVALRLAGDDPDAPHMRSAAEWVRSAG GIAASRVFTRIWLALFGEWSWDDVPVLPAEMTFLPPWFPLNIYDFACWARQTWALTIVGS-LRPVRSFGFTLDELRVQAPKATKAPLRSWAGAFERLDSVLHRYEKRPFQPLRRLAL-RRAAEWVIARQEADGCWGGIQPPMVYSIMALHLMGYPLNHPVISMAFRALDRFTIREET-PEGTVRRIEACQSPVWDTALAWALADAGLGGDHPAMVRAGRWLADEEVR-VAGDWAVRRPTLAPGGWAFEFDNDFYPDVDDTAEWIAIRRLLGDGHGPVDHSDGS-GPGSAAATAASAAAEAAVAAAGTIAAADPELAARLRAAAERGVDWSVGMRSSNGAWAAF-DADNVRTLVRKIPFCDFGEWDPPSADVTAHMVEMLALLGRSDHPITQRGVRWLLD-NQEAGGSWFGRWGVNHVYGTGAWPALISAGVDAEHPAIVSSMHWLVEHQTPEGGWGED-LRSYRDDEWIGRGEPTASQTAWALLALLAAEPASGTAEWEAVERG-VRWLC DTQRPDGTW DE PQ FTGTG F P W D FSIN Y H LYRLV FPVTALGRYVTLTG RSTS
>seqJD 242
MSISALQTDRLSQTLTQSWAAQQHLLSIQNPEGYWWANLESNASITAEVVLLH-KIWGTLDSQPLAKLENYLRAQQKTHGGWELYWNDGGELSTSVEAYMGLRLLGVPASDPAL-VKAKQFILHRGGVSKTRIFTKFHLALIGCYRWQGLPSLPAWVMQLESPFPFSIYELSS-WARGSTVPLLIVFDKKPVYPLQPSPTLDELFTESAENVRWELEEKGDWSDAFLWLDKAF-KLAESVDLVP F RE ESI R KAEKWV LE RQ EPSGDWGGIIPAM LNSMLALRALGYSVSDPWRRG-FQAIDNFMVESETECWAQPCISPVWDTGLAVRSLTDSGLSPNHPALVKAGEWLLDKQIL-SYGDWSVKNPQGQPGGWAFEFENSFYPDVDDTAVVAMALQDITLPNEPLKRRAIARA-VRWIATMQCKTGGWAAFDINNDQDWLNDIPYGDLRAMIDPSTADITGRVLEMHGRFAADLD-LANSYAADLSPYRLSRGLNYLIKEQELDGSWFGRWGVNYIYGTGQALSALALIAPER-CRIQIERGIAWFVSVQNADGGWGETCESYKDKSLKGKGISTASQTAWALLGLLDVSFCLD-PAAKIAVDRGIQYLVSTQSEGTWQEESFTGTGFPQHFYLRYRLYCHYFPLMALGRYQRVINS-SAGI
>seq_ID 143
M AKGILN KF AVI AGN KN AG LTAEE ECTVVAPIKEVSG KAVHCRQAVKM AE EY LLALQN-PEGYWVFELEADVTIPSEYIMLQRFLGREISPELRMRLENYLLDRQLPDGGWPLYAVDGFANI-SATVKAYLALKVLGHSPQAPHMIRARIMVLSLG-GAARCNVFTRILLALFGQLPWHTPPAMPVEIVLLPQRFFFHLSKVSYWSRTVIVPMLLLYAK-QPVCRLRPEEGIPELFNTPPDKLRNLDGFQSGRWRKNAFIIIDRLLKRFNRFIPSAIHRKAMA-EAEHWTRSRMQGSGGIGAIFPAMAYAVMALRVLGCREDDPDYVRGMQAIDDLLQHRT-PQEADSPRTGGPCIDSGTSAAFAFDPSPHAAADGRGNSSICQPCNSPIWDTCLSLSALMEAG-MPASHPAAKQAVEWLLSQQIFSPGDWSLKAPDLEGGGWAFQFENTLYPDLDDTSKVIMSLL-RAGALENGLYRDRVARGVNWVLGMQSSDGGWAAFDIDNNYHYLNDIPFADHGALLDPSTS-DLTGRCIELLSMVGFDRTFPPIAQGIGFLRSKQEGSGAWFGRWGVNYIYGTWSVLSGLRQA-GEDMQQPYIRRAVGWLTSCQNHDGGWGETCYSYDDPSLAGQGESTPSQTAWSLL-GLMAAGDVHSLAVRRGVRYLLDHQNQWGTWEEKHFTGTGFPRVFYLRYHGYRHYFPL-WALGVYSRLSSGQKTRQEERRHSSPGDLHLPWLERIGRR
>seq_ID 71
MIKNFTALWPIRRVKGVSVTSQDGHSANGASKPDFEVRPHVDLETAIHRSQSFLL-KEQKPEGYWVGELIVDSTLVSDTIAYHHWNGKVDMEWQRKAVNHIFSMQLPDGGWNIYYGG-PAEINATVKAYLALKLAGVPVMDPRMLRARSVALSMGGVPRMNTFSKLYLALL-GLFPWNYVPTIPCEVILIGKWFHVNFYEMSSWSRSMLVPLAIIN-HFKPTRKLQNQVKLDELYPEGYHERDLALPPDPEFLTFRNFFLWLDKLHKFAEL-WVQAGIHPFRRRALKKCEHWMLERFEGSNGLAAIFPAMLNSLIALKALGYPGDHPE-VKRAEKELKNLEHETADTVRIEPCFSPVWDTAIVAICLHESGIPSDH-PALKKSAEWLIDKEIRFRGDWYFKNPVDVEPSGWVFEFENKWNPDVDDTAMVLLALRKIPTS-DVKRRDECFQRGLKWMMAFQCKDGGWAAFDKDCTKGILEKVPFADHNAMLDPECADITA-RILELLGYEGVGVDHPQIKKALQFIQEEQEDDGSWYGRWGVNYIYGTWQVLRGLRALNIN-MNQPWLLKARDWLESVQHEDGGWGERCNTYDDPVFKGQGPSTASQTAWAVM-GLCTFDDPQRPSLMRGIDYLIKTQNSDGSWTEHEITGTGFPRVFYLKYDMYRNSWPLLALA-TYRNLYASSEKTANGHTNGHSVQLPEALKTPPAFK
>seq_ID 126
MNKKSAMKLKKKAKNHWSLLQPTDALNRVMKRFRSLQSPEGYWVFALEADVTIPSEYIM-FNRFLGRKMDKGLAERLGNYIRAKQMADGGWPLHDNDGPVNISASVKAYMALKMLGDNK-DAEHMVRARQIILAKGGAETANVFTRICLATFGQIPWHCPPAMPIEIVLLPKWFFFHLD-KVSYWSRSVIYPLLIIYAKQPVCRLRPEEAVPELFCKPAEEHIHIDKYRDKGWRKNLFILL-DRVLKRTIHLVPKSINKKALNYAEKWTREFIMAGRGGIGAIFPAMANAVMALSLLGYDESDPD-FARGMQSVDDLMVDKFHVPEKSPWEHTVITGGAELSAAPELDISPDHGTAEN-LEQAMCQPCNSPIWDTCLTLSAMMEAGENQDSKSTQQALNWLWDQQIFFRGDWIS-KAPKLEGGGWAFQFENTFYPDLDDTAMVLMAMCRAGVLDQPEHRENFIKGVNWLIGMQSS-NGGWAAFDIDNCAEYLNDIPFADHGALLDPPTSDLTARVIELLGVLGYDKSFRPIKDGIEFLK-KEQEDDGSWFGRWGVNYIYGTWSVLCGLRQAGEDMNSSYVCKAVEWFENHQNKDGGW-GESCLSYNDKNYAGLGDSTASQTAWALLGLMAAGRVHSKAVSRGVRYLLDTQKDDGS-WDESLFTGTGFPRVFYLRYHGYSQYFPMWALGVYQRFSADEDTKQIMMRRKSPLDLGRKW
>seq_ID 114
MIFTDTPTGSTQNRLDVAIRRAQQNLLRLQHNEGYWCGELFVDSTLCSDYVLFMHWA-DEIDPVMEEKCVAHIRRRQLEDGGWNIYEGGPSDVNATVKAYFALKLAGHAPTQPWMQEA-RACILRLGGIPKMNTYAKLYLALLGQFPWRYLPTVPVEIMFMPRWFFFDIYEVSSWSRAMLM-PLAILNHYKPTKHLPADKQLHELYPIGSEESDLGLGMQKPRFSWPNFFLFCDRLIKIM-HSLPWKPWKRAALARAEAWMTQRMGEGSDGLAAIFPAMLNSMIALRTLRYSREH-PLYVKAKNDFAGLFVDDPQDFRIQPCLSPVWDTAINLVALLESGLDPHDPKIE-AAVNWLKEKEVRINGDWYVKNHHVPPSGWAFEFNNVYYPDTDDTMMVLAALARAGAHEE-SAPVETKAMFERALKWLLSFQCRDGGWAAFDKDVTQGWLEDVPFADHNAILDPTCSDLT-GRVLELLGLIDYDRNCTPVRRALKFLRDTQEDDGSWYGRWGVNYIYGTWQVLRGLRSIGE-DMRQQWIVRARDWLESCQNEDGGWGETCASYDDPTLKGKGPSTASQTAWALM-GLIAAADPTEPGAFDRKSIRQGVDYLLSTQVADGSWVEPEVTGTGFPRVFYLRYDMYRNNF-PLMALATYRKAREGKLPVRQRE
>seqJD 194
MKKATRSVFSLLDGGKISDSGSRGDSRHAGSRLDSVTKSAAALLASRQNPDGHWVFDLEAD-VTIPAEYVMMRCFIGEPLDSDMASRLSAYLLERQLPDGGWPLYAVDGNANISAT-VKAYFALKLLGHDKYAPHMVSARRMILAQGGAERSNVFTRITLALFGQVPWHTTPAMPIEIM-LLPKWFFFHLSKVAYWSRTVIVPLLILYNKQPVCRLGYSEGIAELFSTSPDMLVHLDHFRY-RAWRKNAFIVLDRLLKRTMHLVPGRIKRRALEEAERWTRERMKGDGSIGAIYPAMANAVMAL-KTLGCGDSDPDYLRGLRAIDRLLIHGKPEAGALPADGAGTLFPVLD-GASSAAVDLYPASLSDTAKSHAFSFCQPCNSPVWDTALSLTALSEAGGGGYSPE-RAMEWLFNRQIATQGDWTERCPGLECGGWAFQYENALYPDVDDTAKVLMSLFRAGALER-GEYPEKIAKAVRWVLGMQGADGGWGAFDVDNNHFYLNDIPFADHGALLDPSTADLTGR-CIEMLGMLGHGPDYPPITRGIEFLREEQEPFGGWFGRWGVNYIYGTWSVLSGLSQAGEDM-GRPYVRKAVEWLVSCQNDDGGWGETCASYDDPSLAGSGASTASQTAWALLGLMAAGEAD-HAAVRAGIAYLADSFADGWDERHFTGTGFPRVFYLRYHGYSLFFPVWALGVYARHREGGKT-VQEQVRERGVNGVFDFVMGGSA
>seq_ID 154
MMANATDTIELPPSRAADRIVPMTDIDQAVDAAHAALGRRQQDDGHWVFELEADATI-PAEYVLLEHYLDRIDPALEERIGVYLRRIQGDHGGWPLYHGGKFDVSATVKAYFALKAIGDDI-DAPHMARARAAILDHGGAERSNVFTRFQLALFGEVPWHATPVMPVELMLLPRKALFS-VWNMSYWSRTVIAPLLVLAALRPRAINPRDVHVPELFVTPPDQVRDWIRG-PYRSQLGRLFKYVDIALRPAERLIPDATRQRAIKAAVDFIEPRLNGEDGLGAIYPAMANTVM-MYRALGVPDSDPRAATAWEAVRRLLVELDGEAYCQPCVSPIWDTGLAGHAMIEAASGPEGIR PEDTKKKLAAAAEWLRERQILNVKGDWAINCPDVPPGGWAFQYNNDYYPDVDDTAWGMLL-HREGDPANDEALERARQWIIGMQSSNGGWGAFDIDNNLDFLNHIPFADHGALLDPPTAD-VTARCISFLAQLGHPEDRPVIERGIAYLRTDQEREGCWFGRWGTNYIYGTWSVLCAY-NAAGVAHDDPSVVRAVDWLRSVQREDGGWGEDCASYEGATPGIYTESLPSQTA-WAVLGLMAVGLRDDPAVMRGMAYLTRTQKDDGEWDEEPYNAVGFPKVFYLRYHGYRGFF-PLLALSRYRNLASSNSRHVAFGF
>seq_ID 156
MLIYSDILEKEDRVSETLSRQSVEPDEINHAIEGAQAALGGKQKSDGHWVYELEADATI-PAEYVLLEHYLDRIDPEKQAKIGVYLRRIQGHHGGWPLYHDGGFDLSATVKAYFALKAIGDDI-NAPHMRIAREAILDHGGAARTNVFTRIQLALFGEVPWDATPVMPVELMLLPRKAFFS-VWNMSYWSRAVIAPLLVLNALRPKAINPRGIHVQELFVKPPSEVKDWIRGPYRS-VWGRFFKHLDSALRPVLPLIPRSVHKKALKAASDFIEPRLSRGGLGAIYPAMANWMMYRA-QGVPDSDPRAKTAWDAIQDLLVDHGDEIYCQPCVSPVWDTGLSGLAMIEAASGPAGTKTKET-LAALKKSAEWLREHQILDVKGDWAINAPDLRPGGWAFQYENDYYPDVDDTAVVAMLLHR-VDPENSREAISRAREWIIGMQSTNGGWGAFDIDNDHELLNHIPFSDHGALLDPPTADVSAR-CISFLAQLGDPDDRPVILKAIEYLRSEQEPEGCWFGRWGTNYIYGTWSVLCALNI-AGVPHDDPMVLRAVNWLESVQRPDGGWGEDCATYEGGTAGTYKKSLPSQTA-WAVLALMAVGRRESEAVKRGVAYLVSQQNEKGEWQEEAYNAVGFPKVFYLRYHGYKQFF-PLTALARYRNLGVSNSGKVEYGF
>seq_ID 74
MEGASPTASNRISQYAVDLRAKARAAVASTCDWLLSHQHADGHWCAELEGDSILQSEYILL-LAWLGKERTEIARRCAAHLLKQQEPNGAWTQFPGAPIDVGSSVKAYFALKLTGH-□ AAADYMVRARNAILEAGGADKVNSFTRFYLALLGQIPFELCPAVPPEMVLLPNWSPINIY-RISSWSRTIFVPLSIVWAHRAARDIVEDVSIHELFIRKPEDWPELRCPGLEKPAGLFS-WDRFFRTADSGLKLLEKYGLRPLRKRALRQAQQWMLDRFQQSDGPGAIFPPIVWSAIAL-RTLGYAEDSPEIQYCLDHLERLVLEDGETTKLQPCKSPVWDTSITLRALAAAGL-GLAQEPTCRGVEWLLSKEVRVPGDWTNNVDCEPGGWFFEYENAFYPDNDDTSMGI-MALADQLAAANITLEVHPGETLANTSWVGGRGIAEQLAGSSAAMMEQAAAATRRAVAWM-VAMQNKDGGWGAFDKNNDAEFLCHVPFADHNAMIDPSTPDLSARVIESF-GRLGVTIESPGKLGDTVRRAVAYIRANQLSDGSWFGRWGVNYIYGTWQCLVGLRAVGVPAN-DPAIEQGKLWLLAHQQACGGWGESCETYEDPSLRGQGSPTASQTAWALLGIIAAGGAN-LAEWHGVQYLMDTQREDGAWDEIEFTGTGFPRVFYLKYHYYPIYFPLLALAEWNRATARS
>seq_ID 326
MFDTISFDFDALDQAISRAHARLSAEQRADGHYVYELEADATIPAEYVLLEHFLDRIDPELEA-RIGVFLRGIQGNSPQNPGGWPLFHDGAMDISASVKAYFALKAIGDDPDAPHMRRA-REAILARGGAARTNVFTRIQLALFGAVPWRACPVMPVEIMLLPDWFPITIWKISYWSRT-VIAPLLVLLTERPIARNPRNVRIDELFVTPPDQVTDYIRGPYRSNWGYLFKAIDSAL-RPLERHFPARSRKRAIQAAIDFITPRLNGEDGLGAIYPAMANTVMMYHTLGYSPDHPDYATA-WASVRKLVTDASYRFEGASYVQPCLSPVWDTSLAAHA-LAEAGSPGDAQLAAACDWLIPRQILDVKGDWAYRKPDAPPGGWAFQYN-NAHYPDVDDTAVVGMILDRNGDPAHREAVERARQWILGMQSRSGGWGAFDSDNEFHYLN-HIPFADHGALLDPPTADVTARCISFLAQLGHAEDRPAIERGVAYLRREQEQDGSWF-GRWGTNYIYGTWSSLCALNAAGVAQDDPMMVRAVEWLLARQRPDGGWGEDCETYAHAKP-GEYHESLPSQTAWALLGLMAAGQAEHEAVARGIAWLQSVQEDDGSWTEQPYNAVGF-PRVFYLRYHGYPRFFPLLAMARYRNLARGNSRQVQFGF
:>seq_ID 192
MDKIKMKNINQPKFRVFRGGQKAATPCPGTTNERRGALDRGRLSASLKHS-REWLLSLQADAGNWVFALEADTTIASEYVMLQRFLGRPLAPELQQR-LANYLLSRQLPDGGWPLYAEDGFANISTTVKAYLALKLLGYPTHCDPLVRARQIVLALG-GAEKCNVFTRIALALFGQIPWRTTPAMPVEIMLLPRWFYFHLSKISYWARTVWPLLILY-AKRPVCRLEPWEGIPELFVTPPDKLGYLDVCKPGQWRKNVFIWVDRLTRKMVRCVPRRLHN-LALRAAETWTREHMQGAGGIGAIFPAMANAVMALRTLGCSPDDADYQRGLKALDD-LLIDRCDVPPREDTPVSPCWCTGTSAAPMLDPSPAGSHAQGGDQGICQPCASPIWDTGLAL-TALLEGGLDARHPAVDRAVRWLLDQQVDVKGDWAQRVPNLEAGGWAFQFENALYPDLDDT-SKVLMSLIRAGAMDNPGYRQELSRAINWVIGMQNSDGGWGAFDVDNNYLYLNDIPFADH-GALLDPSTADVTGRCIEMLAMAGFGRDFLPIARGVDFLRREQEDFGGWYG-RWGVNYIYGTWSALSGLIHAGEDLQAPYIRQAVGWLESVQNPDGGWGETCYSYDDPALAG-
RGVSTASQTAWALLGLMAAGEVDNLAVRRGIQYLVEEQNRAGGWDERHFTGTGF-PRVFYLRYHGYSQYFPLWALGLYERLSSGNPSRQQMVRRAGPAGLHLPVLDRRKKLRRKRKA
>seq_ID 72
MKSEEVTIKPAVGLEKDELNAAITRSQSFLLCEQKPEGYWVGELMVDSTIVSDTIAYHHWNG-KVDPEWQRKAVNHILSMQLPEGGWNIYQNGPPEVNATIKAYLALKLAGIPITDPRM-LKARQVALTLGGVPRMNTFSKLYLALLGLWPWKYVPTIPCEVLLLGKWFHVNIWDMSNWS-RAMIVPLAIINHYKPTRPVKVDLSELFLEGFHERDLALPKDPQSFTWRNFFLGLDQLHKFA-ELWVNAGIHPFRRLALKKCEQWMLERFEGSDGLAAIFPAMLNSLIALKSLGYPDDHPEVL-RAERELKKLEHETKDTVRIEPCLSPGWDTAIAAMCLRESGVPAEHPRLKKAGDWLVNREVRF-KADWHHKNPVDVEPSGWVFQFNNKWNPDLDDTAMVLLALRLIPTDH-PRRRDEAFQRGLKWLLAFQCRDGGWAAYDKDCTKNILEKVPFADHNAMLDPECADITARV-LELLGFEGYALDHPQVQEAVEYLREHQETDGSWYGRWGVNYIYGTWQTLRGL-WALKMDMNQPWLLKARDWLESVQLPDGGWGERCNTYDDPVFKGQGPSTASQTA-WAVMALCTFGDPKRPSLVRGIQYLIENQNEDGSWTELETTGTGFPRVYYLKYDIYRNT-WPLLAMATYRKMLDPKEVRVK
>seq_ID 145
MNKH KGTFSVIEGGKTTQARGSETCAIMDAADLEKVTSVAASQLAGQQQDDGHWVFDLEAD-VTIPAEYVM LQRFIGREIDPEISERLAAYMQERQLPDGGWPLYAVDGNVNISAS-VKAYFALKLLGHDKNAPHMVRARQLILSLGGAAKCNVFTRITLATFGQIPWHTAPAMPIEIM-LLPRWFFFHLNKVAYWSRTVIVPLLILYATQPICRLQYNEGITELFTTPPDMLVHLDKFRH-HAWRKNVFIALDRVLKRTMHLVPGRIKQHALAEAERWTRARMQGOGGIGAIYPAMANAVMAL-KTLGCSDDDADYLRGLEAVDNLMVHRNLKTGTIPMDDDSGGIAIDNSSAAPELSPTYLT-DTAGNTEFSFCQPCNSPIWDTCMSLSALCESGYAENNSGVTDRAIKWLFSQQIATPGDW-SEKCPGLESGGWAFQYENSRYPDVDDTAKVLMSLFRAGALEKPEYRE-KIERAIRWVQGMQSTDGGWGAFDVDNDYFYLNDIPFADHGALLDPSTADLTGRCIEMM-GMLGHGPDYPPIARGIAYLKKEQEPFGGWFGRWGVNYIYGTWSVLSGLHQAGENMDAPY-VRKAVEWLISCQNSDGGWGETCASYDDPSLAGSGASTASQTSWALMALMAA-GEWRHSAVRNGVRYLTESYCNGWNEKQFTGTGFPRVFYLRYHGYSLFFPVWALA-VYSRYINGTATVQEKVREKQFRQCLMV
>seq_l D 127
MLPYNQDFYNEDEALKDDHCEGAGNVSNPPTLDEAIKRSQDFLLSQQYPEGYWWA-ELEGNPTITSHTVILYKILGIEDEYPMDKMEKYLRRMQCIHGGWELFYGDGGQLSVTIE-SYVALRLLNVPPTDPALKKALKFIIDKGGVXKSRMFTKICLALLGCFDWRGIPSLPPWVMLL-PGWFLSSIYETACWARGCWPLIVVFDKKPVFKVSPEVSFDELYAEGREHACKTL-PFCGDWTSHFFIAVDRVFKMMERLGVVPFQQWGIREAEKWLLERQEDTGDFLGVYPP-MFYSWCMKTLGYEVTDPVVRRALLSFKKFSIERADECSVQSSLS PVWDTALWRSLVES-GLPPDHPALQRAGEWLLQKQITKHGDWSFKNQSGVAGGWAFQFFNRWYPDLD-DSAWVMALDCLKLPNEDVKNGAITRCLKWISSMQCKGGGWAAFDKDNHGHWINSTPFSDL-KAMVDPSTTDISARVLEMVGRLKLHGTSFDEAHFLPPESIARGLVYLRREQENEGCWF-
GRWGVNYIYGTCGALVALSLVAPMTHEEEIARGARWLVQVQNMHGKKINGPQDGGWGE-TCFSYNDPALKGQGDVSTASQTAWALQGLLAAGDALGKYEVESIGHGVQYLLSTQRKDGS-WHESQFTGGGFPIHFYLRYHFYAQHFTLSSLARYRTRLQASKIKPPIP
>seq_ID 166
MNTEPRFSAPETLRAIAGAGRALGRHQRRDGHWVFELEADATIPAEYVLLEHYMDRITPER-QARIGAYLRRIQGEHGGWPMFHAGEFNISASVKAYCALKAIGDDPQAPHMVRARQAILGHG-G AE RAN VFTRIQLALFG Al P W RG VPV M P VE IMHLPKWFFFNIWAM SYWARTCWPL L-VLQARKPRARNPRQVSFDEIFRTEPDEVRDWIRGPYRSRWGWFKHIDTVLRWTEPLFSKVA-RESAIFKAVDFVEERLNGEDGLGAIYPAMAYALMMYDVLGYPEDDPRCVTIWKAIDKLLIET-DEEVYCQPCVSPVWDTSLSGHAMIEAARTGGIEAQAELDAACDWLVARQVKDVRG-DWAETRPDAEPGGWAFQYRNDHYPDVDDTAWAMLLHRNGRPEHAEAIE-KARRWWGVQSRNGGWGAFDADNDREFLNHIPFSDHGALLDPPTADVTGRCISFLSQLG-HEEDRPVIERALAYLRAEQERDGSWYGRWGTNYVYGTWTVLCGL-NAAGIPHDDPMVRRAVDWLVSIQRADGGWGEDERSYDVGHYVENAESLPSQTAWAM-LGLMSVGQADHPAVLRGAAYLQRTQGPDGEWQERAYNAVGFPRVFYLKYHGYRLFFPL-FALSRLHNLQRGNSREVSFGF
>seq_ID 21
M SGEVRVAGDALAEDAG RAAAAASQY LY RTQQRD H W RAE L ES N VTVTAE Y VL LRQALG LD-LEERRDALVRYLCSRQKADGSFGIASTLPGDVSTTAEAYLALRLLGLDREDERLRAAERFIR-GAGGLARVRVFTRINLALFGLFPWEAVPTVPAELIFLPRWAPVNVYRLASWARST-MVPLFVLFHHRPVFALPGGAGSDWLDHLWLGPGDKRVPYRTSVMETVRRHGPGWKAFF-NAADAWLRVHDRLRHLPPLGRLRTEALRACEEWILARQEASGDWAGIFPPMLNGVLAL-HVAGHGLDAAPVRRGLEAIERFAVSDREGFRIEACQSPVWDTILALIGLLDSGESPTD-PRLVAARRWIEGMQLTNDWGDWKVYDPRGEPGGWAFEYANSWYPDVDDTAAVIVGLL-KHDPASRAGETVRRAAAWVASMQNRDGGWAAFDVNNDRLFLNEIPFSDMDS-LCDPSSPDVTGRVLEAFGMLDAPHLRAACRRGVAYLRRAQEPEGSWYGRWGVNYVYGTS-NVLNGLARQRVPASDPMVARALGWLDSVQNADGGFGEGLESYADRAAMGRG-P STASQTAWG VM G LLAY RAADDAAV R RGIAWLVE RQ LAD G E AQGS WE E EA FTGTGF-PRHFYLRYHLYRHYFPLMALGRFCAQGRG
>seq_ID 111
MSYEWTEPVRPGRRHAVSPVQNFCQSLAPAIQRACDALFSQQAADGFWCGELTADTTLES-DYILLQLWLNQPDDHGWNPPTRPRIDRAGRSILERQLPDGGFNIYAGGPSEVSATI-KAYCALKLAGLDPHSPPLRRARERILALGGLQAANSYVKINLSLFGLYPRKHVPSVPPEIV-MLPGNVLYEMSSWTRSILVPLSIVQARGSNRRAPNGFNLDELLLPGVKLALPKRK-GLAVLFHHLDRMFKVWEKRGSERIRGAAIREAERWLIARTHYTEGLGAIYPAMMYFI-MALDALGYAEDHPDRSEAIRHFESLLIETDDRFLFQPCVSPVWDTAICAFALGEAGNTDD-PRMTLAADWLISKEVRRKGDWSIKRPDTEPSGWAFEFANEFYPDIDDTAMVLLALMHANGSN-PEAQAAAERRAVNWLLAMQSSDGGWAAFDVDNNWAMLNQVPFADHNAMLDPTCPDITGRV-LECLCRRGMAGFIDAARRGVAYLLQAQEKDGSWYG RWGVNYIYGSFLAM RGLTTS-
GAPGSQDAVDRAARWLRAIQNPDGGWGESCASYARDGYVAAPSSASGTAWALL-
GLCAAGDRDSAQFRRGVEYLLTLQAPDGKWPEGATTGTGFPNVFYLTYAMYRDYF-
PLLALSQV
>seq_ID 157
MPKDIPADLASEAISGDMLEQAVLRASMALHRKQQTDGHWVFELEADATIPAEYVLLEHFLD-RIDDDLERKIGVYLRRIQGDHGGWPLFHEGAFNLSASVKAYYALKAIGDDPDAPHMRRA-REAILAAGGAERSNVFTRIQLALFGQIPWRGVPVMPAELMIAPKWFPINMWKVSYWSRT-VIAPLLVLMDRKPKARNPRNVHVRELFLHDPDRIRDWIRGPFRSGWGHFFKYLDSVLRWEP-VALKPMRPRSIRLAVDFVRERLNGEDGLGAIYPAMANSVMMYDVLGYSPDHPEAAIAWES-VRKLLVIKEDEAYCQPCLSPIWDTGLSGHAMAEAEGAVSPGVAAACDWLRNRQIT-DWGDWAEIRPGVQPGGWAFQYNNAHYPDVDDTAWAMLLHRQGDPAHEESIRKA-REWIIGLQCRDGGWGAFDADNDKDYLNHIPFADHGALLDPPTADVTARCISFLAQLGN-PEDKPVIDRAMAWLRKEQEADGSWFGRWGTNYIYGTWSVLCAMNVAG-MPHDDPAIRRAVNFLVATQREDGGWGEDEETYDPASGAQPGRYKESTPSQTAWALIG-LMAAGEAEHEATRRGIAYLQATQKPDGEWDEAAYTAVGFPRVFYLKYHGYRQFFPL-MALSRYKNLRSSNMKKVSFGF
>seq_ID 205
MNQAATITRPQDETLTTSARRPAQPALPDPLDAGIAHWESLLAQQQSDGHWVYELEADATI-PAEYILMVHYLGETPDLVLEGKIANYLRRIQNADGGWPLFHAGASDISASVKGYFALKMAGDN-PEAEHMRRARAAIHAMGGAEASNVFTRTLLALYGVMPWQAVPMMPVEIMLLPEWFPFHLS-KVSYWARTVIVPLLVLNSLRPQARNPRKIGIDELFVRPCQATRLPRRAPHQSPLWVGV-FRTLDAWRMAEPLFPRGLRQRAI ERAREFTVERLNGEDGLGAIF PAMVNSVLM-FDVLGVPESDPNRAIARRSIDKLLVIKDDEAYCQPCLSPVWDTSLAAHALLEVGE-PRTIAAAARGLDWLLPLQELELRGDWTVRRPNVRPGGWAFQYANPHYPDVDDTAWAAAM-DRVDKGDRSNRYDEAVSRACEWIVGMQSSNGGWGAFEPENTHLYLNNIPFADHGALLDPP-TADVSARCLAMLCQLGQMPANSEPAARALRYLLDEQEADGSWFGRWGTNYIYGTWSAL-CG L N AAGIGTD AP EM KRAAQWLLSIQN E DGG WG ESG DSYKLEYRGYE KAPST ASQT AWAM-LGLMAAGAGDHPALVRGVEYLLRTQASHGFWDEPYFTAVGFPRVFYLRYHGYSRFFPL-WALARFRN LLRDG N RAI SWG L
>seq_ID 218
MKTDGNTTLDTTISMEELERTVKSAYEALAKDQQDDGHWIYELEADVTIPAQFILLEHTLDKI-DEELEQKIANYLRRCQSREHWGWPVYYGGEFNISASVQAYFALKMTGEDINAPHMVRAREAI-LAHGGPEYANVFTRIQLSLFGEASWLATPFMPVEIMLLPRWMYFSIWNMSYWSRTTVAPLLIV-ADLKPKAINPRNVHIPELFPTPPDKVKTWIHGPFRSKWGHVFKFIDTAIRPFTRFVPSFLHK-KAYKAALDFIEPRLNGVDGLGAIYPPMSYSAVMYRALGIPDDDPRAATNWEALKGLLVI-KEREAYCQACVSPVWDTALSGHALMEASFGPDGINADRTEKLIDRAAHWL-RAHQVLNWGDWAINNPNLQPGGWAFQYGNDYYPDVDDTAVAAMLLHRQNLPENEEALD-RARKWIIGMQSSNGGWGAFDIDNDKQILNDIPFADHGALLDPPTADVSARCISLLAELGH-PEDRPVIERGIKYLRKEQEEDGSWFGRWGTNYIYGAWSVLCAFNAS GVPHDDPSVLKCVNFLKSVQREDGGWGESCETYEGSAHGVYTESLPSQTAWAVLGLMAS-GRRTDPAVKRGIVWLIQHQQDNGEWAEEPFNAVGFPRMFYLHYLGYKQFFPLLALA-RYRHMEKSGTNNVSFAF
>seq_ID 11
MLPYNQDHHFGKVAENATMPPTLDEAIERSQDFLLSLQYPEGYWWAELEANVTLTAQTIM-LYKILGIDHKYPIHKMKTYILRTQRAHGGWEIFYGDGGCLSTTIGAYMAL-RILGVPKTDPVLQKALKLIHSKGGVTKSRMFTKICLALLGCYDWKGIPSLPPWLVLLPSWF-PFSLYDTASWVRGCWPLTIIFDKKPVYKLNPLLCLDELYSEGKGKARVHLSFIPGDWTSNF-FVGLDHVFKYMENLGWPFRQWGIKEAERWTLERHEDSGDFHGIYPPMFYSIVSYSLL-GYEITDPWHRALESMRGFTVEREDECWQSCISPMWDTAFVIRSLAESGLQPDHPALQKA-GEWLLQKQATQHGNWFYKKRTGRAGGWAFQFFNRWYPDVDDSAAVSMAL-NAIKLQDDDVKKGAIKRCAEWISVMQCKDGGWAAYDCDNDREWLNCTPFGDLKAMIDPNT-VDVTARVLEMVGRVKEAGDASAILPPRAIARGLAYLRREQETEGCWYGRWGVNYIYGTS-GALMALALVAPSTHKEEIERGARWLVEVQNKRGTKGANGYSHTNGAREGGVAMNGNCK-N M GAP E DGG WG ETC FSYNDITLKGRN EVSTVSQTAWALQGLLAAG DALG KYEVESIEH-GVQ YLLST Q RKDGS WCE KH FTGGG F P RF F YIRY H LYAG H F P LSALARYRD RVRAGKM AK
>seq_ID 214
MDATAPLRDPGAPSAENCSVDRRELDDVIGESCRWLGERQNQDGHWVFELEADATI-PAEYILLNHFLDEIDDAREARIASYLRAIQGKHGGWPLFHDGDFDMSATVKAYYALKLTGD-GVDEPHMVRARQAILEHGGAERTNVFTRFTLAMFDQVPWRACPVTPVEALLLPRFAPF-HWSKVSYWSRTVMTPLMILYSRRARAVNPRGIGVRELFRRDPEVIRDWLKNPTGHWIGDALI-QIDKVLRVIEPAIHWAFRDRAEKWALDFIEERLNGRDGLGGIYPAIANTLMAYHTLGYA-KDHPGYRIAREAVDGLCTPHAKGEYVQPCLSPVWDTCLASHAIQEAGQSAGD-RAVDQSNAWLRERQVLDVVGDWKSNRGHLRPGGWAFQYNN-PHYPDVDDTAVWMALARSKEDEANREAIARAEEWIIGMQSSNGGWGAFDAENEHD-FLNHVPFADHGALLDPPTVDVSARCLGMLAQLGRPKTDPVVARGLDYLWREQEADGSWF-GRWGTNYIYGTWSALNAFNAVEWDMTDPRICKAVDWLKSRQRDDGGWGE-DC ATYWKE RRSVS KASTPSQT AWAVLG LM AAG EVDSP EVERGI RY LLEAP RDGG KWEE E LY-N AVGFPRIFYL RYH GYS AY FP LWAL ARYRN LTSG NCKRTIHGM
>seqLlü 73
MPEEAILTETHPLDATTIETAITRARKALLGEQRADGHFVFELEADVSIPCEYILFYHFIGR-PAPAELEAKIGHYLRARQSAEHDGWPLFQDGAFNISSSVKAYFALKAIGDTPDMPHMQR-ARTAILAHGGAAAANVFTRSLLALFGLIPWHGIPVMPIEIMHLPEWFPFHIAKISYWGRT-VLVPMMWHALKPKPANTCTIRIDELFVIPPDQVRHWPGSPGKRFPWTAIFA-GIDKVLQIAEPYFPRRSRQSAIDKAVAFVTKRLNGEDGLGAIYPAMAYSALMYL-SIGRSLSDPHIQLVLKAIDKLWVKDHEAYVQPCVSPVWDTALASHALMEAGDGDKPILDS-LKKGLAWLKPLQVTDIAGDWAWKKPDVKPGGWAFQYGNAYYPDLDDTAVWMAMDRARD-RWPEIDEDNFRPSIARAREWIVGLQSENGGFGAFDADNDRDYLNAIPFADHGALLDPPTAD-VTARCISMLTQLGEKPENSETLRRAIAYLFAEQEKDGSWFGRWGLNYIYGTWSVLCSL-
NAAGIAHDAPEVRRAVAWLRTIQNEDGGWGEDAESYALDYAGYQQAPSTSSQTA-WAVLGLMAAGEKDDPAVARGIAYLTRTQGEDGFWTEKRFTATGFPRVFYLRYHGYSKFFPL-WAMARYRNLHNGNHASVLTGM
>seq_ID 103
MNDMTEMHTLDATAVPAAPAAADAPAPSAATTGLDAAVARATDALLAAQNAD-GHWVYELEADSTIPAEYVLLVHYLGEEPNAELEQKIARYLRRIQQPDGGWPLFTDGAPNI-SASVKAYFALKVIGDDENAEHMQRARRAIHAMGGAEMSNVFTRIQLALYGWPWYAVPMM-PVE11LL PQ W F P F H LS KVSY WARTVIVPLLVLN AKRPVAKN PRGVRID ELFKSAPVNTGLL-PKQPHQHAGWFAFFRAVDGVLRLADGLFPRYTRERAIRQAAAFVDERLNGED-GLGAIYPAMANAVMMYAALGYPEDHPNRAIARQSIEKLLVVGEEEAYCQPCLSPVWDTS-LAAHALLETGDERAREAAVRGLDWLVPRQILDVRGDWISRRPHVRPGG-WAFQYANAHYPDVDDTAWVMAMDRVAKHDQTDAYRESI-ARAREWVVGMQSSDGGWGAFEPENTQYYLNNIPFSDHGALLDPPTADVSGRCLSMLAQL-GETSASSEPARRALDYMLKEQEPDGSWYGRWGMNYIYGTWTALCSLNAAGLGHDD-PRVKRAAQWLLSIQNPDGGWGEDGDSYKLDYRGYERAPSTSSQTAWALLGLMAAGEVDN-PAVARGIGHLLGTQREHGLWDETRFTATGFPRVFYLRYHGYRKFFPLWALARYRN-LKRAGAARVTVGM
>seqJD 95
MNDMTEMHTLDAAAAPAADAPAVTAVTAGLDAAVARATDALLAAQNADGHWVYELEADSTI-PAEYVLLVHYLGEEPNAELEQKIARYLRRIQQPDGGWPLFTDGAPNVSASVKAYFALKVIGD-DENAEHMQRARRAIHAMGGAETSNVFTRIQLALYGWPWYAVPMMPVEVMLLPQWFPFHLS-KVSYWARTVIVPLLVLNAKRPVAKNPRGVRIDELFKSAPVNTGLLPKQPHQSTGWFAF-FRAVDGVLRLVDGLFPRYTRERAIRQAVAFVDERLNGEDGLGAIYPAMANAVMMY-AALGYPEDHPNRAIARQSIEKLLVVGEEEAYCQPCLSPVWDTS LAAHALLETGDER-ARDAAVRGLDWUPRQILDVRGDWISRRPHVRPGGWAFQYANPHYPDVDDTAWVMAMDR-VAKLDQSDAYREQIARAREWVVGMQSSDGGWGAFEPENTQYYLNNIPFSDHGALLDPPTAD-VSGRCLSMLAQLGETNASSEPARRAFDYMLKEQEPDGSWYGRWGMNYIYGTWTALCAL-NAAGLGHDDPRVKRAAQWLLSIQNQDGGWGEDGESYKLDYRGYERAPSSSSGTAWALL-GLMAAGEVDNPWARGIDYLLGAQCEHGLWDETRFTATGFPRVFYLRYHGYRKFFPLWALA-RYRNLKRANTTRVTVGM
>seq_ID 106
MNDLTDMPTLAADSAAADLDAAVARATDALLAAQQADGHWVYELEADSTIPAEYILLVHYL-GETPNLELEQKIGRYLRRIQQPDGGWPLFTDGAPNISASVKAYFALKVIGD-DENAEHMQRARRAIHAMGGAEMSNVFTRIGLALYGAIPWRAVPMMPVEIMLLPQWFPFHLS-KVSYWARTVIVPLLVLNAKRPIAKNPRGVRIDELFIDPPVNAGLLPRQGHQSAGWFAF-FRVVDHALRAVDGLFPSYTRERAIRQAVAFVDERLNGEDGLGAIYPAMANAVMMYDA-LGYPEDHPNRAIARRSVEKLLWHDDEAYCGPCLSPVWDTSLAAHALLETGDPRAEDA-VVRGLEWLRPLQILDVRGDWISRRPNVRPGGWAFQYANPHYPDVDDTAVWMAM-DRVEKLRHSDAYREAISRAREWVVGMQSSDGGWGAFEPENTQYYLNNIPFSDHGALLDPP-
TAD VS G RC LS M LSQ LG ETAAN SE AAR RSL DYM LKEQEPD GSWYG RWGM NYVYGTWTAL-CSLNAAGLGPDDPRVKRGAQWLLSVQNKDGGWGEDGDSYKLDYRGYEQAPSTSSQTA-WALLGLMAAGEVNHPAVARGIDYLIAEQKEHGLWDETRFTATGFPRVFYLRYHGYRKFFPL-WALARYRN LKRAN ATRVTVGM
>seq_ID 87
MNDLTEMATLSAGAVPAGVDAAVARATDALLAAQQADGHWVYELEADSTIPAEYVLLVHYL-GETPNLELEQKIGKYLRRIGQADGGWPLFTDGAPNISASVKAYFALKVIGD-DENAEHMQRARRAIHAMGGAEMSNVFTRIGLALYGAIPWRAVPMMPVEIMLLPQWFPFHLS-KVSYWARTVIVPLLVLNAKRPLAKNPRGVRIDELFIDPPVNAGLLPRQGHQSPGWFAF-FRVVDHALRAVDGLFPSYTRERAIRQAVSFVDERLNGEDGLGAIYPAMANSVMMYAALGYA-EDHPNRAIARKSVEKLLVVHDDEAYCQPCLSPVWDTSLAAHALLETGDARA-QEAVLRGLEWLRPLQILDVRGDWISRRPNVRPGGWAFQYANAHYPDVDDTAWVMAMDRA-QKLTGSDTYRESMARAREWVVGMQSSDGGWGAFEPENTQYYLNNIPFSDHGALLDPPTAD-VSGRCLSMLSQLGETPLNSEPARRALDYMLKEQEPDGSWYGRWGMNYVYGTWTALCSL-NAAGLTPDDPRMKRGAQWLLSIQNKDGGWGEDGDSYKLNYRGYEQAPSTASQTAWALL-GLMAAG EVNNPAVARGVDYLVAQQNEEGLWDETRFTATGFPRVFYLRYHGYRKFFPLWALA-RYRNLKRANATRVTVGM
>set|JD 107
MNDLTDMANLSAGTVPAGLDASVARATDALLAAQNADGHWVYELEADSTIPAEYVLLVHFL-GETPNLELEQKIGRYLRRIQQADGGWPLFTDGAPNVSASVKAYFALKVIGD-DENAEHMQRARRAIHAMGGAEMSNVFTRIGLALFGAIPWRAVPMMPVEIMLLPQWFPFHLS-KVSYWARTVIVPLLVLNAKRPLAKNPRGVRIGELFIDPPVNAGLLPRQGHQSPGWFAF-FRWDHALRAADGLFPSYTRERAIRQAVSFVDERLNGEDGLGAIYPAMANAVM-MYDVLGYPEDHPNRAIARKSIEKLLWHDDEAYCQPCLSPVWDTSLVAHAL-LETGDARAEQAVLRGLDWLRPLQILDVRGDWISRRPNVRPGG-WAFQYANAHYPDVDDTAWVMAMDRAQKLQNTDTYRESI-ARAREWWGMQSSDGGWGAFEPENTQYYLNNIPFSDHGALLDPPTADVSGRCLSM LAQL-GESALSSEPARRALDYMLKEQEPDGSWYGRWGMNYVYGTWTALCSLNAAGLGPED-PRVKRAAQ W LLSIQ N KDGG WG E DG DSYKLN YRGF E PAPSTASQTAWAL LG LM AAGEVN H -PAVERGIGYLIAQQNDEGLWDETRFTATGFPRVFYLRYHGYRKFFPLWALARYRNLKRANAT-RVTVGI
>seq_ID 212
MESGNNKQPAAAIGALDASIESATNALLGYRQPDGHWVFELEADCTIPAEYVLLRHYLGEP-VDAALEAKIANYLRRVQGAHGGWPLVHDGGFDMSASVKGYFALKMIGDDIDAPHMAKA-REAIRSRGGAIHSNVFTRFLLSMFGITTWRSVPVLPVEIMLLPMWSPFHLNKISYWARTTIV-PLMVLAALKPRAVNRLDIGLDELFLQDPKSIKMPAKAPHQSWALFKLFAGIDAVLR-TIEPLFPKRLRDHAIKLAVDFVEERLNGEDGLGAIYPPMANTVMMYKVLGFPEDHPPRAITRR-GIDKLLVIGEDEAYCQPCVSPVWDTALTCHALLEVGGEAAVPPAKRGMDWLLPKQVLD-LKGDWAVKRPNLRPGGWAFQYNNAHYPDLDDTAWVMAMDRSRRATGSREYDEAIARARE-
WIEGMQSDDGGWAAFDVNNLEYYLNNIPFSDHGAMLDPPTEDVTARCVSMLSQLGE-TAASSKAVADGVEYLRRTQLPDGSWYGRWGLNYIYGTWSVLCAL-NAAGVDHQDPVIRKAVTWLASVQNPDGGWGEGAESYRLNYTRYEQAPTTASQTSWALL-GLMAAGEVDSPWARGVEYLKSTQTGKGLWDEQRYTATGFPRVFYLRYHGYAKFFPLWALA-RYRNLRSTNSKWGVGM
>seq_ID 101
MNDLTEMATLSAGAVPAGVDTAVARATDALLAAQNADGHWVYELEADSTIPAEYVLLVHYL-GETPNLELEQKIGKYLRRIQQADGGWPLFTDGAPNISASVKAYFALKVIGD-DENAEHMQRARRAIHAMGGAEMSNVFTRIQLALYGAIPWRAVPMMPVEIMLLPQWFPFHLS-KVSYWARTVIVPLLVLNAKRPLAKNPRGVRIDELFIDPPVNAGLLPRQGHQSAGWFAF-FRWDHALRAVDGLFPNYTRERAIRQAVSFVDERLNGEDGLGAIYPAMANSVMMYDVLGYA-EDHPNRAIARKSIEKLLVVQEDEAYCQPCLSPVWDTSLAANALLETRDARAEDAAIRG-LEWLRPLQILDVRGDWISRRPHVRPGGWAFQYANAHYPDVDDTAWAVAMERA-QQLKQNDAYRDSIARAREWWGMQSSDGGWGAFEPENTQYYLNNIPFSDHGALLDPPTAD-VSGRCLSMLSQLGETPLNSEPARRALDYMLKEQEPDGSWYGRWGMNYVYGTWTALCSL-NAAGLTPDDPRVKRGAQWLLSIQNKDGGWGEDGDSYKLNYRGFEQAPSTASQTAWALL-GLMAAGEVNNPAVARGIDYLIAEQNAEGLWDETRFTATGFPRVFYLRYHGYRKFFPLWALA-RYRNLKRDNTTRVTVGL
>seq_ID 112
MSAPSHVGNTLEHAAELATRKAMAYLTCLQERDGHWCAELTADTTLES-DYILFQLWLYPPQDGKWEPETRPLIRKAVNSILERQLPDGGFNICVGGPSEVSASVKAYVAM KLAGLPPEDDRMARLRERILALGGIQAANSYVKVNLSLFDLYPREFSPSIPPEVALLPFDL-LYQMSAWTRAIVISLGIVHAANPRRPAPAGFNLQELWLPGVSPEFRRDPSFFTWHNTFLTVD-KALKLWERYGSKAVRRRAVEKAKTWMIERLHHSDGLGAIYPPMMYSVMALDVLGYA-KDDPLRVEALRHFNNLMVDDGDRFFFQPCFSPVWDTAIGAYALVQADPSHEAIAPAADWLI-AKEVRRKGDWSVKRPNTEPSGWAFEYSNEYYPDIDDTAMVMLALGETRASNTEAQAAACK-RGLAWLLAMQSSDGGWAAFDADNNWEFLSQVPFADHNAMLDPTCADITGRV-LEALASQGLDRNHKAVRRGAEWLIRHQENDGSWYGRWGVAYIYGTCFALRGLAASGEN-DREAHILRAGEWLRSIQNADGGWGESCKSYDNRIFTGGPSTPSQTAWAILGLIAGGDANSLS-VGHGIEYLLETQRSDGSWDEQFATGTGFPRVFYLNYHMYKDYFPLLALASFVKARAGSNG
>seq_ID 83
MNDLTEMATLSAGTVPAGLDAAVASATDALLAAQNADGHWVYELEADSTIPAEYVLLVHYL-GETPNLELEQKIGRYLRRVQQADGGWPLFTDGAPNISASVKAYFALKVIGD-DENAEHMQRARRAIHAMGGAEMSNVFTRIQLALYGAIPWRAVPMMPVEIMLLPQWFPFHLS-KVSYWARTVIVPLLVLNAKRPIAKNPRGVRIDELFVDPPVNAGLLPRQGHQSPGWFAF-FRVVDHVLRAADGLFPSYTRERAIRQAVSFVDERLNGEDGLGAIYPAMANAVMMYDVLGYA-EDHPNRAIARKSIEKLLVVHEDEAYCQPCLSPVWDTSLAAHALLETGDARAEEAVIRG-LEWLRPLQILDVRGDWISRRPHVRPGGWAFQYANAHYPDVDDTAWAVAMDRVQKLKHNDT-FRDSIALAREWVVGMQSSDGGWGAFEPENTQYYLNNIPFSDHGALLDPPTADVSGRCLSM-
LAQLGETPLNSEPARRALDYMLKEQEPDGSWYGRWGMNYVYGTWTALCALNAAGLTPDD-PRVKRGAQWLLSIQNKDGGWGEDGDSYKLNYRGFEQAPSTASQTAWALLGLMAAGEVNN-PAVARGVEYLIAEQKEHGLWDETRFTATGFPRVFYLRYHGYRKFFPLWALARYRNLKRD-NATHVTFGL
>seq_ID 175
MLQTEAITTEGLRFRSLAPDDPLLPRVKQALKLSGQHSREEMHSDGHWCGEVKT-NATTSAEHVLLCQALDINLDADREAFISWFRCTQGADGGWSTAPDQAGDISVTVEAYLAL-KILGLSEDDAAM RSARDFAIAAGGVARVRIFTRIYLAMFGLFPWAAVPELPPELILL-PSRVPVSIYHWSAWARATWPLLIISHHRPIYALPGGKATCSDYLDELWCDPRNK-MVPYNHDKPTAWRSDPFALIFTLADSILHRLDGLRSFNPLRRFALRKCVDWILEHQEDMGDIG-DIMPPLHGAMLALRLEGYPLHSDPIHRGLEAIERFAYRDQQGKRIQTTVSAFWDTSLM-LVALGDAGMASSPWLTRSLGWLQQHQRLGNYGDWKVNNPGLKAGGFSFGYFNT-WYP DVDDTASAVLAIIRQ D ERLVCSAS VLDAL N WLLGM Q NTDGG WG AF DRDNN-KLFLNKIPFSDMEAFCDPSTPDVTGHVLEAFGIFLAVSARQQSPTKADVLTDRIVSAS-RRAICYLSDTHVSSGGWYGRWGCNYIYGTSAVLCALAYFGSKSDTLSGVRSVKDA-VNQAIRWLETVQ NQDGG WG ETV N SY KD PSRAGSG PSTASQTAWAIM ALLPYLP PSTE-VIQ RGVEY LLRT QTKT ASQG ATWH EKAYT GT G FP KYF YM GYSFYCH YF P M M ALG RY A-YPCPEWHENWRPKKE
>seq_ID 88
MNDLTDMATLSAGAAPAADLDAAVARATDALLAAQNADGHWVYELEADSTIPAEYVLLVHYL-GETPNLELERKIGRYLRRIQQADGGWPLFTDGAPNVSASVKAYFALKVIGD-DENAEHMQRARRAIHAMGGAEMSNVFTRIQLALYGAIPWRAVPMMPVEIMLLPQWFPFHLS-KVSYWARTVIVPLLVLNAKRPLAKNPRGVRIDELFIDPPVNAGLLPRQGHQSAGWFAF-FRVVDHVLRAVDGLFPKYTRERAIRQAVSFVDERLNGEDGLGAIYPAMANAVMMYDVLGYA-EDHPNRAIARKSIEKLLVVHDDEAYCQPCLSPVWDTSLAAHALLETGDPRAEDAAL-RGLEWLRPLQILDVRGDWISRRPNVRPGGWAFQYANAHYPDVDDTAWAMAMDRA-QKLRQSDTYRESIARAREWVVGMQSSDGGWGAFEPENTQYYLNNIPFSDHGALLDPPTAD-VSG RC LSM LSQ LGESALTS EPARRALD YM L KEQEPDGSWYG RWGMN YVYGTWTALCAL-NAAGLGPDDPRVKRAAQWLLSIQNKDGGWGEDGDSYKLNYRGYEQAPSTASQTAWALL-GLMAAGEVNNPAVARGIDYLLAEQKEHGLWDEVRFTATGFPRVFYLRYHGYRKFFPLWALA-RYRNLKRANATRVTVGM
>seq_ID 92
MNDMTEMHTLDATAAPAGLDAAVARATDALLAAQQADGHWVYELEADSTIPAEYVLL-VHYLGEAPNVELEQKIARYLRRIQQPDGGWPLFTDGAPNISASVKAYFALKVIGD-DENAEHMQRARRAIHAMGGAEMSNVFTRIQLALYGWPWYAVPMMPVEIMLLPQWFPFHLS-KVSYWARTVIVPLLVLNAKRPVAKNPRGVRIDELFKGAPVSTGLLPKQPHQSAGWFAF-FRAVDGVLRLVDGLFPRYTRERAIRQAVAFVDERLNGEDGLGAIYPAMANAVMMY-AALGYPED H P N RAI ARRSIEKLLVVG EQEAYCQPCLS PVWDTS LAAH AL-LETGDARAREAAVRGLDWLVPRQILDVRGDWISRRPHVRPGG
WAFQYANAHYPDVDDTAWAMAMDRVAKLDRTDAYRESI-ARAREWWGMQSSDGGWGAFEPENTQYYLNNIPFSDHGALLDPPTADVSGRCLSMLAQF-GETSASSEPARRALDYMLKEQEPDGSWYGRWGMNYIYGTWTALCSLNAAGLGHDD-PRVKRAAQWLLSIQNADGGWGEDGDSYKLDYRGYERAPSTSSQTAWALLGLMAAGEVDN-PAVARGVDYLLGTQREHGLWDETRFTATGFPRVFYLRYHGYRKFFPLWALARYRNL-KRANAMRVTVGM
>seq_ID 206
MTRKTIPASELDAAIVRARDALLDRQHPDGHWCFELECDATITAEYILMMHFVDEIDTALQAR-MAKYLRAVQRLDGHGAWDLYFGGDLDISCSVKAYFALKAAGDPPDAPHMVRAREAILARG-GAAKSNVFTRILLATFGEIPWRGTPFMPVEFVLFPRWAPIHMDKVAYWARTTMVPLL-VLCSIRAAAKNPLGVHVQELFVTPPELEREYFPRKRGLQQAFLVADRVVRHLEPLIPRAL-RRRAIQRAVEWSEARMNGEDGFGGIFPPMVYSYEMMVLLDYPEDH-PLRVECKAALKKLVVHRDDGSSYCQPCLSPVWDTAWSVMALEQAPSDARTETAI-ARAYDWLTDRQVLDLRGDWENNAAPSTPPGGWAFQYENPYYPDIDDSAWLAMLHARG-KRTGQPGRYEMPVARCLDWIIGLQSRNGGFGAFDANCDRDFLNAIPFADHGALLDPP-TEDVSGRVLLALGITERPQDATARERCIQYLRDTQQPDGSWWGRWGTNYIYGTWSVLAGL-GLAGVDRKLPMVRNGLQWLRGKQNADGGWGETNDSYARPELAGKHEDGSMAEQTAWAM-LGQMAVGEGDADSVHRGAAYLLDAQNEDGFWMHPYHNAPGFPRIFHLKYHGYTAYFPL-WALGRYRRLAAARASAMQTAKAESAESMTAH
>seq_ID 96
M N D LSMTQTLGE VLPQTLIDD H APVAAALATGAAP-VDALDAAVTRATEAILAVQKDDGHWVYELEADATIPAEYVLLVHFLGETPNLELEQKIA-RYLRRIQLPNGGWPLFTDGAMDVSASVKAYFALKMIGDPEDAAHMVRARECILANGGAEAAN VFTRILLALFGVVTWYAVPMMPVEIMLLPKWFPFHLSKVSYWARTVIVPLLVLNAKRPVARN-PRGVRIDELFRGAPVTTGLLPRSGHQSKSWFAFFRAVDGVLRVTDGLFPKASRER-AIKAAVSFVDERLNGVDGLGAIFPAMANSVMMYDVLGYPADHPNRAIARESIEKLLVVHEDE-AYCQPCLSPVWDTSLAAHALLETGDARAEEAAERGLAWLRPLQILDVRGDWIS-RRPDVRPGGWAFQYNNAHYPDVDDTAVVAMAMHRSAAVTNSNVDANAI-ARAREWVVGMQSSDGGWGAFEPENTQYYLNNIPFSDHGALLDPPTADVSGRCLSMLAQL-GEMPATSEPARRAYDYLLKEQEDDGSWYGRWGMNYIYGTWTALCALNAAGISLEDARI-KRAAQWLVSIQNADGGWGEDGTSYKLDYRGYEKAPSIPSQTAWALLGLMAAGYVDHPA-VARGIDYLQREQRDHGLWDEERFSATGFPRVFYLRYHGYRKYFPLWALARYRNLKRTGE-KRVTVGM
>seq_ID 104
MNDMTEMHTLDATAAPAAPTVATGLDAAVARATDALLAAQNADGHWVYELEADSTI-PAEYVLLVHYLGEAPNVELERKIARYLRRIQLPDGGWPLFTDGAPNISASVKAYFALKVIGD-DENAEHMQRARRAIHAMGGAEMSNVFTRIQLALYGWPWYAVPMMPVEIMLLPQWFPFHLS-KVSYWARTVIVPLLVLNAKRPVAKNPRGVRIDELFKSAPVNTGLLPKQPHQSAGWFAF-FRAVDGVLRLTDGLFPRYTRERAIRQAVAFVDERLNGEDGLGAIYPAMANAVMMY-
AALGYPEDHPNRAIARQSIEKLLWGEDEAYCQPCLSPVWDTSLAAHALLETGDER-AREAAVRGLDWLVPRQILDVRGDWISRRPHVRPGGWAFQYANAHYPDVDDTAWAMAMDR-VAKLDRTDAYRESIARAREWWGMQSSDGGWGAFEPENTQYYLNNIPFSDHGALLDPPTAD-VSG RC LSM LAQ FG ETS ASS EPARRAL DYMLKEQEPDGSWYGRWGM N Yl YGTWTALCSL-NAAGLGHDDPRVKRAAQWLLSIQNPDGGWGEDGDSYKLDYRGYERAPSTSSQTAWALL-GLMAAGEVDHPAVARGIDHLLGTQREHGLWDETRFTATGFPRVFYLRYHGYRKFFPLWALA-RYRNLKRANATRVTVGM
>seqLlD 27
MAHQETMASETSISLHTLACDATKLAGTYALRQVREDGHWYGEM-KSNATITAEYVFLAQALGFSIEEDRDDLIKYFLSEQNTDGSWSLAYDFPGDVSVTAEAYFAL-CLLGLDRSHPAMASAREFTLSKGGIAKVRVFTRMFFACFGLFPWSAVPELPAELILLPAAAP-MSIYQLASWARATWPMLVIRHHRPIYALPNGRSSSNEYLDELWVDPTDKMVPYSPS-LWSLWNDDLTAFGFTLADNILKALGGLRWFPSRKIALRHCVAWILERQEPEGDIGGIFPPL-HAALFALALEGYGLESSPVRRGIDALQNTYAWRDSTGLRIQGCISPILDTILMTIGLIDSSL-PAESPLVARSSRYLKAHQQLGNEGDWRVYNGNVPSGGFNFEYFNS-WYPDIDDTAAAILAMVKQDPNLLDLGPILSAVQWILGLQNDDGGWAAFDRENNY-LFLNKIPFSDMDSFCDPSTADVTGRVIECFGLNGKNPIPRFFIDDMSSATERAID-F LSTEQ E ADGSWYG RWGSN Yl YGTS AVLCG LVY H LEG WD DTYPVM EKRH KVDTHAALD-WLKRHQNPDGGWGERLESYYEPRLAGNGPSTASQTAWALMGLLAYLAPT-DESITRGIQYLSRTQIKEGELAGSWKEDHYTGTGFPNHFYLCYTLYSQYFPMMALGRYTSLS-GYRPLENLESTVEDHKGNSSDC
>seq_ID 28
MMTLREEGHKEGITPGKEQLTSDIEHSLKLATEYALSSIRSDGHWCGEL-RSNVTITAEYIFLRHALGLDLRTDNAAYCRYILSQQNCDGSWGLAPEYPGDVSTT-TEAYLALKLLGTSPDMPAMQQARAFVRKAGGAEKVRVFTRIFLATFGLFPWDAVPQLPVELI-LLPSSCPINMYTLASWARGTIAPLLIICHHQPVYALPEDYLDELWLDPTDKNVPYGS-SLRDLLSRGDITGLAFSWDNLLYYLNGLRSVPLLRSYARRKCIQWILERQEPT-GDWAGIFPPMHASIYAFVLEGYELNDPPVRLGIQALENFAWEDEKGKRIQACVSPVWDTALM-SIGLCDAMSPDKQILQQAITWIRNRQLLKPCGDWRIYRSKLAPGGFSFEYENS-HYPDVDDTAAIILAQLKQDPQSVASDSVIAAATWILGMQNPDGGWAAFDVEND-KLFLNKIPFSDMDSLCDTSCADITGRILEAFGLMMKRELKRPVLSPMLRHACIRGITYLA-STQESNGAWFGRWGCNYIYGTCHALGLVAPALQWLKSKQNDDGGWGEPLLSYRT-PGTQLQQQSTPSQTAWALMGLLAHLPLTDPAIERGIRWLVCSQQPEKGNGASWPEA-VYTGTGFP N H FYLGYDYYRHYFPM M ALG RY LQASQAQA
>seqJD 94
MNDLTDMATLSAGTVPAELDAAVARATDALLAAQNADGHWVYELEADSTIPAEYVLLVHYL-GETPNLELEQKIGRYLRRIQQADGGWPLFTDGAPNISASVKAYFALKVIGD-DENAEHMQRARRAIHAMGGAEMSNVFTRIQLALYGAIPWRAVPMMPVEIMLLPQWFPFHLS-KVSYWARTVIVPLLVLNAKRPLAKNPRGVRIDELFIDPPVNAGLLPRQGHQSAGWFAF-
FRAVDHVLRAVDGLFPAYTRERAIRQAVAFVDERLNGEDGLGAIYPAMANAVMMYDVLGYA-EDHPNRAIARKSIEKLLVVHEDEAYCQPCLSPVWDTSLAAHALLETRDPRAEQAAVRGLD-WLRPLQILDVRGDWISRRPHVRPGGWAFQYANPHYPDVDDTAWAMAMDRAQKLNQSDTY-RESIARAREWVVGMQSSDGGWGAFEPENTQYYLNNIPFSDHGALLDPPTADVSGRCLS-MLSQLGETALNSDAARRALDYMLKEQEPDGSWYGRWGMNYVYGTWTALCALNAAGLGPD-DARVKRAAQWLLSIQNKDGGWGEDGDSYKLNYRGYEPAPSTASQTAWALLGLMAAGEVNN-PAVKRGIDYLIAEQKEHGLWDEARFTATGFPRVFYLRYHGYRKFFPLWALARYRNLKRDNT-TRVTVGI
>seq_ID 30
MERSSLLVPASIDSHSRESETTGLDQAIVRARAALLGRQGADGHWCFELESDC-TITAEYILMMHFTDEIDED LQERMARYL RATQ VQETHGG WPQYVG-G Al D LSCTVKAYYAL KAAGDSPEAPH M RRARE AVLALGG AAKS N VFTRILLAM-FEQVPWRAVPYLPVEIMLLPRWAPIHIEKMSYWARTTLVPLTILCSLKARAANPKRVDI-RELFVTAPEQERHYFLRGGLLNRIFLGLDKFARTLDRWMPKSLRQHAIRKAEAWFLPRMNGE-DGLGAIFPPMVNCYEAMILLGYPKDHPARKTCLRSIQKLIVHRDDGSAYCQPCV-SPVWDTAWSAMALIHSGDDTATQTAIARAGDWLVQRQELDCRGDWEAQAPQAAPGG-WAFQYANGYYPDIDDTALVAALLHISDRRRGQPGQHAFNIDRAVDWMLALQSRNGGFAAF-DADNTHYYLNAIPFADHGALLDPPTEDVSGRVAACLGILKRDQDRDGLRRCIDYLRT-TQQPDGSWWGRWGSNYIYGTWSALSGLALAGEDLRQPYLRKSVDWLRTRQHPDGGWGE-TNDSYIDPHLAGTNAGISTPHSTAWAVLAQLAMGEVESDSVRRGIAFLLACQQTDGLWSHP-SHNAPGFPRVYYLKYHGYAAYFPLYALARYRHLLNRSREQR
>seq_ID 98
MNDMTEMHTLDATAAPAGLDAAVARATDALLAAQQADGHWVYELEADSTIPAEYVLL-VHYLGEAPNVELEQKIARYLRRIQQPDGGWPLFTDGAPNISASVKAYFALKVIGD-DENAEHMQRARRAIHAMGGAEMSNVFTRIQLALYGVVPWYAVPMMPVEIMLLPQWFPFHLS-KVSYWARTVIVPLLVLNAKRPVAKNPRGVRIDELFKGAPVSTGLLPKQPHQSAGWFAF-FRAVDGVLRLVDGLFPRYTRERAIRQAVAFVDERLNGEDGLGAIYPAMANAVMMY-AALGYPED H P N RAI ARRSIEKLLVVG EQEAYCQPCLS PV WDTS LAAHAL-LETGDARAREAAVRGLDWLVPRQILDVRGDWISRRPHVRPGG-WAFQYANAHYPDVDDTAWAMAMDRVAKLDRTDAYRESI-ARAREWWGMQSSDGGWGAFEPENTQYYLNNIPFSDHGALLDPPTADVSGRCLSMLAQF-GETSASSEPARRALDYMLKEQEPDGSWYGRWGMNYIYGTWTALCSLNAAGLGHDD-PRVKRAAQWLLSIQNADGGWGEDGDSYKLDYRGYERAPSTSSQTAWALLGLMAAGAVDN-P AVARGV DYL LGTQRE H S L WD ETRFTATGF P RV FYL RYH GYRKF FP LW ALARYRN LKRA-NATRVTVGM
>seq_ID 187
MTSDTASAAALDPRRLATSITRASRALHDVQQPDSHWVFELEADVTIPAEYVMMRHYFAEP-VDAEIEAKIAKYLRRMQNDNGGWSLFYGHEFDMSASVKAYYALKMIGDSPDAPHMKKA-REAMLARGGASRANVFTRIMLALFGQVSWKAVPMMPVEIMLLPRWFPFHLTKVSYWARTVIV-
PLLVLMTLKPRAKNPRGIGVRELFLEDPQTVGPTPKAAHQSQLWFTSFDIIDRVLRITDPF-FPKGMRKRAIAKAEAFVTERLNGVDGLGAIFPAMVNSIMMYDVLGYPPNDPNRALARESVER-LLVIKDDEAYCQPCVSPVWDTALAAHSMLESGEAADIEAAKAGLDWLLPRQVLDLKGDWAD-KRPDVRPGGWAFQYNNAHYPDLDDTAWVMAMDRVRRLDGTTKYDEAI ARA­
TE Wl LGLQSE N GG WAAF DADN L EYYLN NIP F AD H GAL LD P PTEDVTARC LSM LAQLG DT-LETSEPMRRGVEYLRKTQLPDGSWFGRWGINYVYGTWSVLCALNAVGVPHDDPMIAKAAD-WLESIQNEDGGWGEDGNSYKLNYKGYERAATTASQTAWAT-LALMAAGRVDRDATQRGIDNLVQSQEADGFWGEPYYTGGGFPRVFYLRYHGYSKFFPL-WAMARYRNLRSSNSRFVGAGM
>seq_ID 207
MNKHSGNRTAIDPAALEMSIASATEALLAYRHADGHWAFELEADSTIPSEYILLRHYLAEPI-DVVLEAKIGNYLRRTQGAH GGWPLVH DGP FDM SASVKSYFALKMIG DSVDAAH MVKA-REAIRARGGAANSNVLTRFLLALYGVVSWRAVPVLPIEIVLLPIWSPFHLYKISYWARTTIV-PLMVLAVLKPRAKNPKGVGIEELFLQDTKSVGMNPKAPHQSWGWFLLFRGIDGILRVIEPHL-PKKLRERAIASALAFTEERLNGEDGMGAIYPSMANIVMMYDALGKDDHFPPRAIARRAIDKLL-VIGEEEAYCQPCLSPVWDTALTCHALQEVGGANAVAKAKQGLDWLKPRQVLD-VKGDWAVKAPNIRPGGWPFQYNNAHYPDLDDTAVVVMAMDRAQRHAGSKEYATAIARGRE-WIEGMQSRDGGWAAFDVNNLEYYLNNLPFADHGALLDPPTEDVTARCVSM-LAQVGEFTQRSKAVAEGIAYLRRTQHAEGSWYGRWGLNYIYGTWSVLCALNAAGID-HQDPMIRKAVEWLVSIQSWDGGWGEDAISYRLDYSGYEQAPSTSSQTAWALLGLMAAGEVE-HPAVARGVNYLKNAQTENGLWDEQRYTATGFPRVFYLRYHGYSKFFPLWALARYRNLRSTNV
>seq_ID 29
MTTGHRQFDDGLSERERLIHEAGLTLQRSMDYAYNVVRSDGHWCGEMSS-NVTITAEYIFLRQALGLDLKTDGAAYCRHILSQQNSDGSWGLAPEYPGDVSTT-TEAYLALKMLGLSTDAPAMQQAKAFVLNAGGVAKVRVFTRIFLATFGLFPWKAVPQLPVELI-LLPSACPINIYKFASWARGTIAPLLIICHHQPVYALPNGVFAENEYLDELWQDST-NKSEPYSPSIWELLSQGDITGLTFSLLDKLLYQLNGLRSIPLLRSYALKQCMKWILERQEPT-GDWAGIFPPMHASWAFVLEGYKLEDPPVRLGIEALENFAWEDAKGKRVQPCVSPVWDT-TLMSIALSDAATPNHQIVDRAIQWIRDRQLLEPRGDWRVYRPRLAPGGFSFEYTNS-HYPDIDDSAAIILAQVKH DPISANSSSVIAAATWILGMQNPDGGWAAFDVEND-KLFLNKIPFSDMDSLCDTSCADITGRILEAFGLLIRRVPDKDSSQLFQLLPAIRAACRR-GIRYLASTQEANGAWFGRWGCNYIYGTSHAL-CGLAYFLGEDQQVPAMVQPALQWLKSGGNDDGGWGESLLSYQSPERKEQRSTASQTA-WALMGLLAHLPHTDIVIERGIRWLVSSQRPVETLGSTWPEP-VYTGTGFPNHFYLGYDYYRHYFPMMALGRYLRGVQG
>seq_ID 25
MLQTEAITTEGLRVRSLSPDDPLLPRIKQAIKLSGQHSRGEMHSDGHWCGEVKTNATTSAEH-VLLCQALGIN LDADREAFISWFRCTQGADGGWSTAPDQAGDISVTVEAYLALKILGLSED-DAAMRRARDFAIAAGGVAKVRIFTRIYLALFGLFPWAAVPELPPELILLPSRVPVSIYHWSA-
WARATWPLLIISHHRPIYALPGGGKGTSSDYLDELWCDPQNKMIPYNHDEPTAWRSDPF-ASIFTLADSILHRLDGLRSFNPFRRFALQKCVDWILEHQEDMGDIGDIMPPLHGAMLALR-LEGYPLHSGPIHRGLEAIERFAYRDKQGKRIQTTVSAFWDTSLMLIALGDAGMAS-KPWLTRSLGWLQQHQRLGNYGDWKVNNHGLKAGGFSFGYFNTWYPDVDDTA-SAVLAMIRQDERLVHSASVLDALNWLLGMQNTDGGWGAFDRDNDKHFLNKIPFSDMDAL-CDPSTPDVTGHVLEAFGLFLALSKADALADRVVAASRRAIRYLSDTHVLSRGWYG-RWGCNYIYGTSAVLCALAYFGSENDALSGVRVMKDAINQAIRWLETVQNPDGGWGETVD-SYKDPSRAGSGPSTASQTAWAIMALLPYLPPSTEVIQRGMEYLLRTQTKTASQGATWHEKA-YTATGFPKYFYMGYSLYAHYFPMMALGRYAYPCPAWHENWRLKRD
>seq_ID 97
MNDLSQAQPLDAILPDFADAAPSAPAPAVTGEAP-TASLDAAITRATEAILAAQKPDGHWVYELEADATIPAEYVLLVHYLGETPNLELEQKIA-RYLRRIQLPDGGWPLFTDGALDISASVKAYFALKMIGDPADAEHMVRAREAILAHG-GAETVNVFTRILLALFGVVSWRAVPMMPVEIMLLPMWFPFHLSKVSYWARTVIVPLLVL-NAKRPVARNPRRVRIDELFRGAPVNTGPRDRAPHQHAGWFRFFSGVDVLLRAVD-GLFPKSTRERAVRQAVAFVDERLNGEDGLGAIFPAMANSVMMYDVLGYPADHPNRAI-ARQSIDKLLVIKDDEAYCQPCLSPVWDTSLAAHALLETGEAHAEQAAERGLAWLRPLQILD-VRG D WISRRP N VRPGG WAFQ Y N N AH Y PD V D DTAWAM AM QRSATVTQSDVD RDAI-ARAREWWGMQSSDGGWGAFEPENTQYYLNNIPFSDHGALLDPPTADVSGRCLSM-LAQLGELPQNSEPAQRAFDYMLKEQESDGSWYGRWGLNYIYGTWTALCSLNAAGLPHDD-PRMKRAAQWLLSIQNEDGGWGEGGESYKLDYHGYERAPSTASQTAWALMGLMAAGEVN-HEAVARGVAYLEREQREHGLWDETRFTATGFPRVFYLRYHGYRKFFPLWALARFRHLKRN-GLTRVAVGM
>seqJD 176
MNSVNATVAPIDDAALGGSIGAATRGLLDLKQPDGHFVFELEADATIPSEYVLLRHYLGEP-VDAALEAKIAVYLRRIQGAHGGWPLVHDGPFDMSASVKAYFALKMIGDSIDAPHMA-RAREAILSRGGAANVNVFTRFLLSLFEVLTWRSAPVLPIEIMLLPMWSPFHINKISYWARTT-MVPLMVLAALKPRARNPRGIGIRELFLQDPATVGTPKRAPHQSPAWFTLFNSLDWILR-KIEPLFPKRLRARAIEKAIAFVEERLNGEDGLGAIFPPMVNTVMMYDALGFPPEHPPRAVARR-GIDKLLVIGKDEAYCQPCVSPIWDTALTCHALLEAGGPEALSGAGKSLDWLLPKQEL-VLKGDWAVKRPDVRPGGWAFQYANAHYPDLDDTAWVMAMDRVRRNDRSDKYNEAI-ARGREWIEGMQSRDGGFAAFDADNLEYYLNNIPFSDHAALLDPPTEDVTARCVSMLAQL-GETVRSSPSMAAGVDYLRRTQLKEGSWYGRWGLNYIYGTWSWCALNAAGVDHQDPAM-RKAVDWLVSIQNADGGWGEDAVSYRLDYKGFEGAPTTASQTAWALLALMAAGEVENPA-VARGMKYLIDTQTKKGLWDEQRFTATGFPRVFYLRYHGYSRFFPLWALARYRNLRST-NSKWGVGM
>seqj D 210
MDSGTFNPGGERGNTLDASIDAARAALLGYRRDDGHWVFELEADCTIPAEYVLLRHYLGEPI-DAALEAKIAVYLRRTQGAHGGWPLVYDGEFDMSATVKGYFALKMIGDSIDAPHMAKA REAILSRGGAVHANVFTRFLLAMFGILTWRAVPVLPVEIMLLPMWSPFHLNKISYWARTTIV-PLMVLAALKPRAVNRLGVGLDELFLQDPKSIGMPARGPHQNRGLFALFGAIDAVLR-VIEPLIPKKLRKHAIDRAVAFVEERLNGEDGLGAIYPPMANTVMMYKVLGYPEDHPPRAITRR-GIDLLLVIGEEEAYCQPCVSPIWDTSLTCHALLEAGGAEAAQPVREGLDWLLPKQVLD-LKGDWAVKAPNVRPGGWAFQYNNAHYPDLDDTAWVMALDRARRDQPSAAYDNAIARGRE-WIEGMQSDDGGWAAFDVNNTEYYLNNIPFSDHGAMLDPPTEDVTARCVSMLAQL-GETEQTS KAVARGVAYLRKTQLPDGSWYGRWGMNYIYGTWAVLCAL-NAAGVDHQDPAIRKAVAWLASIQNADGGWGEDGVSYRLDYRGYETAPSTASQTAWALL-SIMAAGEVDHPAVARGIEYLKGTQTEKGLWDEQRHTATGFPRVFYLRYHGYSKFFPLWGLA-RYRNLRATNSKVVGVGM
>seq_ID 23
MTTGHRQFDDGLSERERLIHEAGLTLQRSMDYAYNVVRSDGHWCGEMSS-NVTITAEYIFLRQALGLDLKTDGAAYCRHILSQQNSDGSWGLAPEYPGDVSTT-TEAYLALKMLGLSTDAPAMQQAKAFVLNAGGVAKVRVFTRIFLATFGLFPWKAVPQLPVELI-LLPSACPINIYKFASWARGTIAPLLIICHHQPVYALPNGVFAENEYLDELWQDPT-NKSEPYSPSIWELLSQGDITGLTFSLLDKLLYQLNGLRSIPLLRSYALKQCMKWILERQEPT-GDWAGIFPPMHASVYAFVLEGYKLEDPPVRLGIEALENFAWEDAKGKRVQPCVSPVWDT-TLMSIALSDAATPNHQIVDRAIQWIRDRQLLEPRGDWRVYRPRLAPGGFSFEYTNS-HYPDIDDSAAIILAQVKHDPISANSSSVIAAATWILGMQNPDGGWAAFDVEND-KLFLNKIPFSDMDSLCDTSCADITGRILEAFGLLIRRVPDKDSSQLFQLLPAIRAACRR-GIRYLASTQEANGAWFGRWGCNYIYGTSHAL-CGLAYFLQEDQQVPAMVQPALQWLKSQQNDDGGWGESLLSYQSPERKEQRSTASQTA-WALMGLLAHLPHTDIVIERGIRWLVSSQRPVETLGSTWPEP-VYTGTGFPNHFYLGYDYYRHYFPMMALGRYLRGVQG
>seq_ID 91
MNDLSQAHVLGAAMPETAGEAQNAQAAANSAAAAAEASAVLAPSLDAAITRATDAIL-AAQKPDGHWVYELEADATIPAEYVLLVHYLGETPNVELEQKIARYLRRIQLPNGGWPLFTD-GAIDISASVKAYFALKMIGDPVDAEH M VRAREAILAHG-G A ETVNVFTRILLAL FGVVS W RAVP MMPVEITLLPMWFPFH LS KVSYWA RTVIV PLLVL-NAKRPLARNPRRVRIDELFRGAPVNTGMPARAPHQHVGWFGFFRVVDTVLRAVDGLFPKAT-RERAVREAVAFVDQRLNGEDGLGAIFPAMANSVMMYDVLGYPADHPNRAIARRSIEKLLVIKD-DEAYCQPCLSPVWDTSLAAHALLETGDARAEQAAERGLAWLRPLQILDVRGDWIS-RRPNVRPGGWAFQYNNAYYPDVDDTAWAMAMHRSEALTHSGADREAI-ARAREVWVGMQSSDGGWGAFEPENTQYYLNNIPFSDHGALLDPPTADVSGRCLSM-LAQLGEFPQNSEPAQRALDYMLKEQEADGSWYGRWGLNYIYGTWTALCSLNAAGLPHDDPR-IRRAAQWLLSIQNEDGGWGEGGESYKLDYRGYERAPSTASQTAWALMGLMAAGEVD-HEAVARGIEYLQREQREHGLWDETRFTATGFPRVFYLRYHGYRKFFPLWALARYRHLKRN-GLTRVAVGM
>seq_ID 213
MDSGSYTTGVERNALEASIDAARSALLNYRRDDGHWVFELEADCTIPAEYVLLRHYLGEP-VDAELEAKIAVYLRRIQGAHGGWPLVHDGDFDMSASVKGYFALKMIGD-SIDAPHMVRAREAIRSRGGAIHSNVFTRFLLTLYGVTTWRAVPVLPVEIMLLPSWSPFTLTKI-SYWARTTMVPLLVLCALKPQAKNPKGVGIDELFLQDPKTIGMPVKAPHQNWALFKLFGSIDA-VLRVIEPVMPKGIRKRAIDKALAFIEERLNGEDGMGAIFPPMANAVMMYEAL-GYPEDYPPRASQRRGIDLLLVDRGDEAYCQPCVSPVWDTALASHAVLEADGHEGAKSVR-PALDWLLPRQVLDVKGDWAVKAPNVRPGGWAFQYNNAHYPDLDDTAVVVMALDRA-RKDQPNPAYDAAIARAREWIEGMQSDDGGWGAFDINNTEYYLNNIPFSDHGAMLDPP-TEDVTARCVSMLAQLGETMDSSPALARAVGYLRDTQLAEGSWYG-RWGMNYIYGTWSVLCALNAAGVPHADPMIRKAVAWLESVQNRDGGWGEDAVSYRLDYRGY-ESAPSTASQTAWALLALMAAGEVDHPAVARGIEYLKSTQTEKGLWDEQRYTATGF-PRVFYLRYHGYSKFFPLWALARYRNLQATNSKWGVGM
>seq_ID 196
M S M TS R E D H D ASS Ll SQVE H ALKLS N D YALG LV H P D G H WYG E MNTNVTVTAEYV F LRQAL-RLDLKTDIAAYCHYLLSQQNSDGSWGLAPEYPGDVSTSTEAYLALKILGTSPHTPAMRNA-RAFVLKAGGIARVRIFTRIFLATFGLFPWSAVPELPVELMLLPSICPINIYKFAS-WARGTIAPLLIICHHQPVYSLPNGKSTDNDYLDELWVDCTNKSVPYGLPLWDLMSQGEFAG-LAFGVLDKVLYQLNGLRSIPLIRAYARKQCIQWILERQEKTGDWAGIFPPMHANMYAFT-LEGYKLDDDPVRLGFQALERFAWEDEKGKRIQACVSPVWDTALMTIGLCDAMSPNKQTIDHA-LAWIRARQLLEPRG DWRVYRPQLAPGGFSFEYENSWYPDVDDTAAIILAQVKHDNGSIGSNS-VIAAATWILGMQNPDGGWAAFDVENDKLFLNKIPFSDMDSLCDTSCADITGRILEAYGLMMM-KYFSAKSDADPLLHTLRAAGMRGMHYLASTQEPNGSWYG-RWGCNYIYGTSHVLCGLAYFVEKRLVCVMVKSALQWLKSRQNDDGGWGESLLSYQSPDRE-QQASTPSQTAWALMGLLSHLPVTDDAIERGIRYLVSSQRPEKGIGSS-WPQAEYTGTGFPNHFYLGYDYYRHYFPMMALGRYLQGSRGLN
>seq_ID 99
MNDLSQTQPLAAVLPEAADAPAVADASATAAPEPVQAASPSALDASITRATD-TILAAQKPDGHWVYELEADATIPAEYVLLVHYLGETPNLELEQKIARYLRRIQLPNG-GWPLFTDGALDISASVKAYFALKMIGDPVDAEHMVRARDAILAHGGAERAN-VFTRILLALFGWSWRAVPMMPVEIMLLPVWFPFHLSKVSYWARTVIVPLLVLNAKRPLARN-PRKVRIDELFRAAPVNTGMNERAPHQHAGWFGFFRCVDTVLRAVDGLLPKATRER-AIRAAVAFVDERLNGEDGLGAIFPAMANSVMMYDVLGYPADHPHRAIARKSLDKLLVIKD-DEAYCQPCLSPVWDTSLAAHALLETGEARAEQAAERGLAWLRPLQILDVRGDWIS-RRPNVRPGGWAFQYNNAHYPDVDDTAVVAMAMHRSAALTQSDVDREAI-ARAREWVVGMQSSDGGWGAFEPENTQYYLNNIPFSDHGALLDPPTADVSGRCLSM-FAQIGELPQSSEPARRAFDYMLQEQEPDGSWYGRWGLNYIYGTWTALSSLNAAGMPHDD-PRMRRAAQWLVSIQNEDGGWGEGGESYKLDYHGYERAPSTASQTAWALLGLMAAGEVN-HEAVARGIDYLQREQREHGLWDETRFSATGFPRVFYLRYHGYRKFFPLWALARFRHLKRH-GLTRVTVGM
>seq_ID 85
MIRRMNKSAPSPWSALDAAIARGRDALVRLQQPDGSWCFELESDATITAEYILMMHFMD-RIDDVRQERMARYLRANQRLDTHGAWDLYVDGAPDVSCSVKAYFALKAAGDSEHAPHMI-RARDAILKLGGAARSNVFTRILLATFGQVPWRAAPFMPIEFVLFPKWVPISMYKVAYWARTT-MVPLLVLCSLKARARNPRNVSIRELFVTPPEQERHYFLPARGMRRLFLALDRTVRPIEPLL-PKRLRQRAIRHAEAWCAERMNGEDGLGGIFPPIVYSYQMMQVLGYPDDHPLRRD-CENALEKLLVTRPDGSMYCQPCLSPVWDTAWSTMALEQARGVAAPETGDTASGALRELDE-RIARAYDWLATRQVNDLRGDWIENAPADVEPGGWAFQYANPYYPDIDDTALVTAMLDRR-GRTHRGADGTHPYASRVARALDWMRGLQSRNGGFAAFDADCDRMYLNAIPFADHGALLD-PPTE D VSGRVL LC FGVTKRAAD RAS LAH Al DYVKRTQQ PDGSWWG RWGTNY LY-GTWSVLAGLALAGEDKSQPYITRALDWLRARQHADGGWGETNDSYIDPKLAGTNDGESTS-NCTAWALLAQMAFGDCESDSVKRGIAYLQSVQQEDGFWWHRSHNAPGFPRIFYL-KYHGYTAYFPLWALARYRRLAGAKDADATRSPASATPATDNALA
>seq_ID 93
MIRAMNKSALSPWSALDTAIARGRDALARLQQPDGSWCFELESDATITAEYILMMHFMDRID-DALQERMARYLRAIQRLDTHGAWDLYVDGAPDVSCSVKAYFALKAAGDSEHAPHMI-RAREAILKLGGAARSNVFTRILLATFGQVPWRATPFMPIEFVLFPKWVPISMYKVAYWARTT-MVPLLVLCSLKARARNPRNVAIPELFVTPPDQERHYFPPTRGMRRAFLILDRWRHVEPLL-PKRLRRRAIRHAEAWCAQRMNGEDGLGGIFPPIVYSYQMMDVLGYPEDHPLRRD-CENALAKLLVTRPDGSVYCQPCLSPVWDTAWSTMALEQARSVAVPESDESARALDELDARI-ARAYDWLATRQVNDLRGDWIENAPADTQPGGWAFQYANPYYPDIDDSAVVTAMLDRR-GRTHRNADGSHPYAARVARALDWMRALQSRNGGFAAFDADCDRLYLNAIPFADHGALLDPP-TEDVSGRVLLCFGVTRRAEDRASLARAIDYVKRTQQPDGSWWGRWGTNYLYGTWSVLAG-LTLAG ED PSQ PYIARALEWLRAH Q H ADGGWGETN DSY LD P ALAGTNGG ESTS N CTA-WALLAQMAFGDCASDSVKRGIAYLQSVQQDDGFWWHRSHNAPGFPRIFYLKYHGYTAYF-P LWALARY RRLAG AAE ARARASSGRAP H AADT AL A
>seq_ID 168
MGKVETLHRMSTQDITLDDVERRVSLASKALMRLAGPDGHWCFELEADATIPSEYILYHH-FRGSIPSAELEGKIANYLRRTQSAQHDGWSLVHDGPFDMSATVKAYFALKMIGDSIEAPHMR-RAREAILRRGG AAH AN VFTRTLLALYG EVPWSAVPVM PVEVM L LPRWF P F H LD KVSYWART-VMVPLFVLQAKKPRARNPRGIGIQELFVEPPERVKRWPAGPQESSPWRPVFAAIDKVLQK-VEGSFPAGSRARAIDKAVAFVSERLNGEDGLGAIFPAMVNAVLMYEALGYPEDHPLVATARS-SVEKLVTVKEHEAYVQPCLSPVWDTALSAHALMEAGGVEAERHAKRALDWLKPLQVLDIK-GDWAASKPNVRPGGWAFQYANPHYPDLDDTAVWMAMDRAQVRRSPGPDAADYGQSI-ARARE WV EG LQSRDGGWAAF DAD NTYH YL N Yl P FS D HG ALLD PPTAD VTARCVSM LAQLG E-TRESCPPLDRGVAYLLADQEADGSWYGRWGMNYIYGTWSVLCALNAAGVDPASEP-VRRAVNWLTTIQNPDGGWGEDAASYKLEYRGYERAPSTASQTAWALLGLMAAGEADSPA-VARGINYLTRSQGADGLWTEDRYTATGFPRVFYLRYHGYAKFFPLWALARYRNLQQSNSRR-VAVGM
>seq_ID 184
MKKFGGMARTSLQAQSPGSNNTPSMDEKMLKAGLEAARGALLAQQREDGHWCFPLEADC-TIPAEYILMMHFMDEVDLDLEVRIARFIREKQDVAHGGWPLYYGGEFDLSCSVKAYYALKIV-GDSPDAPHMVRARAAILKHGGAARANVFTRLLLAMYDQLPWRGVPFVPVEIILFPKWFPF-HTSKVAYWSRTVMVPLSILCSLKARAANPRKVAIRELFTVPPGEERNYFPVRTALNRVFL-LIERTLSLLEPFIPQGVRRLALRRAESWIVERLNGDSGLGAIFPAMVNAGEALALLGYPYDH-PAREQCRKALRLLLVEEGERTWCQPCVSPVWDTVLTCLAFQEDTEVDQKPIRKALD-W LVPCQVLDAPAD WQED H PGLPGGGWAFQYAN PH YPD LD DTAAVAW ALYQAD PKAYQ E-SISRAADWLAG MQSSNGGFAAF DS D N TYYYL N El P F AD HG ALL D PPTSD VS ARC AGF LALY-GQS RH KQALERS LAYLFN EQ EASGAW FGRWGSN Yl YGTWSVLEAF RLAGIDAG H-PAIRRAVHWLKSVQREDGGWGESNDSYLSPQQAGQFHTSTSFHTAWALLALMGAGEWRS-HEVHRGIAYLLREQDSDGLWHEPWFTAPGFPRVFYLKYYGYTKYFPVWALTRFHALNRKFPG
=-seqLl D 12
MMYNNGWYFNQFNDIFCFPEQQKEYFPPTGTNISLNLKKRPDRQLLAHGASDLNGPF-HLSQHNAFSAMLLAEVQKVLRLAVGHSLDLQRTDGAWCGEVHSNAT-FTAQYVFLQQQLGLPLDPTEIEGLSRWLFSQQNEDGSWGLGPGLGGDVSTTTETYLAL-KILGVSPEDPRMAAARSSIIKAGSLPATRMFTRVFLASFGLIPWSAVPPLPAELILL-PTLFPVNIYNLSSWARATCVPLLLIRHHEPLHSLPNGRHAENDFLDELWTKDIPRDFCYTT-PLSRMWRLGDYAGIFFTSADHGLRFLGQYFNSPLRNLSRRKIINWILDHQEQSGE-WAGYWPPQHNNIWALSLEGYSLDHPVLRRGIAAVKSFVLHDVTGMRA-QVTVSQVWDTALMSIALSDSAPSTGIISPTQAIDWLMHHEVASHRGDWRVLRPKLAT-GGFCFEEFNTLYPDVDDTAAVIMALIKSNPAHLISGCVRRAAQWILGMQNRD-GGWGAFDWNNDKFFLNKIPFSDMDSLCDPSTPDVTGRIIECFGMMMAGRHGYSLDGPLES-RLRASSQLAIAYLLGCQENNGSWWGRWGVNYLYGTSNVLCGLAYYYDRSGLSKGD-GKSNSHIVSAVDRASEWLKARQHSNGGWGEGPESYDSAQLAGCGQPTASQSAWVT-MALLNYLSPTDEVIQRGISYLVRSQVKYGDESRATWPLERYTATGFPGHLYMEYDYYRHYF-PIMALGRYVNKLSESHKLL
> s e q j D 100
MIRRMTTPTPSPWSALDTAIARGRDALVRLQQPDGSWCFELESDATITAEYILMMHFMD-Kl D D LRQ E KM ARYLRAN QRLDTHGGWALYVDGDPDVSCSVKAYFALKAAGD-SEHAPHMVRARDAILKLGGAARANVFTRILLATFGQVPWRAAPFMPIEFVLFPKWVPISMY-KVAYWARTTMVPLLVLCSLKARARNPRNISIRELFVTPPDEERQYFPPARGMRKLFLALDRT-VRHVEPLMPKGLRQRAIRHAEAWCAERMNGEDGLGGIFPPIVYCYQMMEVLGYPDDH-PLRRDCENALEKLLVTRPDGSMYCQPCLSPVWDTAWSTMALEQARGVAVAEDGE-PGDARRALDERITRAYDWLAERQVNDLRGDWIENAPADVQPGGWAFQYAN-PYYPDIDDTAWTAMLDRRGRTHANADGTNPYATRVARALDWMRGLQSRNGGFGAF-DADCDRLYLNAIPFADHGALLDPPTEDVSGRVLLCFGVTKRADEHASLAR-CIDYVKRTQQPDGSWWGRWGTNYIYGTWSVLAGLALAGEDKSQPYIARAIEWLRARQHAD-GGWGETNDSYIDPKLGGTNGGESTSNFTAWALLAQMAFGDCESDS-
VKRGIAYLQSVQQEDGFWWHRSHNAPGFPRIFYLKYHGYTAYFPLWALARYRR-
LAGVAN KRVST ADKT ADAMA
>seq_ID 84
MIRRMNQSAPSSWSALDAAIARGRDALVRLQQPDGSWCFELESDATITAEYILMMHFMD-RIDDVRQEKMARYLRANQRLDTHGAWDLYVDGAPDVSCSVKAYFALKAAGDSEHAPHMI-RARDAILKLGGAARSNVFTRILLATFGQVPWRAAPFMAVEFVLFPKWVPISMYKVAYWARTT-MVPLLVLCSLKARARNPRNVSIRELFVTPPEQERHYFPPARGMRRLFLALDRTVRPIEPLL-PKRLRQRAIRHAEAWCAERMNGEDGLGGIFPPIVYSYQMMQVLGYPDDHPLRRD-CENALEKLLVTRPDGSMYCQPCLSPVWDTAWSTMALEQARGVAAPETGDTATGAPRDLDG-RIARAYDWLATRQVNDLRGDWIENAPADVEPGGWAFQYANPYYPDIDDTALVTAMLDRR-GRTHRAADGTHPYASCVSRALDWMRGLQSRNGGFAAFDADCDRMYLNAIPFADHGALLD-P PTED VSG RVL LC FGVTKRAAD RAS LARAIDYVKRTQQPDGSWWG RWGTN YLY-GTWSVLAGLALAGEDKSQPYIARALDWLRARQHADGGWGETNDSYLDPKLAGTNGGESTS-NCTAWALLAQMAFGDCESDSVKRGIAYLQSVQQEDGFWWHRSHNAPGFPRIFYL-KYHGYTAYFPLWALARYRRLAGAKDAGATRSGASGASATSVTDDALA
>seq_ID 86
MIRRM NKSAPSPWSTLDTAIARGRDALVRLQQPOGSWCFELESDATITAEYILM MHFMD-RIDDVRQEKMARYLRANQRLDTHGAWDLYVDGAPDVSCSVKAYFALKAAGDSEQAPHMI-RARDAILKLGGAARSNVFTRILLATFGQVPWRAAPFMPIEFVLFPKWVPISMYKVAYWARTT-MVPLLVLCSLKARARNPRNVSIRELFVTPPEQERRYFPPARGMRRLFLALDRAVRHIEPLM-PKRLRQRAIRHAQAWCAERMNGEDGLGGIFPPIVYSYQMMQVLGYPDDHPLRRD-CENALEKLLVTRPDGSVYCQPCLSPVWDTAWSTMALEQARGVAAPETGETAAGTLRELDERI ARAYDWLAARQVNDLRGDWIENVPADVEPGGWAFQYANPYYPDIDDSALVTAMLDRR-GRTHRHADGTNPYAPRVARALDWMRGLQSRNGGFAAFDADCDRMYLNAIPFADHGALLD-PPTEDVSGRVLLCFGVTKRAEDRASLARCIDYVKRTQQPDGSWWGRWGTNYLY-GTWSVLAGLALAGEDKSQPYIARALDWLRARQHADGGWGETNDSYLDPTLAGTNGGESTS-NCTAWALLAQMAFGDCESDSVKRGIAYLQSVQQEDGFWWHRSHNAPGFPRIFYL-KYHGYTAYFPLWALARYRRLAGAAAAPPAALVAADTALA
?seq_ID 80
MI RRM NKPAPSPWSALDTAIARGRDALM RLQQPDGSWCFELESDATITAEYILM MHFMDKID-DARQEKMARYLRAIQRLDTHGGWDLYLDGDPDLSCSVKAYFALKAAGD-SEHAPHMVRARDAILKLGGAARSNVFTRILLATFGQVPWRATPFMPIEFVLFPKWVPISMY-KVAYWARTTMVPLLVLCSLKARARNPRNIAIPELFVTPPDQERQYFPPARGMRRAF-LALDRWRHVEPLLPKRLRQRAIRHAQAWCAERMNGEDGLGGIFPPIVYSYQMMDVLGYPD-DHPLRRDCENALEKLLVTRPDGSMYCQPCLSPVWDTAWSTMALEQARGVAVPEAGAPA-GALDELDARIARAYDWLAERQVNDLRGDWIENAPADTQPGGWAFQYANPYYPDIDDSAVI-TAMLDRRGRTHRNADGSHPYAARVARALDWMRGLQSRNGGFAAFDADCDRMYLNAIPFAD HGALLDPPTEDVSGRVLLCFGVTKRADDRASLARAIDYVKRTQQPDGSWWGRWGTNYLY-GTWSVLAGLALAGEDPSQPYIARALAWLRARQHADGGWGETNDSYIDPALAGTNAGESTS-
NCTAWALLAQMAFGDGESESVKRGIAYLQSVQQDDGFWWHRSHNAPGFPRIFYL-
KYHGYTAYFPLWALARYRRLAGGASSAGAHTVPASTGADAALA
>seq_ID 82
MNKPAPSPWSALDTAIARGRDALMRLQQPDGSWCFELESDATITAEYILMMHFMD-KIDDVRQEKMARYLRAIQRLDTHGGWDLYVDGDPDVSCSVKAYFALKAAGD-SEHAPHMVRARDAILALGGAARSNVFTRILLATFGQVPWRATPFMPIEFVLFPKWVPISMY-KVAYWARTTMVPLLVLCSLKARARNPRNIAIPELFVTPPDEERHYFPPARGMRRAF-LALDRWRHVEPLLPKRLRQRAIRHAQAWCAERMNGEDGLGGIFPPIVYSYQMMDVLGYPD-DHPRRRDCENALEKLLVTRTDGSMYCQPCLSPVWDTAWSTMALEQARAVAVPEAGARA-SALDELDARIARAYDWLAERQVNDLRGDWIENAPADTQPGGWAFQYAN-PYYPDIDDTAWTAMLDRRGRTHRNADGSHPYAARVARALDWMRGLQSRNGGFAAF-DADC D RM YLN Al P FAD HGALLDPPTE DVSGRVLLC FGVTKRAAD-RASLARAIDYVKRTQQPDGSWWGRWGTNYLYGTWSVLAGLALAGEDPSQPYIARALAWL-RARQHADGGWG ETN DSYIDPTLAGTNAGESTSNCTAWALLAQMAFGDCESESVRR-GIAYLQSVQQDDGFWWHRSHNAPGFPRIFYLKYHGYTAYFPLWALARYRRLASGVS-SAGVHAVPASTGADAALA
>seq_ID 108
M NDLSQTQPRDAVLPEAAGAVPPASAPAPAAASEAPAASLDTAITRATDAIL-AAQKPDGHWVYELEADATIPAEYVLLVHYLGETPNVELEQKIARYLRRIQLPDGGWPLFTD-GAPDVSASVKAYFALKMIGDPADAEHMVRAREAILANG-GAEAVNVFTRILLALFGWSWRAVPMMPVEIMLLPMWFPFHLSKVSYWARTVIVPLLVL-NAKRPLARNPRRVRIDELFRGAPVNTGPRDRAPHQHAGWFRFFSGVDMLLRAVDGLFPKAT-RERAVRAAVAFVDERLNGEDGLGAIFPAMANSVMMYDVLGYPADHPNRAIARQSIEKLLVIKD-D E AYCQ PC LSPV WDTSLVAH ALLETGEARAEQAAERG LAWLRPLQILDVRGDWIS-RRPNVRPGGWAFQYNNDYYPDVDDTAVWMAMHRSAALTHSEVDREAI-ARAREWVVGMQSSDGGWGAFEPENTQYYLNNIPFSDHGALLDPPTADVSGRCLSM-LAQLGELPQGSEPAQRAFAYMLKEQEPDGSWYGRWGLNYIYGTWTALCSLNAAGMPHDD-PRMKRAAKWLLSIQNEDGGWGEGGESYKLDYHGYERAPSTASQTAWALMGLMAAGEVN-HEAVARGVAYLQREQREHGLWDETRFTATGFPRVFYLRYHGYRKFFPLWALARFRHLKRH-GLTRVAVGM
>seq_ID 169
MREAAVSKVETLQRPKTRDVSLDDVERGVQNAARALTEMTQTDGHICFELEADATIP-SEYILFHQFRGTVPRDGLEAKIGNYLRRTQSKVHGGWALVHDGPFDMSATVKAYFALKMIGD-DIEAPHMRAARKAILQRGGAANANVFTRILLALYGEVPWAAVPVMPVEVMHLPKWFPFHLD-KVSYWARCT M V P LFVIQAKKPRAKN PRGIG VAE LF VTP P DSVRTW PGSP H ATWPWTPIF-GAIDRVLQKTQDHFPKVPRQRAIDKAVAWVSERLNGEDGLGAIFPSMVNSVLMYEVLGYPP-D H PQ VKI AL EAIEKLVAEKD D EAYVQPCLSPVW DTALTS H AM LETGG AAAEAN ARAG LD WL K-P LQILDIKG DWAETKP N VRPGG WAFQYAN P H YP D LDDTAWVM AM DRAQ RQH-GLVSGMPDYSASIARAREWVEGLQSADGGWAAFDADNNHHYLNHIPFSDHGALLDPPTAD VTARVVS M LSQ LGETRETS RALDRGVTYLLN DQEKDGSWYGRWG M N FIYGTWSVLCAL-NAAGVDPQSPEIRKAVAWLIRIQNPDGGWGEDASSYKLNPEFEPGYSTASQTA-WALLALMAVGEVDDPAVARGVNYLMRTQGQDGLWNEERYTATGFPRVFYLRYHGYPKFF-PLWAMARFRNLKKGNSRQVQFGM
>seq_ID 163
MREAAVSKVETLQRPKTRDVSLDDVERGVQSAARALTDMTQADGHICFELEADATIP-SEYILFHHFRGTEPRAGLEAKIGNYLRRTQSKVHGGWALVHDGPFDMSASVKAYFALKMIGD-DIEAPHMRAVRKAILQRGGAANANVFTRILLALYGEVPWTAVPVMPVEVMHLPKWFPFHLD-KVSYWARCTMVPLFVIQAKKPRAKNPRGVGVAELFVTPPDSVRTWPGSPHATWPWTPIF-GAIDRVLQKTGDHFPKVPRQRAIDKAVAWVSERLNGEDGLGAIFPSMVNSVLMYEVLGYPP-DHPQVKIALEAIEKLVAEKDDEAYVQPCLSPVWDTALTSHAM LEVGGTQAEANARAGLDWLK-PLQILDIKGDWAETKPNVRPGGWAFQYANPHYPDLDDTAWVMAMDRAQRQH-GLVSGMPDYSTSIARAREWVEGLQSADGGWAAFDADNNHHYLNHIPFSDHGALLDPPTAD-VTARVVSMLAQLGETRETSRALDRGVTYLLNDQEKDGSWYGRWGMNFIYGTWSVLCAL-NAAGVDPQSPEIRKAVAWLIRIQNPDGGWGEDASSYKLNPEFEPGYSTASQTA-WALLALMAVGEVDDPAVARGVNYLMRTQGADGLWNEERYTATGFPRVFYLRYHGYPKFF-PLWAMARFRNLKRGNSRQVQFGM
>seq_lD 105
MKPNHTFSPAALDAAILRGRDTLSGLQQPDGSWCFELESDATITAEYILMMHFMDKIDE-VRQAQMARYLRAIQRVETHGAWDLYVDGAPDISCSVKAYFALKAAGDSEHAPHMIRAREAIL-KLGGAARSNVFTRILLATFGQVPWRAAPFMPVEFVLFPKWVPISMYKVAYWARTTMVPLL-VLCSLRARARNPRNVSIAELFVTPPDEERHYFPPAKGMRKLFLALDRTVRHLEPLL-PRRLRQRAIRHAEAWCAERMNGEDGLGGIFPPIVYSYQMMEVLGYPEDHPLRRDCEDA-LEKLLVTRADGSVYCQPCLSPVWDTAWSTMALEQARGATPAAPDTQVSERELDARI-ARAYDWLATRQVNDLEGDWRENARPGTLPGGWAFQYANPYYPDIDDSAWTAMLDRRGRA-QARASGENPYAERVTRALDWMRGLQSRNGGFGAFDADCDRLYLNAIPFADHGALLDPP-TEDVSGRVLLCFGVTKRPADRAAAARAIEYVKRTQQPDGSWWGRWGTNYLYGTWSVLAG-LALSGEDKSQPYIARALDWLRAHQHADGGWGETNDSYADPRLRATNYGESTSNCTA-WALLAQMAFGDWQSDSVRRGIAYLLSVQQDDGFWWHRSHNAPGFPRIFYLKYHGYTAYF-PLWALARYRRLAGAQAAPSSPGPGTAATIADPAVA
>seq_ID 211
MTSGTTILGAERGRTLDASIDAARAALLGYRRDDGHWVFELEADCTIPAEYVLLRHYLGEP-VDAALEAKIAVYLRRTQGAHGGWPLVHDGEFDVSATVKAYFALKMIGDSIDAPHMAKA-REAILARGGAIHVNVFTRFLLSMFGILTWRSVPVLPVEIMLLPMWAPFHLNKISYWARTTIV-PLMVLAALKPRAVNKLDIGLDELFLQDPQSIGMPAKAPHQSWGLFTLFGSIDAVLR-VIEPLIPKKLRSYAIGRAVAFIEERLNGEDGLGAIYPPMANTVMMYKVLGYGEDHPPRAITRR-GIDLLLWGEEEAYCQPCVSPIWDTSLTCHALLEAGGAEAALPVRKGLDWLIPKQVLD-LKGDWAVKAPNVRPGGWAFQYNNAHYPDLDDTAWVMALDRARRDQPSAAYDNAIARGRE-WIEGMQSDDGGWAAFDVNNTEYYLNNIPFSDHGALLDPPTEDVTARCVSMLAQLGETAETS-
SALARGVAYLRKTQLAEGSWYGRWGLNYIYGTWSVLCALNAAGVAHQDPAM-
RKAVAWLASIQNADGGWGEDAVSYRLDYRGYESAPSTASQTAWALLALMAAGEVDHPA-
V ARG V EYLKGTQTE KGVW D EQ RYTATGFP RVF YLRYHGYSKF F P LW AL ARYRN L-
RATNSKVVGVGM
>seq_ID 76
MDSVNATAREAKESKISESEILESSIASATQGVLGFQQSDGHWVFELEADCTIPAEYVLL-RHYLAEPVDTVLEAKIGNYLRRVQGAHGGWPLVHDGEFDMSASVKAYFALKMIGD-SIDAPHMVRAREAIHARGGAIHSNVFTRFMLAMFGIVTWRAVPVLPIEIMLLPFWSPFHINKI-SYWARTTMVPLMVIAALKPRAKNPKGVGIDELFLQDPRSIGMTAKAPHQSMAWFLL-FRSLDAILRVIEPLFPKSLRKRAIDTALAFSEERLNGEDGMGAIYPPMAN LVMMYDALGKDE-NYPPRAVTRRGIDKLLVIGDDEAYCQPCVSPVWDTTLTAHALLEAGGDKAGPAAKHGLD-WLIPKQELEVKGDWAVKRPDVRPGGWAFQYNNAYYPDLDDTAWVMSMDRMRREH-GVTGYDSAIDRGREWIEGMGSDDGGWAAFDVNNLEYYLNNIPFSDHGALLDPP-TEDVTARCVSMLAQLGETAKTSKHVADGVAYLRKTQHPEGSWYGRWGMN-FIYGTWSVLCALNMAGVRHDDPMIRKAADWLASIQNKDGGWGEDTVSYRLDYKGWEAAP-STASQTAWALLALMAAGEVDHPAVARGVEYLIATQNEKGLWDEQRYTATGF-PRVFYLRYH GYSKF F P LWGLARYRN LRNTN SRVVGVG M
>seq_ID 179
MEQQPELISGGVGGVAYPWDLGSQAIEEAILAARAALLAHLHPDGYWCFELEADCTI-PAEYIMMMHYTGELEAALELKLARYIRECQLQEGGWPLYYGGAMDIS-CSVKAYFALKLAGDDPEAAHMRRARKAVLERGGAVNANVFTHIALALFGEIPWRG-VPFMPPEILLLPRWFPFHLSKVSYWSRTVMVPLFILAAHKPRARNPRAIHI-SELFVTDPQLETGYFKARSRLNRLFITLDALGRRIEPFIPRAVRAKALRRAAEWFITRLN-GEHGLGAIFPAMVNSYEALELLGYAADHPLRQQVRKGLRDLWEQADRAYCQPCL-SPIWDTALACLALQEADRGSSSAQVRHALDWLQARQLLDTPGDWSEQHPS-LPGGGWPFQFRNDHYPDLDDTAIVAWAMQRASDPERYGAAIRRATVWLLGMQSANGG-FAAFDSDNTRYYLNEIPFADHGALLDPPTSDVTARVVALLGSLDGEVHDRSALNRAVAFLHRE QEAEGCWYGRWGTNYIYGTWSVLTALEQLGYDFNAPWVRKAVIWLKSVQRDDGGWGE-SNDTYLDHRPQDRQADESTPFQTAWAVLALIAAGECRSPEVWRGVEYLLRHQRPD-GLWYCPWFTAPGFPRVFYLKYHGYDAYFPLMALARYRNCVLDNDA
>seq_ID 81
MIRRMNKPAPSPWSALDAAIARGRDALMRLQQPDGSWCFELESDATITAEYILMMHFMDKID-DARQEKMARYLRAIQRLDTHGGWDLYVDGDPDVSCSVKAYFALKAAGD-SEHAPHMVRARDAILALGGAARSNVFTRILLATFGQVPWRAAPFMPIEFVLFPKWVPISMY-KVAYWTRTTMVPLLVLCSLKAHARNPRNIAIPELFVTPPDQERHYFPPARGMRRAF-LALDRWRHAEPLLPKRLRQRAIRHAQAWCAERMNGEDGLGGIFP-PIVYSYQMMDVLGYPADHPLRRDCENALEKLLVTRPDGSMYCQPCLSPVWDTAWST-MALEQARGVAVHEAGAPASALDELDARIARAYDWLAERQVNDLRGDWIENAPADTQPGG-WAFQYANPYYPDIDDSAWTAMLDRRGRTHRNADGTHPYAARVARALDWMRGLQSRNGG-
FAAFDADCDRMYLNAIPFADHGALLDPPTEDVSGRVLLCFGVTKRAD-DRASLARAIDYVKRTQQPDGSWWGRWGTNYLYGTWSVLAGLALAGEDPSQPYIARALAWL-RARQHADGGWGETNDSYIDPALAGTNAGESTSNCTAWALLAQMAFGDGESES-VKRGIAYLQSVQQDDGFWWHRSHNAPGFTRIFYLKYHGYTAYFPLWALARYRRLAGGASSA-GAHAVPASTAADAALA
>seq_ID 22
MATLTTMATTATMATTEASQPLEAQARTALTKATSYAWEIISNRHWCGELESNVTVTCEHIFF-LYVLYQHIDPDEGSQYRQWLLSQQNADGSWGIAPNYPGDVSTSAEAYLALRIIGMSPDSPEL-FQARTFIRAAGG LSKMRMFTRIF F AEFG LVPWT Al PQ LPAE FILVP AH F PISIYRLAS-WARSNWPLLIIAHHRPLYPLPNGLHKQNPFLDELWLDPATKPLPYGSLDPTDPLSFVFTILD-KALSYLGGLRRCPTRGYARRRCIQWILQHQEKAGDWAGIIPPMHAGIKALW-LEGYKLHDEPIQLGLAAIERFTWTDNRGKRLQCCISPVWDTVLMIRALQDTPASLGIKSDPRI-ADALAWTAENQHRGPEGDWRVYQPNIPVGGWAFEYSNTWYPDIDDTAAAVLAFLTHDPA-TARSRLVRDAVLWIVGMQNADGGWAAFDHENNRLFLNKIPFSDMESLCDPSTPDVTGR-TIECLGMLRDLLMLPAEKAGKKGEKYGYPDGERDAAADSHLLKIINTACARAIPYLIRTQEAT-GAWYGRWAVNYVYGTCLVLCGLQYFKHDPTFAPEIDTMATRAVKWLRQIQNSDGGWGES-VLSYREPWRAGCGPSTPSQTAWALMGLLTVCGGEDRSVQRGVRHLVDTQDDILSKGEG-GAAAWTEREFTSTGFPNHFYISYTLYRVYFPITALGRYLSLVEGGKKENGGGA
>seq_ID 178
MNSINATAAPIDDNVLGDRIGAATRGLLSLKQSDGHFVFELEADATIPSEYILMRHYLGEP-VDTVLEAKIAAYLRRIQGAHGGWPLVHDGPFDMSASVKAYFALKMAGDSIDAPHMA-RAREAILSRGG AAN VN VFTRF LLS F FG ELTWRSVP VLPV EIMLLPMWSPFHLN KVSYWARTT-MVPLMVLAALKPRARNPRGIGIRELFLEDPATVGTPKRAPHQSPGWFALFTGFDRV-LRLIEPLSPKWLRARAMKKAIAFVEERLNGEDGLGAIFPPMVNTVMMYDALGFPPEHPPRA-VTRRGIDKLLWGENEAYCQPCVSPIWDTALSCHALLEAGGPEAVNSAGKCLDWLLLKQEL-VLKGDWAVKRPDVRPGGWAFQYANGHYPDLDDTAVWMAMDRVRRNGPNGRYDEAI-ARGREWIEGMQSRDGGFAAFDADNLEYYLNNIPFSDHAALLDPPTEDVTARCVSMLAQL-GETVDSSSSM AAGVEY LRRTQLAEGS WYG RWG LN Yl YGTWSVLCAL N VA-GVDHQDPVIRRAVNWLVSIQNADGGWGEDAVSYRLDYKGFEGAPTTASQTAWALLALMAA-GEVENPAVARGIKYLIDTQTKKGLWDEQRYTATGFPRVFYLRYHGYSKFFPLWALARYRN-LRSTNSKAVGVGM
>seqLlD 177
MNATVAQIGDAVLEDRIGSATRGLLNLKQSDGHFVFELEADATIPSEYILLRHYLGEPVDT-VLEAKIAAYLRRIQGAHGGWPLVHDGPFDMSASVKAYFALKMIGDSVDAPHMA-RAREAILSRGGAANVNVFTRFLLSFFEVLTWRSVPVLPVEIMLLPMWSPFHLNKISYWARTT-MVPLMVLAVLKPRARNPRDVGIRELFLQDPATVRTPKRAPHQSPAWFALFSSLDWILR-RIEPLFPKRLRARAMEKAIAFVEERLNGEDGLGAIFPPMVNTVMMYDALGFPPEHPPRA-VTRRGIDKLLVIGEDEAYCQPCVSPIWDTALSCHALLEAGAPEALNSAGKCLDWLLPKQEL-VLKGDWAAKRPDVRPGGWAFQYANGHYPDLDDTAVWMAMDRVRRNGRGDKYDEAIER-
GREWIEGMQSRDGGFAAFDADNLEYYLNNIPFSDHAALLDPPTEDVTARCVSMLAQLGAT-VDGSSSMAAGVEYLRRTQLAEGSWYGRWGLNYIYGTWSVLCAL-NAAGVDHQDPAIRKAVDWLLSIQNEDGGWGEDAVSYRLDYKGFEGAPTTASQTA-WALLALMAAGEVENPAVTRGIKYLIDTQTKKGLWDEQRYTATGFPRVFYLRYHGYSKFFPL-WALARYRNLRSTNSKVVGVGM
>seq_ID 170
MREAVSKVEALQRSKTQGISLEDVERGVAQATRALTALAHDDGHICFELEADATIP-SEYILFHHFRGTQVPGDLEAKIGNYLRRTQGRHGGWALVHEGPFDMSCTVKAYFALKMIGD-DIEAPHMRRAREGILSRGGAANANVFTRFMLALYGEVPWRAVPVMPVEVMFLPKWFPFHLD-KISYWARTT WPL FVLQATKPRARN P RGISVQ E LFVTP PESVRSW PGSPH ATWP WTPIFG-FIDRVLQRVENHLPRKSRQRAMEMARAWVSERLNGEDGLGAIFPAMVNS-VLMYEVMGYRPDHPQVRVACDAIEKLWEKADEAYVQPCVSPVWDTALASHAL-LEAGGPEAEAQARAGLDWLKPRQVLDIVGDWAARKPKVRPGGWAFQYANAHYPDLD-DTAWVMAMDRAMHQHGLVAGMPDYKASIARAREWVEGLQSEDGGWAAFDADNNHMYLN-HIPFSDHGALLDPPTADVTARWGMLSQLGETRETSRALDRGVNYLLNDQEEDGSWYG-RWGMNFIYGTWSVLCALNAAGVDPADPRIQKAVSWLIRIQNPDGGWGEDASSYKIDPAFE-PGSSTASQTAWALLALMAAGAVDDPAVTRGINFLTRTQGADGFWKEERYTATGF-PRVFYLRYHGYPKFFPLWAMARFRNLKRGNSRRVQFGM
> s e q J D 14
MLLAEVQKALRLAVGHSLDLGRADGAWCGEVHSNATFTSQYVFLQQQIGLPLDPTEIEG-LSRWLFSQQNEDGSWGLGPGLGGDVSTTTETYLALKILGVSPEDPRMAAARTSIIKAGSL-PATRM FTRVFLASFGLIPWSAVPPLPAELILLPTLFPVNIYNLSSWARATCVPLLLIRH-HEPLHSLPNGRHAENDFLDELWTKDIPRDFCYTTPLSRMWRLGDYAGIFFTSADH-GLRFLGQYFHSPLRNLSRRKIINWILDHQEQSGEWAGYWPPQHNNIWALSLEGYSLD-H PVLRRGIAAV KS F VLH DATGM RAQVTVSQ VWDTALM SIALSDSAPSTGIISPTQAIDWLMH-HEVASHRGDWRVLRPKLATGGFCFEEFNTLYPDVDDTAAVIMALIKSNPAHLIS-GCVRRAAQWILGMQNRDGGWGAFDWNNDKFFLNKIPFSDMDSLCDPSTPDVTGRI-IECFGMMMAGRHGYSLDCQLENRLRASSQLAIAYLLGCQENNGSWWGRWGVNYLYGTS-NVLCGLAYYYDRSSLSKGDVKSNSNIVSAVDRASEWLKARQHSNGGWGEGPESYD-NAQLAGCGQPTASQSAWVTMALLNYLSPTDEVIQRGVSYLVRNQVKYGDESRAT-WLLERYTATGFPGHLYMEYDYYRHYFPIMALGRYVNKLSGSHKLL
>seq_ID 180
MTRALRQAPESAGAIGIAAASPATETSGQDTHPREISGAITAARDALLKLQQADGHWCFM-LEADCTIPAEYILWTHFTGELEPEIERKLAARLRAK-Q ASH GGWP LYEGGD LDISCSVKVYYALKLVGD DP N AP H M RRARE Al L AQGGG ARAN VFT R-LALAMFSQIPWRGVPFIPVEIMLLPRWFPFHLSKVSYWSRTVMVPLAILYSLKAQAQNPRN-VHIQELFTVPPEQERHYFPVRSRLNKILLSVERTARLLEPLIPSMLRRRALKKAETWFTERLN-GEDGLGGIFPAMVNAHESLILLGYSPDHPWRVQAKKALQNLVIEEKNSASCQPCLSPIWDT-GLAALALQETEGGHTTAPVIRALDWLKERQILEQSGDWQVQHPNLKGGGWAFQYNN-
SYYPDLDDTALVAWSMDQAATPERYGEAIGRACDWLCGMQSRNGGFAAFESDNTHYYLNEI-PFADHGALLDPPTADVTARCIVLLGRLNKPQYAETLQRALDYLRREQEPNGSWF-GRWGTNYIYGTWSALTALEQANIDPQEGFIRKAVEWLKQVQRLDGGWGEDNYSYFDSSLAG-RYQESTPVHTAWALLALMAVGEANSEAVKKGIAYLLQIQQEDGLWDHPAFNAPGFPRVFYL-KYHGYDKFFPLWALARYRNHLNRQC
>seqJD 155
MMANATDTIELPPSRAADRIVPMTDIDQAVDAAHAALGRRQQDDGHWVFELEADATI-PAEYVLLEHYLDRIDPALEERIGVYLRRIQGDHGGWPLYHGGKFDVSATVKAYFALKAIGDDI-DAPHMARARAAILDHGGAERSNVFTRFQLALFGEVPWHATPVMPVELMLLPRKALFS-VWNMSYWSRTVIAPLLVLAALRPRAINPRDVHVPELFVTPPDQVRDWIRG-PYRSQLGRLFKYVDIALRPAERLIPDATRQRAIKAAVDFIEPRLNGEDGLGAIYPAMANTVM-MYRALGVPDSDPRAATAWEAVRRLLVELDGEAYCQPCVSPIWDTGLAGHAMIEAASGPKGIR-PEDTKKKLAAAAEWLRERQILNGEGRLGDQLPRRAPRRLGLPVQQRLLPRRGRHGS-GRHVLHREGDPANDEALERARQWIIGMQSSNGGWGAFDIDNNLDFLNHIPFADHGALLDPP-TADVTARCISFLAQLGHPEDRPVIERGIAYLRTDQEREGCWFGRWGTNYIYGTWSVLCAY-NAAGVAHDDPSWRAVDWLRSVQREDGGWGEDCASYEGATPGIYTESLPSQTA-WAVLGLMAVGLRDDPAVMRGMAYLTRTQKDDGEWDEEPYNAVGFPKVFYLRYHGYRQFF-PLLALSRYRNLASSNSRHVAFGF
>seq_ID 8
MNRMLQPLHSGAGIFRSSLDRVIAQARQALGGRQAEDGHWCFEFEADCTI-PAEYILMQHYMDERDEALEARIAVYLRGKQADHGGWPLYYGGHFDLSAS-VKVYYALKLAGDDPELPHMRRAREAILAHGGAERSNVFTRITLALFAQVPWRAVPFIPVEIM-LLPRWFPFHIYKVASWSRTVMVPLFILCSLKARAKNPLQVHIRELFRRPPDQITDYFSHARR-GIVAYIFLSLDRFWRLMEGWIPHGIRRRALKKAEAWFTARINGEDGLNGIFPAMVNAHEAL-ELLGYPPDHDYRRQTGAALRKLWERANDAYCQPCVSPVWDTCLALHALLEEDGEVSPA-VQNGIRWLKNRQIGAEPGDWRESRPHLAGGGWAFQYANPYYPDLDDTAAVGWALARAGRA-EDRDSIEKAANWLAGMQSRNGGFGAYDVDNTHYYLNEIPFADHKALLDPPTADVTGRVVAF-LAH LARPRDRDVLRRAVAYLLREQESSGAWFGRWGTNYIYGTWSVLMALAELNDPSLKPT-MERAAYWLRAVQQGDGGWGESNDSYSDPGLAGMGQTSTAAQTAWACLGLMAAGDRDS-VALHRGIAWLQAHQEGDGCWQAPFFNAPGFPKVFYLIYHGYAFYFPLWALARYRNLGCMAHE
>seq_ID 203
M SM N E AV LAAP RAAVAT AAP ALQAPIE ALS P L D AGIGH AV D AL LAQQN AD G H WVYEL EADATI-PAEYVLMVHYLGETPDLSLEARIARYLRRIQNADGGWPLFHEGRSDISASVKAYFALK-MAGDDPQAAHMARAREVILAMGGAETSNVFTRTLLALYGVMPWQAVPMMPVEIMLLPQWF-PFHLSKVSYWARTVIVPLLVLNSLRPQARNPRKVGIDELFLGSRDA-VRLPPRAPHQHKGWHALFHGADVLLRTAEHVMPRGLRRRAIDAAKAFVRERLNGEDGLGAIF-PAMANSVMMFDVLGVPPDDPDRAIARRSIDKLLVVHGDEAYCQPCLSPVWDTALAAHALLEA-SEPRATAAVTRALDWLRPLQVLDVRGDWTVRRPDVRPGGWAFQYAN-PHYPDVDDTAVWAAMHRAARTDHSGRADPNAEATARAIEWIVGMQSANGGWGAFE-
PENTHLYLNNIPFADHGALLDPPTADVSARCLSMLCQTGATPDKSEPAAR-ALQYLLAEQLPDGSWFGRWGTNYIYGTWSALCAL-NAAGLGPDAPPLRRAAEWLVAIQNPDGGWGEDGDSYKLEYRGYETAPSVASQTA-WALLALMAAGQAAHPAVTRGIDYLLRTQQADGLWHEPRFTAVGFPRVFYLRYHGYARYFPL-WALARYRNLERSGNRQVAWGL
>seq_ID 165
MREAAVSKVETLQRPKTRDVSLDDVERGVQSATRALTEMTQADGHICFELEADATIP-SEYILFHQFRGTEPRPGLEAKIGNYLRRTQSKVHGGWALVHDGPFDMSASVKAYFALKMIGD DIEAPHMRAVRKAILQRGGAANANVFTRILLALYGEVPWAAVPVMPVEVMHLPKWFPFHLD-KVSYW ARCTM V P LFVIQAKKPRAKN P RGVGVAE LF VTPP DSVRTWPGSP H ATW PWTPIFG-GIDRVLQKTQDHFPKVPRQRAIDKAVAWVSERLNGEDGLGAIFPAMVNSVLMYEV-LGYPPEHPQVKIALEAIEKLVAEKEDEAYVQPCLSPVWDTALNSHAM-LEAGGHQAEANARAGLDWLKPLQILDIKGDWAETKPNVRPGGWAFQYANPHYPDLD-DTAWVMAMDRAQRQHGLVSGMPDYSESIARAREWVEGLQSADGGWAAFDADNNHHYLN-HIPFSD H G AL LD PPT AD VTARVVS M LSQ LG ETRATS RAL DRGVTY LLN DQEKDGSWYG-RWGMNFIYGTWSVLCALNTAGVDPQSPEIRKAVAWLIRIQNPDGGWGEDASSYKLNPEFE-PG YST ASQT AWAL LALM AAG EVD D PAVARGVN YLVRT QGQ DG L WS E E RYT ATG F-P RVFYLRY H GYP KF FP L WAM ARF RN LKRG NS RQ VQ FGM
>seq_ID 181
MSISPTFSGSSLQKSSLSDHSTISEPFTWDRVNGISAVALDDAITRAR-SALLAQQREDGHWCFSLEADCTIPAEYILMMHFMDEIDTALERRIANFLRN-RQVTDGHGGWPLYYGGDFDMSCSVKVYYALKLAGDSPEAAHMVRARNAILERG-GAARSNVFTRLLLAMYRQIPWRGVPFVPAEIMLLPRWFPFHLSKVAYWSRTVMVPL-SILCTLKAKAANPRNIHVRELFTVDPEMEKNYFPVRTPLNHLLLYLERLGSKLEPLIPS-FIRRRALKKAEQWTIERLNGRDGLGAIFPAMVNAYEALTLLGYDHDHPLLQQCRLALRELL-VNEGEDITWCQPCVSPVWDTVLASLALGEDERADNGPVRHALDWLVPLQALDQPGDWRNS RPDLPGGGWAFQYANPHYPDLDDTAAAAWALCQADTEDYRTSITRAADWLAGMQSSNGG-FAAFDIDNVHYYLNEIPFADHGALLDPPSSDVTARCIGLLALNGEARHQETVKRGLTFLFNE-QEPSGAWFGRWGTNYVYGTWSVLEALKLARVDHDHQAVKRAVQWLKSVQRADGGWGE-TNDSYLDSELAGQLETSTSFQTAWAVLGLMAAGEVGSTAVRNGIDYLIRTQSAAGL-W EE PW FTAPG F PKVFYLKYH GYS KYFPLWALNRY RAM NSRSW
>seqLlD 110
MILFPAGFYFSIYEISYWSRCIWPLSIAIARKPHVTVGDDLLKELYLVPREDWYRIER-DQDGFCWYNFFIDADSIFRRYEQHPIKFIRRIAKKMAEKWLLEHMEKSGGLGAIWPA-MINSIFAMKCLDYPDDH PALTAQ MKEVEALVIYEGDMLYLQ PCVSP VW DTAWSIIAMNDS-GIPGSHPVLQKAGKWLLSKEVRDFGDWKLKCKVEEPSGWYFQYANEFYPDTDDTGAVL-MALQRVSLPEDMHKEKTLLRALRWLQAMQCDDGGWGAFDRNNNKTILNNIPFADFNALLD-PSTSDVTGRCIEFFGRIGFNKTYLNIKKAVEFLKKEQDEDGSWFGRWGSNYIYGTWSVISGLI-AVGEDINKAYIKKAIAWLKSVQNSDGGWGETIKSYEDSALKGIGKSTPSQTAWALLTLITA-
GEIKSSSTERGIDFLLSTQKEDGSWDEREFTATGFPKVFYLKYHMYRNYFPL-
MALGRYRHFTHKLATSQ
>secLlD 182
MSISQAFFRTLIQKSSLSDSSLVSENFPADDVAGNEANEISAVTLDEAITRA-YTALLAQQ REDGH WCFPLEADCTIPAEYILMMHFM DEVDTVLE RKI-ANFLRTRQVTDGHGGWPLYYGGDFDMSCSVKTYYALKLAGDSPEAAHMVHARNAILERG-GAARSNVFTRLLLAMYRQIPWRGVPFVPAEIMLLPRWFPFHLSKVAYWSRTVMVPL-SILCTLKAKAINPRNVHVQELFWDPVKEKNYFPVRTSLNRLLLYVERLASKLEPFIPS-FIRRRAVKKAEQWVIERLNGNDGLGAIFPAMVNAYEALTLLGHDRDHPLLQQCRQSLRELL-VDEGEEITWCQPCVSPVWDTVLATLALQEDKQADSEPIRRALDWIV-PLQILDEPGDWRDSRPNLLGGGWAFQYANPHYPDLDDTAAVAWALIQTGAEDYRVSITRA-ADWLAGMQSSNGGFAAFDIDNAYYYLNEIPFADHGALLDPPTSDVSARCVGLLALNGE-VRHQEAVKRGLDFLFNEQESSGAWFGRWGSNYIYGTWSVLEAFR-L ARV DKG H QAVQ RAI QWLESVQ RADGGWG ETN DSY LDPQ LAGQLEASTSFQT A-WAVLGLMAAGEVENTAVRKGIDYLLRTQIATGLWEEPWFTAPGFPRVFYLKYHGYSKYFPL-WALNRYRTLSSKSAV
>seq_ID 162
MSPFLQASDDNNPLFKESCQALDHATEFARDTLVNKEHWCGWVLS-NVTVTAEWIFLQYILGLEMSNEDRRGFLKHFTSSQRPDGSWSLATQTTTGGELSCTIEAYLAL-KILGVSPEEDYMVRARDYVRSHGGAEKM RMLSRFHLAMFGLIPWAAVPQMP-PELIFMPSWSLVNIYKFSSWARCNIVGLCMLRVHEPLYALPNGKQLDNDYLDELWLDPYH-KAIPYTVPYLQLMQTSPLGVLFQLGDLFLWLLSFLGFWFLRRWAVSSSIQWTLD-HQEPSGDWGGIYPPMHHNILALMLEGWSQDDPVIQRGIGACQRFLAEDPAHGKWMQPSV-SPVWDTFLMIRAVADAKTTDDADKLLVKPVDWVLAQQIDDDHIGDWRIYRPDIPAGG-FAFEYFNKWYPDVDDTAVGVVALMRHDPSLVNDDRILKAAAWTLGMQNRDFGWAAF-DADNNAFYLHATPFSDMDSLTDSSTPDVTGHVLEM LGLMYRLERQGRVKSPEMLAFLSQSFI-GACDRGLGYLLGSQEAFGGWYGRWGVNYIFGTSAALCALAYFADRKGVRGKMAAGAD-WLRSRQNPDGGWGELLESYDNKALAGRGRSTPSQTAWALQGLLELEDPRGE-VVEAGVNWLLRHQVTSPSRNSGRVSATWPEDDYTATGFPGHFYLKYELYCFIYFPMMALA-RYRSCIQDGA
>seqLlD 172
MDDRVGAATFEAQPRAGFGSVEAAISRAREALLAVQKPDGHFVFELEADVSIPAEYILFRH-FLGDPAKTEIERKIGVYLRRRQTAAGGWPLFAEGVFNVSSSVKAYFALKIIGDDP-NAPHMAKARNAILAHGGAAQSNVFTRSLLALYGEVPWRAVPAMPVEIMHLPRWFPFHLS-KVS YWGRTVIAPLIVVH ALKPRAKN PRKIS VS E L FVAPAETVS RWPGAP H KSFPWTTIF-GAIDRVLHKTEPLLPARSHQTAIDKAVAFVTARLNGEDGLGAIYPAMAY-SAMMFFALGAPLSDPRIVQIRKAIDRLLVIKDGEAYCQPCVSPVWDTALASHALMESAGQR-PEARTAPAAAAVFEALDWLKPLQVLDVKGDWATQNPDVRPGGWAFQYANPHYPDLD-DTAWVLAMDRAVKTSPLIAGEEETAYVEAISRAREWILGLQSANGGFGAF DADNDRDYLNYIPFADHGALLDPPTADVTAROVSMLGQLGERPETSPALARAIDYLLSEQEE-EGSWFGRWGMNYIYGTWSVLSAFNAVERPADCAATRKAAAWLKRIQNPDGGWGEDGE-SYALGYKGYNPAPSTASQTAWALLALMAAGEVDAPEVALGLDYLVSTQADDGFWDEARF-TATGFPRVFYLRYHGYAKFFPLWAMARYRNLKSGNRLKTQFGM
>seq_ID 24
MLGAIREPPIDVQIALHSRDDNQTGLVLRGTRRTVDRVLKGLCSSPCFFCSVSLTMATLTTT-MATTATMATTEASKPLEAQARTALTKATNYAWEIFSNRHWCGELESNVTVTCEHIFFLY-VLYQHIDPGEGSQYRQWLLSQQNSDGSWGIAPNYPGDISTSAEAYLALRIIGMSTDSPELYR-ARTFIRAAGGLSKMRMFTRIFFAEFGLVPWTAIPQLPAEFILVPAHFPISIYRLAS-WARSNWPLLIIAHHRPLYPLPNGLHKQNPFLDELWLDPATKPLPYGSSDPTDPVAFVFTILD-KALSYLGGLRRSPTRGYARRRCVQWILQHQEKAGDWAGIIPPMHAGIKALL-LEGYKLHDEPIQLGLAAIERFTWADNRGKRLQCCISPVWDTVLMIRALQDTPASLGIKLDPRI-ADALAWTAENQHRGPEGDWRVYKPNIPVGGWAFEYHNTWYPDIDDTAAAVLAFLTHDPA-TARSRLVRDAVLWIVGMQNADGGWAAFDHENNQLFLNKIPFSDMESLCDPSTPDVTGR-TIECLGMLRDLLMRPAENAENGEKYGYPDGEGDAAADAHLLQIINTACARAIPYLIRSQEAT-GTWYG RWAVN YVYGTC LVLCG LQ YF KH D PKF AP El Q AM AARAVKW LKQVQN S DGG WG E-SLLSYREPWRAGCGPSTPSQTAWALMGILTVCGGEDRSVQRGVRHLVDTQDDTLSQGDG-GAAAWTEREFTIREPLHEASQRIGSD
>seq_ID 26
M ATLTTTM ATTATM ATTEAS KPLEAQ ARTALTKATN YA-WEIFSNRHWCGELESNVTVTCEHIFFLYVLYQHIDPGEGSQYRQWLLLQQNSDGS-WGIAPNYPGDISTSAEAYLALRIIGMSTDSPELYRARTFIRAAGGLSKMRM FTRIFFA-EFGLV P WTAIPQL PAE FILV PAH F PISIYRLAS WARSN VVP LLIIAHHRPLYPLPNGLHKQN-PFLDELWLD PATKPLPYGSSD PTDPVAF VFTIL D KALSYLGGLRRSPTRGYA-RRRCVQWILQHQEKAGDWAGIIPPMHAGIKALLLEGYKLHDEPIQLGLAAIERFTWADNRG-KRLQGCISPVWDTRVYKPNIPVGGWAFEYHNTWYPDIDDTAAAVLAFLTHDPATARSRLV-RDAVLWIVGMQNADGGWAAFDHENNQLFLNKIPFSDMESLCDPSTPDVTGR-TIECLGMLRDLLMRPAENAENGEKYGYPDGEGDAAADAHLLQIINTACARAIPYLIRSQEAT-GTWYGRWAVNYVYGTCLVLCGLQYFKHDPKFAPEIQAMAARAVKWLKQVQNSDGGWGE-SLLSYREPWRAGCGPSTPSQTAWALMGILTVCGGEDRSVQRGVRHLVDTQDDTLSQGDG-GAAAWTEREFTSTGFPNHFYISYTLYRVYFPITALGRYLSLIEGGGEKKKKGGGT
=*seq_ID 171
MGKVETLHRTSTQDITLDDVERRVTLASKALMRLANADGHWCFELEADATIPSEYILYHH-FRGSIPTAELEGKIAAYLRRTQSAQHDGWALIHDGPFDMSATVKAYFALKMVGDPIDAPHMR-RARDAILRRGGAAHANVFTRIMLALYGEVPWTAVPVMPVEVMLLPRWFPFHLDKVSYWART-VMVPLFVLQAKKPRARNPRGIGIRELFVEAPERVKRWPAGPQESSPWRPVFAAIDKVLQK-VEGFFPAGSRARAIDKAVAFVSERLNGEDGLGAIFPAMVNTVLMFEALGYPDDHPFAVTARS-SVEKLVTVKEHEAYVQPCLSPVWDTALAAHALMEAGGTEAERHAKRAMDWLKPLQVLDIK-GDWAASKPDVRPGGWAFQYANPHYPDLDDTAVWMAMDRVQSRRSPGPDAADYGLSI-
ARARE WV EG LQSRDGG WAAF DAD N TYH YLN Yl PFSD H G ALLDPPTAD VTARCVSM LSQLG E-TRETCPPLDRGVAYLLADQEADGSWYGRWGMNYIYGTWSVLCALNAAGIDPACEP-VRRAVTWLTAIQNPDGGWGEDASSYKLEYRGYERAPSTASQTAWALLALMAAGEADNPA-VARGINYLTRTQGADGLWAEDRYTATGFPRVFYLRYHGYAKFFPLWALARYRN-LQRGNSLKVAVGM
>seq_ID 173
MLREATAISNLEPPLTASYVESPLDAAIRQAKDRLLSLQHLEGYWVFELEADCTI-PAEYILMMHFMDEIDAALQAKIANYLRHHQSADGSYPLFRGGAGDISCTVKVYYALKLAGDSI-DAPHMKKAREWILAQGGAARSNVFTRIMLAMFEQIPWRGIPFTPVEIMLLPKWFPFHLD-KVSYWSRTVMVPLFILCSHKVTARNPSRIHVRELFTVEPQKERHYFDHVKTPLGKAILALER-FGRMLEPLIPKAVRKKATQKAFDWFTARLNGVDGLGAIFPAMVNAYEALDFLGVPPDDERRR-LARESIDRLLVFQGDSVYCQPCVSPIWDTALTSLTLQEVARHTADLRLDAALSKGLKWLAS-KQIDKDAPGDWRVNRAGLEGGGWAFQFGNDYYPDVDDSAVVAHALL-GSEDPSFDDNLRRAANWIAGMQSRNGGFGAFDADNTYYYLNSIPFADHGALLDPPTADV-SARCAMFLARWVNRQPELRPVLERTIDYLRREQEADGSWFGRWGTNYIYGPGAVLLAY-EGRRVPNDDPSVRRAVAWLKSIQREDGGWGEDNFSYHDPSYRGRFHTSTAFQTG-FALIALMAAGEXGSPEVQAGVDYLLRQQRPDGFWNDECFTAPGFPRVFYLKYHGYDKFFPL-WALARYRN ERYALA
>seqJD 117
MNETAFANPAPQVGPAQRQPAAPQEAPAARLPAPALDRGIDRALDALL-HQGRPDGHWVYELEADATIPAEYVLMVHYLGEDPDRDLEARIA-RYLRRIQNPDGGWPLFHQGRSDISASVKAYFALKMAGDDPGSAPMQRARQAIHAMG-GAEATNVFTRTLLALYGVLPWKAVPMMPVEIMLLPRWFPFHLSKVSYWARTVIVPLL-VLNSLRPQARNPRGVGINELFVGNCHTVGLPPRAAHQHAGWYTVFRGLDALLRLAEPLF-PRTLRRRAIAAAQRFVRERLNGEDGLGAIFPAMANSVMMFDVLGVPPEDPARAVARR-SIERLLVEHGDEAYCQPCLSPVWDTALATHALLETGEARAAQAAGRALDWLRPLQVLDLRG-DWAVRRPLVRPGGWAFQYANAYYPDVDDTAVVAAAMDRFMRAHHAPGRYGEAVARA-TEWIVGMQSGNGGWGAFEPENTHLYLNNIPFADHGALLDPPTADVSARCLSMLCQTGAT-PANSEPAARALRYLLAEGMPDGSWFGRWGTNYIYGTWSALCALNAAGLPPEA-PELCRAVAWLARIQNADGGWGEDGSSYRLDYSGYEPAPSVASQTAWALLALMAAGAAQH-PAVARGIDYLLRTQQPGGLWHEPRFTAVGFPRVFYLRYHGYARYFPLWALARYRN-LQRGLGDHGGNSGQVAWGL
>seq_l D 204
MSMNETAFATAVPRIAPASAGDSPAPRDAAQALDQGIGRAIDALLHQQRPDGHWVYELEADA TIPAEYVLMVHYLGEAPDLELEARLARYLRRIQNPDGGWPLFHEGRSDVSASVKAYFALK-MAGDDPQAAHMQRARRAVHALGGAEASNVFTRTLLALYGVMPWLAVPMMPVEIMLLPQWF-PFHLSKVSYWARTVIVPLLVLNSLRPQARNPRGVGINELFVGNCHTVGLPPRAAHQHAG-WYTVFRGLDALLRVAEPLVPRTLRRRAIAAAQAFVRERLNGEDGLGAIFPAMANS-VMMFDVLGVPPDDPARALARQSVERLLVEHGDEAYCQPCLSPVWDTALAAHALLETGEA-
RATAAAGRGLDWLRPLQVLDVRGDWAVRRPLVRPGGWAFQYANAYYPDVDDTAVVAAAM-NRYMRAHDVPGRYDEAVARAAEWIVGMQGGDGGWGAFEPENTH LYLNNIPFADHGALLD-PPTADVSARCLSMLCQIGATPGKSEPAARALRYLLAEQMPDGSWFGRWGTNYIYGTWSAL-CALNATGLAPEAPEMRRAVAWLEQIQNADGGWGEDGSSYRLDYRGYEPAPSVASQTA-WALLALMAAGAAQHAAVARGIDYLLRTQQSGGLWHEPRFTAVGFPRVFYLRYHGYARYFPL-WALARYRNLQRGGAHQVPWGL
>seq_ID 79
MRIGTTTNPSMPFPLSSSGAVFYREVNELREVQQEINRIQAF-LLGRQQEDGTWRFCLESSPMTDSHMIILLRTLGIHDERLMEKLTA-HITALQHDNGAWKLYPDEQEGHLSTTIDSYYALLLSGKYTKNEPRMALARS-FILEKGGLTQANMLTKFATALTGQYQWPSHFLVPVEIALLPPSFPVSFYDFVGYA-RVHLAPMMIVADRNYVKKPDNAPDLSDLYADTPISRGLYPHRFLENFLKEGQSFLATIHDS-LQQLPFLPGQLHKLALRRLEQYILARIEPDGTLYNYSTSTFFMIFALLARGFSPKDPLI-QKAMQGLTGSVYDYENGAHLQLATSAVWDTALLTFSLQKSGLSPTHPAIQKANRYLL-RKQQHTYGDWKIRNPNGKPGGWGFSDYNTMNPDIDDTTAAL-RSLRLLARTDVTAATAWKRGLEWLLSMQNDDGGWPAFERNTDADFIRHLPIEGADTVSTDPS-SADLTGRTLEFLGNYAGRTLTDLHVEKGVRWLLKHQESDGSWYGRWGIAYLYGTWAAIT-GLMAVGFSPTEPAIQKAVAWLVANQNPDGGWGESCQSDLKKTYVPLGASTPSQTAWAIDALI AVSSKPTAELQRGIRYLLTHNQANDWTTRYPTGGGRPGGTYFAYHSYRWIWPLLALS-HYQVKYANT
>seqLlD 70
MLLYDKVHEElERRTTALQTr/IQRQDGTWQFCFEGALLTDCHMIFLLKLLGRNDElEPF-VKRLVSLQTNEGTWKLYEDEKGGNLSATIQAYAALLASEKYSKEDMNMRRAEMFIKEHGGVS-RAHFMTKFLLAIHGEYEFPALFHFPTPILFLQDDSPLSIFGLSSSA-RIHLIPMMICr/INKRFRVEKKLLPNLNHIAGGGGQWFREERSPLIQSFLGDVKKVISY-PLSLHHKGYEEVERFMKERIDENGTLYSYASATFYMIYALLALGHSIQSPIIEKAVTGLK-SYIWKMDRGSHLQNSPSTVWDTALLSYSLQEAKVTNENKMIQRATEY-L LQ KQQTKKV D WS VH ASS LVAGG WG FSDVNTTIP DIDDTTAAL RALARS RGNDRVD-DAWGRGVEWVKGLQNNDGGWGAFERGVTSKLLSNLPIENASDMITDPSTPDITGRV-LELFGTYAPNELLEEQKKKAIKWLMDVQEQNGSWYGKWGICYIYGTWATMTGLRAL-GVPSTHPALKKAASWLEHLQHEDGGWGESCQSSVEKKFISLPFSTPSQTAWALDALISY-YDQ ETPIIRKGISYLLAQSTM N E KYPTGTG LPGGFYIRYHSYG HIY P LLALAH YV KKYRK
>seqJD 140
MAGERSALITALKRSQAADGSWRFPFETGISTDAYMIILLRTLDINDEPLIQALVERIES-RQEANGAWKLFADEGDGNVTATVEAYYALLYSGYRQPTDRHMQKAKRRILDMGGLDRVHL-FTKVMLALTGQYPWPGRFPLPLEFFLLPPSFPLNMYDLSVYGRANMIPLLI-AADSRYSRKTDKSPDLSDLFASRGDWGMPESRSLLTYVKRSLIGLPAGLHQAAK-QRAVRYLFEHIEPDGTLYSYFSSTFLFIFALLALGYRNDDPRIRQAVRGLRSLRT-Tl DG H VH LQYTTASVWNTALASYTLQE AGVP MTDRAIEKAN-
RYLLSRGNVRYGDWAVHNPYSTPGGWGFSDVNTMNPDVDDTTAALRAIRQAAA-KETAFRHAWDRANQWLFSMQNDDGGFAAFEKNVSSRFWRYLPIEGAEFLLMDPSTADLT-GRTLEYFGTFAGLTKDQRAVSRAVDWLLSHQERNGSWYGRWGICYIYGTWAAIT-GLTAVGVPAHHPALQKAVRWLLSIQNDDGGWGESCKSDGAKTYVPLGDSTPVHTAWALDAL-VAAAERPTLEM KAGFRALFRLLH H PD WT ASYP VGQGW AG AF Yl HYHSYRYIF-PLLALAHYEQKFGPLDD
>seq_ID 137
MAGERSALITALKRSQAADGSWRFPFETGISTDAYMIILLRTLDINDEPLIQALVERIES-RQEANGAWKLFADEGDGNVTATVEAYYALLYSGYRQPTDRHMQKAKRRILDMGGLDRVHL-FTKVM LALTGQYPWPGRFPLPLEFFLLPPSFPLNMYDLSVYGRANMIPLLI-AADSRYSRKTDKSPDLSDLFASRGDWGMPESRSLLTYVKRSLIGLPAQLHQAAK-QRAVRYLFEHIEPDGTLYSYFSSTFLFIFALLALGYRNDDPRIRQAVRGLRSLRT-TIDGHVHLQYTTASVWNTALASYTLQEAGVPMTDRAIEKAN-RYLLSRQ N VRYG D WAVH N PYSTPGGWG FSDVNTM N P DVDDTTAALRAIRQAAA-KETAFRHAWDRANQWLFSMQNDDGGFAAFEKNVSSRFWRYLPIEGAEFLLMDPSTADLT-GRTLEYFGTFAGLTKDQRAVSRAVDWLLSHQERNGSWYGRWGICYIYGTWAAIT-GLTAVGVPAHHPALQKAVRWLLSIQNDDGGWGESCKSDGAKTYVPLGDSTPVHTAWALDAL VAAAERPTLEMKAGFRALFRLLHHPDWTASYPVGQGMAGAFYIHYHSYRYIF-PLLALAHYEQKFGPLDD
>seq_ID 136
M VAD E RSALID ALKRSQSVDGSW RF PF ETGISTDAYM11LLRTLGIH DEPLIQALVERIE S-RQDANGAWKLFADEGDGNVTATVEAYYALLYSGYRKKTDSHMQKAKARILEVGGLERVHL-FTKVMLALTGQHSWPRRFPLPLVFFLLPPSFPLNMYDLSVYGRANMVPLLWAER-RYSRKTDNSPDLSDLAASRNDWRLPDTEALWSYVKRSLTGLPAWLHRAAEQRAVRYMLEH-IEPDGTLYSYFSSTFLLIFALLALGYPKDDPHIARAVRGLRSLRTEIDGHTHMQYTTASVWN-TALASYALQEAGVPPTDRTIEKANRYLLSRQHIRYGDWAVHNPYGVPGGWGFSDVNT-MNPDVDDTTAALRAIRRAAAKETAFRHAWDRANRWLFSMQNDDGGFAAFEKNVG-KRFWRYLPIEGAEFLLMDPSTADLTGRTLEYFGTFAGLTKDHSAIARAIDWLLDHQEADGS-WYGRWGICYVYGTWAAVTGLSAVGVPIDHPAMQKAVRWLLSIQNDDGGWGESCKSDGAK-TYVPLG ASTP VHTAWALD ALIAAAE RPTP E M KAGVRALVRM LH H P DWT ASYPVGQG-MAGAFYIHYHGYRYIFPLLALAHYEQKFGPFVD
>seqLlD 49
MLLYEKVYEEIARRTTALQTMQRQDGTWRFCFEGAPLTDCHMIFLLKLLGRDKEIEPFVKR-LASLQTNEGTWKLYEDEVGGNLSATIQSYAALLASEKYTKEDANMKRAEMFINERGGVARAH-FMTKFLLAIHGEYEYPSLFHLPTPIMFLQNDSPLSIFELSSSA-RIHLIPMMLCLNKRFRVGKKLLPNLNHIAGGGGEWFREDRSPVFQTLLSEVKKII-TYPLSLHHKGYEEVERFMKERIDENGTLYSYATASFYMIYALLALGHSIQSPIIQKAITGIAS-YIWKMERGSHLQNSPSTVWDTALLSYALQEAQVPKASKVIQNASAYLL-RKQQTKKVDWSVHAPNLFPGGWGFSDVNTMIPDIDDTTAVLRALARSRGDENVD-
NAWKRAVNWVKGLQNNDGGWGAFEKGVTSRILANLPIENASDMITDPSTPDITGRVLEF-FGTYAQNELPEKQKQSAINWLMNVQEENGSWYGKWGICYIYGTWAVLTGLRSLGIPSSDPS-LKRAALWLEHIQHEDGGWGESCQSSVEKRFVTLPFSTPSQTAWALDALISYYEKETPIIRKGI-SYLLSNPYVN E KYPTGTG LPGGFYIRYHSYAHIYP LLTLAH YTKKY RK
>seq_ID 62
MNIVIRISKGWVSNLLLDEKAHEEIVRRATALQTMQWQDGTWRFCFEGAPLTDCHTIFLL-KLLG RD KEIEPF VERVAS LQTN EGTW KLYEDEVGG N LSATIQSYAALLAS KKYTKE D AN M KRA-ENFIQERGGVARAHFMTKFLLAIHGEYEYPSLFHVPTPIMFLQNDSPFSIFELSSSA-RIHLIPMMLCLNKRFRVGKKLLPNLNHIAGGGGEWFREDRSPVFQTLLSDVKQIISY-PLSLHHKGYKEIERFMKERIDENGTLYSYATASFYMIYALLALGHSLQSSMIQKAIAGIT-SYIWKMERGNH LQ NS PSTVWDTALLSYALQEAQ VSKD N KM IQ N ATAYLLKKQHTKKAD-WSVHAQALTPGGWGFSDVNTTIPDIDDTTAVLRALARSRGNKNIDNAWKKGVNWIKGLQNN-DGGWGAFEKGVTSKLLAKLPIENASDMITDPSTPDITGRVLEFFGTYAQNELPEKQIQRAIN-WLMNVQEENGSWYGKWGICYIYGTWAVMTGLRSLGIPSSNPSLTRAASWLEHIQHEDGGW-GESCHSSVEKRFVTLPFSTPSQTAWALDALISYYDTETPAIRKGVSYLLSNPYVNERYPTGT-GLPGAFYIRYHSYAHIYPLLTLAHYIKKYRK
>seqLlD 59
METLIDPEISRLTQRLLEDQEEDGAWRYCFENSLMTDAYMIVLIRSLGIK-KERLVQELADRLLSQQEEKGFWKIYRDEVEGNLSATVEAYFALLWSGAVKEKDENMVKARD-CILSGGGLDKVHSMTKFMLAAHGQYPWDRFFPVPVEVILLPTYFPVSFT-DFSAYARVHLAPLLLLKSERYIRKTSTTPDLSYLLKDQEDFSFFREEERSFIEYVTSG-VEAIAAFPANLNDLAKKTALNYMLARLEPDGSLYSYFSSSFYMIIALLSQGYSRKDPLVVNAI-KALISYQCKGDGYPHIQNSPSTIWDTALISHALQSSGVDSRNAQILKAS-HYLYRHQHTQKGDWASEAPQTAPGGWGFSESNTINPDVDDTTAALRALKLDA-YTDPVKRM AWN RG V KWALS MQNKDGGWPAFEKNKN KDILS WV PMDGA-EDAALDRSCADLTGRTLEFLGNDAGMGRENSQVLKGIEWLMNNQENDGS-WYGKWGICYIYGTWAALTGMMAAGMSADHQSIIKAIKWLYQIQNSDGGWGESCRSDKERKY-IS LG ASTPSQTAWAL D ALISIN D H PTKEID RG I ES LV RLLNTDDWRKEYPTGAGLP-GRFYIHYHSYPYIWPLLALSNYKTKFLEVR
>seqLlD 51
MVLYGRVCAEIERTITALHTMQQQDGAWRFCFEGSPLTDCHMIFLLRLLEKEEEIEPF-VARLTSIQTNEGTWKLYEDERAGNVSTTIQAYAALLASGMYTKEDVNMKRAEAFIQERGGI-ARSHFMTKFLLALHGGYEYPRMFYFPTPILFLPEDSPLSIFELSSSA-RIHLIPMMICMNKRFTVSKTILPNLDHISGSSKSEWFREDRSSLFETILGE-VKKFVTYPLSLPIHKGDKEAERFMIERIDRNGTLYSYASATFYMIYALLALGHHIQSPLI-QQAVAGLRTYKWHMEAGIHLQNSPSTVWDTALLSYALQEANVNESTPMIQTATEYIWQRQH-HEKKDWSLHAPTLSPGGWGFSDVNTTIPDVDDTTAALRALARSRKRNRRIEE-AWKKGVNWVKGLQNKDGGWAAFEKGVTNRFLTHLPLENSGDMMTDPSTADITGRVLEF-FGTYAPNELQDHQKNRAITWLMDVQENNGSWYGKWGVSYIYGTWAALTGLRAVGVANTH-
PALKKAVMWLERIQHRDGGWGESCRSSIEKRFVPLSFSTPSQTAWAIDALISYY-
DEETPVIRKGISYLLEHAASHQEYPTGTGLPNGFYIRYHSYSYMYPLLTFAHYINKYRK >seq_ID 32
MLLYEKAHEEIVRRATALQTMQWQDGTWRFCFEGAPLTDCHMIFLLKLLGRDKEIEPFVER-VASLQTNEGTWKLHEDEVGGNLSATIQSYAALLASKKYTKEDANMKRAENFIQERGGVARAH FMTKFLLAIHGEYEYPSLFHLPTPIMFLQNDSPFSIFELSSSA-RIHLIPMMLCLNKRFRVGKKLLPNLNHIAGGGGEWFREDRSPVFQTLLSDVKQIISY-PLSLHHKGYEEIERFMKERIDENGTLYSYATASFYMIYALLALGHSLQSSMIQKAIAGIT-SYIWKMERGNHLQNSPSTVWDTALLSYALQEAQVSKDNKMIQNATAYLLKKQHTKKAD-WSVHAPALTPGGWGFSDVNTTIPDIDDTTAVLRALARSRGNKNIDNAWKKGGNWIKGLQNN-DGGWGAFEKGVTSKLLAKLPIENASDMITDPSTPDITGRVLEFFGTYAQNELPEKQIQRAIN-WLMNVQEENGSWYGKWGICYLYGTWAVMTGLRSLGIPSSNPSLTRAASWLEHIQHEDGGW-GESCHSSVEKRFVTLPFSTPSQTAWALDALISYYDTETPAIRKGVSYLLSNPYVNERYPTGT-GLPGAFYIRYHSYAHIYPLLTLAHYIKKYRK
>seqLlD 31
MSTIHENVRSRQKKTISLLRETQNADGSWSFCFEGPILTNAFLILLLTSLGDNDKELIA-ELAEGIRAKQRPDGTFANYPDDRKGNVTATVQGYAGLLASGLYSRSEAHMIQAERFIISNG-GLRNVHFMTKWMLAANGLYPWPALHLPLSFLVIPPTFPLHFYQFSTYARIHFVP-MAVTLNKRFSLKNPNVSSLAHLDRHMTKNPFTWLRSDQDENRDLSSLFAHWKRLLQI-PAAF H QLG LRTAKTYM LD Rl EEDGTLYS YASATIFMVYGLLALGVS-RHSPVLRKALAGTKALLTSCGNIPYLENSTSTVWDTALLNYALMKSGISDNDQMITSAARFL-RERQQKKVADWAVHNPHAEPGGWGFSNINTNNPDCDDTAAVLKAIPRKLYPASWERGLS-WLLSMQNSDGGFSAFEKNVNHPLVRLLPLESAEEAAIDPSTSDLTGRVLHCLGEAGLS-SDHPQIEKAVQWLIRHQEEDGSWYGRWGVCYIYGTWAALTGMKACGVSQNHPAVK-KAIRWLKSIQNEDGSWGESCKSAEEKTYVPLSYGTLVQTAWAAEALLQYEKTHHQAVTKGIS-FLIENRHYEGAAFSYPTGIGLPKQFYIRYHSYPYVFSLLALSTFMKMSEKEEEK
>seq_ID 48
MLLYEKAHEEIARRATALQTMQRQDGTWRFCFEGAPLTDCHMIFLLKLLGRDKEIEPFVKR-LAS LQTN EGTWKLYE D EVGGN LSATIQSYAALLASKKYTKE D AN M KRAEN Fl KE RGGVARAH-FMTKFLLAIHGEYEYPSLFHLPTPIMFLQNDSPLSIFELSSSA-RIHLIPMMVCLNKRFRVGKKLLPNLNHIAGGGGEWFREDRSPLFQTLLSDVKQIISY-PLSLHHKGYEEVERFMKERIDENGTLYSYATASFYMIYALLALGHSLQSSLIQKAIAGIT-SYIWKMERGSHLQNSPSTVWDTALLSYALQEAHVPKDHKMIQQTITYLLKKQHTKKAD-WSVH ALALTPGG WGFSDVNTTIP DVD DTTAVLRALARS RGN E NIDNAWKKGVNWIKGLQNN-DGGWGAFEKGVTSKLLANLPIENASDMITDPSTPDITGRVLELFGTYTQNELPKKQKQSAIN-WLMNVQERNGSWYGKWGICYIYGTWAVMTGLRSLGIPSNNPSLKRAALWLEHIQHEDGGW-GESCQSSVEKRFVTLPFSTPSQTAWALDALISYYDKETPTIRKGVSYLLANPYVNEKYPTGT-GLPGGFYIRYHSYAQIYPLLTLAHYTKKYQK
>seq_ID 34
MNIVIRISKGWVSNLLLYEKVHEEIARRTTALQSMQRQDGTWRFCFEGAPLTDCHMIFLL-KLLGRDKEIEPFVKRLASLQTNEGTWKLYEDEVGGNLSATIQSYAALLASEKYTKEDANMKRA-EMFINERGGVARAHFMTKFLLAIHGEYEYPSLFHLPTPIMFLQNDSPLSIFELSSSA-RIHLIPMMLCLNKRFRVGKKLLPNLNHIAGGGGEWFREDRSPVFQTLVSDVKKII-TYPLSLHHKGYEEVERFMKERIDENGTLYSYATASFYMIYALLALGHSLQSSMIQKAIAGIT-SYMWKMESGNHVQNSPSTVWDTALLSYALQEAHVLKDNKMLQNATAYLLKKQHTKKAD-WSVH APALTPGG WGFS D VNTTVPDVD DTTAVLRV LARSRG NEKVDHAWQKGINWVK-GLQNNDGGWGAFEKGVTSHILANLPIENASDMITDPSTPDITGRVLEFFGTYAQNEL-PEKQKQSAINWLMNVQEENGSWYGKWGICYIYGTWAVLTGLRSLGIPSSDPSLKRAALW-LEHIQHEDGGWGESCQSSVEKRFVTLPFSTPSQTAWALDALISYYDKETSVIRKGISYLLS-N P Yl N ETYPTGTGLPGGFYIRYHSY AH IYPLLTL AH YAKKYRK
>seq_ID 47
MLLYEKVHEEIVRRATALQTMQWQDGTWRFCFEGAPLTDCHMIFLLKLLGREKEIEPFVE-RIASLQTNEGTWKLYEDEVGGNLSATIQSYAALLASKKYTKEDANMKRAENFIKERGGVA-RAHFMTKFLLAIHGGYEYPSLFHLPTPIMFLQNDSPLSIFELSSSA-RIHLIPMMLCLNKRFRVGKKLLPNLNHIAGGGGEWFREDRSPVFQTLISDVKQIISY-PLSLHHKGYEEIERFMKERIDENGTLYSYATASFYMIYALLALGHSPQSSMIQKAIAGLT-SYIWKMGRGSHLQNSPSTVWDTALLSYALQEARVSKDNKMIQNATAYLLKKQHTKKAD-WSVHAPALIPGGWGFSDVNTTIPDIDDTTAVLRALARSRGNKNIDNAWQKGVNWIKGLQNN-DGGWGAFEKGVTSKLLANLPIENASDMITDPSTPDITGRVLEFFGTYAQNGLPEKQKQSAIN-WLMNAQEENGSWYGKWGICYIYGTWAVMTGLRSLGIPSSNPSLKRAASWLEYIQHEDGGW-GESCHSSVEKRFVTLPFSTPSQTAWALDALISYYDTETPAIRKGVSYLLSNPYVNERYPTGT-GLPGAFYIRYHSYAHIYPLLTLAHYLKKYRK
>seq_ID 52
MRSILEDVKAFRQKTLAELQNRQRSDGSWRFCFEGPVMTDSFFILMLTSLGDQDSS-LIASLAERIRSRQSEDGAFRNHPDERAGNLTATVQGYTGMLASGLYDRKAPHMQKAEAFIK-DAGGLKGVHFMTKWMLAANGLYPWPRAYIPLSFLLIPSYFPLHFYHFSTYARIHFVPMAIT-FNRRFSLKNNQIGSLRHLDEAMSKNPLEWLNIRAFDERTFYSFNLQWKQLFQWPAYVHQLG-FEAGKKYMLDRIEEDGTLYSYASATMFMIYSLLAMGISKNAPVVKKAVSGIKSLISSCGKE-GAHLENSTSTVWDTALISYAMQESGVPEQHSSTSSAADYLLKRQHVKKAD-WAVSNPQAVPGGWGFSHINTNNPDLDDTAAALKAIPFQRRPDAWNRGLAWLLSMQNKDGG-FAAFEKDVDHPLIRNLPLESAAEAAVDPSTADLTGRVLHLLGLKGRFTDNHPAVRRALRWLD-H HQKADGS WYG RWGVC FIYGTWAALTGM KAVGVS ANQTS VKKAISW L KSIQ REDGS WG E-SCKSCEAKRFVPLHFGTWQSSWALEALLQYERPDDPQIIKGIRFLIDEHESSRERLEYPT-GIGLPNQFYIRY HSYP FVFSLLASSAFIKKAEM RETY
>seq_ID 188
M RSELLQ LQSADGSW RLC FDSGTM PDSY FIIILRM LGYSQD EALIRQIAS-
RILSRQLPNGTWKIYPDEEDGNLDATAEAYFALLYSGFLTKLDPRMQLAKQFILSKGGLS KIRSLLTQAIFAAAGQASWPKSMRIPLEVFFSDNGIGIDLFSLSGHARVHIVPIIM-LANAQFVQHSASMPDLSDLFAGSSKRFENDSPWIAALATLIGSLSLSELLPFESPTPQE-KAVQFLFDRLEPDGTLLTYTTATMFMILVLLMLGYSSSSPLIHRMVSGIHSVICANSHVQIAS-SEV WDTAM LVH ALRKAGV N PTSTALEN AGAYLRQ RQQT Q LG D WAIRNPGT-PAGGWGFSNVNTLYPDVDDTTAALRAIQPYSSRTPELQADWQRGLNWVLTMRNDNG-GWPAFERQGSRLPITFFNFEGAKDIAVDPSTVDLTSRTLQFLGQELGMNAGNSWIEST-L RWVLSQQES NGS WYGRWGITYVH GTSAALQGLTAVGIAE D H PA-VKKGVDWLLQVQNEDGGWGESCISDKVRRYVPLNFSTPSQTAWALDGLTAALPKPTPALER-GVDALLQSLDRH D WTYTYPTGG ALPGSVYAH YASN N YIW PLLALSNIWQKYS
>seqJD 60
MGTLQEKVRRFQKKTITELRDRQNADGSWTFCFEGPIMTNSFFILLLTSLDEGENEKE-LISSLAAGIHAKQQPDGTFINYPDETRGNLTATVQGYVGMLASGCFHRTEPHMKKA-EQFIISFIGGLRHVHFMTKWMLAANGLYPWPALYLPLSLMALPPTLPIHFYQFSSYARIHFAP-MAVTLNQRFVLINRNISSLHHLDPHMTKNPFTWLRSDAFEERDLTSILLHWKRVFHAP-FAFQQLGLQTAKTYMLDRIEKDGTLYSYASATIYMVYSLLSLGVSRYSPIIRRAIT-GIKSLVTKCNGIPYLENSTSTVWDTALISYALQKNGVTETDGSVTKAADFLLERQHTKIAD-WSVKNPNSVPGGWGFSNINTNNPDCDDTTAVLKAIPRNHSPAAWERGVSWLLSMQNN-DGGFSAFEKNVNHPLIRLLPLESAEDAAVDPSTADLTGRVLHFLGE-KVGFTEKHQHIQRAVKWLFEHQEQNGSWYGRWGVCYIYGTWAALTGMHACGVDRK-HPGIQKALRWLKSIQNDDGSWGESCKSAEIKTYVPLHRGTIVQTAWALDALLTYEN-SEHPSVVKGMQYLTDSSSHSADSLAYPAGIGLPKQFYIRYHSYPYVFSLI-AVGKYLDSIE-KETANET
>seq_ID 56
MQDFKTKVNVYMDELHMQMQHRQREDGAFVFCFEGSMMTNAFLIMLLKAVGDTDQAL-VHQLAEAIREKQNEDGSFSLYHDQAGHVTATVQGYCGMLVSGRYQQDEPHMEKAA-RYIRSKGG LKDVH FMTKWMLAVNGMHPW PYFYAP LSFLLIPTY F-PLHFYHLSAYARIHFVPMMIALNKRYTSHEQFPSLSHLDANMSKNPFDWFMAREERSTHH-FLAYMRSYTALDSRFDFFGYEAAKRYMFDRLEKDGTLYSYLSASIFMVYALMS-LGYSPGHHLILKAVKGMKQLVTDCGGKKYAENSTSTVWDTALVSYASQRAGRTQDDPVIKKS-FTYLLNRQQMKKADWAIHNRFIAAPGGFGFSDLNTNNPDCDDTQIVLKAIPQTYAPVQWKRG-FDWLLSMQNRDGGFSAFEKNQDHFLLRHLPLESAEDAAIDPSTPDITGRVLHLI ASEEN D-KSPLMQRQKDHCVKWLLDHQEKDGSWYGRWGVCYIYGTWAALTGLKASGIPSSHPA-VQ KACRF LKTIQ LEDGS FGESC KSS EVKRYVP LPFGTVVQT AWAAE ALLQYVQPD D KSIL-KAISFLIQHQHSSKALHYPVGIGLPKQFYITYHSYPFVFPMMACSTFLEEMRRKNE
>seq_ID 58
MKNRNKGAGCMQLVKSEIERLKQQLLSEQTPDGSWNHPFDTGCMTDIYMIVLLRTLEEEDEE-ELIKELAKGILSRQGKDGAWRLFHDHHEGSLSLTIEAYYALLYSGYYEKNHPALVKARRVIT-KGGGLKKAGMYTKIMLALTGQYPWPLLFPVPMEVILLPRSFPLNMYDISVFGRSNLIPVILL-GNKKFSRKTALSPDLGDLSVRDDDDPWPELRSAEWRSLTSFLAAGVKALVGIPRQIRAWSIE-
KAREYMQSHTEPDGTLYNYFSSTFYMIFALLALGGGPEEPAIRNAVAGLKRMTVKADGRT-HIQYTTAAVWNTALISHALQEAGVPPKENAIQKANQYLAGQQHRRFGDWIVHNTKA-EPGGWGFSRFNTINPDVDDTTAALRSLYQPAREKPHYDDIWKKGLLWTLSMQNRD-GGWPAFERNVDKKLLHLLPIQGAEFILTDPSTADLTGRTLEFLGKAGYADASLPPIK-KAVKWLKKHQEPNGSWYGRWGICYIYGTWAAVTGMAAVGVTLEDKSMKKGIDWLL-SIQNEDGGWGESCRSDMEKKYIPLKESTLTQTAWAVDALAAAGMADSTPSRKGAAFLVREG-KRKDWTADYPMGQGMANFFYIHYHSYRCIWPLLALSHYIEKSEAPD
>seq_ID 57
MQDFKTKVNEYIDELHMQLQRRQREDGAFVFCFEGPMMTNAFLIMLLKAVGDSDQAL-VHQLAEAIREKQNEDGSFSLYHDQAGHVTATVQGYCGMLVSGRYQQDEPHMEKAAH-FIRSNGGLKDVHFMTKWMLAVNGMHPWPYFYAPLSFLLIPTYFPLHFYHLSAYARIHFVPMMI-ALNKRYTSHEQFPSLAHLDANMSKNPFDWFMAREERSTHHFLAYMRSYTALDSRLD-FFGYEAAKRYMFDRLEKDGTLYSYLSASIFMVYALMSLGYSPGHHLIL-KAVKGMKQLVTDCGGRKYAENSTSNVWDTALVSYASQQAGRTQDDPVIKKSF-TYLLNRQQMKKADWAIHNRHAAPGGFGFSDLNTNNPDCDDTQIVLKAVPQTYAPVQWKRG-FDWLLSMQNQDGGFSAFEKNQNHFLLRHLPLESAEDAAIDPSTPDIAGRVLHLIALEENS-MSPLMQRQKDHCVKWLLDHQEKNGSWFGRWGVCYIYGTWAALTGLKTA-GISSSHSAVQKACRFLKTIQLEDGSFGESCKSAEVKRYVPLPFGTWQTAWAAEAL-LQYVQPDDKVILKAISFLIQHQHSSEALHYPVGIGLPKQFYITYHSYPFVFPMMACST-FLEEMRRKNE
>seqUD 61
MGTLQEKVRRFQKKTITELRDRQNADGSWTFCFEGPIMTNSFFILLLTSLDEGENEKE-LISSLAAGIHAKQQPDGTFINYPDETRGNLTATVQGYVGMLASGCFHRTEPHMKKA-EQFIISHGGLRHVHFMTKWMLAANGLYPWPALYLPLSLMALPPTLPIHFYQFSSYARIHFAP-MAVTLNQRFVLINRNISSLHHLDPHMTKNPFTWLRSDAFEERDLTSILLHWKRVFHAP-FAFQQLGLQTAKTYMLDRIEKDGTLYSYASATIYMVYSLLSLGVSRYSPIIRRAIT-GIKSLVTKCNGIPYLENSTSTVWDTALISYALQKNGVTETDGSVTKAADFLLERQHTKIAD-WSVKNPNSVPGGWGFSNINTNNPDCDDTTAVLKAIPRNHSPAAWERGVSWLLSMQNN-DGGFSAFEKNVNHPLIRLLPLESAEDAAVDPSTADLTGRVLHFLGE-KVGFTEKHQHIQRAVKWLFEHQEQNGSWYGRWGVCYIYGTWAALTGMHACGLTE-SIPVYKRLCVGSNPYKMMTEAGENPAKAPKSKHMYRFIEEPLYKRPGL
>seqLlD 50
MAEAISYPRRVHIITTKFPVNFYDFSVFGRSNIAPILLLADSKFQIPKTTETPDISHLYV-RELYWWSEDRGWNGFTKAINKGVNNLIGLPNELHTLGRKQAENYMLDRLEDDGTLLSYYSST-F F MIYAL LSVGYT KD H KVIKKAARG LLSMN TTV KDTIHIQ YTTAHIW N TS Ll SHALQTAG-ASPDDTMVMRANHYLLQRQHTKFGDWAIYQPNLGPGGWGFSHSNTFNPDVDDT-TASLRSIQNSLHSHPNYQSSWYRGLSFTLGMQNQDGGFPAFEKGVDKTFLHLL-PVQGAEFLLTDPSTPDLTGRTLEFLGESAHLYKDSGAIKRGVNWLIENQRRDGSWYG-RWGICYIYGTWAALTGLQAVGVSKEHPSVQEGIDWLKSIQQDDGGWGESCESDSQKTY-
IPLSKSTVTQTAWAVDALIAYEKEETVEIKKGMEYLLENWNHEDWTMDYPMGQGMAKA-
FYIHYHSYRYVFPLLTMGHYMRKFM
>seq_ID 199
MSETISCQRIQAAYQRSRAELLSLRNSTGHWTGELSTSALSTATAIMALEMIRRKRL-PADLSLNTYIDNGIRWLAEHQNSDGGWGDTVKSFSNISTTMLCHAVFHAT-KSTEQYVSHVVNARQYIDRVGGVEAVVARYGKDKTFSVPILTHCALAGLVKWKTIPALPFEL-ACLPARFYKTVRLPWSYALPALIAIGQVRHHFCKPRNPITRLIRKLAVKRSLKKLISIQPS-NGGFLEAAPLTSFVTMSLAGMGLTDHPVVQKGLQFLLDSVRPDGSWPIDTNLATWTTTLS-VNALEGTLAEFEKTPIREWLLQQQYKELHPYTSAEPGG-WAWTDLPGGVPDADDTPGAILALLNLQPDEPDTQQPADLGVALRNGVKWLLDLQNSNG-GWPTFCRGWGALPFDQSAADISAHVIRALQAWLQTEPESAEAELRLRAERAVRKCFKYLAT-VQRPDGSWLPLWFGNQHVENDENPVYGTARVLAAYAQGEQCGSIQAEQGILFLKSVQNLD-GGWGGATSAPSSVEETALAVDTLLALGLEPADPVVAQGLNWLSGRVENGTYTETTPIG-FYFAKLWYFEQLYPIIFTVSALHRAETVLKKSADDNLRLSLEEEDYPIMSVKEK
^seq_ID 75
MDQDRLQRCYAIARDDLLAQRNGQGHWTGELSTSALSTATAVSALQLVVRHDPAQSERLM-PLIEGGVRYLTEHQNPDGGWGDTDRSYSNIATTMLAVAALTIAERREALFEQLAFAENYIE-AQGGIPGLRRRYGKDKTFAVPILTNYALAGLVDWREVSPLPFEL-ACLPQKFYKLVKLPVVSYAIPALVAIGQARYFHRPPFNPLM-RGLRGAAVKKSLAVLERMQPASGGYLEAAPLTSFVVMSLASIGNASHPVAQNGVQFLVDSV-RE DGSWPIDS N LAN W VTT LSIS AL ATGG D DIAE L DC L PWV LAN QYQ ETH PFT-GADPGGWGWTDLSGSVPDADDTPGAMLAIAHFFHSPRADNETRRQIASAAISGARWLLD-LQNSDGGWPTFCAGWGTQPFDRSGSDLTAHAIRALHAWRSELGDLPVERAIER-GLRYLQKQQRDDGSWLPLWFGNQDIHDDENPIYGTVKVLLAYRDLGKMS-SETAQRGAAWLAARQNEDGGFGGGPSISTLCGGPGESSVEETALAIEALFAAENSNISAEIV-PPAVGWLCQRVEEGSYVNCTPIGFYFSKLWYYEKLYPRVMTVTSLGAALQANASVPPA-PETVTTSSDH
>seq_ID 325
M ATS D PS LAEAIQ N T RAH LLSLRNARG HWEGH LSN SALSTATAIVALH LVDAPLHSA-RIAQGVRWLVLHQNKDGGWGDTTLSKSNLSTTLLCWSALSLCEPDRTEPIQHCEAWIKERT-GSLEPEVICRAVVARYGKDKTFSVPILMLCAIGGRLGPEKEAWSRVLALPFELAAMPREWF-GAIGLPVVSYALPALIAIGYARFYHAPPSLLNPLHALRKALWPRISPMLKLLQPSTGGYLEA-TPLTSFVTMALASAGEKFHPCVPEAVRFLEDSQRPDGSWPIDTNLATWGTTLSTKALTAT-SEGREALDIPALKSWLLEQQYQEIHPFTNAAPGGWAWTDLPGGVPDADDTSGAL-VALW H LC ED E AERQALAPAVAKGVQ W LM D LQN RDGGIPTFCRG WGTLP FD RSTPEITAHAL-HAWGLWQWLPEELQQEVSLRIPRAIAFIARPPSRGAPGFNHVPLWFGNEHAKEEENHVYG-TAQIMNHLLSSGLNTPEIKVILETGHRNLLAWQQLDGGWSGSETGPASLEETAVSVAALAL-HTLHAGNRTRSSAEDAVAKGTQWLVQHTATGTTFPSAPIGLYFARLWYHEQLYPVIWTLGAL-HAVETLSAAALPLRARASAPPQHPGWRTKPIHIAPPSDP
>seqJD 135
MIPAERLRTAYRTARAALLAERVPEGHWVGELSTSALSTATAVMALHLVNPFTHRELI-DAGRKWLAEHQNADGGWGDTVKSFSNISTTMLCRAAFKLAGEKEYPETVQRVEEYLSR-NAGALPTARAAAIRARYGKDHTFSVPILMTCAVAKLVPWDEVPRLPFEL-ACLPQSWYRF AKLPWSYALPALIAIGQCIH H H RRSQNPIRNTVRRLARG-LSLKVLRRIQPTSGGYLEATPLTSFWMALSSIRRRRAAAEQQVIDEGVRFLVASVRPDGS-WPIDTNLATWVTTLSVNALATAGDLEALDTKEQILAWLLKQQYKERHPYTGADPGG-WAWTDLPGGVPDGDDTPGALIALAHLDPKSDPQAVLSGLRWVLRLQNGDGGAPTFCRG-WGTLPFDRSGADLTAHSVRSLASWYRVWGAGPPPIEHLRHRLKDLEFPLSGLFWDVARRN-PRFVRYLKKQQRSDGSWLPLWFGNQHAPDDINPVYGTARVLAAYRDLELKDAPECRRGIEF-LLSVQNADGGWGGAKGCPSSVEETALAVEVLLDLADGDAVQKGVAWLAEAVES-DRFRDASPIGFYFAKLWYFEKLYPIIFTVAALGRAVKITSPAPAAESA
>seq_ID 115
M ETLS RS RLEAALAKATQALLTELN P AG H WSG E LSSSALSTATAI VALGAVDREQQ RE Ll -AGGMRWLAQHQNADGGWGDTVKSRSNISTTALCWAAVSTSTEHAESAAKAEAWLTRAAGS-MAQLVPAIEARYGKDRTFSVPILMHLAICGRVSWSQIPALPFELAALPHQLF-GALQLPVVSYALPALIAIGQAIHHHAPPTNPLLNGLRKSARARTLEVLESIQPQNGGFLEAT-PLTSFVTM ALASAGEAQH PVARRGVSF LQASVQRDGSWAIDTN LATWVTTLSI-KALAHQPGALSPERALTLREWLLGQQYWEHPYTHAAPGG-WAWTDLPGGVPDADDTPGALLALLHLGVVDAPTRQAGQIGVRWLLDLQNRDGGIPTFCRG-WGALPFDRSSPDLTAHTLRAWTAWLPQLDESLKRRTLRAVTKAIHFLATHQRTDGS-WLPLWFGNEHAPDDENPLYGTAKWIALRELLNRDFTLPNGMLERALCWLVERQDISGGWS-GAKNGPVSVEETALAVEALAGTGHVSATDRGAAWLTEQIEADTWREPAPIG-FYFAKLWYY E RLYPQIWTVGALG RVAAL RVG ES ESDTP AGLH RATS ET
> s e q J D 208
MMAWENSVSEVLDRRELRGTLDLLRGELLAQRTKDGHWTGELSASALSTATAI-S AM SAAV RSG KLAGAD KAALLEQIQSG RRWLADQQ N DDGGFGDTDRSHSNIAT-SYLVLAAWTLSDQVTGETTDANAISRLRNWIQLAGELDGLRRRYGKDKTFWPILTNMAI-AGLVPWKKVSALPFEAAWPQSMYRFVGMPWSYAVPALVAIGQVKFLEGGGCLPPWSLV-RRAAIEPSMKVLRSMQPSSGGYLEATPLTAFWMSLSASGRADHEVTQNGLRFLRDS-MLPDGSWPIDTNLANWATSLATTALTMDPDDDRSWSTNELIQWQRGCQYQERHPFT-GADPGGWGWTDLTGSVPDADDTPGAIISLRMQATTRPDPLCDDYSRDWPASDSSGSV-SANALDTWKACDRGVDWLLGLQNRDGGWPTFCRGWGKLPFDRSSNDLTAHALRAI-ACLPKRESAKRSRAVQRGLRFLRKNQQADGSWLPLWFGNQDRPEEDNPIYGTSRVLVDV-SPALGHDAISRGLYYLINSQNSDGGWGGGESVRETFGLPEGFISSVEETALAVEAL-VSWWGRIPGNEGGQAAENDIPDGSPWDASMRSALRAAILSGTRWLIDAVQRERHQVAWPIG-FYF AKLW YYERLYP LVYTTAALG RVM Q RD EL LR
>seq_ID 247
MEIQDEVDLLEPQESLTASADSAVDRALFWLLDAQYEDGYWAGILESNACMEAEWLLCFHVL-GIAN H P M S RG LVQGLLQ RQ RADGSWD VYYG ARAGDIN TTVEVYAALRCQG YAADH P DI-KRARDWIQLQGGVKQVRVFTRFWLALIGEWPWEETPNLPPEILFFPRWFPFNIYHFAAWA-RATLVPLCILSARRMVVPLNKKSCLQELFPEDRSAVVALGKKAGAWSTFFYHADRAL-KKYQRTFKRPPGRQQAIKMCLEWILRRQDADGAWGGIQPPWIYSLMALKA-EGYPVTHPVMAKGLAALDAHWSYERPGGARFVQACESPVWDTLLSSFALLDCGFSCTSS-SELRKAVDWILDQQVLLPGDWQQKLPTVSPGGWAFERANVHYPDVDDTAVALIV-LAKVRPD Y P DTARV N LAIE RG LN W LF AM QCRN GGWGAF DKDNDKDLLTKIPFSDFGE-TIDPASVDVTAHVLEALGLLGYRTTHPAVAKALEFIRSEQENDGCWFGRWGVNYIYGTAAVL-PALASLNMNMNQEFIRRAANWILGKQNNDGGWGESCASYMDDTQRGRGPSTASQTA-WAMMSLLAVDGGTYAESLLRAEAYLKTTQTPEGTWDEPYYTGTGFPGYGIGR-REIKRQRSLQQHAELSRGFMINYNLYRHYFPLMALGRLAALRGA
>seq_ID 148
MTSPFKHPISHALTSFNGIVTEPEQSVEQKAGAKVHQFPASLWKSKPG-KAKSPLDIAIEGCRDFFFREQLPKGYWWAELESNVTITAEYIMLFNFLSLVDHERQRK-MSNYLLSKQTEEGFWTIYYGGPGDLSTTVEAYFALKLTGYPADHPAMVKARAF-ILEKGGVIKSRVFTKIFLALFGEFDWLGVPSMPVELNLLPNWAYVNVYEFSSWARATIIPL-SIVMLKRPVHKLPPSQRVQELFVRPPRAIDYTFTKEDGIFTWKNFFIGLDHMLKVY-ERSPVRPFKKRAMGKAEEWVLEHQEETGDWGGIQPAMLNAVLALSALGYDNGHPAVAHGL-KALEN FCI ES D EQIVLQSCIS PVWDTALALKALV D AG VPSD H PSLVKGAQWL-LEREVRRPGDWRVKSPDLEPGGWAFEFLNDWYPDVDDSGFVMIALKGVEVKDRKAM-NAAVKRGIDWCLGMQSKNGGWGAFDKDNTRHILNKIPFADLEALIDPPTADLTGRM-LE L M GTFG YAKTYPAAQ RALKF LKE N Q EP EGPWWGRWG VN Y LYGTWSV LCGLAAIGED-LEQPYIKKAVNWIKSRQNMDGGWGETCESYHDPTLAGMGESTASQTGWALLGLMAAGEVH-SATVVRGVQYLISTQSQDGTWDETQYTGTGFPKYFMIKYHIYRNCFPLMALGTYRTLTGGTA >seq_ID 149
MTSPFKHPISNALTSFNGNFAEPEQCVEQQTGAKVHHLPASIWKRKMGKAKSPLDVAIEGS-RDFFFQEQLPKGYWWAELESNVTITAEYIMLFHFLGLVDRERQRKMSNYLLSKQTEEG-FWPIYYGGPGDLSTTIEAYFALKLSGYPADHPALAKARAFILEQGGWKSRVFTKIFLALFGE-FEWQGVPSMPVELNLLPDWAYINIYEFSSWARATIVPLS-VVMHSRPVRRVPPSARVQELFVRQPTAADYSFAKNDGIFTWENFFLGLDRV-LKVYEKSPLRPFKNMALAKAEEWVLEHQEPTGDWGGIQPAMLNAVLALNVLGYQNDHPA-VEQGLRALANFCIETEDQLVLQSCVSPVWDTALALKALLDAGVPPDHPSLVKGAQWLLD-KEVTRPGDWRVKSPALEPGGWAFEFLNDWYPDVDDSGFVMIALKGIQVKDRKS-MDAAIKRGINWCLGMQSKNGGWGAFDKDNTRHVLNKIPFADLEALIDPPTADLTGRM-LELMGTFNYPITLPAAQRAIEFLKKNQEPEGPWWGRWGVNYLYGTWSVLCGLAAIGE-D M DQ P Yl RKAV N Wl KS RQ NIDGG WGETCQSYH D RTLAG VGEST PSQTGWALLG LLAA-GEMHSATVVRGVQYLISTQNSDGTWDEQQYTGTGFPKYFMIKYHIYRNCFPLMALGTYR-TLTRTQP
>seqLlD 216
MTDVLTRELSPNSTRDRVRSCVSSARQYLLSLQHEEGWWKGELDTNVTMEAEDLLLRQFL-GISDEQVTQETARWIRSCQREDGTWATFHGGPPDLSTTVEAYVALRLAGDAWDAAHLRKA-REYILDSGGIESTRVFTRIWLALFGEWPWSRLPVLPPEMMLLPDWFPLNIYDWAS-WARQTVVPLTIVGSLRPTRDLGFSVRELRTGIQRRDLESPLSWAGVFHGLDSVLHRLE-KLPLKPLRKVALARAEQWILDRQESDGGWGGIQPPWVYSILALHLRGYPLDHPVLRKALD-GLDGFTIRHRTENGWIRKLEACQSPVWDTALAMTALLDSGTPPNDPALVRAAD-WILRQEIRVSGDWRVRRPALEPSGWAFEFANDHYPDTDDTAEVVLGLQRVRHPEPHR-VNAAVERATAWLVGMQSSDGGWGAFDADNTRTLCEKLPFCDFGAVIDPPSADVTAHIVEM-LAARGMADSESARRGVRWLLEHQEVDGSWFGRWGANHVYGTGAVVPAL-VACGISPQH E AVRAAVQWLV AHQ N ADGGWGE D LRSYVD RTWVG RGTSTPSQTA-WALLALLAAGERGEVVRRGVEWLMAAQRPDGGWDEPQYTGTGFPGDFYISYHMYRIVF-P LTALG R Y LG RGGDVGTG
>seq_ID 229
MTATTDGSTGASLRPLAASASDTDITIPAAAAGVPEAAARATRRATDFLLAKQDAEGWWKGD-LETNVTMDAEDLLLRQFLGIQDEETTRAAALFIRGEQREDGTWATFYGGPGELSTTIE-AYVALRLAGDSPEAPHMARAAEWIRSRGGIASARVFTRIWLALFGWWKWDDLPELP-PELIYFPTWVPLNIYDFGCWARQTIVPLTIVSAKRPVRPAPFPLDELHTDPARPNPPR-PLAPVASWDGAFQRIDKALHAYRKVAPRRLRRAAMNSAARWIIERQENDGCWGGIQPPA-VYSVIALYLLGYDLEHPVMRAGLESLDRFAVWREDGARMIEACQSPVWDTCLATIAL-ADAGVPEDHPQLVKASDWMLGEQIVRPGDWSVKRPGLPPGGWAFEFHND-NYPDIDDTAEWLALRRVRHHDPERVEKAIGRGVRWNLGMGSKNGAWGAFDVDNTSAF-PNRLPFCDFGEVIDPPSADVTAHWEMLAVEGLAHDPRTRRGIQWLLDAQEADGSWF-GRWGVNYVYGTGSVIPALTAAGLPTSHPAIRRAVRWLESVQNEDGGWGEDLRSYRYV-REWSGRGASTASGTGWALMALLAAGERDSKAVERGVAWLAATQREDGSWDEPYFT-GTGFPWDFSINYNLYRQVFPLTALGRYVHGEPFAKKSRAADAPAEAAPAEVKGS
>seq_ID 113
MTDVIDKAVAATGPADPSQGAAATLQAAADHLLGLQDDAGWWKGELETNVTMDAEDLLL-RQFLGIRTEEVTREAGDWIRSQQRADGTWANFFDGPADLSTTIEAYTALRMAGDAKDAEHM-RAARTYILDSGGIEASRVFTRIWLALFGEWQWSDLPVMPPELIYLPKWF-PLNVYDWACWARQTVVPLTIVNALRPVRPLGFDLKELRTGRRAPAQRGLFSTLDRALHVY-ERKPLRSVRDAALRRSADWIIARQEADGSWGGIQPPWVYSLMALNLL-GYGVDHPVMRKGIEGLDRFTIRDERGRRLEACQSPVWDTVLAMTALRDAELPENHPAL-VKAADWVLGEEITNPGDWSVRRPRVAPGGWAFEFDNDGYPDVDDTAEWLALNR-VAHPDAPAAIRRGVDWLEGMACKDGGYGAFDADNTRTLALKLPFCDFGAVIDPPTADVTAHT-LEAYAALGLANSRASQRALEWLVKAQERDGSWFGRWGANHVYGTGAVVPAMVAVGVDPE-DEMIRRAVRWLEEHQNDDGGWGEDLRSYRDKSWIGRGVSTASQTAWALLALLAAGEERG-TAVEQGVRFLIRTQRADGTWDEDHYTGTGFPGDFYLNYHLYRLVFPISALGRYVRAVGAAGD-GGDAGHAGHAGTVS
>seq_ID 236
MTATTDGGGAITGGADPRHDSTAAPAAAAAGPSGGGTGLPEGVREAVDRATAEL-LARQDPAGWWKGDLQTNVTMDAEDLLLRQFLGIRDEAVTRAAALFIRGEQQGDGTWAT-FHGGPPELSATIEAYVALRLAGDPPDAPHMTRASAWIRAHG-GIAAARVFTRIWLALFGWWSWDRLPELPPELVFLPPWVPLNIYDFGCWARQTIVPLTVVSAL-RPVRSAPFALDELHTDARDPVPAKPLPPLASWDGAFGRMDKALHLYRRVA-PRRLRKAAMAAAGRWIVERQENDGCWGGIQPPAVYSVIALHLLGYDLGHPVM-RAGLESLDRFAVWREDGARMVEACQSPVWDTCLAAIALADAGLPPDHPALVRAADWMLGEE-IRRPGDWAVRRPGLAPGGWAFEFHNDNYPDIDDTAEVVLALRRIRHPQPGGVEAAIARG-VSWTLGMQSKNGAWGAFDADNTSPFPNRLPFCDFGEVIDPPSADVTAHWEMLAAEGRAAD-PRARRGIAWLLAEQEPDGPWFGRWGTNYVYGTGSVVPALTAAGIAPSHPAVRRAVRWLES-VQNEDGGWGEDQRSYRDRSWAGKGASTASQTAWALMALLSAGERDGDAVARGLAYL-VETQRPDGTWDEPYFTGTGFPWDFSINYHLYRQVFPLTALGRYLHGEPFGPERRNVPPAGES >seq_ID 134
MSLTSDPSPATPATQPTSARPGSLSDRRSRSGGSAVAGPVLVTTRPVAPVAKSGAVTPTATS-G AVTST ATSG P ALL P DLATD L AD PT GP LAG AASATVRAAGG AG-TRTQQTGQ LGSTELAGPQ ADQVAD RAAAV LG RARDH LLGLQS EAGWWKG E LETNVTM DA-EDLMLRQFLGILPPELAAETGRWIRSKQQDDGGWPTFHGGPSDLSTTFEAYVGLR-LAGDLPDAPHMLAAASFVRAHGGLAATRVFTRIWMALFGEWPWDEVPVLPPELVLL-PSWVP LN VYD FGCW ARQTVVALTIVG H F RPVRS LGFSIDELRVAAVRPDRA-PLVSWTGVFQRLDAGLRRYQRHPVKTLRELALRRATEWVLARQEADGGWGGIQPPWVYSI-MALHLMGYSMDHPVLVAALDGLETFTVREQVREGDE-WTVRRLEACQSPVWDTALAWALADAGLDARHPAMRKAGEWLVREEVTVPGDWRVRRPN-LEPGGWAFEFANDIYPDVDDTAEWLAVRRLLGSGWDDVDPTFAKQARAS-VERAVNWSVGMRSANGAWGAFDADNVRELATKIPFCDFGEVIDPPSADVTAHMVEMLADL-GRADHPVTQRAVRWLLDDQEPGGSWFGRWGVNHVYGTGAWPALISAGVAADH-PAIRSAVRWLVAHQHPDGGWGEDLRSYQDDAWVGRGEPTASQTA-WALLALLAADPMNEAVGRGVRWLCDTQLPNGTWDEPYYTGTGFPWDFSINYHLYRLVF-P LTALGRYVTLTG RSAA
>seq_ID 225
MTATTDGSTGAALPPRVTAASDTDTDIPVAAGVPDIAARAMRRATDFLLSRQSDQGWWKGD-LETNVTMDAEDLLLRQFLGIRDEGTTRAAALFIRGEQREDGTWATFHGGPGDLSATIE-AYVALRLAGDPPDAPHLARASAWIREQGGIAASRVFTRIWLALFGWWKWEDLPELPPELIWF-PAWVPLNIYDFGCWARQTIVPLTIVSAERPVRPAPFPLDELHTDPARPNPPRALAPVTGWD-GAFQRLDKALHVLRGAVPRRLRRAAMNTAARWIIERQENDGCWGGIQPPAWSIIALHLL-GYDLNHPVMRAGLESLDRFAVWREDGARMIEACQSPVWDTCLATIALADAGLPAD-HPQLVKAADWMLGEQIVRPGDWSVRRPHLPPGGWAFEFHNDNYPDIDDTAEWLALRR-VAHHDPERVDNAIGRGVRWNLGMQSRNGAWGAFDVDNTSPFPNRLPFCDFGEVIDPPSAD-VTAH VVEM LAAEG LAH D P RTRRG VQ WLLAEQ EP NGSW FG RWGVN Y LYGTGSWPALTAA-GISGSHPAIRRAVAWLESVQNDDGGWGEDLRSYRDARGWSGRGASTASQTAWALMALLAA-
GERESRAVERGVEWLAATQHEDGSWDEPYFTGTGFPWDFSINYHLYRQVFPLTALGRYVN-G E PLAG KPRAAG AATARE DTGQ EQSLAEAKGS
>seqJD 223
MTATTDGSTGAANITGAPADDPTDTRTAANDVTDIARRAAERSVEHLLGRGDEQGWWKGD-LATNVTMDAEDLLLRQFLGIQDPATTRAAALFIRGEQLGDGTWNTFYGGPGDLSATIE-AYVALRLAGDRPDEPHMARASGWIRDQGGIAAARVFTRIWLALFGWWKWDDLPELPPELM-FFPKWVPLNIYDFGCWARQTIVPLTIVSAKRPVRPAPFALDELHTDPDHPNPPRKLAPPTS-WDGLFQRLDKGLHLYHKVAPRPLRRIAMNVAARWIIERQENDGCWGGIQPPAVYSVIALHLL-GYDLDHPVMKAGLASLDRFAVHREDGARMIEACQSPVWDTCLATIALADAGLRPDHPAL-VKAADWMLAEEITRPGDWSVRKPELAPGGWAFEFHNDNYPDIDDTAEWLAL-RRVRHPDPARLEAAIARGVRWNLGMQSRNGAWGAFDADNTSPFPNRLPFCDFGE-VID PPSADVTG H VVEM LAVEG LAN H PRTREGIEW LLAEQEACGAW F-GRWGVNYVYGTGSWPALITAGLPAGHPAIRRAVDWLESVQNDDGGWGEDLRSYQEEK-Wl G H G EST ASQTAWALLALLAAG RRDTASVTRG VTWLTEAQQ ADGS WDE P YFT-GTGFPWDFSINYHLYRQVFPLTALGRYVHGDPFADRTDAAEGV
>seq_ID 226
MTATTDGSTGAALPPRVTAASENDTDIPEAAGVPDIAAHAMRRATDFLLSRQDDQGWWKGD-LETNVTMDAEDLLLRQFLGIRDEDTTRAAALFIRGEQREDGTWATFHGGPGELSTTIE-AYVALRLAGDPPEAPHMARASAWIRERGGIAAARVFTRIWLALFGWWKWEDLPELP-PELIWFPSWVPLNIYDFGCWARQTIVPLTIVSAKRPVRPAPFPLDELHTDPRRPRPPRPHA-PPNTWDGAFQRLDRALHALRRAVPRRVRQAAMNAAARWIIERGENDGCWGGIQPPAVYSVI-ALHLLGYDLRHPVMRAGLESLDRFAVWREDGARMIEACQSPVWDTCLAAIALADAGLPAD-HPSLVKAADWMLGEQIVRPGDWSVRRPHLPPGGWAFEFHNDNYPDIDDTAEVVLAL-RRVRHHDPERMDSAIGRGVRWSLGMQSKNGAWGAFDVDNTSPFPNRLPFCDFGE-VIDPPSADVTAHVVEMLAVEGLAHDPRTRRGIQWLLAEQEPDGSWFGRWGVNYLY-GTGSWPALAAAGIPGSHPAIRRAVAWLEKVQNDDGGWGEDLRSYRHVREWSGR-GASTASQTAWALMALLAAGERDSGAVERGVAWLAATQREDGSWDEPYFTGTGFPWDFSI-NYHLYRQVFPLTALGRYVHGEPFSKKQTAARNGSAQPLAGVKGSR
>seq_ID 219
MDPALSRAVDWLLEHQDPAGWWCGEFETNVTITAEHILLLRFLGLDPSPLRDAVTRYLL-GQQREDGSWALYYEGPAD LSTSIEAYAALKV LGLD PTS E P-MRRALQVIHDLGGVAQARVFTRIWLAMFGQYPWDGVPSMPPELIWLPPSAPFNLYDFACWA-RATITPLLIILARRPVRPLGCDLGELVLPGSEHLLTRVPGSGPFWWGDKVLKRYDHLVRHP-GRDRACQRIVEWIIARQEADGSWGGIQSAWVMSLIALHLEGLPLDHPVMRAGLAGFDRVALE-DERGWRLQASTSPVWDTAWAVLALRRAGLPREHPRLALAVDWLLQEQIPGGGDWQVRT-GTIPGGGWAFEFDNDHYPDIDDTAWVLALLEAGHEDRVRNAVERAARWILAM RST-DGGWGAFDRDNAREVIHRLPIADFGTLIDPPSEDVTAHVLEMLARLSFPSTDPWARG-LEFLQQTQRPDGAWFGRWGVNYIYGTWCAVSALTAFADTDATARAMVPRAVAWLL-
DRQNADGGWGETCGSYEDPNLAGVGRSTPSQTAWAVLALQAAGLGQHPACRRGLDFL-
RERQVGGTWEEREHTGTGFPGDFFINYHLYRHVFPTMALAGAATGMDSPR
> se q J D 220
FLGIRDEATTRSAALFIRGEQREDGTWATFHGGPPDLSTTVEAYVALRLAGDSPDAPHMTRA-AHWVRSQGGIAEARVFTRIWLALFGWWPWDRLPELPPELIFLPPWAPLNIYDFGCWARQTIV-PLTVVSAKRPVRPAPFPLDELHTDPADPAPRARFAPLASWNGAFQRLDRALHAYRKVAPRAL-RRAAMATAGRWIVERQENDGCWGGIQPPAWSMIALHLLGYDLGHPVMRAGLESLDRFTLT-RE DGSRMVEACQSPVWDTC LATI AL AD AGVP AD H PQ LV RAAD-WMLDEQIERPGDWSVRRPHLAPGGWAFEFHNDNYPDIDDTAEWLALRRVRHPDTAR-MERAISLGVRWNLGMQSKNGAWGAFDVDNTSSLPNRLPFCDFGEVVDPPSADVTAHVVEM-LAAEGLAADPRTRRAVDWLLAEQEPSGAWFGRWGVNYLYGTGSAVPALVDAGLPTTH-PAIRRAVAWLESVQNDDGGWGEDLRSYREQGRMARGASTASQTGWALMALLAAGERES-RAARRGVTFLAETGHEDGSWEEPYYTGTGFPWDFSINYHLYRQVFPLTALGRYTRGAAPEGA
>seq_l D 125
MQTQNRVTSTQKVELSNLTQAIIASQNYILSRQYPEGYWWGELESNITLTAETVLLH-KIWKTDKTRPFHKVETYLRRQQNEQGGWELFYGDGGELSTSVEAYMALRLL-GVTPEDPALIRAKDFILSKGGISKTRIFTKFHLALIGCYDWKGIPSIPPWIMLFPDNFPFTIY-EMSSWARESTVPLLIVFDKKPIFEIEPAFNLDELYAEGVENVKYALPRNHNWSDIFLGLD-KLFKWTEKNNLVPFHKKSLQAAEKWMLNHQQESGDWGGIMPPMVNSUA-FKVLNYDVADPSVQRGFEAIDRFSIEEEDTYRVQACVSPVWDTAWVIRALVDSGLKPDHPS-LVKAGEWLLDKQILEYGDWAIKNKQGKPGGWAFEFINRFYPDLDDSAVVVMALNGIKLPDEN-RKKAAINRCLEWMATMQCKPGGWAAFDVDNDQAWINEIPYGDLKAMIDPNTADVTARV-LEMVGSCGLKMDENRVQKALFYLEKEQESDGSWFGRWGVNYIYGTSGVLSALA-VIAPNTHKPQMEKAVNWLISCQNEDGGWGETCWSYNDSSLKGTGISTASQTAWAIIGLLDA-GEALETLATDAIKRGIDYLLATQTPDGTWEEAEFTGTGFPCHFYIRYHLYRHYFPLIALGRY-WKIGLKTPSVIPLN
>seq_ID 228
MLARRATDRAVRHLLSRQDEQGWWKGDLETNVTMDAEDLMLRHFL-GIQNPDVLDAAGRYIRSQQAADGTWATFHGGPPELSATVEAYVALRLAGDPP-DAPHMAAASAWVRNNGGVASSRVFTRIWLALFGWWRWEDLPELPPEIIYFPP-WLPLNLYDFGCWARQTIVPLTWSAKRPVRPAPFSLDELHADPRRPNPPRPAAPLASWD-GAFQRLDRALHLYRKVALRPLRRAALRSCARWIVERQENDGCWGGIQPPAVYSVIALHLL-GYDLDHPVMRAGLESLDRFAVWREDGSRMIEACQSPVWDTCLAVIALADAGLAPDHPAL-VKSADWMLAEEIDRPGDWSVKRPRLAPGGWAFEFDNDNYPDIDDTAEVILALRRVDHPRPE-RIAAAVRRGVRWTLGMQSRNGAWGAFDVDNTSPLPNRLPFCDFGEVIDPPSADVTAHVVEM-LAHEGGARDPRTRRAVGWLLAEQEPSGAWFGRWGTNYVYGTGSVVPALVAAGLPATH-PAIRRAVRWLESVQNEDGGWGEDQRSYPDPEWIGHGASTASQTAWALLALLAAGERESKA-VERGVGWLAATQDQDGSWDEPYFTGTGFPWDFSINYHLYRLVFPLTALGRYVSGEAT-GARPRRT
>seq_ID 241
MTATTDGSTGALPPRADAASEHDIETPEAAGVREAAVRAARRATDFLLSRQDAQGWWKGD-LETNVTMDAEDLMLRQFLGVLDEKTAQAAALFIRGEQREDGTWASFYGGPGELSTTIE-AYVALRLAGDAPDSPHLAKASAWIREQGGIAAARVFTRIWLALFGWWKWEDLPELP-PELIWFPKWVPLNIYDFGCWARQTIVPLTIVSAKRPVRPAPFPLDELHTDPARPNPPRPLA-PAFSWDGAFQRMDKGLHALRKVAPRGLRRAAMNAAARWIIERQENDGCWGGIQPPAVYSIIA-LHLLGYDLQHPVMREGLASLDRFAVWREDGARMVEACQSPVWDTCLAAIALVDAGLPAD-HPQLVKAADWMLGEEIVRPGDWSVRRPGLPPGGWAFEFHNDNYPDIDDTAEVILALR-RITHHDPVRVDKAVGRGVRWTLGMQSKNGAWAAFDVDNTSPFPNRLPFCDFGEVIDPPSAD-VTAHVIEMLAVEGLAHDPRTRRGIEWLLAEQEPDGSWFGRWGVNYVYGTGSWPAL-VAAGLPGAHPAIRRAVSWLESVQNDDGGWGEDLRSYKYVKEWSGRGASTASQTAWAL-MALLAAGERDSKAVERGVEWLAATQREDGSWDEPYFTGTGFPWDFSINYHLYRQVF-PLTALGRYVHGEPFADRLKGS
>seq_ID 238
MHEGEAMTATTDGSTGAATPPATTASAPLHLSPEARETHEATARATRRAVDFLLARQSDEG-WWKGDLATNVTMDAEDLLLRQFLGIRDEATTRAAALFIRGEQQEDGTWNTFYGGPGDLSA-TIEGYVALRLAGDSPEAPHMRKASAFVRAQGGVARARVFTRIWLALFGWWKWEDLPEMP-PELMFFPKWAPLNIYDFGCWARQTIVPLTWCAQRPVRPAPFALEELHTDPADPDPAQPAPP-VVSWDNVFHKLDKLLHGYRRIAPRRVREAAMRAAATWIVERQENDGCWGGIQPPAVYSI-MALNLLGYDLDHPVLRAGLASLDRFAVWREDGARMIEACQSPVWDTCLATVALADAGVPAD-HPQMIKAADWMLAEQIVRPGDWWRRPDLPPGGWAFEFHNDNYPDIDDTAEVVLALRR-VAHPDATRVDKAVRRAVDWNVGMQSKNGAWGAFDADNTSPFPNRLPFSDFGEVIDPPSAD-VTAHVVEMLAEEGLAHHPRTRRGIEWLLKNQEGNGSWFGRWGVNYVYGTGAWPAL-V AAGL P AS H P Al R RS VS W LGQVQ NEDGGWGEDL RSYQDSAW H G RG H STASQTA-WALLALLAAGERETEQVRRGIAYLVETQTEDGTWDEPWFTGTGFPWDFTI-NYHLYRQVFPVTALGRYLNGTGPGEN
>seq_ID 237
MRRRRSPRGPGAGPEADYGPARASAPDRLRGDAARGDAARRVQDATARAIRNLL-GRQDPAGWWKGDLETNVTMDAEDLLLRQFLGIRDEAVTQAAALFIRREQREDGTWAT-FHGGPPELSATIEAYVALRLAGDAPDAPHMATASAWIRAHGGLAAARVFTRIWLALFGWWD-WENLPELPPELVLLPPVWPLNIYDFGCWARQTIVPLTVVSAMRPVRPAPFALDELHT-DARVPVPPRRMAPPTTWNGAFQWMDRALHVYRRFAPRRLREAAMASAGRWIIERQEND-GCWGGIQPPAVYSVIALHLLGYDLGHPVMRAGLESLDRFAVWREDGSRMIE-ACQSPVWDTCLAAIALADAGVRPDHPALVKAADWMLGEEIVRTGDWAVRRPGLAPGG-WAF EFH N DTYPDID DTAE WLALRRIRH P DPARVEAAIARGVSWN LGM QSRGGAWGAF-DADNTSPFPNRLPFCDFGEVIDPPSADVTAHWEMLAAEGRAADPRTRRGIAWLLAEQEPEG-PWFGRWGTNYVYGTGSWPALTAAGLSPGHPAIRRAVLWLESVQNPDGGWGEDQR-SYQDRAWAGKGESTPSQTAWALMALLSAGERDAKTVERGIAYLVETQLADGGWDEPHFT-GTGFPWDFSINYHLYRHVFPLTALGRYLYGEPFGHDGRHIGAHLGDRTGVPAEGV
>seq_ID 239
MDFLLDRQSDEGWWKGDLATNVTMDAEDLLLRQFLGIRDEATTQAAALFIRGE-QQEDGTWNTFYGGPGDLSATIEGYVALRLAGDSPEAPHMRKASAFVRARG-GVARARVFTRIWLALFGWWKWEDLPEMPPELMFFPKWAPLNIYDFGCWARQTIVPLT-VVCAQRPVRPAPFALEELHTDPADPNPAQPAPPVASWDNVFHKLDKMLHGYRKVAPRRV-REAAMRAAATWIVERQENDGCWGGIQPPAVYSIIALHLLGYDLDHPVLRAGLESLDRFAVW-REDGARMIEACQSPVWDTCLATVALADAGVPADHPQMIRAADWMLAEQIV-RPGDWVVRRPDLPPGGWAFEFHNDNYPDIDDTAEWLALRRVAHPDATRVD-KAVRRAVDWNAGMQSKNGAWGAFDADNTSPFPNRLPFSDFGEVIDPPSADVTAHVVEM-LAEEGLAHHPRTRRGIEWLLENQEANGSWFGRWGVNYVYGTGAWPALVAAGIPAAH-PAIRRSVSWLGQVQNEDGGWGEDLRSYQDTAWHGRGHSTASQTAWALLALLAAGERDSE-QVRRGIAYLVETQTEDGTWDEPWFTGTGFPWDFTINYHLYRQVFPVTALGR
>seq_ID 235
MTQTVPRTAASAPAARTAADTVAAAVQFLRREQDRAGWWKGELATNVTMDAEDLLLRHFL-GILTPQIAEESARWIRSQQRADGTWANFPDGPADLSTTVEAWVALRLAGDPADAPWLA-TAAEWIREHGGIEATRVFTRIWLAMVGQWSWDDLPSLPPELIFLPSWFPLNVYD-FACWARQTIVPLTIVGTLRPARKLPFDVAELRTGKRPPKPRAPWTWDGVFQNLDTAL-HAYAKLPLNPVRKLALKQAAEWILARQEADGSWGGIQPPWVYSILALHLLGYSLDHPALKAGI-AGLDGFTIREKTDQGWVRRLEACQSPVWDTALAMTALLDAGVSPGDESLVRAAEWMLGE-EIRVPGDWAVRRPSLKPGGFAFEFANDGYPDTDDTAEVVLALRRMGKPDHLRIREAVDRS-VAWLEGMQSSDGGWGAFDADNTQVLTTRLPFCDFGAVIDPPSADVTAHVVEMLAAEGKADT-RECRRGIRWLWDNQEADGSWFGRWGANYVYGTGAVVPALVAAGVPGTDPR-IRRAVRWLAEHQNDDGGWGEDLRSYDDRSWAGRGDSTPSQTAWALLALLAAGEREST-VVARGVEWLCERQRPDGGWDEDKHTGTGFPGDFYLSYHLYRVVFPLSALGRYVRGGS
>seq_ID 159
MSGQSNFTGGKKMTPAEGSSSPAPALLEKAAPSIELDERSDPLSRTLARAVSWLVAAQD-GAGHWVAPLEADATIPSEYVFLHEVLGRPLDPVRRDKIVRAILS-VQGKEGAWPLFHDGDPDISATVKAYQALKLCGFDPSHPALVRAREWVLSQGGAG-KVNVFTRIALAIFGQYSWTKIPALPAEMVLLPSWFPFSIYSVSYWSRTVIVPLLFIYHHK-PLVRLSPERGISELFDPARPDGESFAPSPDFFSLRNLFLLLDKVLQVWNRHPPGFLRKKALS-FAMEWMVPRLKGEGGLGAIYPAMANSAVALSLEGYELDHPLMQRVLASIDDLLIEGEKEV-LVQPCVSPVWDTALAMGALIEAGISPDSPTVDRAMEWFCAREVRTRGDWAIRAPDCEPGG-WAFQFENDYYPDVDDTAMVLMGMAKILPARPDLAARMEGVFRRAT-LWVMAMGGTDGGWGAFDRDNDLLFLNHIPFADHGALLDPSTADLTGRVLELL-GALGYGPDFPPAARAIRYLRREQEEDGSWF-GRWGVNYIYGTWSWAGLKSIGVPMSEPWVMRSMEFLLARQNPDGGWGEDCLSYASRD-FAGRGASTPSQTAWALIALLHGGHAGHMAVRQGVDYLIQQMTPEGTWNEELFTGTGF-PRVFYLRYHMYRHYFPLWALALYRNMTERGRALGHERVDFWKTAPYAPIARSV
>seq_ID 232
MTATTDGSTGALPPRAPSASDTDHGTPVAAGVQEAALHAVGRATDFLLSRGDAQGWWKGD-LETNVTMDAEDLLLRQFLGIRDDATTRAAALFIRGEQRPDGTWATFYGGPPDLSAT-VEAYVALRLAGDDPAAPHMAKASAWIRARGGIAAARVFTRIWLALFGWWKWDDLPEMPPEI-VYFPTWMPLNIYDFGCWARQTIVPLTWSAKRPVRPAPFPLDELHTDPGRPNPPRPLDRLGS-WEGAFQRLDRALHGYHKVALKRLRRAAMNRAARWIVERQENDGCWGGIQPPAVYSVIALHL-LGYDLGHPVMRAGLESLDRFAVWREDGARMIEACQSPVWDTCLATIALADAGLPP-DHPQLVKAADWMLGEEIVRPGDWSVKRPQLPPGGWAFEFHNDNYPDIDDTAEVVLAL-RRVRHPDPERVERAVRRGVRWTLGMQSGNGAWAAFDADNTSPFPNRLPFCDFGE-VIDPPSADVTAHWEMLAAEGLSHDPRTRRGIEWLLAEQEPGGAWF-GRWGVNYVYGTGSWPALVTAGLPAAHPAIRRAVAWLETVQNDDGGWGEDLR-SYPDPAEWGGKGASTASQTAWALLALLAAGERDGKATERGVAWLARTQREDGSWDEPYFT-GTGFPWDFSINYHLYRQVFPLTALGRYVHGEPAVLKPGTR
>seq_l D 224
MTATTDGSTGAANLRAAAASDPTESTSAAPDMMAVARHAAERSVEHLLGRQDEQGWWKGD LATNVTMDAEDLLLRQFLGIQDPETVKAAARFIRGEQLGDGTWNTFYEGPPDLSAT-VEAYVALRLAGDRPDDPHMIRAAGWVREQGGIAESRVFTRIWLALFGWWKWDDLPELP-PELMFFPKWVPLNIYDFGCWARQTIVPLTIVSAKRPVRPAPFALDELHT-DPACPNPSRPTAPAASWDGVFQRLDKALHLYHKVAPRRLRRIAMNEAARWIIERQEND-GCWGGIQPPAVYSVIALHLLGYDLDHPVMRAGLESLDRFAVWREDGARMIE-ACQSPVWDTCLATIALADAGVSPDHPALVRAADWMLGEEIVRPGDWAVRKPGLAPGG-WAFEFHNVNYPDIDDTAEVALALRRVRHPDPARVDAAIERGVRWN LGMQSRNGAWGAF-DADNTSPFPNRLPFCDFGEVIDPPSADVTGHVVEMLAVEGRAHDPRTRRGVEWLLAEQEAS-GAWFGRWGVNYIYGTGSWPALIAAGLPAAHPSVRRAVDWLRSVQNDDGGWGEDLRSY-REEKWIGHGSSTASQTGWALLALLAAGERETRSVERGVAWLAATQQADGSWDEPHFT-GTGFPWDFSINYHLYRQVFPLTALGRYVYGDPFATATAIGAGTGKGA
>seq_l D 243
MSISALQTDRLSQTLTQSVVAAQQHLLSIGNPEGYWWANLESNASITAEWLLH-KIWGTLDSQPLAKLENYLRAQQKTHGGWELYWNDGGELSTSVEAYMGLRLLGVPASDPAL-VKAKQFILHRGGVSKTRIFTKFHLAUGCYRWQGLPSLPAWVMQLESPFPFSIYELSS-WARGSTVPLLIVFDKKPVYPLQPSPTLDELFTESAENVRWELEEKGDWSDAFLWLDKAF-KLAESVDLVPFREESIRKAEKWVLERQEPSGDWGGIIPAMLNSMLALRALGYSVSDPWRRG-FQAIDNFMVESETECWAQPCISPVWDTGLAVRSLTDSGLSPNHPALVKAGEWLLDKQIL-SYGDWSVKNPQGQPGGWAFEFENSFYPDVDDTAWAMALQDITLPNEPLKRRAIARA-VRWIATMQCKTGGWAAFDINNDQDWLNDIPYGDLRAMIDPSTADITGRVLEMHGRFAADLD-LANSYAADLSPYRLSRGLNYLIKEQELDGSWFGRWGVNYIYGTGQALSALALIAPER-CRIQIERGIAWFVSVQNADGGWGETCESYKDKSLKGKGISTASQTAWALLGLLDVSFCLD-PAAKIAVDRGIQYLVSTQSEGTWQEESFTGTGFPQHFYLRYRLYCHYFPLMALGRYQRVINS-SAGI
>seq_ID 197
MTSGTFGAKRVDLLAAFEHSAPAEKTRETCVGLQTAIARTRQYLLDQQHSEGFFVAELEGDTI-LESEYILLLAFLNEGQSPDAQAAARYLLTKQNTDGSWSNFPGGPIDVSCAVKAYLALRIT-GHAADEPALIRAREAILQAGGVERVNSFTRFYLAMLGLIPYSLCPAVPPEWLLPDWFPIN-LSQMSAWSRTIWPLSLLWAFQPAVELNDADGHQITIEELYASPEKQLPRFIRGVN-HESNSNGWMNWSRFFFRVDQCLKSIESYGIKPLRSRAVRKCVQWILDRQEMSDGLGAIFP-PIVWTLIGLKCAGFDDQHPMVQKQRDELNRLMLREQDALRLQPCLS PVWDTAISIIALRESG-VEPDHPALSKARNWLLSKEVRHAGDWSKAHPETPVSGWYFEFNNEFYPDVDDTAMVLIAL-ASTLPEEATPLAISHGVLPVQTGWSAESTSRVQALKQLENHRPVLEAMGRGVQWL-KALQSKDGGWGAFDSDINKELLTKVPFADHNAMLDETNADISARVLEAYAAVGISFND-PSVQRALEFIWN DQEDDHAWYGRWGVNYIYGTWQVLVGLTAIGISAHDPRLVRAAGWLKS-KQQACGGWGETPATYDNPTLRGQGTPTASQTAWAVLGLIAAGEQNSIECQRGVEFLL-KTQKHNGTWDEEEFTGTGFPRVFYLRYHYYPLYFPLMALGRFARAGGRVNFAG
>seq_ID 158
MTTNAAATSARSGEDAIRQVSGQQLETAIASARNSLLALQRPDGHFVFELEADATI-PAEYVLMRHYLAEPVDAVLEEKIARYLRRIQSDDGGWPLFRDGASNISASVKAYYALK-MIGDAPNAPHMQKARAWILAQGGASHSNVFTRNLLALFGAIPWSGVPVMPVEIMLLPKWFPF-HIDKISYWARTVLIPLTVLNALKPVARNPKGVGIAELFVTPPDQVRNWPKGPHQKFPWSQVFG-GIDRVLRLFEPAFPKSLRKKSIDKAVAFATERLNGEDGLGGIFPAMVNALLVYDALGY-P H D H P D YVT ARGSIE KLLVIKD D E AYCQ PC LS PVW DTALAV HALMES-GVAQADQNVDRALAWLKPLQVLDTVGDWAASRPGVRPGG-WAFQYANAYYPDVDDTAVVVMAMDRAAGGDAAKRDHYRESMARGREWVAGVQSKNG-GWGAFDADNTYEYLNQIPFSDHGALLDPPTADVSARCVSMLAQLGERRETSPVLDKAM-RYLESTQEKDGSWYGRWGMNYIYGTWSVLCALNAAGVAPSAPSMRKAADWLL-SIQNSDGGWGEDGESYSLDYKGYEPAPSTASQTAWALMGLMAAGEVDHPAVQRG-VAYLAAKQGSDGFWGEERFTATGFPRVFYLRYHGYSKFFPLWALARYRNLNAANSKSVLVGM
>seq_l D 77
MAADGSALSESRLSSEALDRAVLSAHTALSQAQQDDGHWVYELEADATIPAEYILLEHFMD-RIDDALEQKIAIYLRRIQSEEHGGWPLYHNGKFDLSATVKAYFALKAVGDDI-NAPHMQRAREAILDHGGAERSNVFTRSQLALFGEVPWRATPVMPVELMLLPAKAFFS-VWNM SYWS RTVIAPLLVL AALRPVAAN P RQVH VRELF VTP PEKVQ DWIRG PYRS AWGYVF K-GLDSVLRPWPFIPEKTHKKAIQAALDFIEPRLNGKDGLGAIYPAMANWMMYRAMGVPDEDP-RAKTAWEAVQALIVEKDDEAYCQPCVSPIWDTGLSGHAMIEAASGPNGIAPEKTVAELK-KASAWLRSKQILNVKGDWAVRNPNLAPGGWAFQYGNDYYPDVDDTAWGMLLHREGDPT-NAEAIERARTWIVGMQSTDGGWGAFDIDNNKDVLNHIPFADHGALLDPPTADVTARCIS-FLAQLRNPEDEPVIQRGLEYLRKEQEKDGSWFGRWGTNYIYGTWSALCALNAAGVSHDDPA-WKAVEWLRSVQRADGGWGEGCESYEGGPHGTYGESLPSQTAWAVLGLMAAGRRDDPA-VTRGIAWLADQQDANGEWHEDPYNAVGFPKVFYLRYHGYKQFFPLMALARYRNLESS-NTRRVSFGF
>seq_ID 6
MTVSTSSAFHHSSLSDDVEPIIQKATRALLEKQHQDGHWVFELEADATIPAEYILLKHYLGE-PEDLEIEAKIGRYLRRIQGEHGGWSLFYGGDLDLSATVKAYFALKMIGDSPDAPHML-RARNEILARGGAM RANVFTRIQLALFGAMSWEHVPQMPVELMLMPEWFPVFIINKMAYWART-VLVPLLVLQALKPVARNRRGILVDELFVPDVLPTLQESGDPIWRRFFSALDKVLHK-VEPYWPKNMRAKAIHSCVHFVTERLNGEDGLGAIYPAIANSVMMYDALGYPENHPERAIAR-RAVEKLMVLDGTEDQGDKEVYCQPCLSPIWDTALVAHAMLEVGGDEAEKSAISALS-WLKPQQILDVKGDWAWRRPDLRPGGWAFQYRNDYYPDVDDTAWTMAM-DRAAKLSDLHDDFEESKARAMEWTIGMQSDNGGWGAFDANNSYTYLNNIPFADHGALLD-PPTVDVSARCVSMMAQAGISITDPKMKAAVDYLLKEQEEDGSWFGRWGVNYIYGTWSAL-CALNVAALPHDHLAIQKAVAWLKNIQNEDGGWGENCDSYALDYSGYEPMDSTASQTAWALL-GLMAVGEANSEAVTKGINWLAQNQDEEGLWKEDYYSGGGFPRVFYLRYHGYSKYFPL-WALARYRNLKKANQPIVHYGM
>seq_ID 89
MNDLTNSSAPGARPDDATPSAAGPTPAEAAGGAVAPSRAVQPADTQTAAT-GAAGAAAAVGATPAELAATAPASSGTPAGASAAPAPSGTPSVDAPAELASAAPAPSGATPAA-TATAATAPAPARAASID APALAAAD L D AAITRATD ALLAAQQ ADG H Wl YELEADSTI-PAEYVLLVHYLGETPNLELERKIARYLRRVQLPGGGWPLFTDGAPDVSASVKAYFALKMIGD-DANAEHMVRARNAIHAMGGAEMSNVFTRIQLALFGVVPWFAVPMMPVEIMLLPQWFPFHLS-KVSYWARTVTVPLLVLSAKRPLARNPRGVRVDELFVAPPVNAGLLPRAGHQSPAWFACFRLL-DGLLRLTDGLFPRYTRERAIRQALQFVDERLNGEDGLGAIYPAMANSVMMYAALGYPEDHPN-RATARRAIEKLLVIHDDEAYCQPCLSPVWDTSLAAHALLETGEPRAEAAAIRGLD-WLRPLQILDVRGDWISRRPDVRPGGWAFQYANPHYPDVDDTAWTLAMDRVAKLAQT-DAYRDAIARAREWVVGMQSSDGGWGAFEPENTHQYLNSIPFSDHGALLDPPTADVSGRCLS-MLAQLGETAANSAPARRALDYLLAEQGADGSWYGRWGMNYIYGTWSALGALNAAGLPFDD-PRVKRAAQWLLSIQNPDGGWGEDGDSYKLDYRGYERAASTASQTAWALLGLMAAGEVEH-PAVARGIAWLAAQQREHGLWDEARFTATGFPRVFYLRYHGYRKFFPLWALARYRNLRRTG-TRRVTVGM
>seq_ID 201
MLPYNQNSYKEALHGGHAAHNPPTLEEAIKRSGEFLLAHQHPEGFWWGDLECNVTSASHTLI-LYKILGIADRYPLHKFEKYLRRMQCSHGGWEMSFGDGGYLSATIEAYIC-LRLLNVPQSDPALQRALKNILARGGVTKARVFTKVCLALLGGFDWAALPSLPPWLMLF-PAWFPWNIYEAASWARGC W P Ll VLLEKKPVFQVKPEVS F D E LYV EG RAH AC KAL-PFSAHDWVSNIFVAADRAFKLMERFGAVPFRQWSIKEAKKWVLDRQEEMGDFIGYNPP-MLYFAVCLKLWGYEVTDPLLQRALLAHKKLTVETEDECWLQSSQSPVWDTALVIPALVES-GLPPDHPALQKAGQWLLEKQILKHGDWALKTGGGRMQDDIGGGWAFQFVNS-WYPDVDDSAAWIALNCIKMPDEDVKNGAIARCLKWIAFMQGRNGGWAAF-DRDSNQRWMDATPFSDIEAMLDVSTADVTARVLEMVGLMRLKHAAQPANNSLGKAHRHIS-TESIARGVDYLTKEQEKEGCWWGRWGVNYIYGTRGALMGLSQVAAKTHKKEI-ARGAAWLVKVQNKKNEKKQGAQDGGWGEACFSYDDPATKGQNSRSTASQTG-
WAMQGLLAAGEVLGRKYEMEAVEEGVQFLLDTQRKDGSWSEAEFTGGGFPKHYYL-
KYHYFAQHFPLSALARYRARLLQLSRPKNQA
'-•seqJD 183
MDGSQRISDMSQQPEGIAVSDEISSAYSVSSLNQDEINVDELENKLTQARSAM-LSLQKPDGHWCFPLEADCTIPAEYILMMHFMDEIDVILENKIARFIREKQDLTHGGWPLYYG-GAFDISCTIKSYYALKLVGDSPDAAHMVRAREAILERGGAAKANVFTRLL-LAMYEQIPWSGVPWPTELMLLPSWFPFHISKVSYWSRTVMIPLSILCTIKARAINPRNVDI-RELFIVPPEQEKNYFPQADTWLKRAFMLVERVLSRVEPKLPQAIRQYSIRKAENWTLER-LNGECGIGAIFPAMVNAHESLALLGYAYDHPSRVQCRNALRGLLVDEGER-AWCQPCTSPVWDTVLTCLALQEDPAADQGPVLKALDWLVDQQVLDEPGDWRDKRPDLL-GGGWAFQYANPHYPDLDDTAAVAWALDQSDAQRYQKPLDRAANWLAGMQSRNGGFAAF-DIDNTYHYLNEIPFADHGALIDPPTSDVTARCVGLLGKYGKHQREVWRGISFLLREQEKNGS-WFGRWGTNYIYGTWSVLEAFQLANFDMQHTSVRRAVKWLESVQRVDGGWGETND-SYLDIQLAGQFPQTSTTFQTAWAVLGLMAAGEVNSKSVRRGINYLLHNQADDHL-WEDPWFTAPGFPRVFYLRYHGYSKFFPIWALVRYRALTKERVS
>seqLlD 102
M N DLSQTQP LD AVLPEAAD AAS N LAEAAWAN APAVADALATATPSPMQTAGASPLD-VSITRATDAILAAQQPDGHWIYELEADATIPAEYVLLVHYLGETPNLELEQKIA-RY LRRIQ L PN GG W P LFTDG ALD ISAS VKAYF ALKMIGDPVDAE HMV RARDAILAHGGAE HAN-VFTRILLALFGWSWRAVPMMPVEIMLLPMWFPFHLSKVSYWARTVIVPLLVLNAKRPLARN-PRKVRIDELFRGAPVNTGMNERAPHQHAGWFGFFRCVDTVLRAVDGLLPKASRER-AIRAAVAFVDERLNGEDGLGAIFPAMANSVMMYDVLGYPADHPNRAIARKSLDKLL-VIKEDEAYCQPCLSPVWDTSLVAHALLETREARAEQAAERGLAWLRPLQILDVRGDWIS-RRPNVRPGGWAFQYNNAHYPDVDDTAWAMAMHRSAALTKSDVDREAI-ARAREWWGMQSSEGGWGAFEPENTQYYLNNIPFSDHAALLDPPTADVSGRCLSM-FAQIGELPQNSEPAQRAFDYMLQEQESDGSWYGRWGLNYIYGTWTALCSLNAAGMSHDD-PRMRRAVQWLVSIQNEDGGWGEGGESYKLDYRGYERAPSTASQTAWALLGLMAAGEVDH-DAVARGIDYLQREQREHGLWDETRFTATGFPRVFYLRYHGYRKFFPLWALARFRHLKRN-GLTRVTVGM
>seq_ID 90
MIRPMKNSDLPLPSLLDAAILRGRDALAQRQSADGSWCFELESDATITAEYILMMHFMGKIDE-ARQARMARYLRGIQRLATHGAWDLYVDGAPDVSCSVKAYFALKAAGDSEDAPHM ARARE-TILKLGGAAKSNVFTRILLATFGQVPWRATPFMPVEFVLFPKWVPISMYKVAYWARTT-MVPLLVLCSLKARAKNPRNVSIRELFVTAPEAERHYFARGGFVRNLFLGIDRALRPLDALIP-KALRRRAIRHAEAWCAERMNGEDGMGGIFPPIVYSYQMMDVLGYPEDHPLRRDCENALD-KLLVERPDGSVYCQPCLSPVWDTAWSTMALEQARAVPDPRDAPPVSDAQLQR-CIAASYEWLAGKQVTQVRGDWVENAPAATPAGGWAFQYENPYYPDIDDSAWAAMLHRR-GRLLARSTGTDPYAQWARGLDWMRGLQSRNGGFGAFDADCDRLYLNLIPFADHGALLDPP-TEDVSGRVLLCLGVTGRDEDKPALARAIEYVKRMQRADGCWWGRWGTNYIYGTWSVLAG LALAGENPSQPYIARAIAWLRACQNADGGWGETNDSYLDPALAGTNGGESASNVTA-WALLAQMAFGDWQSESVQRGIRYLLSVQQADGFWWHRSHNAPGFPRIYYLKYHGYTAYF-PLWALARYRRLSQAGAARDVTDGAALAAS
>seq_ID 167
MREAAVSKVETLGRPKTRDVSLDDVERGVQSATRALTEMTQADGHICFELEADATIP-SEYILFHQFRGTEPRPGLEAKIGNYLRRTQSKVHGGWALVHDGPFDMSASVKAYFALKMIGD-DIE AP H M RAVRKAILQ RGGAANANVFTRILLALYGEV PWVAVPVM PVEV MHLPKWFPFHLD-KVSYWARCTMVPLFVIGAKKPRAKNPRGVGVAELFVTPPDSVRTWPGSPHATWPWTPIFG-GIDRVLQKTQDHFPKVPRQRAIDKAVAWVSERLNGEDGLGAIFPAMVNSVLMYEV-LGYPPEHPQVKIALEAIEKLVAEKEDEAYVQPCLSPVWDTALNSHAM-LEAGGHQAEANARAGLDWLKPLQILDIKGDWAETKPNVRPGGWAFQYANPHYPDLD-DTAWVMAMDRAQRQHGLVSGMPDYSESIARAREWVEGLQSADGGWAAFDADNNHHYLN-HIPFSDHGALLDPPTADVTARWSMLSQLGETRATSRALDRGVTYLLNDQEKDGSWYG-RWGMNFIYGTWSVLCALNAAGVDPQSPEIRKAVAWLIRIQNPDGGWGEDASSYKLNPEFE-PGYSTASQTAWALLALMAAGEVDDPAVARGVNYLVRTQGQDGLWSEERYTATGF-P RVF YLR Y H G YP KF F P L W AW ARF RN LKRG NSRQVQFGM
>seq_ID 133
MTTTDETALAAGTPKAAFAPAPRGAADDLVARTVAVEAPPSPAPASDDTLARAVAHL-KSLQDEAGWWKGDLETNTTMDSEDLMLRHWLGIWNPEQAERTARFIRSKQYADGS-W PIY H AG PG D LN ATVESYVALRM VGDSPQ D P H M RAAAAWARARG-GVPATRIFTRIWLALFGWWRWEDLPVLPPELIFVPAKMPLSIYKFASWGRQTIVAIMVLMAHR-PAGTPPFPIAELFPPPATKKKAAAQRKAQKKAGHAGGPTAWRDSSIDDMFTE-PAPGTDTLRQ PAALAIGPARPAPAKG RRG KGQ P AAPD V MG RAKDGGGPGLP L-PARLVS RVG FRTRRALRQ AAL DH VN W N LLFGGIDRFLHVYH RH PIRPVRS LALGLAE RWIV-VRQEADGCFGGIQPPTVYSIMALRVLGYPMDHPVMTAALRSLDEYSVTLPD-GARMQEACQSPVWDTCLATIALADAGVPRDDPSLVRAADWMLAEEVRERRG-DWSVPIP D VPTGGWS FE F DN DTYPDVDDSAEVM LALM RVAH PRPEKWAA-TYRGLQWVFGMQCADGGWGAFDVDNAGELVYKIPFADFGMLTDPPSADVTAHWELLGEL-GLGDDPRTKRGVEWLLHSQEADGSWYGRWGVNHLYGTGGWPALRAAGLPASH-PAIQRAADWLVAKQNPDGGWGESCYSYDEMSTAGVGVSTASQTAWALLALIAAGRVGD-GVT G E AAARGVAWLAETQT AEGTWD E DYFTGTG F AGYF YI­
N Y H LYRLVW P VM ALGRYQ AALAGKGH
>seq_ID 7
MNPVVHNLTRPHRSAEPRPSALQRSIAAAQAALLQHQAADGHWCFEFEADCTIPAEYILMM-HYMDERDAALEAKMAAYLRRKQENHGGWSLYHGGHFDMSAS-VKAYFALKLAGDDPEAAHMRRARSAILAHGGAERANVFTRIT-LALFGQVPWRAVPFIPVEILLFPRWFPMHIYKVASWSRTVMVPLFILCSLKPQAKNPLGVHI-RELFTRPPEDIDDYFAHALQGWVSRIFLWFDRLGRALESWIPQALRRRAIARAEAWFIERLN-GEDGLNGIFPAMVNAHEALALLGYAAEHPYRQQTRAALTKLWERAGEAYCQPCV-
SPVWDTCLALHALLEADGDVSEAARRSMQWLLDRQITDAPGDWRERRPHLAGGG-WAFQYANPYYPDLDDTAAVAWALARARRPEDRPAVERAANWLAGMQSRNGGFGAYDVDN TYYYLNEIPFADHKALLDPPTADVSGRVLAFLAILDREQDAPVRARLIQYLLREQEPSGAWF-GRWGTNYIYGTWSVLMGMAELRDPGAEVRDAMARAAHWLRSVQQDDGGWGESND-SYADPGLAGLGQESTAAQTAWACLALMAAGDSDSESLRRGIQWLQRHQEQPGDWQDPYF-NAPGFPRVFYLTYHGYKIYFPLWALARYRNITERHCA
>seq_ID 190
MALSNGEIREEIQRLSEELIQRQEPDGSWRFCFENGITIDACTIILLRTLNVDKEELIRQLH-DRIVAAQQPEGCWRWYHDDKEGHLSATVEAYYALLCSGYSRPEDEPIQRAKRYILDRG-GIGQARSLFTKAILAATGQRKWPASLSLIPIEILLLPESLPLNFYDFSGYSRVHLVPLLIMA-ERNFRTRSVRTPDLSELFLDARNGEEDPLTLTPESREPLKLIQSGLAHLVGTPRRIRQAAVN-RAEQYM LD Rl EGDGT LYTYASCTV LM VFALLALGYEPQH PVIQ RAVEG LSQ M KFTVDST-GQGGTRYVTIQ N S PSTVW DTALISYALQ EAG VSSSH PAIQ RAAD Y LRN RQH R-RPGDWQIHNPGIVPGGWGFSETNTFVPDVDDTTAALRALSALHGSEPA-VLGAWNRGLNWVWSMQNNDGGWPAFEKNTNKEM LTWLAIEGAKSAATDPSEADLTGRT-LEYLGNFAKLSVRQDWVARGADWLLSHQEADGSWYGRWGICYIYGTWAALTGLMAVGM-PADHPGIAKAANWLIRIQNADGGWGESCRSDQVRRYVPLHASTPSQTAWALDALIAVH-DRRAPEIERGVARLIALLHEDDWPSTYPTGAGLPGYFYVHYHSYRYIWPLLALSHYVNKYGD-SSP
>seq_ID 45
MSGVLLYDKVREEIERRTTALQTMQRQDGTWSFCFEGALLTDCHMIFLLKLLGRNDEIEPF-VKRLASLQTNEGTWKLYEDENGGNLSATIQAYAALLASEKYSKEDINMRRAEMFIKEHGGVS-RAHFMTKFLLAIHGEYEFPTLFHFPTPILFLQDDSPLSIFELSSSA-RIHLIPMMICMNKRFRVEKKLLPNLNHIAGEGGQWFRE-ERSPLFQSFVGDVKKVIAYPLSLHHKGYEEVERFIGERIDENGTLYSYASATFY-MIYALLALGHSIQSPIIEKAVIGLKSYIWKMDRGSHLQNSPSTVWDTALLSYSLQEANVM-KENKMIQKATEYLLQRQQTKRMDWSVHAPSIMAGGWGFSDVNTTIPDVDDTTAALRALARS-RGSSRVDSAWERGVEWLKGLQNNDGGWGAFERGVTSRILANLPIENASDMITDPSTPDIT-GRVLEFFGTYAPNELPEEQKKKAVKWLMDVGELNGSWYGKWGICYIYGTWAAMTGLRAL-GVPSSHPSLKKAASWLEHLQYEDGGWGESCQSSVEKKFISLPFSTPSQTAWALDALISY-YDQETPIIRKGISYLLAQPTM N EKYPTGTGLPGGFYIRYHS YGHIYPLLALAH Yl KKYKK >seq_ID 53
MSGVLLYDKVHEEIERRTTALQTMQRQDGTWQFCFEGALLTDCHMIFLLKLLGRNDEIEPF-VKRLVSLQTNEGTWKLYEDEKGGNLSATIQAYAALLASERYSKEAMNMRRAEMFIKEHGGVS-RAH F M TKF LLAIH G EYEF PALF H FPTPILF LQ D DSP LSIFGLSSSA-RIHLIPMMICMNKRFRVEKKLLPNLNHIAGGGGQWFREERSPLFQSFLGDVKKVISY-PLSLHHKGYEEVERFMKERIDENGTLYSYASATFYMIYALLALGHSIQSPIIEKAVTGLK-SYIWKMDRGSHLQNSPSTVWDTALLSYSLQEAKVTNENKMIQRATEY-L LQ KQQTKKVD WS VH ASS LVAGG WG FSDVNTTIP DI D DTTAAL RALARS RG N D RV D-
DAWGRGVEWVKGLQNNDGGWGAFERGVTSKLLSNLPIENASDMITDPSTPDITGRV-
LELFGTYAPNELLEEQKKKAIKWLMDVQEQNGSWYGKWGICYIYGTWATMTGLRAL-
GVPSTHPALKKAASWLEHLQHEDGGWGESCQSSVEKKFISLPFSTPSQTAWALDALISY-
YDQETPIIRKGISYLLAQSTMNEKYPTGTGLPGGFYIRYHSYGHIYPLLALAHYVKKYRK
>seq_ID 44
MSGVLLYDKVHEEIERRTTALQTMQRQDGTWQFCFEGALLTDCHMIFLLKLLGRNDEIEPF-VKRLASLQTNEGTWKLYEDEKGGNLSATIQAYAALLASEKYSKEDMNMRRAEMFIKEHGGVS-RAH F M TKF LLAI H G EYEF PALF H FPTP I LF LQ D DSP LS IFGLSSSA-RIHLIPMMICMNKRFRVEKKLLPNLNHIAGGGGQWFREERSPLFQSLLGDVKKVISY-PLSLHHKGYEEVERFMKERIDENGTLYSYASATFYMIYALLALGHSIQSPIIEKAVTGLK-SYIWKMDRGSHLQNSPSTVWDTALLSYSLQEAKVTNENKMIQRATEY-L LQ KQQTKKVD WS VH ASS LVAGGWG FSDVNTTI P DI D DTTAAL RALARS RG N D RV D-DAWGRGVEWVKGLQNNDGGWGAFERGVTSKLLSNLPIENASDMITDPSTPDITGRV-LELFGTYAPNELLEEQKKKAIKWLMDVQEQNGSWYGKWGICYIYGTWATMTGLRAL-GVPSTHPSLKKAASWLEHLQHEDGGWGESCQSSVEKKFISLPFSTPSQTAWALDALISY-YDQETPIIRKGITYLLAQSTMNEKYPTGTGLPGGFYIRYHSYGHIYPLLALAHYVKKYRK
>seqLlD 64
MSNLLLYEKVHEEIARRTTALQTMQRQDGTWRFCFEGAPLTDCHMIFLLKLLGRDKEIEPF-VKRLASLQTNEGTWKLYEDEAGGNLSATIQSYAALLASEKYTKEDANMKRAEMFINERGGVA-RAH FMTKFLLAIHGEYEYPSLFH LPTPIM FLQN DSPLSIFELSSSA-RIHLIPMMLCLNKRFRVGKKLLPNLNHIAGGGGEWFREDRSPVFQTLLSDVKKII-TYPLSLHHKGYEEVERFMKERIDENGTLYSYATASFYMIYALLALGHSIQSPIIEKAITGIT-SYIWKMERGSHLQNSPSTIWDTALLSYALQEAQVPKASKVIHNASAYLL-RKQQTKKVDWSVHAPDLFPGGWGFSDVNTTIPDIDDTTAALRALARSRGNENVD-NAWKRAVNWVKGLQNNDGGWGAFEKGVTSRILANLPIENASDMITDPSTPDITGRVLEF-FGTYTQ N ELPE KQ KQS Al N W LM N VQEE N GSWYGKWGICYIYGTWAVM TG LRSFGIPSSN PS-LKRAALWLE HIQH EDGGWG ESCQSSVE KRFVTLP FSTPSQTAWALD ALISYYD KETPVIRKGI-SYLLSNSYINE KYPTGTGLPGGFYIRYH SY AH IYP LLTLAH YAKKYKK
>seq_ID 68
MLLYEKVHEEIARRTTALQTMQRQDGTWRFCFEGAPLTDCHMIFLLKLLGKDKEIEPFVKR-LASLQTNEGTWKLYEDEVGGNLSATIQSYAALLASEKYTKEDVNMKRAEMFINEHGGVARAH-FMTKFLLAIHGEYEYPSLFHLPTPIMFLQNDSPLSIFELSSSA-RIHLIPMMLCLNKRFRVGKKLLPNLNHIAGGGGEWFREDRSPVFQTLVSDVKKII-TYPLSLHHKGYEEVERFMKERIDENGTLYSYATASFYMIYALLALGHSIQSPIIQKAITGIT-SYIWKMERGSHLQNSPSTVWDTALLSYALQEAQVPKASKVIHNASAYLL-RKQQTKKVDWSVHAPDLFPGGWGFSDVNTTIPDIDDTTAALRALARSRGNEN-VDTAWKRAVNWVKGLQNNDGGWGAFEKGVTSRILANLPIENASDMITDPSTPDITGRVLEF-FGTYTQNELPEKQKQSAINWLMNVQEENGSWYGKWGICYIYGTWAVLTGLRSL-
GIPSSDPSVKRAALWLEHIQHEDGGWGESCQSSVEKRFVTLPFSTPSQTAWALDALISY-
YDKETPVIRKGISYLLSNSYINEKYPTGTGLPGGFYIRYHSYAHIYPLLTLAHYAKKYRK
>seq_ID 41
MSNLLLYEKVHEEIARRTTALQTMQRQDGTWQFCFEGAPLTDCHMIFLLKLLGRDKEIEPF-VKRLASLQTNEGTWKLYEDEMGGNLSATIQSYAALLASEKYTKEDANMKRAEMFINERGGVA-RAHFMTKFLLAIHGEYEYPSLFHLPTPIMFLQNDSPLSIFELSSSA-RIHLIPMMLCLNKRFRVGKKLLPNLNHIAGGGGEWFREDRSPVFQTLVSDVKKII-TYPLSLHHKGYEEVERFMKERIDENGTLYSYATASFYMIYALLALGHSIQSPIIGKAITGIT-SYIWKMERGSHLQNSPSTVWDTALLSYVLGEAQVPKASKVIHIMASAYLL-RKQQTKKVDWSVHAPDLFPGGWGFSDVNTTIPDIDDTTAALRALARSRGNEN-VDTAWKRAVNWVKGLQNNDGGWGTFEKGVTSRILANLPIENASDMITDPSTPDITGRVLEF-FGTYTQNELPEKQKQSAINWLMNVQEENGSWYGKWGICYIYGTWAVLTGLRSL-GIPSSDPSVKRAALWLEHIQHEDGGWGESCQSSVEKRFVTLPFSTPSQTAWALDALISY-YDKETPVIRKGISYLLSNSYINEKYPTGTGLPGGFYIRYHSYAHIYPLLTLAHYAKKYRK
>seq_ID 66
MSNLLLYEKVHEEIARRTTALQTMQRQDGTWQFCFEGAPLTDCHMIFLLKLLGRDKEIEPF-VKRLASLQTNEGTWKLYEDEMGGNLSATIQSYAALLASEKYTKEDANMKRAENFIKERGGVA-RAHFMTKFLLAIHGEYEYPSLFHLPTPIMFLQNDSPLSIFELSSSA-RIHLIPMMLCLNKRFRVGKKLLPNLNHIAGGGGEWFREDRSPVFQTLASDVKKII-TYPLSLHHKGYEEVERFMKERIDENGTLYSYATASFYMIYALLALGHSIQSPIIEKAIMGIT-SYIWKMERGSHLQNSPSTIWDTALLSYALQEAQVPKASKVIQNASAYLL-RKQQTKKVDWSVHAPDLFPGGWGFSDVNTTIPDIDDTTAVLRALARSRGNENVD-NAWKRAVNWVKGLQNNDGGWGAFEKGVTSRILANLPIENASDMITDPSTPDITGRVLEF-FGTYGQNELPEKQKQSAINWLTNAQEENGSWYGKWGICYIYGTWAVLTGLRSLGIPSSDPS-LKRAALWLEHIQHEDGGWGESCHSSVEKRFVTLPFSTPSQTAWALDALISYYDKETPVIRKGI-SYLLSNPYINEKYPTGTGLPGGFYICYHSYAHIYPLLTLAHYAKKYRK
>seq_ID 138
MVADERSALIDALKRSQSVDGSWRFPFETGISTDAYMIILLRTLGIHDEPLIQALVERIES-RQDANGAWKLFADEGDGNVTATVEAYYALLYSGYRKKTDSHMQKAKARILEVGGLERVHL-FTKVMLALTGQHSWPRRFPLPLVFFLLPPSFPLNMYDLSVYGRANMVPLLWAER-RYSRKTDNSPDLSDLAASRNDWRLPDTEALWSYVKRSLTGLPAWLHRAAEQRAVRYMLEH-IEPDGTLYSYFSSTFLLIFALLALGYPKDDPHIARAVRGLRSLRTEIDGHTHMQYTTASVWN-TALASYALQEAGVPPTDRTIEKANRYLLSRQHIRYGDWAVHNPYGVPGGWGFSDVNT-MNPDVDDTTAALRAIRRAAAKETAFRHAWDRANRWLFSMQNDDGGFAAFEKNVG-KRFWRYLPIEGAEFLLMDPSTADLTGRTLEYFGTFAGLTKDHSAIARAIDWLLDHQEADGS-WYGRWGICYVYGTWAAVTGLSAVGVPIDHPAMQKAVRWLLSIQNDDGGWGESCKSDGAK-TYVPLGASTPVHTAWALDALIAAAERPTPEMKAGVRALVRMLHHPDWTASYPVGQG-MAGAFYIHYHGYRYIFPLLALAHYEQKFGPFVD
>seq_ID 69
MLLYEKVHEEIARRTTALQTMQRQDGTWRFCFEGAPLTDCHMIFLLKLLGRDKEIEPFVKR-LASLQTNEGTWKLYEDEVGGNLSATIQSYAALLASEKYTKEDANMKRAEMFINERGGVARAH-FMTKFLLAVHGEYEYPSLFHLPTPIMFLQNDSPLSIFELSSSA-RIHLIPMMLCLNKRFRVGKKLLPNLNHIAGGGGEWFREDRSPVFQTLLSEVKKII-TYPLSLHHKGYEAVERFMKERIDENGTLYSYATASFYMIYALLALGHSIQSPIIQKAITGIT-SYIWKMERGSHLQNSPSTVWDTALLSYALQEAQVPKASKGIQNASAYLL-RKQQTKKVDWSVHAPDLFPGGWGFSDVNTTIPDIDDTTAVLRALARSRGNENVDNS-WKRAVNWVKGLQNNDGGWGAFEKGVTSRILANLPIENASDMIPDPSTPDITGRVLEF-FGTYAQNELPEKQKQSAINWLMNIQEENGSWYGKWGICYIYGTWAVLTGLRSLGIPSSDPS-LKRAALWLEHIQHEDGGWGESCQSSVEKRFVTLPFSTPSQTAWALDALISYYEKETPVIRKGI-SYLLSN PYVN E KYPTGTGL PGGFYIRYHSYTHIYPLLTLAH YAKKYRK
>seqJD 67
MSNLLLYEKVHEEIARRTTALQTMQRQDGTWRFCFEGAPLTDCHMIFLLKLLGRDKEIEPF-VKRL AS LQTN EGTWKLY E D EVGGN LSATIQSYAALLAS E KYTKEDAN M KRAE M Fl N E RGGVA-RAHFMTKFLLAIHGEYEYPSLFHLPTPIMFLQNDSPLSIFELSSSA-RIHLIPMMLCLNKRFRVGKKLLPNLNHIAGGGGEWFREDRSPVFQTLLSEVKKII-TYPLSLHHKGYEEVERFMKERIDENGTLYSYATASFYMIYALLALGHSIQSPIIQKAITGIAS-YIWKMERGSHLQ N SPSTVWDTALLSYALQ E AGV P KAS KVIG N ASAYLL-RKQQTKKVDWSVHAPNLFPGGWGFSDVNTMIPDIDDTTAVLRALARSRGDENVD-NAWKRAVNWVKGLQNNDGGWGAFEKGVTSRILANLPIENASDMITDPSTPDITGRVLEF-FGTYAQNELPEKQKQSAINWLMNVQEENGSWYGKWGICYIYGTWAVLTGLRSLGIPSSDPS-LKRAALWLEHIQHEDGGWGESCQSSVEKRFVTLPFSTPSQTAWALDALISYYEKETPIIRKGI-SYLLSNPYVNEKYPTGTGLPGGFYIRYHSYAHIYPLLTLAHYTKKYRK
>seq_ID 35
MSNLLLYEKAHEEIVRRATALQTMQWQDGTWRFCFEGAPLTDCHMIFLLKLLGRDKEIEPF-VERVASLQTNEGTWKLYEDEVGGNLSATIQSYAALLASKKYTKEDANMKRAENFIQERGGVA-RAHFMTKFLLAIHGEYEYPSLFHLPTPIMFLQDDAPFSIFELSSSA-RIHLIPMMLCLNKRFRVGKKLLPNLNHIAGGGGEWFREDRSPVFQTLLSDVKQIISY-PLSLHHKGYEEIERFMKERIDENGTLYSYATASFYMIYALLALGHSLQSSMIQKAIAGIT-SYIWKMERGNHLQNSPSTVWDTALLSYALQEAQVSKDNKMIQNATAYLLKKQHTKKAD-WSVH AP ALTPGG WG FSDVNTTIP DIDDTTAV L RALARS RG N KNID N AW KKGGNWIKGLQ N N-DGGWGAFEKGVTSKLLAKLPIENASDMITDPSTPDITGRVLEFFGTYAQNELPEKQIQRAIN-WLMNVQEENGSWYGKWGICYIYGTWAVMTGLRSLGIPSSNPSLKRAASWLEHIQHEDGGW-GESCHSSVEKRFVTLPFSTPSQTAWALDALISYYDTETPAIRKGVSYLLLNPYVNERYPTGT-GLPGAFYIRYHSYAHIYPLLTLAHYLKKYRK
'-•seqJD 43
MNALLLYEKVHEEIARRTTALQTMQRQDGTWRFCFEGAPLTDCHMIFLLKLLGRDKEVEPF-VKRLASLQTNEGTWKLYDDEMGGNLSATIQSYAALLASKKYTKEDANWKRAEMFITERGGVA-
RAHFMTKFLLAIHGEYEYPSLFHLPTPIMFLQNDSPLSIFELSSSA-RIHLIPMMLCLNKRFRVGKKLLPNLNHIAGGGGEWFREDQSPMFQTLLGNVKQIISY-PLSLHHKGNEEVERFMKERIDENGTLYSYASASFYMIYALLALGHSIQSPMIQKAITGIT-SYIWKMERGNHLQNSPSTVWDTALLSYALGEARVSKESKMIGNASAYLLKKQHKKKAD-WSVHAPVLIPGGWGFSDVNTTVPDVDDTTAVLRALAQSRGNGNVDDAWKKGTNWIK-GLQNNDGGWGAFEKGVTSKLLANLPIENASDMITDPSTPDITGRVLEFFGTYTQNEL-PE KQ KQS Al N WLM N EQEENGSWYGKWGICYIYGTWAVM TG LRALGITSAH PSLKRATLW-LEHIQHEDGGWGESCGSSVEKRFATLPFSTPSGTAWALDALISYYDKETPAIRKGISYLLAN-PYVN E KYPTGTALPGG FYIH YH SYAHIYP LLTLAH YAKKYKK
>seqJD 33
MNIVIRISKGWVSNLLLYEKVHEEIARRTTALQTMQRQDGTWQFCFEGAPLTDCHMIFLL-KLLGRDKEIEPFVKRLASLQTNEGTWKLYEDEVGGNLSATIQSYAALLASKKYTKEDANMKRA-E M FIN E RGGVARAH FMTKFLLAIHGEYEYPSLFHLPTPIMFLQNDSPLSIFELSSSA-RIHLIPMMVCLNKRFQVGKKLLPNLNHIAGGGGEWFREDRSPMFQTLLSDVKQIISY-PLSLHHKGYEEVERFMKERIDENGTLYSYATASFYMIYALLALGHSLQSSMIQKAIAGIT-SYIWKMEKGNHLQNSPSTVWDTALLSYTLQEAHASKDNKMIQHAAAYVLKKQHTKKAD-WSVHAPGLIPGGWGFSDVNTTIPDVDDTTAVLRALARSRGNENVDNAWKKGVNWVK-GLQNNDGGWGAFEKGVTSNLLANLPIENASDMITDPSTPDITGRVLELFGTYAQNEL-PEKQKQSAINWLMNVQEENGSWYGKWGICYIYGTWAVMTGLRSLGIPSSNPSMKRAALW-LEHIQHEDGGWGESCQSSVEKRFITLPFSTPSQTAWALDALISYHDEETPAIRKGISYLLAN-PYVN E KYPTGTG LPGG FYI HYH S YAYI YP LLTLAH Yl KKYRK
>seq_ID 36
MSNLLLYEKVHEEIARRATALQTMQRQDGTWRFCFEGAPLTDCHMIFLLKLLGRDKEIEPF-VKRLAS LQTN EGTWKLYEDEVGGN LSATIQSYAALLASQ KYTKEDAN M KRAENFIKE RGGVA-RAHFMTKFLLAIHGEYEYPSLFHVPTPIMFLQNDSPLSIFELSSSA-RIHLIPMMVCLNKRFRVGKKLLPNLNHIAGGGGEWFREDRSPLFQTLLSDVKQIISY-PLSLHHKGYEEVERFMKERIDENGTLYSYATASFYMIYALLALGHSLQSSMIQKAIAGIT-SYIWKMERGSHLQNSPSTVWDTALLSYALQEAQVPKDHKMIQQTITYLLKKQHTKKAD-WSVHAPALTPGGWGFSDVNTTVPDVDDTTAVLRVLARSRENEKVNNAWQKGIDWVK-GLQNNDGGWGAFEKGVTSKLLANLPIENASDMITDPSTPDITGRVLELFGTYTQNEL-PEKQ KQS Al N WLM N AQEENGSWYGKWGICYIYGTWAVM TG LRSLGIPS N N PSLKRAALW-LEHIQHEDGGWGESCQSSMEKRFITLPFSTPSQTAWALDALISYYDTETPAIRKGISYLLAN-PYVNEKYPTGTGLPGGFYIRYHSYAQIYPLLTLAHYTKKYRK
'-•seqJD 42
MSNLLLYEKVHEEIARRTTALQTMQRQDGTWRFCFEGAPLTDCHMIFLLKLLGRDKEIEPF-VKRLASLQTN EGTW KLY ED EVGGN LSATI QSYAALLAS E KYTKEDAN M KRAE M FIN E RGG V A-RAH FMTKFLLAIHGEYEYPSLFH LPTPIMFLQNDSPLSIFELSSSA-RIHLIPMMLCLNKRFRVGKKLLPNLNHIAGGGGEWFREDRSPVFQTLVSDVKKII-TYPLSLHHKGYEEVERFMKERIDENGTLYSYATASFYMIYALLALGHSIQSPIIEKAIMGIT-
SYIWKVERGSHLQNSPSTIWDTALLSYALQEAQVPKASKVIQNASAYLL-RKQQTKKVDWSVHAPDLFPGGWGFSDVNTTIPDIDDTTAVLRALARSRGNEHVD-NAWKRAVNWVKGLQNNDGGWGAFEKGVTSRILANLPIENASDMITDPSTPDITGRVLEF-FGTYTQNELPEKQKQSAINWLMNVGEENGSWYGKWGICYIYGTWAVLTGLRSLGIPSSDS-SLKRAVLWLEHIQHEDGGWGESCQSSVEKRFVTLPFSTPSQTAWALDALISY-YDKETPVIRKGISYLLSNPYINEKYPTGTGLPGGFYIRYHSYAHIYPLLTLAHYAKKYRK
>seqLlD 65
MSNLLLYEKVYEEIARRTTALQTMQRQDGTWRFCFEGAPLTDCHMIFLLKLLGRDKEIEPF-VKRL ASLQTN EGTWKLY ED EVGGN LSATI QSYAALLAS E KYTKEDAN M KRAE M FIN E RGGVA-RAHFMTKFLLAIHGEYEYPSLFHLPTPIMFLQNDSPLSIFELSSSA-RIHLIPMMLCLNKRFRVGKKLLPNLNHIAGGGGEWFREDRSPVFQTLVSDVKKII-TYPLSLHHKGYEEVERFMKGRIDENGTLYSYATASFYMIYALLALGHSIQSPIIEKAIMGIT-SYIWKMERGSHLQNSPSTIWDTALLSYALQEAQVPKVSKVIQNASAYLL-RKQQTKKVDWSVHAPDLFPGGWGFSDVNTTIPDIDDTTAVLRALARSRGNENVD-NAWKRAVNWVKGLQNNDGGWGAFEKGVTSRILANLPIENASDMITDPSTPDITGRVLEF-FGTYTQ N ELPE KQ KQSAIN W LM N VQEE N GSWYGKWGICYIYGTWAVLTG LRSLGIPSS DS-SLKRAVLWLEHIQHEDGGWGESCQSSVEKRFVTLPFSTPSQTAWALDALISY-YDKETPVIRKGISYLLSNPYINEKYPTGTGLPGGFYIRYHSYAHIYPLLTLAHYAKKYRK
> s e q J D 39
MNNLLLYEKVHEEIARRATALQTMQQQDGTWRFCFEGAPLTDCHMIFLLKLLGRDKEIEPF-VKRLASLQTNEGTWKLYEDEVGGNLSATIQSYAALLASKKYTKEDANMKRAENFIKERGGVA-RAHFMTKFLLAIHGEYEYPSLFHLPTPIMFLQNDSHLSIFELSSSA-RIHLIPMMLCLNKRFRVGKKLLPSLNHIAGGGGEWFREDRSPLFQTLVSDVKQIISY-PLSLHHKGYEEVERFMKERIDENGTLYSYATASFYMIYALLALGHSLQSTMIQKAITGIT-SYIWKMESGNHLQNSPSTVWDTALLSYALQEAHVPKDNKMIQHAATYLLKKQHTQKAD-WSVHAPALTPGGWGFSDVNTTIPDVDDTTAVLRALARSRGNEKVDNAWPKGINWVK-GLQNNDGGWGAFEKGVTSNILANLPIENASDMITDPSTPDITGRVLEFFGKYAQNEL-PEKQKQSAINWLMNVQEENGSWYGKWGICYIYGTWAVMTGLRSLGIPSSNPSMKRAALW-LEHIQHEDGGWGESCHSSVEKRFVTLPFSTPSQTAWALDALISYYDKETSIIRKGISYLLAN-PYVNEKYPTGTGLPGGFYIRYHSYAHIYPLLTLAHYIKKYRK
>seqLlD 63
MSNLLLYEKAHEEIARRATALQTMQREDGTWRFCFEGAPLTDCHMIFLLKLLGRDKEIEPF-VKRLATLQTNEGTWKLYEDEVGGNLSATIQSYAALLASGKYTKEDANMKRAENFIKERGGVA-RAHFMTKFLLAIHGEYEYPSLFHVPTPIMFLQNDSPLSIFELSSSA-RIHLIPMMLCLNKRFRVGKKLLPNLNHIAGGGGEWFREERSPLFQTLLSDVKQIISY-PLSLHHKGYEEVERFMKERIDENGTLYSYATASFYMIYALLALGHSLQSSMIQKAIAGIT-SYIWKMESGNHVQNSPSTVWDTALLSYALQEAHVPKDNKMLQNATAYLLKKQHTKKAD-WSVHAPALTPGGWGFSDVNTTVPDVDDTTAVLRVLARSKGNEKLDHAWQKGINWVK-GLQNNDGGWGAFEKGVTSRILANLPIENASDMITDPSTPDITGRVLEFFGTYAQNEL-
PEKQKQSAINWLMNAQEENGSWYGKWGICYIYGTWAVMTGLRSFGIPSSNPSLKRAALW-LEHIQHKDGGWGESCHSSVEKRFVTLPFSTPSQTAWALDALISYYDTETPVIRKGISYLLAN-PYVNEKYPTGTGLPGGFYIRYHSYAHIYPLLTLTHYIKNIENKPRDISRFIFLGSRSLLKR-IRLCFPYFSVDWRF
>seq_ID 37
MSNLLLYEKAHEEIARRATALQTMQREDGTWRFCFEGAPLTDCHMIFLLKLLGRDKEIEPF-VKRLASLQTNEGTWKLYEDEVGGNLSATIQSYAALLASGKYTKEDANMKRAENFIKERGGVA-RAHFMTKFLLAIHGEYEYPSLFHVPTPIMFLQNDSPLSIFELSSSA-RIHLIPMMLCLNKRFRVGKKLLPNLNHIAGGGGEWFREERSPLFQTLLSDVKQIISY-PLSLHHKGYEEVERFMKERIDENGTLYSYATASFYMIYALLALGHSLQSSMIQKAIAGIT-SYIWKMESGNHVQNSPSTVWDTALLSYALQEAHVPKDNKMLQNATAYLLKKQHTKKAD-WSVHAPALTPGGWGFSDVNTTVPDVDDTTAVLRVLARSKGNEKLDHAWQKGINWVK-GLQNNDGGWGAFEKGVTSRILANLPIENASDMITDPSTPDITGRVLEFFGTYAQNEL-PEKQKQSAINWLMNAQEENGSWYGKWGICYIYGTWAVMTGLRSFGIPSSNPSLKRAALW-LEHIQHKDGGWGESCHSSVEKRFVTLPFSTPSQTAWALDALISYYDTETPVIRKGISYLLAN-PYVNEKYPTGTGLPGGFYIRYHSYAHIYPLLTLTHYIKKYRK
>seq_ID 46
MLLYEKVHEEVKEKMAALQAMQQQDGTWRFCFEGSPLTDCYMIFLLTLLGQDQEIEPFVAR-LAALQTNEGTWKLYEDEPDGNLSATIQAYAALLVSKMYKKEDINMKRAEVFIRKQGGIT-KAHFMTKFLLALHGGYEYPPLFHFPTPILFLSEDSPLSIFELSSSARIHLIPMMLCMNKRFT-VSKKMLPNLDYISGGSKEQWFREERSPLFQTLLRDVTKFLSYPLSLHYKGDKAAERFMIERI-DTN GTLYS YASATFY MIY AL LALG HSIQS P Ll S N AVLG LKTYVWN MDR-WAHLQNSPSTVWDTALLSYSLGEARVPHDNEMIQKAINYLLQKQHKEKKDWSVHAP-TLDAGGWGFSDVNTTIPDVDDTTAVLRALAGSRQGNPKVESAWRKGIEWVKGLQNSDGG-WAAFEKGVTSKVLTHLPLDNSGDMITDPSTVDITGRVLEFFGTYAPNELQGDQK-DRAIRWLIYTQEKNGSWHGKWGVCYIYGTWAALTGLRAVGVPSNHIALQKAATWLE-SIQHSDGGWGESCRSSVEKKFISLPFSTPSQTAWALDALIACYDSETPTIRKGISYLLKHST-KHQEYPTGTALANGFYIRYHSYHHIFPLLTFAHYIKKYRK
>seqLlD 40
MSNLLLYEKVHEEIARRTTALQTMQRRDGTWRFCFEGAPLTDCHMIFLLKLLGRDKEIEPF-VKRLAS LQTN EGTWKLYED EVGG N LSATIQSYAAL LAS KKYTKE D AN M KRAE M FIN E RGGVA-RAHFMTKFLLAVHGEYEYPSLFHLPTPIMFLQSDSPLSIFELSSSARIHLIPMMLCLNKKFR-IRKKLLPNLNHISGGGGEWFRGNRSPLFQTLVSDVKQIISYPLSLHHKGNEEVERFMKERI-DENGTLYSYATASFYMIYALLALGHSLQSTMIQKAITGITSYIWNMES-GNHLQNSPSTVWDTALLSYALQEAHVPKDTNMLQHATAYLLKKQHTKKADWSVHAPAL-APGGWGFSDVNTTIPDVDDTTAVLRALARSRGSEKVDYVWEKGINWVKGLQNN-DGGWGAFEKGVTSNLLANLPIENASDMITDPSTPDITGRVLELFGTYAQNELPEKQTQSAIN-WLMNVQEKNGSWYGKWGICYIYGTWAVMTGLRSLGIPSSNPSLKRAALWLEHIQHEDGGW-
GESCHSSVEKRFVTLPFSTPSQTAWALDALISYYDKETPAIRKGISYLLANRYVNEKYPTGT-GLPGGFYICYHSYAHIYPLLTLAHYIKKYRK
>seqLlD 38
MSNLLLYEKAHEEIARRATALQSMQWQDGTWRFCFEGAPLTDCHMIFLLKLLGRDKEIEPF-VKRLASLQTNEGTWKLYEDEVGGNLSATIQSYAALLASGKYTKEDANMKRAENFIKERGGVA-RAHFMTKFLLAVHGEYEYPSLFHLPTPIMFLQNDSPLSIFELSSSA-RIHLIPMMLCLNKRFRVGKKLLPNLNHIAGGGGEWFREERSPLFQTLVSDVKQIISY-PLSLHHKGYEEVERFMKERIDENGTLYSYATASFYMIYALLALGHSLQSSIIQNAITGIT-SYIWKMESGNHLQNSPSTVWDTALLSYALQEAHVPKDNKMLQNATAYLLKKQHTKKAD-WSVHASALTPGGWGFSDVNTTVPDVDDTTAVLRVLARSRGNEKVDHAWQKGINWVK-GLQNNDGGWGAFEKGVTSNILAKLPIENASDMITDPSTPDITGRVLEFFGTYAQNEL-PEKQKQSAINWLMNVQEENGSWYGKWGICYIYGTWAVMTGLRSFGIPSSNPSLKRAALW-LEHIGHKDGGWGESCHSSVEKRFVTLPFSTPSQTAWALDALISYYDTETPIIRKGISYLLAN-PYVNEKYPTGTGLPGGFYIRYHSYAHIYPLLTLAHYIKKYRK
>seq_ID 55
MLLYEKVRQEVERKVTALRTMQYQDGAWRFCFEGSPLTDCHMIFLLRLLGQNGEMEPFVTR-VASLQTNEGTWKLYEDESVGNLSTTINAYVALLASGRYTKEDINMKRAEAFIRRQGGIT-KAHFMTKFLLALHGGYEYPSLFHFPTPMLFLPEDSPLSIFELSSSARIHLIPMMICMNKRFT-VSKTILPNLDYISGGSKKQWFREERSSLFQRLLGDVKKFLSYPLSLQHKGYKEAERF-MIERIETNGTLYSYASATFYMIYALLALGHSIQSPLISNAVLGLKSYIWNMNKGTH-LQNSPSTVWDTALLSYSLQEAGVPNDNQMIQKATDYLLQKQHKEKKDWSVHAPS-LDAGGWGFSDVNTTIPDIDDTTAALRAIARSREGNQRIEEAWRKGIEWVKGLQNIDGG-WAAFERGVTSHFLTHLPLDNAGDMTTDPSTSDITGRVLEFFGTYAPHQLKDDQKDRAIK-WLMQAQEKNGSWYGKWGVCYIYGTWAALTGLRAVGVPSNHTALQKAATW-LERIQHNDGGWGESCRSSIEKHFISLPFSTPSQTAWALDALITFYDTETPVIRKGISYL-LAHLNQNQDYPTGIGLPDGFYIRYHSYHHIFPILTFAHYIKKYMK
>seq_ID 54
MLLYEKVRQEVERKVTALRTTQYQDGAWRFCFEGSPLTDCHMIFLLRLLGQNGEMEPFVTR-VASLQTNEGTWKLYEDESVGNLSTTINAYVALLASGRYTKEDINMKRAEAFIRRQGGIT-KAHFMTKFLLALHGGYEYPSLFHFPTPMLFLPEDSPLSIFELSSSARIHLIPMMICMNKRFT-VSKTIFPNLDYISGGSKKQWFREERSPLFQTLLGDVKKFLSYPLSLQHKGYKEAERF-MIERIETNGTLYSYASATFYMIYALLALGHSIQSPLISNAVLGLKSYIWNMNKGTH-LQNSPSTVWDTALLSYSLQEAGVPNDNQMIQKATDYLLQKQHKEKKDWSVHAPS-LDAGGWGFSDVNTTIPDIDDTTAALRAIARSREGNQRIEEDWRKGIEWVKGLQNIDGG-WAAFERGVTSHFLTHLPLDNAGDMTTDPSTSDITGRVLEFFGTYAPHQLKDDQKDRAIK-WLM QAQ EKNGSWYGKWGVCYIYGTWAVLTG LRAVGVPSN H TALQKAATW-LERIQHNDGGWGESCRSSIEKHFISLPFSTPSQTAWALDALITFYDTETPVIRKGISYL-LAHLNQNQDYPTGIGLPDGFYIRYHSYHHIFPILTFAHYIKKYMK
>seqJD 189
MRSELLQLQSADGSWRLCFDSGTMPDSYFIIILRMLGYSQDEALIRQIAS-RILSRQLPNGTWKIYPDEEDGNLDATAEAYFALLYSGFLTKLDPRMQLAKQFILSKGGLS-KIRSLLTQAIFAAAGGASWPKSMRIPLEVFFSDNGIGIDLFSLSGHARVHIVPIIM-LANAQFVQHSASMPDLSDLFAGSSKRFENDSPWIAALATLIGSLSLSELLPFESPTPQE-KAVGFLFDRLEPDGTLLTYTTATMFMILVLLMLGYSSSSPLIHRMVSGIHSVICANSHVQIAS-SEVWDT AM LVH ALRKAG V N PISTALE N AG AYLRQ RQQTQLG D WAIRN PGT-PAGGWGFSNVNTLYPDVDDTTAALRAIQPYSSRTPELQADWQRGLNWVLTMRNDNG-GWPAFERQGSRLPITFFNFEGAKDIAVDPSTVDLTSRTLQFLGQELGMNAGNSWIEST-LRWVLSQQESNGSWYGRWGITYVHGTSAALQGLTAVGIAEDHPA-VKKGVDWLLQVQNEDGGWGESCISDKVRRYVPLNFSTPSQTAWALDGLTAALPKPTPALER-GVDALLQSLDRH D WTYTYPTGG ALPGSVYAH YASN N Yl W P LLALSNIWQ KYS
>seq_ID 200
MALPFNQDSYKGDDEADVSKGAAKSPPSLEEAIQRSQEFLLAQQFPEGFWFGELEANVTI-ISHTVILYKLLGIEENFPMYKFERYLRRMQCSHGGWEIAYGIGSYLSATIEAYIAL-RLLNVPQSDPALQKALRVILDSGGVTKARIFTKICLALLGSFDWRGIPSLPPWLILCPTWFPL-SIYEVSSWARGCIVPLLVILDKKPVFKVSPEVSFDELYAEGREHACKIIPISGDWTSKFFIT-VDRVFKMMERLRWPFRQWGIREAEKWILERQEESGDYVNIF-PAM FYSVMCMKVLGYETTDPVVQRALLGFKGFTIETADECKVQSTVSPIWDTAFIVRALVDS-GIPPDHPALQKAGQWLLQKQILKHGDWAFKDRQNPVNQRGFACLQRDSQIETADECRVQST-LSPVWDTAFWKALVDSGIPPNHPALQKAGQWLLQNQTLTHGDWAFKTQSGHLAAGG-WAFQSHNRWYPDADDSAAVMMALDCIELPDEDVKNGAIARGLKWISALQSRNGG-WAGYDKNCDQQWINKVPFNDLNGILDVPTADVTARVLEMVGRLSRLGAVGTPYSPRHCTL-VESIPHLLLPETIARGLAYLRREQEGEGCWWGKWGVNYIYGTCGALLALSQVAPTTHQEEI-ARGAKWLAQVQNRCDKQKAAQGPRDGGWGESCFSYDDPALKGQNDASTASQTA-WAVQG LLAAG DALG KYEV EAIEQGVQYL LATQRKDGTWH E AH FT-GSCFAGHFYVRYHYYAQHFPLSALGLYRTRILQHQ
>seq_ID 139
MVADERSALIDALKRSQSVDGSWRFPFETGISTDAYMIILLRTLGIHDEPLIQALVERIES-RQDANGAWKLFADEGDGNVTATVEAYYALLYSGYRKKTDSHMQKAKARILEVGGLERVHL-FTKVMLALTGQHSWPRRFPLPLVFFLLPPSFPLNMYDLSVYGRANMVPLLVVAER-RYSRKTDNSPDLSDLAASRNDWRLPDTEALWSYVKRSLTGLPAWLHRAAEQRAVRYMLEH-IEPDGTLYSYFSSTFLLIFALLALGYPKDDPHIARAVRGLRSLRTEIDGHTHMQYTTASVWN-TALASYALQEAGVPPTDRTIEKANRYLLSRQHIRYGDWAVHNPYGVPGGWGFSDVNT-MNPDVDDTTAALRAIRRAAAKETAFRHAWDRANRWLFSMQNDDGGFAAFEKNVG-KRFWRYLPIEGAEFLLMDPSTADLTGRTLEYFGTFAGLTKDHSAIARAIDWLLDHQEADGS-WYGRWGICYVYGTWAAVTGLSAVGVPIDHPAMQKAVRWLLSIQNDDGGWGESCKSDGAK-TYVPLG ASTP VHTAWALD ALIAAAE RPTPE M KAGVRALVRM LH H P DWTASYPVGQG-MAGAFYIHYHGYRYIFPLLALAHYEQKFGPFVD
>seq_ID 13
MAQMASSLGSPRLLLRMGREAAQQQHLASGTEVQKALRLAVGHSLDLQRTDGAWCGE-VHSNATFTAQYVFLQQQIGLPLDPTEIEGLSRWLFSQQNEDGSWGLGPGLGGDVSTTTETY-LALKILGVSPEDPRMAAARTSIIKAGSLPATRMFTRVFLASFGLIPWSAVPPLPAELILL-PTLFPVNIYNLSSWARATCVPLLLIRHHEPLHSLPNGRHAENDFLDELWTKDIPRDFCYTT-PLSRMWRLGDYAGIFFTSADHGFRFLGQYFNSPLRNLSRRKIINWILDHQEQSGE-WAGYW P PQ H N NIW ALS LEG YS LD H PVLRRGIAAVKSFVLH DATG M RA-QVTVSQVWDTALMSIALSDSAPSTGIISPTQAIDWLMHHEVASHRGDWRVLRPKLAT-GGFCFEEFNTLYPDVDDTAAVIMALIKSNPAHLISGCVRQCFGMMMAGRHGYSLDCQLETRL-RASSQLAIAYLLGCQENNGSWWGRWGVNYLYGTSNVLCGLAYYYDRSSLSKGDGKSNSNIV-SAVDRASEWLKARQHSNGGWGEGLESYDNAQLAGCGQPTASQSAWVTMALLNYLSPTDE-VIQRGVSYLVRNQVKYGDESRATWPLERYTATGFPGHLYMEYDYYRHYFPI-MALGRYVNKLSGSHKLL
>seq_ID 198
MED LTQ KLQQ ALQ L AS RALLN E RV RPG LAH W EG E LSTSALSTATAVMALFGYAKCGGAS-GRLQKVFDGKSEGDWRLIEQGLAWLLQHQLADGGWGDTDKSISNISTTMLAHAT-LVACREAVRQKSLVLNASDIDAAIERSGRLIEELGGIQAIRDRYGKDHTFSVPILTHAALAG-LVSWNEIPALPYELALLPHRFFEVIQLPWSYALPALIAIGQTLHLRQRT-W N PWWWVRRAAIPGTLQ KLQSIQPESGGF LE ATP LTS FVTM C LASVGRV D H PVTQAG LKFIR-DSVRPDGSW PIDTN LATWVTTLSIN H LGAEAFSSDEREALM RWLLQQQYRTM H PYTNAAP-GGWAWTNLSGGVPDADDTPGAMLALMELDRVSVSSQESLSIEQALYQAALWLIKLQNRD-GGWPTFCRGWGALPFDRSSNDITAHCLRALIQYERRLNDVTVDATGDTTSRPLAVEVPSPKL-REQMQRSIQQGFEYLEKTQREDGSWLPLWFGNQHSPDDENPLYGTARVLLAYADAGLEGS-SAALRGCDWLVRHQHADGAWGPGTSIETADTSDAESDVEGEPASIEETALALMALCRF-DATHNVLHRGASWLITKVENETWREPTPIGFYFAKLWYYEKLYPQVFTVGALKALALRLGS-ALTTVSENEPAPSSAEPPIPPIATDRVADSMHLQRTSPSINLANGGITLA
>seq_ID 252
SPVWDTVLTLLALDDCGYNDCYSEEVDKAVQWVLDQQVLSKGDWSVKLPNVEPGG-WAFEYANTRYPDTDDTAVALIVLSQFKDDPKWKERGINQAIERGVNWLFEMQCKNG-GWGAFDKDNDKTLLTKIPFCDFGEALDPPSVDVTAHIVEAFGKLGYSKDHPKIAHAIEYLKEE-QEADGAWFGRWGVNYVYGTGAVLPALEAIGEDMSQPYIRKAANWLVLHQNEDGGWGE
=-seq_ID 253
SPVWDTVLTLLAFDDCDKNEAYQASVEKAVQWTLDNQVLRKGDWSVKLPDVEPGG-WAFEYANTFYPDTDDTAVALIVLSQFRDVEKWQEAGIEKAIERGVNWLFAMQSKNG-GWGAFDKDNDNNFITKIPFCDFGEALDPPSVDVTAHCIEAFGKLGLSRARPEIARGLDYLKSE-QEADGAWFGRWGVNYVYGTGAVLPALEAIGEDMSQPYIRKAANWLILRGNEDGGWGE
>seqJD 257
SPVWDTXLTLLALDDCDLNERQSKEVEKAVQWVLNQQVLRPGDWCVKVPKVQPGG-
WAFEYKNYFYPDTDDTAVALIVLSQFRDDPKWQEKNIEQAIDRGLNWLIGMQCK-
GGGWGAFDKDNDKTYLTKIPFCDFGEALDSPSVDVTAHIVEAFGKLGLGKSHPAMI-
RAIDYLKAEQEQDGAWFGRWGVNYIYGTGAVLPALEAIGEDMRAPYIAKACDWLIA-
VQQEDGGWGE
>seqLlD 254
SPVWDTLLTLLAYDDSGQNERKADEVEKAVDWVLAXQVLRPGDWKVKAPNLEPGG-WAFEYANYFYPDTDDTAVALIVLSQFRNDAAWKEKGIEQAIEKGVNWLFGMQCK-GGGWGAFDKDNDKQFLTKIPFCDFGEALDPPSVDVTAHIVEAFGKLKFSKDHPNIRRAIDYMK-DEQEADGAWFGRWGVNYIYGTGAVLPALEAIGEDMFAPCIGRACDWLVSRQNDDGGWGE
>seqLlD 255
SPVWDTLLTLLAYDNSGHNARKASEVEKAVDWVLAQQVLRPGDWNVKAPNLEPGG-WAFEYANYFYPDTDDTAVALIVLSGFRNDAAWKDKGIEGAIEKGVNWLFGMQCK-GGGWGAFDKDNDRQFLTKIPFCDFGEALDPPSVDVTAHIVEAFGKLKFSKDHPNIRRAIDYTK-DEQEDDGAWFGRWGVN YIYGTGAVLLALEAIGEDMSAPYIGRACDWLVSRQNDDGGWGE
:>seq_ID 256
SPVWDTLLTLLAIEDSGQSVKRAQEVEKAVDWVLSQQVLRPGDWKVRAPHLEPGG-WAFEYANYFFPDTDDTAVALIVLSQFRNDAAWKAKGIETAIEKGVNWLLGMQCK-GGGWGAFDKDNDKTYLTKIPFCDFGEALDPPSVDVTAHIVEAFGKLGFSKDHPNIARAIEYLK-SEQESDGXWFGRWGVNYVYGVGAVLPALEAIGEDMSAPYIGRACDWLVSKQNSDGGWGE
>seq_ID 258
SPVWDTVLTMLAIHDCGADKQYAPQMDKAIDWLLAN EVRHKGDWAVKLPDVEPGG-
WAFEYSNACYPDLDDTAVALIVLAPYRNDPKWQARDIEGAVERAVDWTLAMQCKNG-
GWGAFGKDNDKAILTKIPFCDFGEALDPPSVDVTAHVLEALAALGYDNSHPA-
VARAIRYLRDEQEPDGSWWGRWGVNYIYGTAAVLPALKAMGVDMNEPFVHKAAD-
WIGSVQNEDGGWGE
>seq_ID 302
SPVWDTSLVLVAMQEAGVPVDHPALVKAAQWLLDREVRLKGDWRVKSPDLEPGG-WAFEFLNDWYPDVDDSGFVMLALKDIKVRDKKQKSQAIKRGIAWCLGMQSANG-GWGAFDKDNTKYLLNKIPFADLEALIDPPTADLTGRMLELMGTFNYPKSHVAWRALGFLKS-VQEPEGPWWGRWGVNYIYGTWSVLGGLDAIGEDMSQPYIRKAVNWLKSKQNLDGGWG E-VCETYEDRSLMGCGPSTPSQTSWALLSLFSAGEINAKAVLRGIKYLVETQNQDGSWDEDA-YTGTGFP
>seq_ID 271
SPVWDTAISVISLAXSGMERGHPALVRAAXWLMSKEIKTAGDWKVTNPAGPVGGWAFEFNN-AFYPDIDDSAMVMMALRHVHLDEHTAHRREKACLRGLNWLLSMQSRTGG-
WAAFDKDNTKVIMTKIPFADHNAMIDPPWADITGRVLEFLGYIGYDQSYPAVARAARFL-REEQEEDGSWFGRWGVNYIYGTWQVLRGLAAIDEDMSQPYIRRAAEWLRSVQPPDGGWGE TCATYHDPSLKGKGPATPAQTAWAVMGLMAAGIYDESVSRGIDYLVRTQRPDGTWDE-TEYTGTGFP
>seq_ID 299
SPVWDTALVLVAMQEAGVPVDHPALIKSAQWLLDLEVRRKGDWHVKSPDLEPGGWA-FESLNDWYPDVDDSGFVMLFIKDIKVRDKKLKDQAIKCGIAWCLGMQSENG-GWGAFDKDNTKHLLNKIPFADLEALIDPPTADLTGRMLELMGNFNYPKSHQAAVKALDFLK-VEQEPEGPWWGRWGVNYIYGTWSVLCGLEAIGEDMSQPYIKKAVNWLKSKQNLDGGWGE-VCDSYADRSLMGCGPSTASQTSWALLSLFAAGEVSSKAALRGVEYLLSTQKLDGTWDE-DAFTGTGFP
>seq_ID 314
SPVWDTALAVRALAAAGVPPEHPAMVKASEWLLTQQIFKPGDWSIKCPDLPPGGWAFEF-VNNWYPDVDDSSMVLVALKDGLADAAKHQAALQRGINWCLGMQSKNGGFASFDKDNT-KEWLNSLPFGDLKALVDPPTEDITARILEMMGAFGHGLDHPVAARALAYLHQTQRPEG-PWWGRWGVNYIYGTWSVLVALKRIGEDMSRPYVRRAVDWVKAHQNPDGGWGEFCESYRN-PELMGKGPSTASQTAWALLGLFAAGEVHAPEVTAGVDYLVKTQDSLGRWDEEQFTGTGFP
>seq_ID 251
SPVWDTVLTMLSVQDCDADENSENAPAIEKAIEWLLANEVRTGGDWQEKVKGVEPGG-WAFEYKNASYPDTDDTAVAMMALAPYRTEEKWKKKGLPEALKRAAEWNIAMQCSNG-GWGAFDKDNDKTILCKIPFCDFGEALDPPSVDVTAHVLEGLAALDYPPEHPAIQRAVQFIK-DEQEPDGSWWGRWGVNFIYGTAAALPALKAVGEDMRAPYIDRAAKWIVDHQNEDGGWGE
>seq_ID 312
SPVWDTALAVRALAAAGVPPEHPAMVQASEWLLTQQIFKPGDWSVKCPDLPPGGWAFEF-VNNWYPDVDDSSMVLVALKDGLADAAKHQAALQRGINWCLGMQSKNGGFASFDKDNT-KEWLNAIPFGDLKALVDPPTEDITARILEMMGAFGHGLDHPVAVRAMAYLHETQRPEG-PWWGRWGVNYIYGTWSVLVALKRIGEDMSRPYVRRAVDWVKAHQNLDGGWGECCESYRN-PELMGRGPSTASQTAWALLGLFASGEVHTPEVKAGVDYLVKTQNSLGRWDEEQFTGTGFP
>seq_ID 250
SPMWDTVLTTLAVQDAGVDQEPEFKPAMERTLEWLLKNEVRTGGDWQQKTRGVEPGG-WAFEYANASYPDNDDTAVALIVLAPFRHDPKWQARGIQHVIDRAVNWMFAMQCDNGG-WAAFDLDNDKAILTRIPFCDFGEALDPPSVDVTAHVLEALAALGYSREHPAVRRAIAF-LKEDQEPDGSWFGRWGVNFIYGTAAALPALKAMDEDMTQDWITRAADWMRSRQNDDGGW-GE
>seq_ID 260
SPVWDTVLTLLAIQDADKQDDMAAEVDRAIGWLLSKEVRTNGDWSVKLPDVEPGGWAFEHE-NARYPDTDDTAVAVMVLAPYRHHPKWRKRGLPEALDRAISWMRAMQCRNG-GWGAFDKDNDNAFLCVIPFCDXGEALDPPSIDVTAHALEAFAAMGFGPEDTTVARALDYMS-KEQEADGSWWGRWGVNYIYGTAAALPAYKAFGQDMRDPKLMKAADYLRAKQNADGGWGE > s e q J D 259
SPVWDTVLTLLAMEDCEATEEFIAAAIEQAIEWLLENEVRTPGDWQMKVPDADPGG-WAFEYANAAYPDVDDTAVAILVLARYRDDPKWQAKGLPQAIDRAVAWVLAMQCSNGG-WAAFDKDNDKSILCKIPFCDFGEALDPATVDVTAHVLEALAAVGYGPDHPAVRRGLDFLY-AEQ E ADGSWWGRWGV N YVYGTG AALPAF KAIG AD M RD P RM LKAADWILRCQ N KDGGWG E
>seqLlü 261
SPVWDTVLTLLAIQDADKQEEMAGEIDKAIGWLLSKEVRTKGDWSVKLPRVEPGGWAFEHE-NARYPDIDDTAVAIMVLAPYRDHPKWKKRGLPEALDRAIAWMRAMQCRGGGWGAFDKDND-KQILCTIPFCDFGEALDPPSIDVTAYALEAFAAMGYGPDDKTVARALKYMSKEQEADGS-WWGRWGVNYIYGTAAALPAYKALGQDM RDPGLM KAADYLRDKQN ADGGWGE
>seqLlü 262
SPVWDTVLTLLAMQDADRTDKHKAAVDKAIQWVLDQEVRTPGDWCVQTPDVEPGG-
WAF E YE N ARYPDV D DTAVAIM V LAPYQ D DPKWRKRG LPDALARAIAWI RAM QCKN G-
GWGAFDRDNDNSMLTVIPFCDFGEALDPPSVDVTAHALEAFHMMGYGPEDPT-
VARALAYLDAEQEQDGSWWGRWGVNFIYGTSAALPALKAMGRDMRDPRYTKAADYL-
RAVQNDDGGWGE
>seqLlD 275
SPVWDTLLALLALQDCDRELTAEMSRALDWVLANEVRYHGDWTKKVKGVEPSGWAFERAN-LNYPDIDDTAVALIVLARLPRAWLDEPRIRATIDRVLGWTLAMQSSNGGWAAFDKDNDRPIIT-KIPFCDFGEALDPPSADVTAHVLEALGLLGFDRRHPAVERGLRFLRSEQEADGSWF-GRWGVNYVYGTAAVLPGLAAIGEDMTQDYIRRANDWLIAHQNPDGGWGE
>seq_ID 280
SPVWDTLLSLVALQDCGKELTPARERALEWILGREIRTRGDWAKKVKNVEASGWAFERAN-LHYPDIDDTAVALIMLARLPRAWLDQPRIRAVIDRALGWTLAMQSSSGGWAAFDKDNDRLIIT-KIPFCDFGEALDPPSADVTAHVLEALGILGFDRQHAAVRHGLKFLRSEQEADGSWF-GRWGVNHVYGTGAVLPALAAIGEDMAQDYVRRAADWLVAHQNADGGWGE
>seqJD 277
SPVWDTLLALLAMQDCERELTPQMERALDWVLANEVRYYGDWSKKVRGVEPSGWAFERAN-LNYPDIDDTWALIVLARLPRALLDQPRIRAVIDRALGWTLAMQSSNGGWAAFDKDNDHLIIT-KIPFCGFGEALDPPSADVTAHVLEALGLLGFDRHHPAVARGYQFLRKEQEADGSWF-GRWGVNHIYGTAAVLPALAAIGEDMSQPYIRAAAEWIIAHQNADGGWGE
> s e q L lü 300
SPVWDTALVLVAMQXAGVPVXHPALVKSAQWLLDLEVXXKGDWQVKSPELEPGG-WAFXFLNDWYPDVDDSGFVMLSIKXIKVRDKKHKEQAIKRGISWCLGMQSDNGG-WAAFDKNNTKYLLNKIPFAXLEALIDPPTAXLTGRMLELMGNFNYPKTH-KAAVQALEFLXMEXEPXGPWWGRWGVNYIYGTWSVLCGLEAIGEDMAQPYIKKSINWLKS-KQNMDGGWGEVCESYGDRSLMGCGPSTASQTSWALLSLFAAGEVHSKAATRGIEY-LLATQKLDGTWDEDAYTGTGFP
>seq_ID 279
SPVWDTLLXLLAMQDCERESTPSMERALDWXXANEVRYYGDWSKKVRGVEPSGWAFXRAN LNYPDIDDTDVALIVLARLPRALLDQSRVHAVIDRALGWTLXMQSSNGGWAAFDKDNNHLIIT-KIPFCDFXEALDPPSADVTAHVLEALGLLGFNRNHPAVERGYRFLRSEQETDGSWF-GRWGVNHVYGTXAVLPALAAIGEDMTQPYIRSAAEWIIAHQNADGGWGE
>seq_ID 264
SPVWDTLLTLEALLDCNLSPKTFTGMQAAVDWILSKQIVTPGDWQIKVPGVSCGGWAFE-RANTFYPDMDDTAVAMIVLARIRRYYNDSSRIDRALACATDWILSMQCSNGGWAAFDLDNT-NDLVTRIPFSDFGEMLDPPSVDVTAHWEALGCLGRTRNDPAVARAVAYILDEGEPEGSWF-GRWGVNHIYGTG AVL P A LAAVGTD M S AGY IT RAAD W VAT H Q N ADGGWG E
>seq_ID 19
GGWMFQASISPIWDTGLTVLALRSAGLPPDHPALIKAGEWLVSKQILKDGDWKVRRR-KAKPGGWAFEFHCENYPDVDDTAMVVLALNGIQLPDEGKRRDALTRGFRWLREMQSSNG-GWGAYDVDNTRQLTN Rl PFCN FG EVIDP PSEDVTAH VLECFGSFGYDEAWKVIRKAVEY-LKAQQRPDGSWFGRWGVNYVYGIGAWPGLKAVGVDMREPWVQKSLDWLVE-HQNEDGGWGE
>seq_ID 278
SPVWDTLLSLLAMQDCERGFTPSMERALDWVLANEVRYYGDWSKKVRGVEPSGWAFERAN LNYPDIDDTAVALIVLARLPRAQLDQPRIREVIDRALGWTLAMQSSNGGWAAFDKDNDHLIIT-KIPFCDFGEALDPPSADVAAHVLEALGLLGFERKHPAVERGLKFIRSEQEADGSWFGRWGVN HIYGTAAVLPALXAIGEDM
>seq_ID 315
SPVWDTALAVRALAAAGLPPDHPFMTQATSWLLTQQIFKPGDWCIKCPDLPPGG-WAFXFHNNWYPDVDDSSMVLVALKDGLPDTARHQAALQRGINWCLGMQSKNGGFAS-FDKDNTKEWLNALPFGDLKALVDPPTEDITARILEMMGAFGHGLDHPTADRALAFLRRTQH-PEGPWWGRWGVNYLYGTWSVLVALKRIGXDMSRPYVQRAVNWIKSHQNPDGGWGEVCE-SYRHPELMGQGPSTASQTAWALLGLLAAGEIQAAEVKAGVDYLVKTQNAQGRWDEKYFT-GNWLP
>seq_ID 297
SPVWDTALVLQAMQEASIPLDHPALVKAAQWLLDREVRIKGDWKIKSPGLEPGG-WAFEFQNDWYPDVDDSAAVLIAIKDIQVKNNKAKQGAVRRGIDWCLGMQSKNG-GWGAFDKDNTKHLLNKIPFADLEALIDPPTADLTGRMLELMGNFGYDKHHPQAVHALEFLK-KEQEPEGPWFGRWGVNYIYGTWYVLIGLEAIGEDMNQPYIKKAANWIKSRQNIDGGWGE
>seqJD 17
QASISPVWDTGLAVLALRAAGLPADHDRLVKAGEWLLDRQITVPGDWWKRPNLNPGG-
FALQFDNVYYPDVDDTAWIWALNTLRLPDERRRRDAMTKGFRWIVGMQSSNG-
GWGAYDVDNTSDLPNHIPFCDFGEVTDPPSEDVTAHVLECFGSFGYD-
DAWKVIQRAVAYLKREQKPDGSWFGRWGVNYIYGTGAWSALKAVGIDMREPYIQKALD-
WVEQHQNPDG
>seq_ID 303
SPVWDTALVLVAMQEAGVPLDHPALVKAAQWLLDREVRIKGDWRIKSPDIEPGG-
WAFEFLN DWYPDVDDSGFVM LAIKDVKV RDKKKKEQAIKRGINWCLGM QSAN G-
GWGAFDKDNTKYLLNKIPFADLEALIDPPTADLTGRMLELLGTFNFPKDHHAI-
ERALEFIQLEQEPEGPWWGRWGVNYIYGTWSVISGLEAIGEDMSQPYIRKTVNWLKS-
KQNMDGGWGE
>seq_ID 298
SPVWDTTLVLVAMQEAGVPVDHPALVKSAQWLLDLEVRRKGDWQVKSPDVEPGGWAFEF-MNDWYPDVDDSGFVMLAIXNIRVRDKKHQEQAIKRGIAWCLEMQSENG-GWGAFDKDNTKYLLNKIPFADLEALIDPPTADLTGRMLELMGNFDYSASYPAAVRALEFLK-KEQEPEGPWWGRWGVNYIYGTWSVLCGLEAIGEDMSQPYIRKAVNWLKSKQNLDGGWGE
>seq_ID 301
S PVWDTALALVAMQE AGVPKD H P ALVKAAQW LLD LEVRRKGD WQIKS PELEPGG-WAFEFLNDWYPDVDDSGFVIMAIRDIKAPDKKHKEQAIKRGIAWCLGMQSKNG-GWGAFDKDNTKHLLNKIPFADLEALIDPPTADLTGRMLELMGSFDYPMDHPAAARALEFLK-KEQEPEGPWWGRWGVNYIYGTWSVLCGLESIGEDMSQPYIKKAVNWLKSKQNMDGGWGE
>seqLlD 276
SPVWDTLLTLLAMEDCDRGLTPSMQRALEWVLAQEVRYAGDWSKKVKGVEPSGWAFERAN-LNYPDIDDTAVALIVLARLPRAWLDEPRIRATIDRVLGWTLAMQSSNGGWAAFDKDNDRPIIT-KIPFCDFGEALDPPSADVTAHVLEALGLPGFDRRHPAVERGYKFLRSEQEADGSWF-GRWGVN HIYGTAAVLPALASIXEDM
>seq_ID 283
SPVWDTCLTSNALVESGGDTSAPHVHRSVQWLLNQEIRNHGDWSVKAPKVGPSG-
WAFEFANKVYPDVDDAAEVIIALANYSNDSGTAPPDAIARGVRWISGMQSSNGGWGS-
FDKNNTSFFVTRLPFFDFGEVIDPPSVDVTAHVIEALAVAGWQEKASKQIQKALDYIWSE-
QEADGPWFGRWGINYIYGTCAVLSALEAIGYDMADARVVKALKWIEECQNADGGWGE
>seqLlD 307
SPVWDTPWMIEALLETGVPPGDPALLRAGRWLMSKQITGVRGDWAMKSPKGKPGGWAFE-FENDYYPDVDDTIQVLTALCKLSIPWREKEKAVMQGIDWLISMQNDDGGWGAF-DRNQTRWIVNRIPFSDHKACLDPSSPDITGRMVEFLMRRNYSTSHPSVKKALKYIRETQEDF-GAWFARWGINYIYGTWCVLTALAAMGIGHTDSRVAKAVAWLSSVQRPDGGFSE-AADTYHPHKPFESYSESVPSQSAWALMGLVAGGAVHSPAAARAACYLINNRNLNNG-WDERHYTGTGFP
>seq_ID 267
SPVWDTAISVIALAESGLHRGHPSLVQATEWLVANEIRRGGDWQVKNPTAPISGWAFEFKND-FYPDVDDTAMVLLALRHVHLYNDDVSQDREKSYLRGLNWMLSMQCKNGGWAAFDRDNVK-TIFEKIPFADHNAMIDPPSVDITGRVLELLGYVGYDKSYPCVTKALEYIKKDQEADGSWYG-RWGVNYIYGTWQVLRGLAAIGEDMQSEYVQKAVRWM KSVQNPDGGWGE
>seq_ID 309
SPVWDTVLSITALADADLPRTHPAMRRAVAWVLGKQVLCEGDWRVKNRRGEPGGWS-FEFNNNFYQDNDDTAAVLIALHKARLPDEAKGEAMQRGLRWLLSMQCDDGGWSAFDVNNN-KRLLNKIPFADLESMLDPSTCDLTGRTLEALGSIGFPFTHRIVQHAVRFIRQHQEADGAWYG-RWGVNYIYGTCHVLCGLLSVGEDMHQPYVQRAVQWLIEHQNADGGWGE
>seqJD 202
MVYSYEMMVLLDYPEDHPLRVECKAALKKLWHRDDGS-SYCQPCLSPVWDTAWSVMALEQAPSDARTETAIARAYDWLTDRQVLDLRGDWENNAAPST-PPGG WAFQYE N PYYPDID DSAWLAM LH ARG KRTGQPG RY E M PVARCLDWIIGLQSRNGGF-GAFDANCDRDFLNAIPFADHGALLDPPTEDVSGRVLLALGITERPQDATARER-CIQYLRDTQQPDGSWWGRWGTNYIYGTWSVLAGLGLAGVDRKLPMVRNGLQWLRG-KQNADGGWGETNDSYARPELAGKHEDGSMAEQTAWAMLGQMAVGEGDADSVHRGAAYLL-DAQNEDGFWMHPYHNAPGFPRIFHLKYHG
>seq_ID 306
SPVWDTPWTVMALLEAGVPSNDPALLRSGRWLLAKQITDTKGDWAIKNKNTAPGGWSFE-FENKYFPDVDDTIEVLHCLHKLAIPWREKEKPCRLGIDWLLSMQND-DGGWGAFDKNQKRQWNRIPFSDHGACLDPSSPDITGRMIEFLATQKFNSEYESVKRAL-KYIWKTQEDFGGWHARWGINYIYGTWCVLTGLRAIGFNMTDRRVQKALNWLESIQNKDGGF-GESPASYEECRYIPWKESVPSQTAWALMALVAGGGAGSAPAENAATFLINYRNSNGVWDEE-CYTGTGFP
>seq_ID 281
SPVWDTLLTL LAYQDC E LE M N DSAGRALDWILSQ E N SYRG DW AH RN KKLEPSGWAFE RAN-LHYPDIDDTSVALIVLARLPQAVRSRPDIKSAIDRALAWTLGMQCRNGGWAAFDRDNDKLIIT-
MIPFCDFSEALDPPSADVTAHVVEAMAHLGFDRSHKAVEKAYQYLLAEQEDDGSWF-
GRWGVNHIYGTAAVLPALAALGEDATVPHVKRAADWISAHQNTDGGWGE
>seq_ID 310
S PVWDT ALAVRALAAAG L P P E H P AM VKASEWLLTQQIFKPG DWSVKCP D LP PGG WAF E F-VNNWYPDVDDSSMVLVALKEGLADAAKHQAALQRGINWCLGMQSKNGGFASFDKDNT-KEWLNAIPFGDLKALVDPPTEDITARILEMMGAFGHGLDHPVAVRGLAYLHQTQRPEG-PWWGRWGVNYIYGTWSVLVALKRIGEDMSRPYVRRAVDWVKAHQNPDGGWGE
>seq_ID 311
S PVW DT ALAVRALAAAG L P P E H PAM VKASEWLLTQQ I FKPG DWSVKC P D LP PGG W AF E F-VNNWYPDVDDSSMVLVALKDGLVDAAKHQAALQRGINWCLGMQSKNGGFASFDKDNT-KEWLNAIPFGDLKALVDPPTEDITARILEMMGAFGHGLDHPVAVRALAYLHQTQRPEG-PWWGRWGVNYIYGTWSVLVALKRIGEDMNRPYVRRAVDWVKAHQNLDGGWGE
>seqLlD 290
SPIWDTAKAVNALHESGLPSDHPQLKAAARWL-VEKEVRKPGDWKMRVPHVDVGGWPFQFRNEFYPDVDDTAAVVMALGRVDERDVPGIKD-SITRGINWVTQMQCSCGGWAAFDVDVKREFLTKVPYADHNAMLDPPCPDITGRCLEMYG-RFPGVRKDADVQRVIEKGIEYLKKTQEPDGSWYGRWGVNYIYGTWQSLK-GLAAVGEDPSQPYIQKAAHFLKTHQNSDGGWGE
>seqLlD 292
SPVWDTAKAVNALHESGLPSDHPQLKAAARWL-VEKEVRKPGDWKMRVPHVDVGGWPFQFRNEFYPDVDDTAAVVMALGRVDERDVPGIKD-SITRGINWVTQMQCSCGGWAAFDVDVKREFLTKVPYADHNAMLDPPCPDITGRCLEMYGRF-P EVRKDAN VQ N VIAKGIEYLKKTQ EP DGSW YG RWGVN YIYGTWQSLK-GLAAVGEDPSQPYIQKAAHFLKTHQNSDGGWGE
>seq_ID 293
SPVWDTCLSLAALTEAGAQNDHPAVKQAVEWLLDHQIFVEGDWCAQASGLEPGG-WAFQYENDKYPDVDDTGMVLMSLLRAGVHDKEHKRKRVNQALNWVLGMQNPDGSWGAF-DIENNYEYLNKIPFADHGALVDPGTADLTARCVELLAMLGYDATFPPVKRALE-FLEHDQEEDGSWYGRWGVNYIYGTWSVLCALGAIGEDVAKPYVRKS-VQWLQDTQNEDGGWGE
>seq_ID 313
SPIWDTALAVRALTAAGMPPEHPAMVKASEWLLTQQIFKPGDWSVKCPDLPPGGWAFEF-VNNWYPDVDDSSMVLVALKEGLADTAKHQAALQRGINWCLGMQSKNGGFASFDKDNT-KEWLNAIPFGDLKALVDPPTEDITARILEMMGAFGHGLDHPVAVRALAYL-HETQRPGGPWWGRWGVNYLYGTWSVLVALKRIGEDMSRPYVRRAVDWVKDHQNLDGGW-GE
>seq_ID 304
SPVWDTPWMVMALLEAGVPTDXPGLLRAGRWLISKQITGVHGDWAVKNRHALPGGWSFE-FENDYFPDVDDTIEVLHVIHRLAIPWEEKSECCRLGLDWLLSMQNDDGGWGAF-DRNQTLVMVNRIPFSDHAACLDPSSPDIVGRVLEFLASRSFSREHPAVKRALDYIWREQS-P FGG WWARWGID YLYGTWCVLTG LRAIGWDM EDPRVRKAVAWL ES V ARPDGG YG ES P E-SYRDHSYVEWKRSVPSQTAWALMGLVAGGVGHGKAARGAADYLLTSRNAQGGWDEMDY-TGTGFP
>seq_ID 291
SPMWDTAKAVNALHESGLPSDHPQLKAAARWL-VEKEVQ KPGDWKM RVPYVD VGGWPFQ FRN E FYP DVDDTAAVV M ALG RVDE RD VPGIKD-SITRGINWVTQMQCSCGGWAAFDVDVKREFLTKVPYADHNAMLDPPCPDITGRCLEMYGRF-P EV RKDVD VQRVIEKGIEYL KKTQ EPDGSWYG RWG V N Yl YGTWQS LK-GLAAVGEDPSQPYIQKAAHFLKTHQNSDGGWGE
>seq_ID 318
SPVWDTGLALHALLESGMDPDDPAIAKAMHWLDEREITDVAGDWAEQRPGLAPGG-
WAFQYRN D H YPD V D DTA W G M AM H RAN PQ ARPETLERTRAWIEGMQSQ NGGWGAF-
DADNTHYHLNHIPFADHGAMLDPPTADVSARCLGMLSQMGYDRD-HPSIQRAIAYLKNDQEEDGSWFGRWGTNYIYGTWSVLSALNAA-GEDMSQPYIRKAVDYLTNFQREDGGWGE
>seqL lD 294
SPVWDTCLSLAALTEAGAQNDHPAVKQAVEWLLDHQIFVEGDWCDQAPGLEPGG-WAFQYENNKYPDVDDTGMVLMSLLRAGVHDKEHKRKRVNQALNWVLGMQNPDGSWGAF-DIENNYEYLNRIPFADHGALVDPGTADLTARCVELLAMLGYDATFPP-VKRALEFLEQDQEEDGSWYGRWGVNYIYGTWSVLCALGATGEDVAKPYVRKS-VQWLQDTQ N E DGGWGE
>seq_ID 320
SPVWDTCLGLHALLEAGEPREAPSVKKAVDWLLEREITETYGDWVWRRPHLKPSG-WAFQYWNNYYPDVDDTAVWMALDRVGDPRCRPAIERACEWIIGMQSTSGGWGS-FDPENEFTYLNHIPFADHGALLDPPTVDVTARCISMLAQVGYRHDHPAIRKSVXFILREQEK-DGSWYGRWGTN YVYGTWS ALSALN AVG ED M SSPVVRKG VAWLE AFQQ PDGGWG E
>seq_ID 295
SPVWDTCLSLTAMTESGAHPEHPAVKQAVEWLLDQQIFVKGDWADQAKNLEPGG-WAFQFE N D RCPDVDDTG M V LMALLRAGVQ D KEH Kl KRIN QAVNWVLG M Q N PDGSWGAF-DIGNDHEYLNNIPFADHGALVDPGTADLTARCVELLAMLGYGPDFPPIQRAVAFLERDQEEF-GAWYG RWGVN YIYGTWS VLSAIGILGEDYAKPYVRKAV EWLKEIQNDDGGWGE
>seq_ID 324
SPVWDTSLAAHALLEAGEPNDPEVIGLLDWLKDKQILTTVGDWSARRPNLRPGGWAFQYEN-PHYPDVDDTAVVAMAMHRQGDPKYAEAIARACEWLAGMQSSS-GGWGAFDPENEHFYLNSIPFADHGALLDPPTVDVTARCVGCLAQVDAERFA-S El QAGIDYIKREQEEDGSW FGRWG AN YVYGTWSALVALN KAG EDMNT-PYIRRAVDWLKARQRPDGGWGE
>seqLlD 296
SPVWDTCLSLNALTEADMPANDPRVRAAVQWLFDRQIFVRGDWSENAPELEPGG-WAFQYENDKYPDVDDTGMVLMSLLRANAHEHDAQRKRMNQALNWVLGMQNSDGSWGAF-DIDN H YTYL N NIPF AD H GALVD PGTAD LTG RCIELFGM LG YD KN FTP ARRGIE F-LKRDQHPCGGWYGRWGVNYLYGTWSVLTALGAIGEARDAPYLRRAVEWLYSVQNDDGGW-GE
>seq_ID 305
SPVWDTPWMVMALLEAGCPANDPXLIRAGRWLKAKXITEVRGDWAVKNRKALPGGWSFE-FENDYFPDVDDTIEVLSVIHRLSIPWNEKAKSCRLGLEWXLSMXNRDGGWGAFDRE-QXFKVVNRIPFSDHAACLDPSSPDITGRM-VEFLASXN FS KG H VAV RRALD Yl WKQQ AXFGGWWARWGIDYLYGTWCVLT-GLASLGFXMDDPRARKAADWLESIQHADGGFGESPESYREDSFVDWKRSVPSQTAWALM-G LVAAG RASGAAAQ RAAAWLLDN RNTNGSW D EQ D YTGTG F P
>seq_ID 282
SPMWDTSLAAHALMEADGRGDPKDNPRLISAMDWLADKQILDHVGDWAVRRPDVRPGG-WAFQYENPDYPDVDDTAVWMAMHRADPERYEMSIDRACEWLVGMQSKNGGWGAFE-PENEHYYLNSIPFADHGALLDPPTVDVTARCVGALAQVDRDRYAAEIANGIRSIRRE-QEDDGSWFGRWGANYVYGTWSALVALKGAGEDMQQPYIRRAVDWLKARQRSDGGWGE
>seq_ID 316
SPVWDTAWAVIGLCESGMERTHPAVRSAIRWLYSMQILRPGDWAVKNPLTEPGG-WAFEFHNDFYPDNDDTAAVLMGLLFSDLNDEENHRAFERGVRWLLSMQNNDSGWGAFERN-VDNKIFDQIPFNDQKNMLDPSTADVTGRVVELLGRIGRRLGGSFSDEPYVRQAIEFLKNEQEP-EGCWFGRWGVN Yl YGTWSVLVALEAIGES M RAPYIRKAVN WVKKVQN PDGGWGE
>seq_ID 256
SPIWDTGIVLHSLVESGVSPDHEALLRSVSWLLAKEVTHEG-
DWKVKCPDAPVGGWYFEYANEFNPDCDDTAKVLMATSRFSSVDFPDAGRLRDARN-
RGLQWLLHMQNKDGGWAAFDKGCDNELLTYIPFADHNAMIDPSTEDITGRVLETLAREG-
FDNTHPWKRAIQYLHKTQDAEGPWYGRWGSNFIYGTWLVLQGLKAVGEDMTX-
PRYQRAANWLLNVQNXNGSWGE
>seq_ID 323
SPMWDTS LAAHAFLESGDREDPRLIRALDWLVDKQILDHVGDWAVRRPGLRPGG-WAFQYENPDYPDVDDTAWAMAMHRTDPERYAENIDRACEWLAGMQSKNG-GWGAFDPENEHYYLNSIPFADHGALLDPPTVDVTARCIGCLAQVDAEAFADNIKRGIGFIKRE-QEPDGSWFGRWGANYIYGTWSALVALKGAGEDMSQPYIRKSVAWLKGRQGPDGGWGE
>seq_ID 274
SPVWDTILSMQALLDTKEVFQPSPTLKKAMEWLLEQQVRAWGDWKVYVSDARGGG-WAFQRANSFYPDVDDTIMVMMALRNVSPRGESKWDEAIERALFWVLGMQCEDGGWAAF-DRDNAKAFLTKVPFADHNAMIDPSTADLTSRTFEMFAMIAPEVFTIHHPVVRR-GLEFLKKDQCKDGSWFGRWGVNYMYGTWQVLRGLRLIGEDMSKGYVRKGVEWFKS-VQLEDGGWGE
>seq_ID 284
SPVWDTVAQLHALIASGLARRDEALRRAASWLLTRQSRTHGDWSGRN-PAEPGGFYFEFRNEFYPDVDDTAMALMVLTQAEANVATDVGHAAIARALAWMLGMQNRD-GGWAAFDRDNDKHFLTQVPFADHNAMIDPSTADITGRVLGALSHVPSYGPDHPSVRRAIAF-LQRDQEPDGSWYGRWGVNYLYGTGQVLRGLRAIGFDMQQPFVRRAARFLSAHQNDDGGW GE
>seq_ID 285
SPVWDTAITIIALAESGLPKNHPAFEQAATWLEKKEIRFKGDWAVRMPGVEPSG-WAFEHENKYYPDTDDTMMVLMALRHVQSRNSAERCEQFDRALKWLLAFQCQDGG-WAAFDKDVTASWLEHVPFADHNAILDPTCSDLTARVLELLGSISFDRQSAIVRRAVAMM-RRTQETDGSWYGRWGVNYIYGTWQALRGLAAIGENMDQEWIRRGRDWLESCQNDDGGW-GE
>seq_ID 308
SPVWDTAIAGYALGESGCAPQSALRRMADWLLTKEVRRKDDWSVKRPD-VEPSGWYFEFANEFYPDTDDTAMVLLSLLHGRATNPAAQEACAKRAVNWLLAMQSKDGG-WAAFDVDNDWKPLSYVPFADHNAMLDPSCPDITGRVLEALCKYGVSQEHPAVLRAIDYLI-QTQ EQ DGSWHG RWGVN YVYGTF LALRG LKAAGVSD RE AYVL RAG EW LDLIQ N PDGGWG E
=-seq_ID 288
SPVWDTAITAVSLAESGLEPDHPALQKSAEWLLDKEVRIQGDWAIKNRHGEASG-WAFEFNNEFYPDVDDTLKVLLALRLIKTRDEETKREAMERALGWVMSFQCSDGG-WAAFDKDVTQRWLEDVPFADHNAILDPTCSDITARCLELLGKMGCTSDHPAVRRALRMV-RETQEPDGTWWGRWGVNYIYGTWQILRGLSALKIDMNQDWIVRAKEWLESCQNPDGGWGE
>seq_ID 287
SPVWDTAITSVALTSSGVKPDHPQIQKAADWLLDREVVMRGDWKVKNPYPHASGWAFEFNN-DFYPDADDTFKVLLALMKMKSSDPERQRKIMDRALDWARSFQCKDGGFAAFDKDVTKKW-
LEHVPFADHNAILDPSGSDITARGLECMGKLGWPRTDRVIRRAIRYLKKTQEEDGS-
WWGRWGVNYIYGTWQSLRGLEAIGEDMNQDWWRARNWLESCQNPDGGWGE
>seq_ID 289
SPIWDTAIVTMAIAESGQDPNDPRLQKAADWLLEREIGFRGDWRENCDFPEATGWAFEFNN-DWYPDVDDTFQVILGLKPLSASDSRRQEQTLDRAIRWCRAMQCREGGFAAFDKDINDAWL-NEVPFADHNAILDPPCSDITGRALETLSLMGFDREDPVVRRARQYLMETGLEDGSWF-GRWGVNYIYGTGHALRGLHAIGEDINGSAMQRARNWLENCQNDDGGWGE
>seqLlD 286
SPVWDTAIIMVISLAESGLLSDHPALQKAADWLVNKEVRFRGDWSVNNSYPQVSG-WAFEYNNVYYPDTDDTAMVLMALRLIRPKDPQALNELFRRALDWQLSFQCRDGG-WAAFDKNVTTPWLEDMPFADHNAILDPTCSDLTARTLELLGYTGFDPKAQSVRDALQYLID-TQDEDGSWYGRWGVNYIYGTWQVLRGLRAMGQDMTQDWILRGRDWLESCQNSDGGWGE
>seq_ID 270
SPVWDTALAMSALLEGDTAPDDEALQRGCRWLLGKEVRHRG-DWQVNVGAEPGGWFFEYENEFYPDCDDTAEV-
LAVLERVRLSDPEEDQRRRDALDRALAWQLGMQSTNGGWGAFDKDCDHRILELVPFAD-
HNAMIDPPTVDVTSRSIEAALAMGVPASDAAIRRAVRFLYSEQEADGSWYGRWGSNYLY-
GTWLALCALRSAGEDLTSPAVQRAVEWLLSVQQEDGGWGE
>seq_ID 322
SPVWDTGIAAHALGEAGHASAMQSTADWLLTKEVRRKGDWSVKRPD-VEPSGWYFEFANEFYPDIDDTAQVLLGLAHAKASDPAKQKACMDRAVAWLLAMQGSDGG-WAAFDVDNNWEFLSSVPFADHNAMLDPTCPDITGRVLEALAACGVPNSHPAVKRG-VEFLRNSVEKDGSWYGRWGVNYIYGTYLALRGLRASGEDDREAHILRAGEWLRAIQNAD-GGWGE
>seqLlD 263
SPVWDTSLILNALLAGSEKTETDPKILKAGQWLLDREVREIGDWKIKNNRG-PVGGWYFEYANEFYPDCDDTAEVITVLNQMQFSDPEKEKAKQVAQQRGLDWLLSMQNK-DGGWPAFDKNCDKQSLTYMPFADHNAMIDPSYEDITGRTLEALASLGFSEDDPIVRRAVD-FLKSKQLPDGTWYGRWGCNFLYGTWLAISGLYHAGEDLNEERYQSLLSWLEQCQNEDGGW-GE
>seq_ID 268
SPVWDTCLILNSMLEHLEPDHPRVQKAAEWLLSKEVTEPGDWQVKCPE-APVGGWYFEYANEFYPDCDDTAEVLAALQRVQFTDA-
DREAQKRGAIQRGLGWLLAMQNQDGGXAAFDRECTREALTYVPFADHNAMIDPSNGDIT-
GRVLKALDYAGYSPDDPIVRGGVDFLLANQEPDGTWYGRWGCNHLYGS-W LWWG LKH AGVN LQQTQFTQVM SWLESCQN ADGG WGE
>seqLlD 265
SPVWDTTNAMTAVLDAGLPGNHPAVLRAARWLLSKEVRMPGDWRLWYKNGE-PGGWFFEYNNEFYPDADDTAEALHCLCRWFDCEDEMDR-CRAAIKRGLNWQFACQNPDGGWPAFDKECDDEYLTFIPFADHNAMIDPSCCDIT-GRSLQALSKLGYTTNDVDVKRAIDYLLDAQEDDGTWYGRWGINYIYGTWLAVQGLRAIGVDL-SEKRFQKVTKWLRKKQNPDGGWGE
>seq_ID 269
SPVWDTCLILNSLLEHLEPDHPRLQHAAEWLLSKEVTEPGDWQVKCPE-APIGGWYFEYANEFYPDCDDTAEVLAALQRVRFSDADREAQKHAAIERGLGWLLAMQNGD-GGWAAFDRECTREALTYVPFADHNAMIDPSNGDITGRVLKALDYSGRSPQDPVVQGGVH-FLLANQEPDGTWYGRWGCNHLYGSWLAIWGLKHAGVDSQQSQFMRLLSWLE-SCQNPDGGWGE
> s e q J D 319
SPVWDTSLSAHALMEAGLEENDKRLEGLLDWLKDLQILDVKGDWVARRPDVRPGG-
WAFQYRN D H YP D V D DTAWAM AM H RQGDE KYKE Al D RAAEWIVGMQSSS-
GGWGAFDPENEHFYLNSIPFADHGALLDPPTEDVTARCVGFLAQLDPDAYAEPIKRG-
VEFLKRTQQEDGSWWGRWGANFVYGTWSVLCALNAAGEDPKSPYIQKAVAWLKS-
RQREDGGWGE
>seqJD 321
SPVWDTGIACQALQEVGGPAADAGVQRALDWLVERQLRDEPGDWRRDRPDLEGGG-WAFQYNNPHYPDLDDTSMVAWVMQVADHGRYREEIRRAAKWWGMRSEGGGFASFEVDN-TYYYLN HIP F AD H GXLLDP PTXDVT ARCIAVLAITD RAQH ETVIREAIDFLFVDQEEDGSWF-GRWGTDYIYGTWSVLSXLDWGFDMRDARVRXSVEWLFXQQNPDGGWGE
>seqLlD 272
SPVWDTGLVALALQEVDKHNSQDALQRNLKQAYSWLLSKQLKDEPGDWRISKPTLTGGG-WAFQFNNPHYPDVDDTAVVAFALAQAEHTELDESIHLATRWIEGMQSQNG-GYGAFDVDNTFYYLNEIPFADHGALLDPPTADVSARCAMLMARVAKDHEEYLPALERTIQYLR-SEQEADGSWFGRWGTNYVYGTWSVLLGLEQTNVPKTDPLFTKAAQWLKSVQRPDGGWGE
>seq_ID 273
SPVWDTGLVALALPEVDKHNSQDALQPNLKQAYSWLLSKQLKDQPGDWRISKPTLTGGG-WAFQFNNPHYPDVHDTAVLAFALAQAEHTELDESIHLATRWIEGMQSQNG-GYGAFDVDNTFYYLNEIPFADHGALLDPPTADVSARCAMLMARVAKGHEEYLPALERTIQYLR-SEQEADGSWFGRWGTNYVYGTWSVLLGLEQTNVPKTDPLFTKAAQWLKSVQRPDGGWGE
>seq_ID 317
SPVWDTILGMIGLVDCGHDGKDPLLVTARDWIVKRQLLVNYGDWKVYNPNGPSGGWS-FEYDNSWYPDVDDTAAIVIGFLKQDYEFRHSEVVKRACDWIASMQNQXGGWAAFDINNDKT-FLNEIPFSDMESLCDPSSPDVVGRVLEAFGILNDPKYAEVCRRGIEYLRRTQESEGSWF-GRWGVNYVYGTSNVLCSLKRQDVAXKDPMVTRALTWLKKVQNKDGGWGE
>seq_ID 215
MGRQTRNLTRREPAAEAEERGFRLLDAHRRADSSWVGELSSSALATAMSALALRLLGH-PAESGPVAGGLAWLAATRNPDGGWGDAPGEPSNMNATSIAAAALARCAPRRYREE-VAGGRRWVEEHGGFAALNDPRTTTLSGPGRTLWALAGLVPPERVRKLPTEMILLPRRIRRT-VSTTFPAFLSLSLLHERFRPSPRWRRPLRRRAEREALAWLRRAQGPNGSYEESAFLTS-LIAAALTAAGAEGGDIVRRALPFVLRSRRPDGSWPIDRDLENFDTTQAILAHHEAGRPLREA-GRVREWLLDNQFRRPFFPTSSPPGGWAWAYPAGWPDTDDTACALRSLRLL-GVPAGHPSIRLGLRWLYRMQNRDGSWPTFVRGSRMPFDHGCPYITSQVLSALA-LMGPEARRGAPLRRALAYLRRAQRPDGSLGSLWFRPHTRGTAAAVEAFSDLGLS-GDPLVGRAARWLAEHQNPDGGWGDGHGAPSTAEETAWASAALLRLGGGEAARKGVRWL-VEHQDPGGWKPAVIGLYYASLSYSDTFYALSYPLVALARHRRLSR
>seq_ID 191
MIKKILVLILLMWVTSKVDIERVQTVIRDAREICWNELTDNEWVYPTYLGTLFLSEYYFEL-KALGIQNSQFEESKFTQILLGSQLPDGSWVQVEDAYIQTGQLDATIFNYWYLKAVGIDIHT-DTMKKAQEWIKANGGIEKAQTMTKFKLAMFGQYPWKKLFKIPLILFYKKFNPLYIK-DITAQWVYPHMTALAYLQNQRIIFNVAVSISELYKNKAPKIKNHQKKGRPSFFINN-LVQEMLKLRQPMGSFGGYTVSTLLSMLALN DYTGRTNKHKSEISDALKKGLDFVEFNY-FNFRQAYHGSLDDGRWWDTILISWAMLESGEDKEKVRPIVENMLQKGVQPNGGIEYGYDFG YAPDADDTGLLLQVLSYYGTDYADAMDKGAEFVYSVQNTDGGFPAFDKGKMGKN-PLYKYAFKIAGIADSAEIFDPSSPDVTAHILEGLISSDRSNYDWVKSLKYFMDTQENFGS-WEGRWGINYIYAAGAVLPALKKMNNGWAKAVNWLVSKQNADGGFGETTLSYRDPKKYN-GIGVSTVTQTSWGLLGLLAVEDHYDVKEAIEKARDGEFKDISVVGTGHRGL-LYLQYPSYARSFPVISLGRFLDQQR

Claims (19)

REIVINDICACIONES
1. Mutante de enzima con actividad ciclasa, seleccionado entre mutantes de una enzima de tipo natural que comprende una secuencia de aminoácidos de acuerdo con SEQ ID NO: 2 o una secuencia de aminoácidos derivada de la misma con un grado de identidad de al menos 75% con SEQ ID NO:2; en donde el mutante cataliza al menos la ciclación de un isómero de citronelal para dar al menos un isómero de isopulegol, y una mutación en una posición de acuerdo con F486 de SEQ ID NO: 2.
2. Mutante de enzima según la reivindicación 1, en el que la mutación en la posición F486 de SEQ ID NO:2 es una sustitución seleccionada entre F486N, F486Q, F486L, F486M, F486E, F486G, F486S, F486V, F486T, F486C, F486I y F486A.
3. Mutante de enzima según una de las reivindicaciones anteriores, en el que adicionalmente está presente al menos una mutación en una de las posiciones W374, D437, D440, F428, W555, Y561, Y702, Y705 de la SEQ ID NO: 2.
4. Mutante de enzima según una de las reivindicaciones anteriores, en el que no está presente ninguna mutación en la posición D437 y/o D439 y/o D440 de la SEQ ID NO: 2.
5. Mutante de enzima según una de las reivindicaciones anteriores, en el que no está presente ninguna mutación en la posición Y702 de la SEQ ID NO: 2 o en caso de que esté presente una mutación, esta es una sustitución Y702F o sustitución correspondiente.
6. Mutante de enzima según una de las reivindicaciones anteriores, que dado el caso está además mutada en al menos una de las posiciones P229, D439, D508, E601, G553, G556, N432, P436, P499, R224, S371, T376, T563, W414 o W624 de la SEQ ID NO: 2.
7. Mutante de enzima según una de las reivindicaciones anteriores, seleccionado entre
a) los mutantes sencillos
F486X con X = N, Q, L, M, E, G, S, V, T, C, I o A de acuerdo con SEQ ID NO: 2
Y702X con X = F, A, C o S de acuerdo con SEQ ID NO: 2
Y561X con X= A o S de acuerdo con SEQ ID NO: 2
b) los mutantes múltiples F486A / Y702A, F486A / Y561A o F486A / Y705A de acuerdo con SEQ ID NO: 2.
8. Mutante de enzima según una de las reivindicaciones anteriores, que muestra al menos el 50 % de la actividad citronelal-isopulegol-ciclasa de una enzima que comprende una secuencia de aminoácidos de acuerdo con SEQ ID NO: 2 de posición 1 a 725, 2 a 725 o 16 a 725, dado el caso alargada en el extremo N-terminal mediante un resto metionina.
9. Mutante de enzima según la reivindicación 8, en el que la actividad citronelal-isopulegol-ciclasa se determina con el uso de un citronelal como sustrato de referencia en condiciones estándar.
10. Mutante de enzima según una de las reivindicaciones anteriores, en el que la mutación se realiza en una enzima que comprende una secuencia de aminoácidos de acuerdo con SEQ ID NO: 2 de posición 1 a 725, 2 a 725 o 16 a 725, dado el caso alargada en el extremo N-terminal mediante un resto metionina.
11. Secuencia de ácido nucleico que codifica para un mutante según una de las reivindicaciones anteriores.
12. Casete de expresión que comprende una secuencia de ácido nucleico según la reivindicación 11.
13. Vector recombinante que comprende bajo el control de al menos un elemento regulador al menos una secuencia de ácido nucleico según la reivindicación 11 o al menos un casete de expresión según la reivindicación 12.
14. Microorganismo recombinante que contiene al menos una secuencia de ácido nucleico según la reivindicación 11 o al menos un casete de expresión según la reivindicación 12 o al menos un vector según la reivindicación 13.
15. Procedimiento para la preparación de isopulegol de la fórmula general (I)
Figure imgf000159_0001
en donde se cicla citronelal de la fórmula general (II)
Figure imgf000160_0001
para dar isopulegol de la fórmula (I) por medio de un mutante de enzima según una de las reivindicaciones 1 a 10, o en presencia de un microorganismo que expresa este mutante de enzima según la reivindicación 14.
16. Procedimiento para la preparación de mentol de la fórmula III
Figure imgf000160_0002
en donde
a) se cicla citronelal para dar isopulegol según un procedimiento de acuerdo con la reivindicación 15 y b) isopulegol se hidrogena de manera catalítica para dar mentol.
17. Procedimiento según la reivindicación 16, en donde la hidrogenación se realiza en presencia de hidrógeno y un catalizador que comprende
- del 30 al 70 % en peso de compuestos de níquel que contienen oxígeno, calculado como NiO,
- del 15 al 45 % en peso de compuestos de zirconio que contienen oxígeno, calculado como ZrO2 ,
- del 5 al 30 % en peso de compuestos de cobre que contienen oxígeno, calculado como CuO y
- del 0,1 al 10 % en peso de compuestos de molibdeno que contienen oxígeno, calculado como MoO3, en donde los datos de % en peso se refieren al catalizador seco, no reducido.
18. Uso de un mutante de enzima según una de las reivindicaciones 1 a 10, de un ácido nucleico según la reivindicación 11, de un constructo de expresión según la reivindicación 12, de un vector recombinante según la reivindicación 13 o de un microorganismo recombinante según la reivindicación 14 para la ciclación de terpenos y/o terpenoides.
19. Uso según la reivindicación 18 para la reacción de citronelal para dar isopulegol; o para la reacción de escualeno para dar hopeno.
ES18203725T 2010-11-17 2011-11-17 Procedimiento para la ciclación biocatalítica de terpenos y mutantes de ciclasa que pueden usarse en el mismo Active ES2925777T3 (es)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP10191454 2010-11-17
EP11170812 2011-06-21
EP11183176 2011-09-28

Publications (1)

Publication Number Publication Date
ES2925777T3 true ES2925777T3 (es) 2022-10-19

Family

ID=44999775

Family Applications (2)

Application Number Title Priority Date Filing Date
ES11785004T Active ES2743161T3 (es) 2010-11-17 2011-11-17 Procedimiento para la ciclación biocatalítica de terpenos y mutantes de ciclasa que pueden usarse en el mismo
ES18203725T Active ES2925777T3 (es) 2010-11-17 2011-11-17 Procedimiento para la ciclación biocatalítica de terpenos y mutantes de ciclasa que pueden usarse en el mismo

Family Applications Before (1)

Application Number Title Priority Date Filing Date
ES11785004T Active ES2743161T3 (es) 2010-11-17 2011-11-17 Procedimiento para la ciclación biocatalítica de terpenos y mutantes de ciclasa que pueden usarse en el mismo

Country Status (4)

Country Link
EP (3) EP2640835B1 (es)
JP (4) JP6096667B2 (es)
ES (2) ES2743161T3 (es)
WO (1) WO2012066059A2 (es)

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6598852B2 (ja) * 2014-09-29 2019-10-30 ビーエーエスエフ ソシエタス・ヨーロピア ゲラニルリナロールの生体触媒環化方法及びこれにより得られる環化物
GB201507170D0 (en) 2015-04-24 2015-06-10 Givaudan Sa Process
GB201507207D0 (en) 2015-04-24 2015-06-10 Givaudan Sa Enzymes and applications thereof
MX2018010024A (es) 2016-02-19 2018-11-09 Basf Se Ciclacion enzimatica de acido homofarnesilico.
GB201618090D0 (en) 2016-10-26 2016-12-07 Givaudan Sa Product
EP3585902B1 (en) 2017-02-24 2021-07-14 Basf Se Method for the preparation of (3e,7e)-homofarnesic acid or (3e,7e)-homofarnesic acid ester
PL3585764T3 (pl) 2017-02-24 2021-09-20 Basf Se Sposób wytwarzania nienasyconych kwasów karboksylowych przez karbonylowanie alkoholi allilowych i ich produktów acylowania
GB201917688D0 (en) 2019-12-04 2020-01-15 Givaudan Sa SHC enzymes and enzyme variants
GB201917694D0 (en) 2019-12-04 2020-01-15 Givaudan Sa Enzyme mediated process
GB202005468D0 (en) 2020-04-15 2020-05-27 Givaudan Sa Enzyme-media process
CN116348602A (zh) 2020-09-02 2023-06-27 国际香料和香精公司 角鲨烯何帕烯环化酶衍生物及其用于生产降龙涎香醚的用途
KR20230110315A (ko) 2020-11-18 2023-07-21 우니베르지테트 스튜트가르트 비사이클릭 모노테르페노이드의 효소적 단환화
WO2023175123A1 (en) 2022-03-17 2023-09-21 Givaudan Sa Shc enzymes and enzyme variants
WO2023245039A1 (en) 2022-06-15 2023-12-21 International Flavors & Fragrances Inc. Squalene hopene cyclase variants for producing sclareolide

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE4428004A1 (de) 1994-08-08 1996-02-15 Basf Ag Verfahren zur Herstellung von Aminen
DE19931847A1 (de) 1999-07-09 2001-01-11 Basf Ag Immobilisierte Lipase
DE10019373A1 (de) 2000-04-18 2001-10-31 Pfreundt Gmbh & Co Kg Vorrichtung und Verfahren zur Steuerung eines Maschinenbauteils
DE10019380A1 (de) 2000-04-19 2001-10-25 Basf Ag Verfahren zur Herstellung von kovalent gebundenen biologisch aktiven Stoffen an Polyurethanschaumstoffen sowie Verwendung der geträgerten Polyurethanschaumstoffe für chirale Synthesen
DE10019377A1 (de) 2000-04-19 2001-10-25 Basf Ag Verfahren zur Immobilisierung von biologisch aktiven Stoffen auf Trägermaterialien und Verwendung der mit biologisch aktiven Stoffen geträgerten Materialien für chirale Synthesen
DE102004022686A1 (de) 2004-05-05 2005-11-24 Basf Ag Verfahren zur Herstellung optisch aktiver Alkohole
DE102004063003A1 (de) * 2004-12-22 2006-07-13 Basf Ag Verfahren zur Herstellung von Isopulegol
DE102005010804A1 (de) 2005-03-07 2006-09-14 Basf Ag Verfahren zur Herstellung optisch aktiver Alkohole
WO2009013192A1 (de) 2007-07-23 2009-01-29 Basf Se Verfahren zur herstellung von menthol durch hydrierung von isopulegol
JP5236233B2 (ja) * 2007-09-04 2013-07-17 花王株式会社 (−)−アンブロキサンの製造方法
CN102449158B (zh) 2009-06-05 2017-08-25 巴斯夫欧洲公司 龙涎呋喃的生物催化产生

Also Published As

Publication number Publication date
ES2743161T3 (es) 2020-02-18
EP4112727A2 (de) 2023-01-04
WO2012066059A3 (de) 2012-09-07
JP2017074053A (ja) 2017-04-20
EP3470515B1 (de) 2022-07-13
JP2018148906A (ja) 2018-09-27
EP2640835B1 (de) 2019-05-22
EP3470515A3 (de) 2019-05-29
WO2012066059A2 (de) 2012-05-24
JP7418272B2 (ja) 2024-01-19
EP2640835A2 (de) 2013-09-25
JP2013545465A (ja) 2013-12-26
JP6096667B2 (ja) 2017-03-15
EP4112727A3 (de) 2023-03-15
JP7011529B2 (ja) 2022-01-26
EP3470515A2 (de) 2019-04-17
JP2020167996A (ja) 2020-10-15

Similar Documents

Publication Publication Date Title
ES2925777T3 (es) Procedimiento para la ciclación biocatalítica de terpenos y mutantes de ciclasa que pueden usarse en el mismo
US10717973B2 (en) Method for the biocatalytic cyclization of terpenes and cyclase mutants employable therein
ES2718753T3 (es) Procedimiento para la ciclización biocatalítica de geranillinalool y los productos de ciclización obtenidos al respecto
EP3762498A1 (en) Processes for the production of tryptamines
ES2854724T3 (es) Ciclación enzimática de ácido homofarnesílico
ES2357115T3 (es) Método para la producción de 3-metilamino-1-( tien-2-il)-propan-1-ol.
BR112020017362A2 (pt) Método para produzir vanilina
US20230183761A1 (en) Biocatalytic method for the controlled degradation of terpene compounds
CN113302298A (zh) 罗汉果甙的生物合成
BR112021005879A2 (pt) processo enzimático para produção de produtos de lúpulo modificados
BR112020023411A2 (pt) Método para produzir compostos de albicanol
JP6230549B2 (ja) アルドキシムデヒドラターゼを使用するテルペンオキシムからのテルペンニトリルの製造方法
US20210310031A1 (en) Method for producing drimanyl acetate compounds
US20230151393A1 (en) Cytochrome p450 monooxygenase catalyzed oxidation of sesquiterpenes
US11214775B2 (en) Method for biocatalytic production of terpene compounds
JP7331839B2 (ja) 13-ヒドロキシ-9(z)-オクタデセン酸の製造方法
EP4013862A2 (en) Novel polypeptides for producing albicanol and/or drimenol compounds
JP2006204285A (ja) 新規アルドラーゼ並びに光学活性ihog及びモナティンの製造方法