ES2887366T3

ES2887366T3 - Métodos y composiciones para sintetizar fibras de seda mejoradas

Info

Publication number: ES2887366T3
Application number: ES14846179T
Authority: ES
Inventors: Brendan Turner; Lindsay Wray; Daniel Widmaier; David Breslauer; Josh Kittleson
Original assignee: Bolt Threads Inc
Current assignee: Bolt Threads Inc
Priority date: 2013-09-17
Filing date: 2014-09-17
Publication date: 2021-12-22
Anticipated expiration: 2034-09-17
Also published as: US20180298151A1; EP3046585A2; US20170088675A1; US20230192965A1; EP3973992A3; WO2015042164A3; JP6931934B2; US9963554B2; US20160222174A1; EP3046585B1; JP2019206542A; US10035886B2; JP2016531845A; US20200055996A1; US10435516B2; WO2015042164A2; US12577354B2; JP2024155944A; CA2924343A1; US11192982B2

Abstract

Un copolímero en bloques proteínico capaz de ensamblarse en una fibra, en el que el copolímero comprende al menos dos repeticiones contiguas, donde la repetición consiste en la secuencia de SEQ ID NO: 1396 o variantes permutadas circularmente de la misma.

Description

DESCRIPCIÓN

Métodos y composiciones para sintetizar fibras de seda mejoradas

Campo de la invención

La presente divulgación se refiere a métodos y composiciones dirigidos a proteínas de copolímeros en bloques sintéticos, constructos de expresión para su secreción, microorganismos recombinantes para su producción y fibras sintéticas que comprenden estas proteínas que recapitulan muchas propiedades de la seda natural.

Antecedentes de la invención

Los polipéptidos de seda de araña son polipéptidos grandes (>150 kDa, >1000 aminoácidos) que se pueden dividir en tres dominios: un dominio no repetitivo N-terminal (NTD), el dominio de repetición (REP) y el dominio no repetitivo C-terminal (CTD). El NTD y el CTD son relativamente pequeñas (~150, ~100 aminoácidos respectivamente), bien estudiados y se cree que confieren al polipéptido estabilidad acuosa, sensibilidad al pH y alineación molecular tras la agregación. NTD también tiene una etiqueta de secreción fuertemente predicha, que a menudo se elimina durante la expresión heteróloga. La región repetitiva compone ~ 90 % del polipéptido natural y se pliega en las regiones cristalina y amorfa que confieren fuerza y flexibilidad a la fibra de seda, respectivamente.

Los polipéptidos de seda provienen de una variedad de fuentes, que incluyen abejas, polillas, arañas, ácaros y otros artrópodos. Algunos organismos producen múltiples fibras de seda con secuencias, elementos estructurales y propiedades mecánicas únicos. Por ejemplo, las arañas tejedoras de orbes tienen seis tipos únicos de glándulas que producen diferentes secuencias de polipéptidos de seda que se polimerizan en fibras diseñadas para adaptarse a un nicho ambiental o del ciclo de vida. Las fibras reciben el nombre de la glándula de la que se originan y los polipéptidos están marcados con la abreviatura de la glándula (por ejemplo, "Ma") y "Sp" de espidroína (abreviatura de fibroína de araña). En los tejedores de orbes, estos tipos incluyen ampulácea mayor (MaSp, también llamado dragaline), ampulácea menor (MiSp), Flagelliform (Flag), Aciniform (AcSp), Tubuliform (TuSp) y Pyriform (PySp). Esta combinación de secuencias de polipéptidos a través de tipos de fibras, dominios y variación entre diferentes géneros y especies de organismos conduce a una amplia gama de propiedades potenciales que se pueden aprovechar mediante la producción comercial de fibras recombinantes. Hasta la fecha, la gran mayoría del trabajo con sedas recombinantes se ha centrado en las espidroinas ampulacéa mayor (MaSp).

Actualmente, las fibras de seda recombinantes no están disponibles comercialmente y, con un puñado de excepciones, no se producen en microorganismos fuera de Escherichia coli y otros procariotas gramnegativos. Las sedas recombinantes producidas hasta la fecha han consistido en gran parte en motivos de secuencia de seda corta polimerizados o en fragmentos de dominios de repetición nativos, a veces en combinación con NTD y/o CTD. Esto ha dado lugar a la producción de pequeñas escalas de polipéptidos de seda recombinantes (miligramos a escala de laboratorio, kilogramos a escala de bioprocesamiento) producidos mediante expresión intracelular y purificación mediante cromatografía o precipitación en masa. Estos métodos no conducen a una escalabilidad comercial viable que pueda competir con el precio de las fibras técnicas y textiles existentes. Los hospedadores de producción adicionales que se han usado para fabricar polipéptidos de seda incluyen cabras transgénicas, gusanos de seda transgénicos y plantas. Estos hospedadores aún tienen que permitir la producción de seda a escala comercial, presumiblemente debido a ciclos de ingeniería lentos y escasa escalabilidad.

Las microfibras son una clasificación de fibras que tienen una finura de menos de 1 decitex (dtex), aproximadamente 10 |im de diámetro. H.K., Kaynak and O. Babaarslan, Woven Fabrics, Croatia: InTech, 2012. El pequeño diámetro de las microfibras imparte una gama de cualidades y características a los hilos y tejidos de microfibra que son deseables para los consumidores. Las microfibras son intrínsecamente más flexibles (la flexión es inversamente proporcional al diámetro de la fibra) y, de este modo, tienen un tacto suave, baja rigidez y alta capacidad de drapeado. Las microfibras también se pueden hilar en hilos que tienen una alta densidad de fibra (mayor cantidad de fibras por área de sección transversal del hilo), dando a los hilos de microfibras una mayor resistencia en comparación con otros hilos de dimensiones similares. Las microfibras también contribuyen a un alivio discreto de la tensión dentro del hilo, lo que da como resultado tejidos antiarrugas. Adicionalmente, las microfibras tienen una alta eficiencia de compactación dentro del hilo, lo que mejora la impermeabilidad del tejido y la resistencia al viento mientras mantiene la transpirabilidad en comparación con otras técnicas de impermeabilización y protección contra el viento (tales como los recubrimientos de polivinilo). La alta densidad de fibras dentro de los tejidos de microfibras da como resultado estructuras de microcanales entre las fibras, lo que promueve el efecto capilar e imparte una característica de absorción y secado rápido. La gran área de superficie al volumen de los hilos de microfibra permite un teñido más brillante y nítido, y los tejidos estampados también tienen una retención de patrones más clara y nítida. Actualmente, las fibras de seda recombinantes no tienen una finura lo suficientemente pequeña como para dar como resultado sedas que tengan características de tipo microfibra. La Publicación de la solicitud de Patente de los Estados Unidos No. 2014/0058066 generalmente divulga diámetros de fibra entre 5-100 |im, pero en realidad no divulga ningún ejemplo de trabajo de cualquier fibra que tenga un diámetro tan pequeño como 5 |im. Zhang et al. (Comparative Biochemistry and Physiology Part B: Biochemistry and Molecular Biology, 2012-12-20 ELSEVIER, AMSTERDAM, NL - ISSN 1096-4959, Vol:164, Nr:3, Page(s):151 - 158) ADNc de MaSp1 y MaSp2 aislado de longitud completa en la telaraña de avispa Argiope bruennichi, e identificaron los motivos y secuencias de aminoácidos presentes.

Por lo tanto, lo que se necesita son métodos y composiciones mejorados relacionados con proteínas de copolímeros en bloques recombinantes, constructos de expresión para su secreción a altas velocidades, microorganismos que expresan estas proteínas y fibras sintéticas elaboradas a partir de estas proteínas que recapitulan muchas de las propiedades de fibras de seda, incluidas fibras que tienen pequeños diámetros útiles para textiles de microfibras.

Sumario de la invención

La invención proporciona copolímeros en bloques proteínicos capaces de ensamblarse en fibras, en los que los copolímeros comprenden al menos dos repeticiones contiguas, donde la repetición consiste en la secuencia de SEQ ID NO: 1396 o variantes permutadas circularmente de la misma, y métodos de producción de dichos copolímeros.

Un copolímero en bloques proteínico comprende un dominio cuasi-repetición, el copolímero capaz de ensamblarse en una fibra. En algunas realizaciones, el copolímero comprende una composición de alanina del 12-40 % de la secuencia de aminoácidos del copolímero, una composición de glicina del 25-50 % de la secuencia de aminoácidos del copolímero, una composición de prolina de 9-20 % de la secuencia de aminoácidos del copolímero, una composición de giro p del 15-37 % de la secuencia de aminoácidos del copolímero, un contenido de motivo de aminoácidos GPG del 18-55 % de la secuencia de aminoácidos del copolímero, y un contenido de motivo de aminoácidos de polialanina del 9-35 % de todos los aminoácidos del copolímero.

En algunas realizaciones, el copolímero también incluye un dominio no repetitivo N-terminal entre 75-350 aminoácidos de longitud y un dominio no repetitivo C-terminal entre 75-350 aminoácidos de longitud. En algunas realizaciones, el dominio cuasi-repetición tiene una longitud de 500-5000, 119-1575 o 900-950 aminoácidos. En otras realizaciones, la masa del copolímero es 40-400, 12.2-132 o 70-100 kDa. En algunas realizaciones, la composición de alanina es del 16 al 31 % o del 15 al 20 % de la secuencia de aminoácidos del copolímero. En otras realizaciones, la composición de glicina es 29-43 % o 38-43 % de la secuencia de aminoácidos del copolímero. En algunas realizaciones, la composición de prolina es del 11 al 16 % o del 13 al 15 % de la secuencia de aminoácidos del copolímero. En otras realizaciones, la composición de giro p es 18-33 % o 25-30 % de la secuencia de aminoácidos del copolímero. En algunas realizaciones, el contenido del motivo de aminoácidos de GPG es de 22-47 % o de 30-45 % de la secuencia de aminoácidos del copolímero. En otras realizaciones, el contenido del motivo de aminoácidos de polialanina es de 12-29 % de la secuencia de aminoácidos del copolímero. En algunas realizaciones, el copolímero comprende una secuencia de la Tabla 13a o la SEQ ID NO: 1374. En otras realizaciones, el copolímero consiste en SEQ ID NO: 1398 o SEQ ID NO: 2770.

En algunas realizaciones, un microorganismo manipulado comprende una molécula de ácido nucleico heteróloga que codifica una señal de secreción y una secuencia codificante, la secuencia codificante que codifica el copolímero descrito anteriormente, en la que la señal de secreción permite la secreción del copolímero del microorganismo. En realizaciones adicionales, el microorganismo manipulado es Pichia pastoris o Bacillus subtilis. En otras realizaciones, un cultivo celular comprende un medio de cultivo y el microorganismo manipulado. En otras realizaciones, un método de producción de un copolímero en bloque secretado comprende obtener el medio de cultivo celular y mantener el medio de cultivo celular en condiciones que dan como resultado que el microorganismo manipulado secrete el copolímero en una tasa de al menos 2-20 mg de seda/g DCW/hora. En realizaciones adicionales, el copolímero se secreta a una velocidad de al menos 20 mg de seda/g de DCW/hora. En otras realizaciones más, un medio de cultivo celular comprende un copolímero secretado como se describió anteriormente.

En otras realizaciones, la invención incluye un método de producción de una fibra que comprende obtener el medio de cultivo celular como se describió anteriormente, aislar la proteína secretada y procesar la proteína en una solución hilable y producir una fibra a partir de la solución hilable. En algunas realizaciones, una fibra comprende un copolímero secretado como se describió anteriormente. En algunas realizaciones, la fibra tiene un límite elástico de 24-172 o 150 172 MPa. En otras realizaciones, la fibra tiene una tensión máxima de 54-310 o 150-310 MPa. En algunas realizaciones, la fibra tiene una deformación de rotura de 2-200 % o de 180-200 %. En otras realizaciones, la fibra tiene un diámetro de 4.48-12.7 o 4-5 |im. En algunas realizaciones, la fibra tiene un módulo inicial de 1617-5820 o 5500-5820 MPa. En otras realizaciones, la fibra tiene un valor de tenacidad de al menos 0.5, 3.1 o 59.2 MJ/m3. En otras realizaciones más, la fibra tiene una finura entre 0.2-0.6 denier.

Estas y otras realizaciones de la invención se describen adicionalmente en las figuras, descripción, ejemplos y reivindicaciones en este documento.

Breve descripción de las figuras

La figura 1 representa la arquitectura jerárquica de las secuencias de polipéptidos de seda, incluida la estructura copolimérica en bloques de los polipéptidos de seda naturales. La figura 1 describe "AAAAAA" como SEQ ID NO: 2838.

La figura 2 muestra un procedimiento de cribado de dominios polipeptídicos de seda y su ADN que codifica según algunas realizaciones de la invención.

La figura 3 muestra cómo se ensamblan las secuencias de repetición de seda y los dominios terminales que pasan el cribado preliminar para crear copolímeros en bloques funcionales que se pueden purificar y transformar en fibras, según una realización de la invención.

La figura 4 muestra una transferencia de Western representativa de secuencias de repetición de seda expresadas y secuencias de dominio terminal.

La figura 5 muestra una transferencia de Western representativa de secuencias de repetición de seda expresadas y secuencias de dominio terminal.

La figura 6 representa el ensamblaje de un polinucleótido de seda del copolímero en bloques 18B a partir de las secuencias de repetición R1, R2, según una realización de la invención.

La figura 7 representa vectores de ensamblaje usados para ensamblar segmentos de polinucleótidos de seda, según una realización de la invención.

La figura 8 muestra la ligación de 2 secuencias para formar parte de una secuencia de polinucleótidos de seda, según una realización de la invención. La figura 8 divulga las SEQ ID NOs: 2839-2842 y 2841-2843, respectivamente, en orden de aparición.

La figura 9 es una transferencia de Western que comprende polipéptidos de seda de copolímero en bloques aislados de un cultivo que expresa un polipéptido de seda 18B.

La figura 10 es una vista ampliada con microscopía óptica de una fibra de copolímero en bloques producida mediante los métodos descritos en este documento.

La figura 11 muestra un gráfico de tensión frente a deformación para varias fibras de copolímero en bloques producidas según los métodos descritos en este documento.

La figura 12 es un diagrama de ensamblaje de varios dominios R de seda para formar un polinucleótido de copolímero en bloques, según una realización de la invención.

La figura 13 muestra una transferencia de Western de polipéptidos de copolímero en bloques expresados, siendo cada polipéptido un concatémero de cuatro copias de las secuencias de repetición de seda indicadas.

La figura 14 muestra transferencias de Western representativas de polipéptidos de copolímeros en bloques expresados adicionales construidos usando secuencias de repetición de seda y secuencias de dominio terminal de seda expresadas.

La figura 15 ilustra el ensamblaje de variantes permutadas circularmente de un polipéptido 18B, según realizaciones de la invención.

La figura 16 muestra una transferencia Western de péptidos copolímeros en bloques expresados construidos usando dominios de repetición de seda que constan de entre 1 y 6 dominios R, que incluyen variantes permutadas circularmente y variantes expresadas por diferentes promotores o diferentes números de

La figura 17 son curvas de tensión-deformación que muestran el efecto de la proporción de estiramiento de las fibras de copolímero en bloques de un polipéptido 18B.

La figura 18 es una curva de tensión-deformación para una fibra de copolímero en bloques que comprende la SEQ ID NO: 1398.

La figura 19 muestra los resultados de los espectros FTIR para fibras de copolímero en bloques hibridadas y sin tratar. La figura 20 muestra micrografías electrónicas de barrido de fibras de copolímero en bloques de la invención.

La figura 21 ilustra gráficos que muestran el contenido de aminoácidos de diversas secuencias de repetición de seda que se pueden expresar como copolímeros en bloques útiles para la producción de fibras.

Descripción detallada de la invención

A menos que se defina lo contrario en este documento, los términos científicos y técnicos usados en proporción con la presente invención tendrán los significados que entienden comúnmente los expertos en la técnica. Además, a menos que el contexto requiera lo contrario, los términos singulares incluirán el plural y los términos plurales incluirán el singular. Generalmente, las nomenclaturas usadas en relación con, y técnicas de, bioquímica, enzimología, biología molecular y celular, microbiología, genética y polipéptido y química del ácido nucleico e hibridación descritas en este documento son las bien conocidas y comúnmente usadas en la técnica.

Los métodos y técnicas de la presente invención se realizan generalmente según métodos convencionales bien conocidos en la técnica y como se describen en diversas referencias generales y más específicas que se citan y discuten a lo largo de la presente memoria descriptiva a menos que se indique lo contrario. Véase, por ejemplo, Sambrook et al., Molecular Cloning: A Laboratory Manual, 2d ed., Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y. (1989); Ausubel et al., Current Protocols in Molecular Biology, Greene Publishing Associates (1992, and Supplements to 2002); Harlow and Lane, Antibodies: A Laboratory Manual, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y. (1990); Taylor and Drickamer, Introduction to Glycobiology, Oxford Univ. Press (2003); Worthington Enzyme Manual, Worthington Biochemical Corp., Freehold, N.J.; Handbook of Biochemistry: Section A Proteins, Vol I, CRC Press (1976); Handbook of Biochemistry: Section A Proteins, Vol II, CRC Press (1976); Essentials of Glycobiology, Cold Spring Harbor Laboratory Press (1999).

Se entenderá que los siguientes términos, a menos que se indique lo contrario, tienen los siguientes significados:

El término "polinucleótido" o "molécula de ácido nucleico" se refiere a una forma polimérica de nucleótidos de al menos 10 bases de longitud. El término incluye moléculas de ADN (por ejemplo, ADNc o ADN genómico o sintético) y moléculas de ARN (por ejemplo, ARNm o ARN sintético), así como análogos de ADN o ARN que contienen análogos de nucleótidos no naturales, enlaces internucleósidos no nativos o ambos. El ácido nucleico puede tener cualquier conformación topológica. Por ejemplo, el ácido nucleico puede ser monocatenario, bicatenario, tricatenario, cuádruple, parcialmente bicatenario, ramificado, en horquilla, circular o en una conformación con candado.

A menos que se indique lo contrario, y como ejemplo de todas las secuencias descritas en este documento bajo el formato general "SEQ ID NO:", "ácido nucleico que comprende SEQ ID NO: 1" se refiere a un ácido nucleico, al menos una parte del cual tiene o (i) la secuencia de SEQ ID NO: 1, o (ii) una secuencia complementaria de SEQ ID NO: 1. La elección entre los dos viene dictada por el contexto. Por ejemplo, si el ácido nucleico se usa como sonda, la elección entre los dos viene dictada por el requisito de que la sonda sea complementaria a la diana deseada.

Un ARN, ADN o un polímero mixto "aislado" es uno que está sustancialmente separado de otros componentes celulares que acompañan de forma natural al polinucleótido nativo en su célula hospedadora natural, por ejemplo, ribosomas, polimerasas y secuencias genómicas con las que está naturalmente asociado.

El término "recombinante" se refiere a una biomolécula, por ejemplo, un gen o polipéptido, que (1) se ha eliminado de su entorno de origen natural, (2) no está asociado con la totalidad o una porción de un polinucleótido en el que el gen se encuentra en la naturaleza, (3) está operativamente ligado a un polinucleótido al que no está ligado en la naturaleza, o (4) no se encuentra en la naturaleza. El término "recombinante" se puede usar en referencia a aislados de ADN clonados, análogos de polinucleótidos sintetizados químicamente o análogos de polinucleótidos que se sintetizan biológicamente mediante sistemas heterólogos, así como polipéptidos y/o ARNm codificados por tales ácidos nucleicos.

Como se usa en este documento, una secuencia de ácido nucleico endógeno en el genoma de un organismo (o el producto polipeptídico codificado de esa secuencia) se considera "recombinante" en este documento si una secuencia heteróloga se coloca adyacente a la secuencia de ácido nucleico endógeno, de manera que la expresión de esta secuencia de ácido nucleico endógena está alterada. En este contexto, una secuencia heteróloga es una secuencia que no es naturalmente adyacente a la secuencia de ácido nucleico endógena, ya sea que la secuencia heteróloga sea o no endógena (originada en la misma célula hospedadora o progenie de la misma) o exógena (originada en una célula hospedadora o progenie de la misma). A modo de ejemplo, se puede sustituir una secuencia promotora (por ejemplo, mediante recombinación homóloga) por el promotor nativo de un gen en el genoma de una célula hospedadora, de modo que este gen tenga un patrón de expresión alterado. Este gen ahora se volvería "recombinante" porque está separado de al menos algunas de las secuencias que lo flanquean naturalmente. En una realización, una molécula de ácido nucleico heteróloga no es endógena al organismo. En realizaciones adicionales, una molécula de ácido nucleico heteróloga es un plásmido o molécula integrada en un cromosoma hospedadora por integración homóloga o aleatoria.

Un ácido nucleico también se considera "recombinante" si contiene modificaciones que no ocurren naturalmente en el ácido nucleico correspondiente en un genoma. Por ejemplo, una secuencia codificante endógena se considera "recombinante" si contiene una inserción, deleción o una mutación puntual introducida artificialmente, por ejemplo, mediante intervención humana. Un "ácido nucleico recombinante" también incluye un ácido nucleico integrado en un cromosoma de la célula hospedadora en un sitio heterólogo y una construcción de ácido nucleico presente como un episoma.

Como se usa en este documento, la frase "variante degenerada" de una secuencia de ácido nucleico de referencia abarca secuencias de ácido nucleico que se pueden traducir, según el código genético estándar, para proporcionar una secuencia de aminoácidos idéntica a la traducida de la secuencia del ácido nucleico de referencia. El término "oligonucleótido degenerado" o "cebador degenerado" se usa para significar un oligonucleótido capaz de hibridar con secuencias de ácido nucleico diana que no son necesariamente idénticas en secuencia pero que son homólogas entre sí dentro de uno o más segmentos particulares.

El término "porcentaje de identidad de secuencia" o "idéntico" en el contexto de las secuencias de ácido nucleico se refiere a los residuos en las dos secuencias que son iguales cuando se alinean para una correspondencia máxima. La longitud de la comparación de identidad de secuencia puede ser sobre un tramo de al menos aproximadamente nueve nucleótidos, generalmente al menos aproximadamente 20 nucleótidos, más generalmente al menos aproximadamente 24 nucleótidos, por lo general al menos aproximadamente 28 nucleótidos, más por lo general al menos aproximadamente 32 nucleótidos, y preferiblemente al menos aproximadamente 36 o más nucleótidos. Hay un número de algoritmos diferentes conocidos en la técnica que se pueden usar para medir la identidad de la secuencia de nucleótidos. Por ejemplo, las secuencias de polinucleótidos se pueden comparar usando FASTA, Gap o Bestfit, que son programas en Wisconsin Package Version 10.0, Genetics Computer Group (GCG), Madison, Wis. FASTA proporciona alineaciones y porcentaje de identidad de secuencia de las regiones de la mejor superposición entre las secuencias de consulta y búsqueda. Pearson, Methods Enzymol. 183:63-98 (1990). Por ejemplo, el porcentaje de identidad de secuencia entre secuencias de ácido nucleico se puede determinar usando FASTA con sus parámetros predeterminados (un tamaño de palabra de 6 y el factor NOPAM para la matriz de puntuación) o usando Gap con sus parámetros predeterminados como se proporciona en GCG Versión 6.1. Alternativamente, las secuencias se pueden comparar usando el programa informático, BLAST (Altschul et al., J. Mol. Biol. 215:403-410 (1990); Gish and States, Nature Genet. 3:266-272 (1993); Madden et al., Meth. Enzymol. 266:131-141 (1996); Altschul et al., Nucleic Acids Res.

25:3389-3402 (1997); Zhang and Madden, Genome Res. 7:649-656 (1997)), especialmente blastp o tblastn (Altschul et al., Nucleic Acids Res. 25:3389-3402 (1997)).

El término "homología sustancial" o "similitud sustancial", cuando se refiere a un ácido nucleico o fragmento del mismo, indica que, cuando se alinea de manera óptima con inserciones o deleciones de nucleótidos apropiadas con otro ácido nucleico (o su hebra complementaria), hay identidad de secuencia de nucleótidos en al menos aproximadamente 76 %, 80 %, 85 %, preferiblemente al menos aproximadamente 90 %, y más preferiblemente al menos aproximadamente 95 %, 96 %, 97 %, 98 % o 99 % de las bases de nucleótidos, medidas mediante cualquier algoritmo bien conocido de identidad de secuencia, tal como FASTA, BLAST o Gap, como se discutió anteriormente.

Los ácidos nucleicos (también denominados polinucleótidos) de esta presente invención pueden incluir tanto cadenas sentido como antisentido de ARN, ADNc, ADN genómico y formas sintéticas y polímeros mixtos de los anteriores. Se pueden modificar química o bioquímicamente o pueden contener bases nucleotídicas no naturales o derivadas, como apreciarán fácilmente los expertos en la técnica. Tales modificaciones incluyen, por ejemplo, marcadores, metilación, sustitución de uno o más de los nucleótidos de origen natural con un análogo, modificaciones internucleotídicas tales como enlaces no cargados (por ejemplo, metilfosfonatos, fosfotriésteres, fosforamidatos, carbamatos, etc.), enlaces cargados (por ejemplo, fosforotioatos, fosforoditioatos, etc.), unidades estructurales colgantes (por ejemplo, polipéptidos), intercaladores (por ejemplo, acridina, psoraleno, etc.), quelantes, alquilantes y enlaces modificados (por ejemplo, ácidos nucleicos alfa anoméricos, etc.) También se incluyen moléculas sintéticas que imitan a los polinucleótidos en su capacidad para unirse a una secuencia designada mediante enlaces de hidrógeno y otras interacciones químicas. Tales moléculas son conocidas en la técnica e incluyen, por ejemplo, aquellas en las que los enlaces peptídicos sustituyen a los enlaces fosfato en el esqueleto de la molécula. Otras modificaciones pueden incluir, por ejemplo, análogos en los que el anillo de ribosa contiene una unidad estructural de puente u otra estructura tal como las modificaciones encontradas en los ácidos nucleicos "bloqueados".

El término "mutado" cuando se aplica a secuencias de ácido nucleico significa que los nucleótidos en una secuencia de ácido nucleico se pueden insertar, eliminar o cambiar en comparación con una secuencia de ácido nucleico de referencia. Se puede realizar una única alteración en un locus (una mutación puntual) o se pueden insertar, eliminar o cambiar múltiples nucleótidos en un solo locus. Además, se pueden realizar una o más alteraciones en cualquier número de loci dentro de una secuencia de ácido nucleico. Una secuencia de ácido nucleico se puede mutar mediante cualquier método conocido en la técnica, incluidas, pero no se limitan a, técnicas de mutagénesis tales como "PCR propensa a errores" (un procedimiento para realizar PCR en condiciones en las que la fidelidad de copia de la ADN polimerasa es baja, de manera que una alta tasa de mutaciones puntuales se obtiene a lo largo de toda la longitud del producto de PCR; véase, por ejemplo, Leung et al., Technique, 1:11-15 (1989) and Caldwell and Joyce, PCR Methods Applic. 2:28-33 (1992)); y "oligonucleotide-directed mutagenesis" (a process which enables the generation of sitespecific mutations in any cloned ADN segment of interest; véase, por ejemplo, Reidhaar-Olson and Sauer, Science 241:53-57 (1988)).

El término "vector", como se usa en este documento, pretende hacer referencia a una molécula de ácido nucleico capaz de transportar otro ácido nucleico al que se ha unido. Un tipo de vector es un "plásmido", que generalmente se refiere a un bucle circular de ADN de doble hebra en el que se pueden ligar segmentos de ADN adicionales, pero también incluye moléculas lineales de doble hebra, tales como las que resultan de la amplificación por la reacción en cadena de la polimerasa (PCR) o del tratamiento de un plásmido circular con una enzima de restricción. Otros vectores incluyen cósmidos, cromosomas artificiales bacterianos (BAC) y cromosomas artificiales de levadura (YAC). Otro tipo de vector es un vector viral, en el que se pueden ligar segmentos de ADN adicionales en el genoma viral (discutido con más detalle a continuación). Ciertos vectores son capaces de replicación autónoma en una célula hospedadora en la que se introducen (por ejemplo, vectores que tienen un origen de replicación que funciona en la célula hospedadora). Se pueden integrar otros vectores en el genoma de una célula hospedadora tras su introducción en la célula hospedadora y, por tanto, se replican junto con el genoma del hospedador. Además, ciertos vectores preferidos son capaces de dirigir la expresión de genes a los que están unidos operativamente. Tales vectores se denominan en este documento "vectores de expresión recombinantes" (o simplemente "vectores de expresión").

El término "sistema de expresión", como se usa en este documento, incluye vehículos o vectores para la expresión de un gen en una célula hospedadora, así como vehículos o vectores que provocan la integración estable de un gen en el cromosoma del hospedador.

Las secuencias de control de expresión "operativamente unidas" o "operablemente unidas" se refieren a un enlace en el que la secuencia de control de la expresión es contigua al gen de interés para controlar el gen de interés, así como las secuencias de control de la expresión que actúan en trans o a distancia para controlar el gen de interés.

El término "secuencia de control de la expresión", como se usa en este documento, se refiere a secuencias de polinucleótidos que son necesarias para afectar la expresión de secuencias codificantes a las que están unidas operativamente. Las secuencias de control de la expresión son secuencias que controlan la transcripción, los eventos postranscripcionales y la traducción de secuencias de ácido nucleico. Las secuencias de control de la expresión incluyen secuencias apropiadas de iniciación, terminación, promotoras y potenciadoras de la transcripción; señales de procesamiento de ARN eficientes tales como señales de empalme y poliadenilación; secuencias que estabilizan el ARNm citoplásmico; secuencias que mejoran la eficacia de la traducción (por ejemplo, sitios de unión a ribosomas); secuencias que mejoran la estabilidad de los polipéptidos; y cuando se desee, secuencias que potencian la secreción de polipéptidos. La naturaleza de tales secuencias de control difiere según el organismo hospedador; en procariotas, tales secuencias de control generalmente incluyen promotor, sitio de unión ribosómico y secuencia de terminación de la transcripción. El término "secuencias de control" pretende incluir, como mínimo, todos los componentes cuya presencia es esencial para la expresión, y también puede incluir componentes adicionales cuya presencia es ventajosa, por ejemplo, secuencias líder y secuencias asociadas de fusión.

El término "promotor", como se usa en este documento, se refiere a una región de ADN a la que se une la ARN polimerasa para iniciar la transcripción génica, y las posiciones en la dirección 5' de un sitio de inicio de la transcripción del ARNm.

El término "célula hospedadora recombinante" (o simplemente "célula hospedadora"), como se usa en este documento, pretende hacer referencia a una célula en la que se ha introducido un vector recombinante. Se debe entender que tales términos están destinados a referirse no solo a la célula objeto particular sino a la progenie de dicha célula. Debido a que pueden producirse ciertas modificaciones en generaciones sucesivas debido a ya sea mutaciones o influencias ambientales, tal progenie puede no ser, de hecho, idéntica a la célula madre, pero todavía está incluida dentro del alcance del término "célula hospedadora" como se usa en este documento. Una célula hospedadora recombinante puede ser una célula aislada o una línea celular desarrollada en cultivo o puede ser una célula que reside en un tejido u organismo vivo.

El término "péptido", como se usa en este documento, se refiere a un polipéptido corto, por ejemplo, uno que por lo general tiene menos de aproximadamente 50 aminoácidos de longitud y más por lo general menos de aproximadamente 30 aminoácidos de longitud. El término como se usa en este documento abarca análogos y miméticos que imitan la función estructural y, de este modo, biológica.

El término "polipéptido" abarca proteínas tanto de origen natural como no natural, y fragmentos, mutantes, derivados y análogos de los mismos. Un polipéptido puede ser monomérico o polimérico. Además, un polipéptido puede comprender un número de dominios diferentes, cada uno de los cuales tiene una o más actividades distintas.

Como se usa en este documento, el término "molécula" significa cualquier compuesto, que incluye, pero no se limita a, una molécula pequeña, péptido, polipéptido, azúcar, nucleótido, ácido nucleico, polinucleótido, lípido, etc., y dicho compuesto puede ser natural o sintético.

El término "bloque" o "unidad de repetición" como se usa en este documento se refiere a una subsecuencia mayor de aproximadamente 12 aminoácidos de un polipéptido de seda natural que se encuentra, posiblemente con variaciones modestas, repetidamente en dicha secuencia de polipéptido de seda natural y sirve como una unidad de repetición básica en dicha secuencia de polipéptidos de seda. Se pueden encontrar ejemplos en la tabla 1. Se pueden encontrar ejemplos adicionales de secuencias de aminoácidos en bloque en SEQ ID NOs: 1515-2156. Los bloques pueden incluir "motivos" muy cortos, aunque no necesariamente. Un "motivo" como se usa en este documento se refiere a una secuencia de aproximadamente 2-10 aminoácidos que aparece en múltiples bloques. Por ejemplo, un motivo puede consistir en la secuencia de aminoácidos GGA, GPG, o AAAAA (SEQ ID NO: 2803). Una secuencia de una pluralidad de bloques es un "copolímero en bloques".

Como se usa en este documento, el término "dominio de repetición" se refiere a una secuencia seleccionada del conjunto de segmentos repetitivos contiguos (no interrumpidos por un dominio no repetitivo sustancial, excluyendo elementos espaciadores de seda conocidos) en un polipéptido de seda. Las secuencias de seda nativas generalmente contienen un dominio de repetición. En algunas realizaciones de la presente invención, hay un dominio de repetición por molécula de seda. Una "macrorepetición" como se usa en este documento es una secuencia de aminoácidos repetitiva de origen natural que comprende más de un bloque. En una realización, una macrorepetición se repite al menos dos veces en un dominio de repetición. En una realización adicional, las dos repeticiones son imperfectas. Una "cuasirepetición" como se usa en este documento es una secuencia de aminoácidos que comprende más de un bloque, de manera que los bloques son similares pero no idénticos en la secuencia de aminoácidos.

Una "secuencia de repetición" o "R" como se usa en este documento se refiere a una secuencia de aminoácidos repetitiva. Los ejemplos incluyen las secuencias de nucleótidos de las SEQ ID NOs: 1-467, las secuencias de nucleótidos con secuencias flanqueantes para la clonación de las SEQ ID NOs: 468-931 y las secuencias de aminoácidos de las SEQ ID NOs: 932-1398. En una realización, una secuencia de repetición incluye una macrorepetición o un fragmento de una macrorepetición. En otra realización, una secuencia de repetición incluye un bloque. En una realización adicional, un solo bloque se divide en dos secuencias de repetición.

Cualquier intervalo descrito en este documento incluye los extremos del intervalo. Por ejemplo, una gama de 2-5 % incluye 2 % y 5 %, y cualquier número o fracción de un número intermedio, por ejemplo: 2.25 %, 2.5 %, 2.75 %, 3 %, 3.25 %, 3.5 %, 3.75 %, 4 %, 4.25 %, 4.5 %, y 4.75 %.

A menos que se defina lo contrario, todos los términos técnicos y científicos usados en este documento tienen el mismo significado que el comúnmente entendido por un experto en la técnica a la que pertenece está presente invención. A continuación se describen métodos y materiales de ejemplo, aunque también se pueden utilizar en la práctica de la presente invención métodos y materiales similares o equivalentes a los descritos en este documento y serán evidentes para los expertos en la técnica. En caso de conflicto, prevalecerá la presente memoria descriptiva, incluidas las definiciones. Los materiales, métodos y ejemplos son solo ilustrativos y no pretenden ser limitantes.

A lo largo de esta memoria descriptiva y las reivindicaciones, la palabra "comprende" o variaciones tales como "comprende" o "que comprende", se entenderá que implica la inclusión de un número entero o grupo de números enteros pero no la exclusión de ningún otro número entero o grupo de enteros.

Secuencias de seda

En algunas realizaciones descritas en este documento, se encuentran 1) composiciones de polipéptidos de copolímero en bloques generadas mezclando y emparejando dominios de repetición derivados de secuencias de polipéptidos de seda y 2) expresión recombinante de polipéptidos de copolímeros en bloques que tienen un tamaño suficientemente grande (aproximadamente 40 kDa) para formar fibras útiles mediante secreción de un microorganismo escalable industrialmente. Se proporciona en este documento la capacidad de producir polipéptidos de copolímero en bloques relativamente grandes (aproximadamente 40 kDa a aproximadamente 100 kDa) manipulados a partir de fragmentos de dominio de repetición de seda en un hospedador de microorganismos modificado por ingeniería escalable, incluidas secuencias de casi todas las secuencias de aminoácidos publicadas de polipéptidos de seda de araña. En algunas realizaciones, las secuencias de polipéptidos de seda se emparejan y diseñan para producir polipéptidos altamente expresados y secretados capaces de formar fibras.

En este documento, en varias realizaciones, se proporcionan composiciones para la expresión y secreción de copolímeros en bloque manipulados a partir de una mezcla combinatoria de dominios polipeptídicos de seda a través del espacio de secuencia del polipéptido de seda. En algunas realizaciones, en este documento se proporcionan métodos para secretar copolímeros en bloques en organismos escalables (por ejemplo, levaduras, hongos y bacterias gram positivas). En algunas realizaciones, el polipéptido de copolímero en bloques comprende 0 o más dominios N-terminales (NTD), 1 o más dominios de repetición (REP) y 0 o más dominios C-terminales (CTD). En algunos aspectos de la realización, el polipéptido de copolímero en bloques tiene > 100 aminoácidos de una única cadena polipeptídica. En algunas realizaciones, el polipéptido de copolímero en bloques comprende un dominio que es al menos 80 %, 81 %, 82 %, 83 %, 84 %, 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, o 99 % idéntico a una secuencia de SEQ ID NOs: 932-1398.

Se han identificado varios tipos de sedas de araña nativas. Se cree que las propiedades mecánicas de cada tipo de seda hilada de forma nativa están estrechamente relacionadas con la composición molecular de esa seda. Véase, por ejemplo, Garb, J.E., et al., Untangling spider silk evolution with spidroin terminal domains, BMC Evol. Biol., 10:243 (2010) ; Bittencourt, D., et al., Protein families, natural history and biotechnological aspects of spider silk, Genet. Mol. Res., 11:3 (2012); Rising, A., et al., Spider silk proteins: recent advances in recombinant production, structure-function relationships and biomedical applications, Cell. Mol. Life Sci., 68:2, pg. 169-184 (2011); y Humenik, M., et al., Spider silk: understanding the structure function relationship of a natural fiber, Prog. Mol. Biol. Transl. Sci., 103, pg. 131-85 (2011) . Por ejemplo:

Las sedas aciniformes (AcSp) tienden a tener una alta tenacidad, como resultado de una resistencia moderadamente alta junto con una extensibilidad moderadamente alta. Las sedas AcSp se caracterizan por tamaños de bloques grandes ("repetición de conjunto") que a menudo incorporan motivos de poliserina y GPX. Las sedas tubuliformes (TuSp o cilíndricas) tienden a tener grandes diámetros, con una resistencia moderada y una alta extensibilidad. Las sedas TuSp se caracterizan por su contenido de poliserina y politreonina, y tramos cortos de polialanina. Las sedas ampulácea mayor (MaSp) tienden a tener una alta resistencia y una modesta extensibilidad. Las sedas MaSp pueden ser de dos subtipos: MaSp1 y MaSp2. Las sedas MaSp1 son generalmente menos extensibles que las sedas MaSp2 y se caracterizan por motivos de polialanina, GX y GGX. Las sedas MaSp2 se caracterizan por motivos de polialanina, GGX y GPX. Las sedas ampulácea menor (MiSp) tienden a tener una resistencia moderada y una extensibilidad moderada. Las sedas MiSp se caracterizan por motivos GGX, GA y poli A, y a menudo contienen elementos espaciadores de aproximadamente 100 aminoácidos. Las sedas flageliformes (Flag) tienden a tener una extensibilidad muy alta y una resistencia moderada. Las sedas Flag generalmente se caracterizan por motivos GPG, GGX y espaciadores cortos.

Las propiedades de cada tipo de seda pueden variar de una especie a otra, y las arañas que llevan estilos de vida distintos (por ejemplo, hiladores de telarañas sedentarios frente a cazadores de vagabundos) o que son evolutivamente más viejos pueden producir sedas que difieren en propiedades de las descripciones anteriores (para descripciones de diversidad y clasificación de arañas, véase Hormiga, G., and Griswold, C.E., Systematics, phylogeny, and evolution of orb-weaving spiders, Annu. Inverso. Entomol. 59, pg. 487-512 (2014); y Blackedge, T.A. et al., Reconstructing web evolution and spider diversification in the molecular era, Proc. Natl. Acad. Sci. U.S.A., 106:13, pg.

5229-5234 (2009)). Sin embargo, los polipéptidos de copolímeros en bloques sintéticos que tienen similitud de secuencia y/o similitud de composición de aminoácidos con los dominios de repetición de proteínas de seda nativas se pueden usar para fabricar a escala comercial fibras similares a la seda consistentes que recapitulan las propiedades de las correspondientes fibras de seda natural.

En algunas realizaciones, se puede compilar una lista de secuencias de seda putativas buscando términos relevantes en GenBank, por ejemplo, "espidroína" "fibroína" "MaSp", y esas secuencias se pueden combinar con secuencias adicionales obtenidas mediante esfuerzos de secuenciación independientes. Luego, las secuencias se traducen en aminoácidos, se filtran en busca de entradas duplicadas y se dividen manualmente en dominios (NTD, REP, CTD). En algunas realizaciones, las secuencias de aminoácidos candidatas se traducen de forma inversa en una secuencia de ADN optimizada para la expresión en Pichia (Komagataella) pastoris. Cada una de las secuencias de ADN se clona en un vector de expresión y se transforma en Pichia (Komagataella) pastoris. En algunas realizaciones, diversos dominios de seda que demuestran expresión y secreción satisfactorias se ensamblan posteriormente de manera combinatoria para construir moléculas de seda capaces de formar fibras.

Los polipéptidos de seda se componen característicamente de un dominio de repetición (REP) flanqueado por regiones no repetitivas (por ejemplo, dominios C-terminales y N-terminales). En una realización, tanto los dominios C-terminales como los N-terminales tienen una longitud de entre 75-350 aminoácidos. El dominio de repetición exhibe una arquitectura jerárquica, como se muestra en la figura 1. El dominio de repetición comprende una serie de bloques (también llamados unidades de repetición). Los bloques se repiten, a veces perfectamente y a veces imperfectamente (formando un dominio de cuasirepetición), en todo el dominio de repetición de seda. La longitud y composición de los bloques varía entre diferentes tipos de seda y entre diferentes especies. La tabla 1 enumera ejemplos de secuencias de bloques de especies seleccionadas y tipos de seda, con más ejemplos presentados en Rising, A. et al., Spider silk proteins: recent advances in recombinant production, structure-function relationships and biomedical applications, Cell Mol. Life Sci., 68:2, pg 169-184 (2011); y Gatesy, J. et al., Extreme diversity, conservation, and convergence of spider silk fibroin sequences, Science, 291:5513, pg. 2603-2605 (2001). En algunos casos, los bloques se pueden disponer en un patrón regular, formando macrorepeticiones más grandes que aparecen varias veces (generalmente 2-8) en el dominio de repetición de la secuencia de seda. Los bloques repetidos dentro de un dominio de repetición o macrorepetición, y las macrorepeticiones repetidas dentro del dominio de repetición, pueden estar separados por elementos espaciadores. En algunas realizaciones, las secuencias de bloques comprenden una región rica en glicina seguida de una región poliA. En algunas realizaciones, los motivos de aminoácidos cortos (—1-10) aparecen múltiples veces dentro de los bloques. En la figura 1 se representa un subconjunto de motivos comúnmente observados. Para el propósito de esta invención, los bloques de diferentes polipéptidos de seda natural se pueden seleccionar sin referencia a la permutación circular (es decir, los bloques identificados que son similares entre polipéptidos de seda no se pueden alinear debido a permutación circular). De este modo, por ejemplo, un "bloque" de SGAGG (SEQ ID NO: 2804) es, para los propósitos de la presente invención, lo mismo que GSGAG (SEQ ID NO: 2805) y lo mismo que GGSGA (SEQ ID NO: 2806); todos son simplemente permutaciones circulares entre sí. La permutación particular seleccionada para una secuencia de seda dada puede ser dictada por conveniencia (generalmente comenzando con una G) más que cualquier otra cosa. Las secuencias de seda obtenidas de la base de datos NCBI se pueden dividir en bloques y regiones no repetitivas.

Tabla 1: Muestras de secuencias de bloques

La construcción de polipéptidos de copolímeros en bloques formadores de fibras a partir de los bloques y/o dominios de macrorepetición, según determinadas realizaciones de la invención, se muestra en las figuras 2 y 3. La figura 2 ilustra la división de secuencias de seda en dominios distintos. Las secuencias 200 de seda natural obtenidas de una base de datos de proteínas tales como GenBank o mediante secuenciación de novo se dividen por dominio (dominio 202 N-terminal, dominio 204 de repetición y dominio 206 C-terminal dominio 206 C-terminal). Las secuencias del dominio 202 N-terminal y del dominio 206 C-terminal seleccionadas con el propósito de síntesis y ensamblaje en fibras incluyen información de la secuencia de aminoácidos natural y otras modificaciones descritas en este documento. El dominio 204 de repetición se descompone en secuencias 208 de repetición que contienen bloques representativos, normalmente 1-8 dependiendo del tipo de seda, que capturan información crítica de aminoácidos mientras reducen el tamaño del ADN que codifica los aminoácidos en un fragmento fácilmente sintetizable. La figura 3 ilustra cómo se pueden ensamblar NT 202, CT 206 y secuencias 208 de repetición seleccionadas para crear polipéptidos de copolímero en bloques que se pueden purificar y convertir en fibras que recapitulan las propiedades funcionales de la seda, según una realización de la invención. NT, CT y secuencias de repetición individuales que se ha verificado que expresan y secretan se ensamblan en polipéptidos de copolímeros en bloques funcionales. En algunas realizaciones, un polipéptido de copolímero en bloques formado apropiadamente comprende al menos un dominio de repetición que comprende al menos 1 secuencia de repetición 208, y está opcionalmente flanqueado por un dominio 202 N-terminal y/o un dominio 206 C-terminal.

En algunas realizaciones, un dominio de repetición comprende al menos una secuencia de repetición. En algunas realizaciones, la secuencia de repetición, la secuencia del dominio N-terminal y/o la secuencia del dominio C-terminal se selecciona de las SEQ ID NOs: 932-1398. En algunas realizaciones, la secuencia de repetición es de 150-300 residuos de aminoácidos. En algunas realizaciones, la secuencia de repetición comprende una pluralidad de bloques. En algunas realizaciones, la secuencia de repetición comprende una pluralidad de macrorepeticiones. En algunas realizaciones, un bloque o una macrorepetición se divide en múltiples secuencias de repetición.

En algunas realizaciones, la secuencia de repetición comienza con una glicina y no puede terminar con fenilalanina (F), tirosina (Y), triptófano (W), cisteína (C), histidina (H), asparagina (N), metionina (M) o ácido aspártico (D) para satisfacer los requisitos de ensamblaje de ADN. En algunas realizaciones, algunas de las secuencias de repetición se pueden alterar en comparación con las secuencias nativas. En algunas realizaciones, la secuencia de repetición se puede alterar, tal como, mediante la adición de una serina al extremo C terminal del polipéptido (para evitar terminar en F, Y, W, C, H, N, M o D). En algunas realizaciones, la secuencia de repetición se puede modificar rellenando un bloque incompleto con una secuencia homóloga de otro bloque. En algunas realizaciones, la secuencia de repetición se puede modificar reordenando el orden de los bloques o macrorepeticiones.

En algunas realizaciones, los dominios N- y C-terminales no repetitivos se pueden seleccionar para la síntesis (Véanse SEQ ID NOs: 1-145). En algunas realizaciones, los dominios N-terminal pueden ser mediante la eliminación de la secuencia señal principal, por ejemplo, según lo identificado por SignalP (Peterson, T.N., et. Al., SignalP 4.0: discriminating signal peptides from transmembrane regions, Nat. Methods, 8:10, pg. 785-786 (2011).

En algunas realizaciones, el dominio N-terminal, la secuencia de repetición o las secuencias del dominio C-terminal se pueden derivar de Agelenopsis aperta, Aliatypus gulosus, Aphonopelma seemanni, Aptostichus sp. AS217, Aptostichus sp. AS220, Araneus diadematus, Araneus gemmoides, Araneus ventricosus, Argiope amoena, Argiope argentata, Argiope bruennichi, Argiope trifasciata, Atypoides riversi, Avicularia juruensis, Bothriocyrtum californicum, Deinopis Spinosa, Diguetia canities, Dolomedes tenebrosus, Euagrus chisoseus, Euprosthenops australis, Gasteracantha mammosa, Hypochilus thorelli, Kukulcania hibernalis, Latrodectus hesperus, Megahexura fulva, Metepeira grandiosa, Nephila antipodiana, Nephila clavata, Nephila clavipes, Nephila madagascariensis, Nephila pilipes, Nephilengys cruentata, Parawixia bistriata, Peucetia viridans, Plectreurys tristis, Poecilotheria regalis, Tetragnatha kauaiensis, o Uloborus diversus.

En algunas realizaciones, la secuencia codificante de nucleótidos del polipéptido de seda se puede unir operativamente a una secuencia codificante de nucleótidos del factor de emparejamiento alfa. En algunas realizaciones, la secuencia codificante de nucleótidos del polipéptido de seda se puede unir operativamente a otra secuencia codificante de la señal de secreción endógena o heteróloga. En algunas realizaciones, la secuencia codificante de nucleótidos del polipéptido de seda se puede unir operativamente a una secuencia codificante de nucleótidos 3X FLAG. En algunas realizaciones, la secuencia codificante de nucleótidos del polipéptido de seda está operativamente ligada a otras etiquetas de afinidad tales como residuos de 6-8 His (SEQ ID NO: 2824).

Vectores de expresión

Los vectores de expresión de la presente invención se pueden producir siguiendo las enseñanzas de la presente memoria descriptiva en vista de las técnicas conocidas en la técnica. Las secuencias, por ejemplo, secuencias de vectores o secuencias que codifican transgenes, se pueden obtener comercialmente de empresas tales como Integrated DNA Technologies, Coralville, IA o DNA 2.0, Menlo Park, CA. En este documento se ejemplifican los vectores de expresión que dirigen la expresión de alto nivel de los polipéptidos de seda quiméricos.

Otra fuente estándar para los polinucleótidos usados en la invención son los polinucleótidos aislados de un organismo (por ejemplo, una bacteria), una célula o tejido seleccionado. Los ácidos nucleicos de la fuente seleccionada se pueden aislar mediante procedimientos estándar, que por lo general incluyen extracciones sucesivas de fenol y fenol/cloroformo seguidas de precipitación con etanol. Después de la precipitación, los polinucleótidos se pueden tratar con una endonucleasa de restricción que escinde las moléculas de ácido nucleico en fragmentos. Los fragmentos del tamaño seleccionado se pueden separar mediante un número de técnicas, que incluyen electroforesis en gel de agarosa o poliacrilamida o electroforesis en gel de campo de pulsos (Care et al. (1984) Nuc. Acid Res. 12:5647-5664; Chu et al. (1986) Science 234:1582; Smith et al. (1987) Methods in Enzymology 151:461), para proporcionar un material de partida de tamaño apropiado para la clonación.

Otro método para obtener los componentes nucleotídicos de los vectores o constructos de expresión es la PCR. Los procedimientos generales para la Pc R se enseñan MacPherson et al., PCR: A PRACTICAL APPROACH, (IRL Press at Oxford University Press, (1991)). Las condiciones de PCR para cada reacción de aplicación se pueden determinar empíricamente. Un número de parámetros influyen en el éxito de una reacción. Entre estos parámetros se encuentran la temperatura y el tiempo de hibridación, el tiempo de extensión, la concentración de Mg2+ y ATP, el pH y la concentración relativa de cebadores, moldes y desoxirribonucleótidos. Los cebadores de ejemplo se describen a continuación en los ejemplos. Después de la amplificación, los fragmentos resultantes se pueden detectar mediante electroforesis en gel de agarosa seguida de visualización con tinción con bromuro de etidio e iluminación ultravioleta.

Otro método para obtener polinucleótidos es por digestión enzimática. Por ejemplo, se pueden generar secuencias de nucleótidos mediante digestión de vectores apropiados con enzimas de restricción de reconocimiento apropiadas. Los fragmentos escindidos por restricción pueden tener extremos romos tratándolos con el fragmento grande de la ADN polimerasa I de E. coli (Klenow) en presencia de los cuatro desoxinucleótidos trifosfatos (dNTP) usando técnicas estándar.

Los polinucleótidos se insertan en esqueletos apropiados, por ejemplo, plásmidos, usando métodos bien conocidos en la técnica. Por ejemplo, el ADN del inserto y del vector se puede poner en contacto, en condiciones apropiadas, con una enzima de restricción para crear extremos complementarios o romos en cada molécula que se puedan emparejar entre sí y unirse con una ligasa. Alternativamente, los conectores sintéticos de ácido nucleico se pueden ligar a los extremos de un polinucleótido. Estos enlazantes sintéticos pueden contener secuencias de ácido nucleico que corresponden a un sitio de restricción particular en el ADN del vector. En la técnica se conocen y están disponibles otros medios. Se puede usar una variedad de fuentes para los polinucleótidos componentes.

En algunas realizaciones, los vectores de expresión que contienen una secuencia R, N o C se transforman en un organismo hospedador para su expresión y secreción. En algunas realizaciones, los vectores de expresión comprenden una señal de secreción. En algunas realizaciones, el vector de expresión comprende una señal de terminación. En algunas realizaciones, el vector de expresión está diseñado para integrarse en el genoma de una célula hospedadora y comprende: regiones de homología con el genoma diana, un promotor, una señal de secreción, una etiqueta (por ejemplo, una etiqueta Flag), una señal de terminación/polyA, un marcador seleccionable para Pichia, un marcador seleccionable para E. coli, un origen de replicación para E. coli y sitios de restricción para liberar fragmentos de interés.

Transformantes de la célula hospedadora

En algunas realizaciones de la presente invención, se proporcionan células hospedadoras transformadas con las moléculas de ácido nucleico o vectores de la presente invención y descendientes de los mismos. En algunas realizaciones de la presente invención, estas células portan las secuencias de ácido nucleico de la presente invención en vectores, que pueden ser vectores que se replican libremente, pero no necesariamente. En otras realizaciones de la presente invención, los ácidos nucleicos se han integrado en el genoma de las células hospedadoras.

En algunas realizaciones, los microorganismos o células hospedadoras que permiten la producción a gran escala de polipéptidos de copolímero en bloques de la invención incluyen una combinación de: 1) la capacidad de producir polipéptidos grandes (> 75 kDa), 2) la capacidad de secretar polipéptidos fuera de la célula y eludir la costosa purificación intracelular aguas abajo, 3) resistencia a contaminantes (tales como virus y contaminaciones bacterianas) a gran escala, y 4) el conocimiento existente para el cultivo y procesamiento del organismo es biorreactores a gran escala (1- 2000m3).

Se pueden diseñar/transformar una variedad de organismos hospedadores para que comprendan un sistema de expresión de polipéptidos de copolímero en bloques. Los organismos preferidos para la expresión de un polipéptido de seda recombinante incluyen levaduras, hongos y bacterias grampositivas. En determinadas realizaciones, el organismo hospedador es Arxula adeninivorans, Aspergillus aculeatus, Aspergillus awamori, Aspergillus ficuum, Aspergillus fumigatus, Aspergillus japonicus, Aspergillus nidulans, Aspergillus niger, Aspergillus oryzae, Aspergillus sojae, Aspergillus tubigensis, Bacillus alkalophilus, Bacillus amyloliquefaciens, Bacillus anthracis, Bacillus brevis, Bacillus circulans, Bacillus coagulans, Bacillus lautus, Bacillus lentus, Bacillus licheniformis, Bacillus methanolicus, Bacillus stearothermophilus, Bacillus subtilis, Bacillus thuringiensis, Candida boidinii, Chrysosporium lucknowense, Fusarium graminearum, Fusarium venenatum, Kluyveromyces lactis, Kluyveromyces marxianus, Myceliopthora thermophila , Neurospora crassa, Ogataea polymorpha, Penicillium camemberti, Penicillium canescens, Penicillium chrysogenum, Penicillium emersonii, Penicillium funiculosum, Penicillium griseoroseum, Penicillium purpurogenum, Penicillium roqueforti, Phanerochaete chrysosporium, Pichia angusta, Pichia methanolica, Pichia (Komagataella) pastoris, Pichia polymorpha, Pichia stipitis, Rhizomucor miehei, Rhizomucor pusillus, Rhizopus arrhizus, Streptomyces lividans, Saccharomyces cerevisiae, Schwanniomyces occidentalis, Trichoderma harzianum, Trichoderma reesei, o Yarrowia lipolytica.

En aspectos preferidos, los métodos proporcionan el cultivo de células hospedadoras para la secreción directa del producto para una fácil recuperación sin la necesidad de extraer biomasa. En algunas realizaciones, los polipéptidos de copolímero en bloques se secretan directamente al medio para su recogida y procesamiento.

Purificación de polipéptidos

Los polipéptidos de copolímeros en bloques recombinantes en base a secuencias de seda de araña producidas por expresión génica en un sistema procariota o eucariota recombinante se pueden purificar según los métodos conocidos en la técnica. En una realización preferida, se puede usar un sistema de expresión/secreción disponible comercialmente, mediante el cual el polipéptido recombinante se expresa y luego se secreta de la célula hospedadora, para purificarse fácilmente del medio circundante. Si no se usan vectores de expresión/secreción, un enfoque alternativo implica purificar los polipéptidos de copolímeros en bloques recombinantes a partir de lisados celulares (restos de células tras la interrupción de la integridad celular) derivados de células procariotas o eucariotas en las que se expresó un polipéptido. Los expertos en la técnica conocen métodos para la generación de tales lisados celulares. En algunas realizaciones, los polipéptidos de copolímeros en bloques recombinantes se aíslan del sobrenadante del cultivo celular.

El polipéptido de copolímero en bloques recombinante puede purificarse mediante separación por afinidad, tal como mediante interacción inmunológica con anticuerpos que se unen específicamente al polipéptido recombinante o columnas de níquel para el aislamiento de polipéptidos recombinantes marcados con 6-8 residuos de histidina en su extremo N-terminal o C-terminal. Las etiquetas alternativas pueden comprender el epítopo FLAG o el epítopo de hemaglutinina. Tales métodos los usan habitualmente los profesionales expertos.

Además, el método de la presente invención puede incluir preferiblemente un método de purificación, que comprende exponer el sobrenadante del cultivo celular que contiene polipéptidos de copolímeros en bloques expresados a sulfato de amonio de 5-60 % de saturación, preferiblemente 10-40 % de saturación.

Hilado para generar fibras

En algunas realizaciones, una solución de polipéptidos de copolímero en bloques de la presente invención se hila en fibras usando elementos de procedimientos conocidos en la técnica. Estos procedimientos incluyen, por ejemplo, hilado en húmedo, hilado en húmedo con chorro seco, e hilado en seco. En realizaciones preferidas de hilado en húmedo, el filamento se extruye a través de un orificio en un baño de coagulación líquido. En una realización, el filamento puede extruirse a través de un espacio de aire antes de entrar en contacto con el baño de coagulación. En un procedimiento de hilado húmedo por chorro seco, la solución de hilado se atenúa y se estira en un fluido inerte no coagulante, por ejemplo, aire, antes de entrar en el baño de coagulación. Los fluidos de coagulación apropiados son los mismos que se usan en un procedimiento de hilado en húmedo.

Los baños de coagulación preferidos para el hilado en húmedo se mantienen a temperaturas de 0-90 °C, más preferiblemente de 20-60 °C, y son preferiblemente de aproximadamente 60 %, 70 %, 80 %, 90 % o incluso 100 % de alcohol, preferiblemente isopropanol, etanol o metanol. En una realización preferida, el baño de coagulación es 85:15 % en volumen de metanol: agua. En realizaciones alternativas, los baños de coagulación comprenden sulfato de amonio, cloruro de sodio, sulfato de sodio u otras sales precipitantes de proteínas a una temperatura entre 20 y 60 °C. Se pueden preferir ciertos baños de coagulante dependiendo de la composición de la solución dope y las propiedades deseadas de la fibra. Por ejemplo, se prefieren los baños de coagulante a base de sal para una solución dope acuosa. Por ejemplo, se prefiere el metanol para producir una fibra de sección transversal circular. Los tiempos de residencia en baños de coagulación pueden variar desde casi instantáneos hasta varias horas, con tiempos de residencia preferidos que duran menos de un minuto y tiempos de residencia más preferidos que duran aproximadamente 20 a 30 segundos. Los tiempos de residencia pueden depender de la geometría de la fibra o filamento extruido. En determinadas realizaciones, el filamento o fibra extruidos se hace pasar a través de más de un baño de coagulación de diferente o misma composición. Opcionalmente, el filamento o fibra también se pasa a través de uno o más baños de aclarado para eliminar el disolvente y/o el coagulante residual. Baños de aclarado de concentración decreciente de sal o alcohol hasta, preferiblemente, un baño de agua final, preferiblemente después de los baños de sal o alcohol.

Después de la extrusión, se puede estirar el filamento o la fibra. El estirado puede mejorar la consistencia, la orientación axial y la tenacidad del filamento. El estirado se puede potenciar con la composición de un baño de coagulación. El estirado también se puede realizar en un baño de estirado que contenga un plastificante tal como agua, glicerol o una solución salina. El estirado también se puede realizar en un baño de estirado que contiene un reticulante tal como gluteraldehído o formaldehído. El estirado se puede realizar a una temperatura de 25-100 °C para alterar las propiedades de la fibra, preferiblemente a 60 °C. Como es común en un procedimiento continuo, el estirado se puede realizar de forma simulada durante los procedimientos de coagulación, lavado, plastificación y/o reticulación descritos anteriormente. Las velocidades de estirado dependen del filamento que se esté procesando. En una realización, la velocidad de extracción es preferiblemente de aproximadamente 5 X la velocidad de bobinado del baño de coagulación.

En determinadas realizaciones de la invención, el filamento se bobina en un carrete después de la extrusión o después del estirado. Las velocidades de bobinado son generalmente de 1 a 500 m/min, preferiblemente de 10 a 50 m/min.

En otras realizaciones, para potenciar la facilidad con la que se procesa la fibra, el filamento se puede recubrir con lubricantes o acabados antes del bobinado. Los lubricantes o acabados apropiados pueden ser polímeros o acabados de cera que incluyen, pero no se limitan, aceite mineral, ácidos grasos, estearato de isobutilo, éster 2-etilhexílico de ácido graso de sebo, éster de ácido poliolcarboxílico, éster de ácido graso de aceite de coco de glicerol, glicerol alcoxilado, a silicona, dimetilpolisiloxano, un polialquilenglicol, poli(óxido de etileno) y un copolímero de óxido de propileno.

Las fibras hiladas producidas por los métodos de la presente invención pueden poseer una gama diversa de propiedades y características físicas, dependiendo de las propiedades iniciales de los materiales de origen, es decir, la solución dope, y la coordinación y selección de aspectos variables del presente método se practica para lograr un producto final deseado, ya sea que el producto sea una matriz blanda, pegajosa y flexible que conduzca al crecimiento celular en una aplicación médica o una fibra elástica que soporte cargas, tales como un cable o un hilo de pescar. La resistencia a la de los filamentos hilados mediante los métodos de la presente invención generalmente varía desde 0.2 g/denier (o g/(g/9000 m)) a 3 g/denier, con filamentos destinados a usos de soporte de carga que demuestran preferiblemente una resistencia a la tracción de al menos 2 g/denier. En una realización, las fibras tienen una finura de entre 0.2-0.6 denier. Propiedades tales como la elasticidad y el alargamiento a la rotura varían según el uso previsto de la fibra hilada, pero la elasticidad es preferiblemente del 5 % o más, y la elasticidad para usos en los que la elasticidad es una dimensión crítica, por ejemplo, para productos que pueden ser "atados", tales como con suturas o cordones, es preferiblemente del 10 % o más. La retención de agua de las fibras hiladas es preferiblemente cercana a la de las fibras de seda natural, es decir, el 10 %. El diámetro de las fibras hiladas puede abarcar una amplia gama, dependiendo de la aplicación; los diámetros de fibra preferidos varían desde 5, 10, 20, 30, 40, 50, 60 micrómetros, pero se pueden producir fibras sustancialmente más gruesas, particularmente para aplicaciones industriales (por ejemplo, cable). Las características de la sección transversal de las fibras hiladas pueden variar; por ejemplo, las fibras hiladas preferidas incluyen secciones transversales circulares, elípticas, secciones transversales en forma de estrella, y fibras hiladas que presentan distintas secciones de núcleo/funda, así como fibras huecas.

Ejemplo 1

Obtención de secuencias de seda.

Las secuencias de seda y las secuencias parciales se obtuvieron buscando en la base de datos de nucleótidos de NCBI usando los siguientes términos para identificar las sedas de araña: MaSp, TuSp, CySp, MiSp, AcSp, Flag, ampulácea mayor, ampulácea menor, flageliforme, aciniforme, tubuliforme, cilindriforme, espidroína y fibroína de araña. Las secuencias de nucleótidos resultantes se tradujeron en secuencias de aminoácidos y luego se curaron para eliminar las secuencias de repetición. Se eliminaron las secuencias que tenían menos de 200-500 aminoácidos de longitud, según el tipo de seda. Las secuencias de seda de la búsqueda anterior se dividieron en bloques (por ejemplo, secuencias repetitivas) y regiones no repetitivas.

Se seleccionaron secuencias repetitivas de polipéptidos (secuencias de repetición (R)) de cada secuencia de seda, y se enumeran como SEQ ID NOs: 1077-1393. Algunas de las secuencias R se han alterado, por ejemplo, mediante la adición de una serina al terminal C para evitar terminar la secuencia con un aminoácido F, Y, W, C, H, N, M o D. Esto permite la incorporación al sistema de vectores que se describe a continuación. También se modificaron bloques incompletos mediante la incorporación de segmentos de una secuencia homóloga de otro bloque. Para algunas secuencias de SEQ ID NOs: 1077-1393, el orden de los bloques o macrorepeticiones se ha alterado de la secuencia que se encuentra en la base de datos NCBI, y forman dominios de cuasirepetición

También se seleccionaron secuencias de dominio N-terminal no repetitivas (secuencias N) y secuencias de dominio C terminal (secuencias C) de cada secuencia de seda (SEQ ID NOs: 932-1076). Las secuencias del dominio N-terminal se alteraron mediante la eliminación de la secuencia señal principal y, si no estaba ya presente, la adición de un residuo de glicina N-terminal.

Ejemplo 2

Traducción inversa de secuencias de polipéptidos de seda a secuencias de nucleótidos.

Las secuencias de aminoácidos R, N y C descritas en el ejemplo 1 se tradujeron de forma inversa a secuencias de nucleótidos. Para realizar la traducción inversa, se generaron 10,000 secuencias candidatas usando el codón de Pichia (Komagataella) pastoris para sesgar la selección aleatoria de un codón que codifica el aminoácido deseado en cada posición. A continuación, se eliminaron de cada secuencia los sitios de restricción seleccionados (BsaI, BbsI, BtgZI, AscI, Sbfl); si no se podía eliminar un sitio, se descartaba la secuencia. Luego, se determinó la entropía, la subsecuencia de repetición más larga y el número de 15-mers repetidos para cada secuencia.

Para elegir la secuencia óptima a usar para la síntesis de cada conjunto de 10,000, se aplicaron secuencialmente los siguientes criterios: mantener las secuencias con el 25 % más bajo de la subsecuencia de repetición más larga, mantener las secuencias con el 10 % más alto de entropía de secuencia, y usar la secuencia con el menor número de 15-mers repetidos.

Ejemplo 3

Cribado de polipéptidos de seda de secuencias N, C o R seleccionadas.

Las secuencias de nucleótidos de los ejemplos 1 y 2 estaban flanqueadas por las siguientes secuencias durante la síntesis para habilitar la clonación:

5'-GAAGACTTAGCA - SEDA - GGTACGTCTTC-3 '(SEQ ID NOS 2825 y 2826) donde" SEDA "es una secuencia de polinucleótidos seleccionada según las instrucciones del ejemplo 2.

El ADN resultante se digirió con BbsI y se ligó en ya sea el vector de expresión RM618 (SEQ ID NO: 1399) o el vector de expresión RM652 (SEQ ID NO: 1400) que se había digerido con BtgZI y tratado con fosfatasa alcalina intestinal de ternera. El material ligado se transformó en E. coli para el aislamiento clonal y la amplificación del ADN usando métodos estándar. Pichia (Komagataella) pastoris

Los vectores de expresión que contienen una secuencia R, N o C se transformaron en Pichia (Komagataella) pastoris (cepa RMs71, que es la cepa GS115 (NRRL Y15851) con la mutación en el gen HIS4 restaurada a tipo salvaje mediante transformación con un fragmento del genoma de tipo salvaje (NRRLY 11430) y selección en placas de agar de medio definido que carecen de histidina) usando el método p Eg (Cregg, J.M., DNA-mediated transformation, Methods Mol. Biol., 389, pg. 27-42 (2007)). El vector de expresión consistía en una región de dirección (HIS4), un marcador de resistencia dominante (nat - que confiere resistencia a nourseotricina), un promotor (pGAP), una señal de secreción (factor de emparejamiento alfa líder y pro secuencia) y un terminador (señal pAOX1 pA).

Los transformantes se sembraron en placas de agar YPD que contenían 25 pg/ml de nourseotricina y se incubaron durante 48 horas a 30 °C. Se inocularon dos clones de cada transformación en 400 pl de YPD en un bloque de pocillos cuadrados de 96 pocillos y se incubaron durante 48 horas a 30 °C con agitación a 1000 rpm. Las células se peletizaron mediante centrifugación y el sobrenadante se recuperó para el análisis del contenido de polipéptido de seda mediante transferencia Western. Los datos resultantes demuestran una variedad de fenotipos de expresión y secreción, que van desde niveles de polipéptidos indetectables en el sobrenadante hasta una señal fuerte en la transferencia Western indicativa de un título relativamente alto.

La expresión y secreción satisfactoria de polipéptidos se juzgó mediante transferencia Western. Cada carril Western se puntuó como 1: Sin banda 2: Banda moderada o 3: Banda intensa. Se registró la mayor de las dos puntuaciones para cada clon. En la figura 4 y la figura 5 se muestran las transferencias Western representativas con números de construcción etiquetados, y en la figura 14 se muestran transferencias Western adicionales con clones representativos.

2. En la tabla 2 se muestra una lista completa de todas las secuencias R, N, y C probadas junto con los resultados de la transferencia Western. Los polipéptidos de seda de numerosas especies se expresaron con éxito, abarcando todas las categorías de glándulas y todos los tipos de dominios.

Tabla 2: Secuencias de polipéptidos de seda

Ejemplo 4

Amplificación de secuencias N, R y C para su inserción en un vector de ensamblaje.

El ADN para las secuencias N, R y C se amplificó por PCR a partir del vector de expresión y se ligó en vectores de ensamblaje usando sitios de restricción AscI/SbfI.

El cebador directo consistió en la secuencia:

5'-CTAAGAGGCGCGCCTAAGCGATGGTCTCAA-3' (SEQ ID NO: 2827) los primeros 19 bp de la secuencia N, R, o C.

El cebador inverso consistió en los últimos 17 bp de la secuencia N, R, o C 3'-GGTACGTCTTCATCGCTATCCTGCAGGCTACGT-5' (SEQ ID NO: 2828).

Por ejemplo, para la secuencia:

G G T G C AG C- T G C AAG G GC TGC T G G AG GCTACGGTGGAG G AT.AC GGT GCCGGT GCGGG TGCAG1 G AGCCGGCGCCC50 AG C T TGC G C C G C 1 AG ■ X T C C G G T G ( :■ A T AC; G G A C T G G AT AT( T GGCGC5 AC CTGGTGCTGGTGCCGTAGCAGGTGCCTCAGCTGGAAGCTACGGAGGTGCIGrrAATAGACTG

AG T T C C GCAGG T G CAGCC T C TAGAG TG T C G TCCAAC G TCGCAG C CAT TG C AT C T G C TG G T G C TGCCGCTrTGCCCAACGTTATTTCCAACATCTATAGTGGTGTTCTTTCATCTGGCGrGTCAT CCTC C G AAG1 C AC T T AT T C AGG C C T T C- T T AG AAG T AA T C AG TGC T T TAAT T C AT G T C T T AG G A TC AGC TTCTATCGG C AAC GT T T C AT C TGCCGC-T GT TAAT T CCGC ACTTAATGCTGT GCAAAA C GCCGTAGGCGCC TAT GCGGG A (SEQ ID NO: 4)

los cebadores usados fueron:

Directo: 5'-CTAAGAGGCGCGCCTAAGCGATGGTCTCAAGGTGCAGGTGCAAGGGCTG-3' (SEQ ID NO: 2829)

Inverso: 3'- TAGGCGCCTATGCCGGAGGTACGTCTTCATCGCTATCCTGCAGGCTACGT-5' (SEQ ID NO: 2830) La solución de reacción de PCR consistió en 12.5 |iL 2x de solución reguladora KOD Extreme, 0.25 |il de polimerasa KOD Extreme Hot Start, 0.5 |il de oligo directo 10 |iM, 0.5 |il de oligo inverso 10 |iM, 5 ng de ADN molde (vector de expresión), 0.5 |il de dNTP 10 mM y ddH2O agregada hasta un volumen final de 25 |il. A continuación, se termocicló la reacción según el programa:

1. Desnaturalizar a 94 °C, durante 5 minutos

2. Desnaturalizar a 94 °C, durante 30 segundos

3. Hibridar a 55 °C, durante 30 segundos.

4. Extender a 72 °C, durante 30 segundos

5. Repetir las etapas 2 a 4 durante 29 ciclos adicionales.

6. Extensión final a 72 °C, durante 5 minutos

Los productos de PCR resultantes se digirieron con las enzimas de restricción AscI y Sbfl, y se ligaron en un vector de ensamblaje (véase la descripción en el ejemplo 5), uno de KC (RM396, SEQ ID NO:1402), KA (RM397, SEQ ID NO:1403), AC (RM398, SEQ ID NO:1404), AK (RM399, SEQ ID NO:1405), CA (RM400, SEQ ID NO:1406), o CK (RM401, SEQ ID NO:1407) que se había digerido con las mismas enzimas para liberar un inserto no deseado usando métodos de rutina.

Ejemplo 5

Síntesis de seda a partir de bloques de Argiope bruennichi MaSp2 (RM439, "18B").

Usando el algoritmo descrito en el ejemplo 2, se seleccionó un conjunto de 6 bloques repetidos (o copolímero en bloques) de Argiope bruennichi MaSp2 y se dividieron en 2 secuencias R que constan de 3 bloques cada una. Las dos secuencias R de 3 bloques se sintetizaron luego a partir de oligonucleótidos cortos de la siguiente manera: Síntesis de la secuencia RM409:

Las secuencias de bloques de Argiope bruennichi MaSp2 se generaron usando una metodología distinta a la empleada en el ejemplo 3. Los oligos RM2919-RM2942 (SEQ ID NO: 1468-1491) en la tabla 3 se combinaron en una sola mezcla con cantidades iguales de cada oligo, 100 |iM en total. Los oligos se fosforilaron en una reacción de fosforilación preparada combinando 1 |il de solución reguladora de ligasa 10x de ADN NEB T4, 1 |il de oligos combinados 100 |iM, 1 |il de polinucleótido quinasa NEB T4 (10,000 U/ml) y 7 |il de ddH2O e incubando durante 1 hora a 37 °C. Los oligos se hibridaron luego mezclando 4 |il de la reacción de fosforilación con 16 |il de ddH2O, calentando la mezcla a 95 °C, durante 5 minutos y luego enfriando la mezcla a 25 °C a una velocidad de 0.1 °C/seg. A continuación, los oligos se ligaron en un vector combinando 4 |il de los oligos hibridados con 5 nmol del esqueleto del vector (RM396 [SEQ ID NO: 1405], digerido con AscI y Sbfl), 1 |il de ADN ligasa de NEB T4 (400,000 U/ml), 1 |il 10x de solución reguladora de ligasa de ADN NEB T4 y ddH2O a 10 |il. La solución de ligación se incubó durante 30 minutos a temperatura ambiente. La totalidad de la reacción de ligación se transformó en E. coli para la selección clonal, el aislamiento del plásmido y la verificación de la secuencia según técnicas conocidas.

El oligonucleótido resultante tiene una secuencia de nucleótidos de 5' a 3' de SEQ ID NO: 930 y se identifica como RM409.

Síntesis de la secuencia RM410:

Los oligos RM2999-RM3014 (SEQ ID NOs: 1492-1507) en la tabla 4 se combinaron en una única mezcla a una concentración de 100 |iM de cada oligo. Los oligos se fosforilaron en una reacción de fosforilación preparada combinando 1 |il 10x de solución reguladora de ligasa de ADN NEB T4, 1 |il de oligos combinados 100 |iM, 1 |il de polinucleótido quinasa NEB T4 (10,000 U/ml) y 7 |il de ddH2O e incubando durante 1 hora a 37 °C. Los oligos se hibridaron luego mezclando 4 |il de la reacción de fosforilación con 16 |il de ddH2O, calentando la mezcla a 95 °C, durante 5 minutos y luego enfriando la mezcla a 25 °C a una velocidad de 0,1 °C/seg. A continuación, los oligos se ligaron en un vector mediante la combinación de 4 |il de los oligos hibridados con la estructura del vector 5 nmol (RM400 [SEQ ID NO: 1406], digerido con AscI y Sbfl), 1 |il de ADN ligasa de NEB T4 (400,000 U/ml), 1 |il 10x de solución reguladora de ligasa de ADN NEB T4 y ddH2O a 10 |il. La solución de ligación se incubó durante 30 minutos a temperatura ambiente. La totalidad de la reacción de ligación se transformó en E. coli para la selección clonal, el aislamiento del plásmido y la verificación de la secuencia según técnicas conocidas.

El oligonucleótido resultante tiene una secuencia de nucleótidos de 5' a 3' de SEQ ID NO: 931 y se identifica como RM410.

Montaje y ensayo de Argiope bruennichi Masp2, "18B"

Las secuencias de oligonucleótidos RM409 (SEQ ID NO: 930) y RM410 (SEQ ID NO: 931) sintetizadas según el método descrito anteriormente se ensamblaron según el diagrama que se muestra en la figura 6 para generar la secuencia de nucleótidos de seda RM439 (por ejemplo, "18B ").

Se digirieron RM409 (SEQ ID NO: 930) y RM410 (SEQ ID NO: 931) en vectores de ensamblaje y se ligaron según los diagramas que se muestran en la figura 7 y la figura 8. Los dominios Silk N, R y C, también como elementos adicionales, incluida la secuencia pre-pro del factor de emparejamiento alfa y una etiqueta 3X FLAG, se ensamblaron usando un método de antibiótico 2 pseudo-sin cicatrices (2ab) (Leguia, M., et al., 2ab assembly: a methodology for automatable, high-throughput assembly of standard biological parts, J. Biol. Eng., 7:1 (2013); y Kodumal, S.J., et al., Total synthesis of long DNA sequences: synthesis of a contiguous 32-kb polyketide synthase gene cluster, Proc. Natl. Acad. Sci. U.S.A., 101:44, pg. 15573-15578 (2004)).

El ensamblaje 2ab se basa en el uso de 6 vectores de ensamblaje que son idénticos excepto por la identidad y la posición relativa de 2 marcadores seleccionables. Cada vector es resistente a exactamente 2 de: cloranfenicol (CamR), kanamicina (KanR) y ampicilina (AmpR). El orden (posición relativa) de los genes de resistencia es importante, de modo que AmpR/KanR es distinto de KanR/AmpR para el ensamblaje del ADN. Los 6 vectores de ensamblaje se muestran en la tabla 5, se nombran en base a los dos marcadores de resistencia en cada uno (C para CamR, K para KanR y A para AmpR). Los 6 vectores de ensamblaje son los siguientes: KC (RM396, SEQ ID NO:1402), KA (RM397, SEQ ID NO:1403), AC (RM398, SEQ ID NO:1404), AK (RM399, SEQ ID NO:1405), CA (RM400, SEQ ID NO:1406), y CK (RM401, SEQ ID NO:1407). Los vectores de ensamblaje se muestran en la tabla 5. Las secuencias para los vectores incluyen las de SEQ ID NOs: 1399-1410.

Tabla 5: Vectores de expresión y ensamblaje

La figura 7 muestra una reacción de ensamblaje única realizada con dos vectores compatibles, AC (RM398 SEQ ID NO:1404) y CK (RM401 SEQ ID NO:1407), uno que contiene una secuencia destinada al extremo 5' de la secuencia compuesta diana y una destinada al extremo 3' de la secuencia compuesta diana. El plásmido que lleva la secuencia 5' se digiere independientemente con BbsI, mientras que el plásmido que lleva la secuencia 3' se digiere independientemente con BsaI.

Después de la inactivación de las enzimas, los dos plásmidos digeridos se combinan y se ligan. El producto deseado reside en un vector AK, que es distinto de todos los vectores de entrada y subproductos no deseados. Esto permite la selección del producto deseado después de la transformación en E. coli.

La secuencia de ADN de los sitios de clonación durante este procedimiento se muestra en la figura 8. Al seleccionar el saliente de 4 pb generado por las enzimas de tipo II para que sea AGGT, el ensamblaje de fragmentos de ADN genera uniones sin cicatrices en el polipéptido codificado deseado siempre que el polipéptido comienza con una glicina (codificada por GGT) y termina con un codón que termina en una A (todos excepto F, Y, W, C, H, N, M, y D).

El ensamblaje de RM409 (SEQ ID NO: 930) y RM410 (SEQ ID NO: 931) en los vectores de ensamblaje KC y CA, respectivamente, generó RM411 (SEQ ID n O: 465) en KA, como se muestra en la figura 6. La secuencia RM411 (SEQ ID NO: 465) se transfirió a AC y CA usando AscI y Sbfl. Las secuencias de KA y AC, RM411 (SEQ ID NO: 465) se digirieron y se ligaron según el procedimiento descrito anteriormente para generar RM434 (SEQ ID NO: 466) en KC. ^{Finalmente, RM434 (SEQ ID n O: 466) en KC se digirió y se ligó con RM411 (SEQ ID NO:} 465 ^{) en CA para generar la}secuencia codificante del polipéptido de seda final, RM439 (SEQ ID NO: 467) (también conocido como "18B").

Transferencia de la secuencia codificante del polipéptido de seda "18B" (RM439) al vector de expresión RM468:

El vector de expresión RM468 (SEQ ID NO: 1401) contiene una secuencia del factor de emparejamiento alfa y una secuencia 3X FLAG (SEQ ID NO: 1409). La secuencia codificante del polipéptido de seda 18B, RM439 (SEQ iD NO: 467) se transfirió al vector de expresión RM468 (SEQ ID NO: 1401) mediante enzimas de restricción BtgZI y kits de reacción de Gibson. El vector RM439 se digirió con BtgZI y el fragmento de polinucleótido que contenía la secuencia de seda se aisló mediante electroforesis en gel. El vector de expresión, RM468, exclusivo de un inserto ficticio no deseado, se amplificó por PCR usando los cebadores RM3329 y RM3330, usando las condiciones descritas en el ejemplo 4. El producto de PCR resultante y el fragmento de seda aislado se combinaron usando un kit de reacción de Gibson según las instrucciones del fabricante. Los kits de reacción de Gibson están disponibles comercialmente (https://www.neb.com/products/e2611-gibson-assembly-master-mix), y se describen en la Patente de los Estados Unidos No. 5,436,149 y en Gibson, D.G. et al., Enzymatic assembly of DNA molecules up to several hundred kilobases, Nat. Methods, 6:5, pg. 343-345 (2009).

El vector de expresión resultante que contiene RM439 (SEQ ID NO: 467) se transformó en Pichia (Komagataella) pastoris. Los clones de las células resultantes se cultivaron según las siguientes condiciones: El cultivo se hizo crecer en un medio de sal basal mínimo, similar al descrito en

[http://tools.invitrogen.com/content/sfs/manuals/pichiaferm_prot.pdf] con 50 g/L de glicerol como materia prima de partida. El crecimiento se realizó en un recipiente de fermentación agitado controlado a 30 °C, con 1 VVM de flujo de aire y agitación a 2000 rpm. El pH se controló a 3 con la adición a demanda de hidróxido de amonio. Se agregó glicerol adicional según fuera necesario en base a aumentos repentinos de oxígeno disuelto. Se dejó que continuara el crecimiento hasta que el oxígeno disuelto alcanzó el 15 % del máximo, momento en el que se recogió el cultivo, por lo general a 200-300 OD de densidad celular.

El caldo del fermentador se descelularizó mediante centrifugación. Se recogió el sobrenadante del cultivo de Pichia (Komagataella) pastoris. Los componentes de bajo peso molecular se eliminaron del sobrenadante usando ultrafiltración para eliminar partículas más pequeñas que los polipéptidos del copolímero en bloques. El sobrenadante del cultivo filtrado se concentró luego hasta 50x. Los polipéptidos en el sobrenadante se precipitaron y analizaron mediante una transferencia Western. El producto se muestra en la transferencia de Western en la figura 9. El peso molecular predicho del 18B procesado es 82 kDa. El producto observado en la transferencia de Western en la figura 9 exhibió un PM más alto de ~ 120 kDa. Si bien se desconoce la fuente de esta discrepancia, se ha observado que otros polipéptidos de seda aparecen con un peso molecular superior al esperado.

El polipéptido 18B de copolímero en bloques se purificó y procesó en una solución hilable de fibras. La solución hilable de fibras se preparó disolviendo el polipéptido purificado y secado en un disolvente de hilado. El polipéptido se disuelve en el disolvente seleccionado entre un 20 y un 30 % en peso. La solución hilable de fibras se extruyó luego a través de un orificio de 150 micrómetros de diámetro en un baño de coagulación que comprendía 90 % de metanol/10 % de agua en volumen. Las fibras se retiraron de la coagulación y se estiraron de 1 a 5 veces su longitud, y posteriormente se dejaron secar. La fibra resultante se muestra en la figura 10.

Se realizó una prueba mecánica en el polipéptido 18B de copolímero en bloques que se secretó, purificó, disolvió y convirtió en una fibra como se describió anteriormente. Se probaron las propiedades mecánicas de las fibras en un medidor de tracción hecho a medida, usando procedimientos comunes. Las muestras de prueba se montaron con una longitud de calibre de 5.75 mm y se probaron a una tasa de deformación del 1 %. Las fuerzas resultantes se normalizaron al diámetro de la fibra, medido por microscopía. Los resultados de tensión frente a deformación se muestran en la figura 11, en la que cada curva de tensión-deformación representa una medición repetida de una fibra de un solo experimento de hilado, de un solo lote.

Ejemplo 6

Ensamblaje y ensayo de 4X secuencias R de repetición.

Los dominios R seleccionados de las SEQ ID NOs: 1-1398 que se expresaban y secretaban bien se concatenaron en 4x dominios de repetición, usando el esquema de ensamblaje que se muestra en la figura 12. La concatenación se realizó como se describe en el ejemplo 4 y se muestra en las figuras 7 y 8. Las secuencias seleccionadas de esta ligación de secuencias R se muestran en la tabla 6. Las secuencias para estos constructos de seda incluyen aquellas secuencias de construcción de seda de longitud completa de SEQ iD NOs: 1411-1468. Los productos resultantes que comprenden 4 secuencias de repetición, un factor de emparejamiento alfa y un dominio 3X FLAG se digirieron con AscI y Sbfl para liberar la secuencia de seda deseada y se ligaron en el vector de expresión RM652 (SEQ ID NO: 1400) que se había digerido con AscI y Sbfl para liberar un inserto ficticio no deseado. Después del aislamiento clonal de E. coli, los vectores se transformaron luego en Pichia pastoris. Los transformantes se sembraron en placas de agar YPD que contenían 25 |ig/ml de nourseotricina y se incubaron durante 48 horas a 30 °C. Se inocularon tres clones de cada transformación en 400 |il de BMGY en un bloque de 96 pocillos cuadrados y se incubaron durante 48 horas a 30 °C con agitación a 1000 rpm. Las células se peletizaron mediante centrifugación y el sobrenadante se recuperó para el análisis del contenido de polipéptido de copolímero en bloques mediante transferencia Western (Figura 13). De los 28 constructos transformados con 4x secuencias de repetición idénticas, la mayoría (18/28) tenían al menos un clon con una señal sustancial en la transferencia de Western y solo 1 no mostró ninguna señal. De dos constructos compuestas por 2 repeticiones cada una de 2 secuencias de repetición distintas, una mostró una fuerte señal de transferencia de Western, mientras que la otra mostró una modesta señal de Western. Esto confirma que ensamblar copolímeros en bloques más grandes que expresan polinucleótidos a partir de polinucleótidos más pequeños y bien expresados generalmente conduce a polipéptidos de copolímeros en bloques expresados funcionalmente. El rayado, las bandas múltiples y la variación de clon a clon son evidentes en la Western. Si bien no se ha identificado la fuente específica de estas variaciones, generalmente son consistentes con los fenómenos por lo general observados, incluida la degradación de polipéptidos, la modificación postraduccional (por ejemplo, glicosilación) y la variación clonal después de la integración genómica. Los productos polipeptídicos modificados y degradados se pueden incorporar en fibras sin afectar negativamente a la utilidad de las fibras dependiendo de su uso pretendido.

Tabla 6: Constructos de seda de copolímero en bloques de longitud completa con factor de emparejamiento alfa, dominios de repetición 4X y dominios 3X FLAG

Ejemplo 7

Expresión de 18B de Bacillus subtilis

Una lanzadera E. coli/B. subtilis y el plásmido de expresión se construyen primero. El polinucleótido que codifica 18B se transfiere, usando una reacción de Gibson, al plásmido pBE-S (Takara Bio Inc.). El plásmido pBE-S (SEQ ID NO: 1512) se amplifica usando los cebadores BES-F (5'-AAGACGATGACGATAAGGACTATAAAGATGATGACGACAAATAATGCGGTAGTT TATCAC-3') (SEQ ID NO: 2831) y BES-R (5' - CCAGCGCCTGGACCGTAACCCGGCCGCAGCCTGCGCAGACATGTTGCTGAACGC CATCGT - 3') (SEQ ID NO: 2832) en una reacción de PCR. La mezcla de reacción consiste en 1 |il de BES-F 10 |iM, 1 |il de BES-R 10 |iM, 0.5 |ig de ADN pBE-S (en un volumen de 1 |il), 22 |il de H2O desionizada y 25 |il de Phusion High-Fidelity PCR Master Mix (catálogo NEB M0531S). La mezcla se termocicla según el siguiente programa:

1) Desnaturalizar durante 5 minutos a 95 °C

2) Desnaturalizar durante 30 segundos a 95 °C

3) Hibridar durante 30 segundos a 55 °C

4) Extender durante 6 minutos a 72 °C

5) Repetir las etapas 2-4 durante 29 ciclos adicionales

6) Realizar una extensión final durante 5 minutos a 72 °C

El producto se somete a electroforesis en gel y se aísla el producto de aproximadamente 6000 pb, luego se extrae usando un kit de recuperación de ADN en gel Zymoclean (Zymo Research) según las instrucciones del fabricante. El polinucleótido 18B codificante se aísla mediante digestión de 18B en el vector de ensamblaje KA usando la enzima de restricción BtgZI, seguido de electroforesis en gel, aislamiento de fragmentos y extracción en gel. Los fragmentos pBE-S y 18B se unen usando Gibson Assembly Master Mix (New England Biolabs) según las instrucciones del fabricante, y el plásmido resultante se transforma en E. coli usando técnicas estándar para el posterior aislamiento clonal, amplificación del ADN y purificación del ADN. El plásmido resultante, pBE-S-18B (SEQ ID NO: 1513), se diversifica luego mediante la inserción de diversos péptidos señal (la "mezcla de ADN SP") según las instrucciones del fabricante. A continuación, se transforma una mezcla de plásmidos pBE-S-18B que contienen diferentes péptidos señal de secreción en la cepa RIK1285 de B. subtilis según las instrucciones del fabricante. 96 de las colonias resultantes se incuban en medio TY (10 g/L de triptona, 5 g/L de extracto de levadura, 5 g/L de NaCl) durante 48 horas, momento en el cual las células se peletizan y el sobrenadante se analiza mediante transferencia Western expresión del polipéptido 18B.

Ejemplo 8

Expresión de 18B de Chlamydomonas reinhardtii

Un vector de E. coli que lleva un casete de expresión de C. reinhardtii escindible, pChlamy (SEQ ID NO: 1514), se construye primero usando síntesis de ADN comercial y técnicas estándar. El casete se describe en detalle en Rasala, B.A., Robust expression and secretion of Xylanase1 in Chlamydomonas reinhardtii by fusion to a selection gene and processing with the FMDV 2A peptide, PLoS One, 7:8 (2012). El polipéptido que codifica 18B, una etiqueta 3x FLAG y un codón de parada se traduce de forma inversa usando la preferencia de codón de C. reinhardtii (disponible, por ejemplo, en http://www.kazusa. o .jp/codon/cgibin/showcodon.cgi?species=3055) y sintetizados usando síntesis comercial. Durante la síntesis, se incluyen sitios BbsI flanqueantes para permitir la liberación del polinucleótido 18B-3x FLAG. Se une el polinucleótido resultante de la amplificación por PCR del plásmido pChlamy usando cebadores manipulados para generar un fragmento lineal que incluye la secuencia completa del plásmido excepto 5'-ATGTTTTAA- 3' y que también incluye 40 pb de homología con la secuencia codificante 18B-3xFLAG en cada extremo con el polinucleótido 18B-3xFLAG liberado por digestión con BbsI usando una reacción de Gibson, y transformado en E. coli para selección clonal, amplificación de ADN y aislamiento de plásmidos. El plásmido resultante se digiere con Bsal para liberar el casete de expresión 18B, que se aísla mediante purificación en gel. El fragmento digerido se electropora en la cepa cc3395, que luego se selecciona con zeocina a 15 |ig/ml. Se cultivan varios clones en cultivo líquido, las células se peletizan mediante centrifugación y el sobrenadante se analiza mediante transferencia Western para determinar la expresión de proteínas.

Ejemplo 9

Secuencias adicionales de seda y similares a la seda

Se obtuvieron secuencias de seda adicionales y similares a seda y secuencias parciales de la base de datos de secuencias de NCBI mediante la búsqueda del término "seda" mientras se excluía "espidroína", "bombyx" y "latrodectus". Un subconjunto de las secuencias de nucleótidos resultantes se tradujo en secuencias de aminoácidos y luego se curaron para eliminar las secuencias de repetición. Se eliminaron las secuencias cortas, generalmente de menos de 200-500 aminoácidos de longitud. Además, las secuencias primarias para polipéptidos seleccionados que se sabe que forman elementos estructurales se obtuvieron de bases de datos públicas. Las secuencias de aminoácidos así obtenidas, además de las secuencias descritas en el ejemplo 1, se usaron para buscar secuencias de seda adicionales y similares a la seda por homología. Las secuencias de seda y similares a la seda resultantes se curaron y luego se dividieron en regiones repetitivas y no repetitivas.

Se seleccionaron secuencias repetitivas de polipéptidos (secuencias de repetición (R)) de cada secuencia de seda e incluyen SEQ ID NOs: 2157-2690 (SEQ ID No s : 2157-2334 son secuencias de nucleótidos, SEQ ID NOs: 2335-2512 son secuencias de nucleótidos con secuencias flanqueantes para la clonación, y las SEQ ID NOs: 2513-2690 son secuencias de aminoácidos). Algunas de las secuencias R se han alterado, por ejemplo, mediante la adición de una serina al terminal C para evitar terminar la secuencia con un aminoácido F, Y, W, C, H, N, M o D. Esto permite la incorporación al sistema vectorial descrito anteriormente. Los bloques incompletos también pueden haberse alterado mediante la incorporación de segmentos de una secuencia homóloga de otro bloque.

Las secuencias de dominio N terminal no repetitivas (secuencias N) y las secuencias de dominio C terminal (secuencias C) también se seleccionaron de algunas secuencias de seda y similares a seda (SEQ ID Nos: 2157-2690). Las secuencias del dominio N-terminal se alteraron mediante la eliminación de la secuencia señal principal y, si no estaba ya presente, la adición de un residuo de glicina N-terminal. En algunos casos, los dominios N y/o C no se separaron de la (s) secuencia (s) R antes del procesamiento adicional. Las secuencias de aminoácidos R, N y C se tradujeron de forma inversa a secuencias de nucleótidos como se describe en el ejemplo 2. Las secuencias de nucleótidos resultantes se flanquearon con las siguientes secuencias durante la síntesis para permitir la clonación:

5'-GAAGACTTAA - SEDA - GGTACGTCTTC-3' (SEQ ID NOS 2833 y 2826) donde "SEDA" es una secuencia de polinucleótidos seleccionada según las instrucciones anteriores.

El ADN lineal resultante se digirió con BbsI y se ligó en el vector RM747 (SEQ ID NO: 2696) que se había digerido con BsmBI para liberar un inserto ficticio. El material ligado se transformó en E. coli para el aislamiento clonal, la amplificación del ADN y la verificación de la secuencia usando métodos estándar. Los plásmidos resultantes se digirieron con BsaI y BbsI, y el fragmento que codificaba un polipéptido de seda o similar a la seda se aisló mediante electroforesis en gel, escisión del fragmento y extracción en gel. El fragmento se ligó posteriormente en el vector de expresión RM1007 (SEQ ID NO: 2707) que había sido digerido con BsmBI y tratado con fosfatasa alcalina intestinal de ternera. El material ligado se transformó en E. coli para el aislamiento clonal, la amplificación del ADN y la verificación de la secuencia usando métodos estándar.

Los vectores de expresión que contienen secuencias R, N y/o C se transformaron en Pichia (Komagataella) pastoris (cepa RMs71, descrita en el ejemplo 3) usando el método PEG (Cregg, J.M. et al., DNA-mediated transformation, Methods Mol. Biol., 389, pg. 27-42 (2007)). El vector de expresión consistía en una región de dirección y un promotor (pGAP), un marcador de resistencia dominante (nat - que confiere resistencia a nourseotricina), una señal de secreción (factor de emparejamiento alfa líder y pro secuencia), un epítopo C-terminal 3xFLAG y un terminador (señal pAOX1 pA).

Los transformantes se sembraron en placas de agar con medio de peptona dextrosa de extracto de levadura (YPD) que contenían 25 |ig/ml de nourseotricina y se incubaron durante 48 horas a 30 °C. Se inocularon dos clones de cada transformación en 400 |il de medio de complejo de glicerol regulado (BMGY) en un bloque de 96 pocillos cuadrados y se incubó durante 48 horas a 30 °C con agitación a 1000 rpm. Las células se peletizaron mediante centrifugación y el sobrenadante se recuperó para el análisis del contenido de polipéptido de copolímero en bloques mediante análisis de transferencia Western del epítopo 3xFLAG.

La expresión y secreción satisfactoria de polipéptidos se juzgó mediante transferencia Western. Cada carril Western se puntuó como 1: Sin banda 2: Banda moderada o 3: Banda intensa. Se registró la mayor de las dos puntuaciones para cada clon. En la figura 14 se muestran datos representativos de la transferencia de Western. En la tabla 7 se muestra una lista completa de todas las secuencias R, N y C probadas junto con los resultados de la transferencia de Western. Los polipéptidos de copolímeros de bloques de seda y similares a la seda de numerosas especies se expresaron con éxito, abarcando diversas especies y diversas estructuras polipeptídicas.

Se han descrito un número de realizaciones de la invención. No obstante, se entenderá que se pueden realizar diversas modificaciones sin apartarse del espíritu y alcance de la invención.

Tabla 7: Secuencias de polipéptidos de seda adicionales

Ejemplo 10

Variantes permutadas circularmente de polipéptidos de Argiope bruennichi MaSp2

Los 6 bloques repetidos (copolímero de bloque) de Argiope bruennichi MaSp2 identificados en el ejemplo 5 se permutaron circularmente aproximadamente 90 grados (moviendo ~1.5 bloques desde el final de los seis bloques hasta el principio), luego se dividieron en 2 Secuencias R que constan de 3 bloques cada una, RM2398 (SEQ ID NO: 2708) y RM2399 (SEQ ID NO: 2709). Estas secuencias de 3 bloques se usaron posteriormente para generar secuencias de 6 bloques giradas ~90 y ~270 grados de la secuencia original de 6 bloques, y las secuencias de 3 bloques existentes (RM409 y RM410) se usaron para generar una secuencia de 6 bloques girada —180 grados. Cada secuencia de 6 bloques se ensambló luego en secuencias de 18 bloques. El procedimiento de ensamblaje y las secuencias rotadas se muestran en la figura 15.

Para generar RM2398 y RM2399, el plásmido RM439 (SEQ ID NO: 467) se amplificó mediante PCR usando ya sea los cebadores RM2398F (5'-CTAAGAGGTCTCACAGGTAGTCAAGGACCTGGTTCAGG-3') (SEQ ID NO: 2834) y RM2398R (5'-TTCAGTGGTCTCTACCTTGTTGTCCTCCAGATCCAG-3') (SEQ ID NO: 2835) o RM2399F (5'CTAAGAGGTCTCACAGGTCCTGGAGGTCAGGGTCCAT-3') (SEQ ID NO: 2836) y RM2399R (5'-TTCAGTGGTCTCTACCTGGTCCCTGTTGACCAGCACCAGGA-3') (SEQ ID NO: 2837). Cada reacción consistió en 12.5 |iL 2x de solución reguladora KOD Extreme, 0.25 |il de polimerasa KOD Extreme Hot Start, 0.5 |il de oligo directo 10 |iM, 0.5 |il de inverso oligo 10 |iM, 5 ng de ADN molde (RM439), 0.5 |il de dNTP 10 |iM y ddH2O agregada a un volumen final de 25 |il. Luego, cada reacción se termocicló según el programa:

1. Desnaturalizar a 94 °C, durante 5 minutos

2. Desnaturalizar a 94 °C, durante 30 segundos

3. Hibridar a 55 °C, durante 30 segundos.

4. Extender a 72 °C, durante 60 segundos

5. Repetir las etapas 2 a 4 durante 29 ciclos adicionales.

6. Extensión final a 72 °C, durante 5 minutos

El ADN lineal resultante se digirió con Bsal y se ligó en los vectores de ensamblaje RM2086 (SEQ ID NO: 2693) y RM2089 (SEQ ID NO: 2695) que se habían digerido con BsmBI. El material ligado se transformó en E. coli para el aislamiento clonal, la amplificación del ADN y la verificación de la secuencia usando métodos estándar. Usando el procedimiento de ensamblaje 2ab descrito en el ejemplo 5 (con modificaciones menores en los vectores de ensamblaje para desplazar los sitios de corte BtgZI más lejos de las secuencias de seda), los fragmentos de 3 bloques se ensamblaron en dos fragmentos de 6 bloques diferentes, uno con RM2398 procediendo RM2399 (produciendo RM2452 - SEQ ID NO: 2710), y uno con RM2399 procediendo RM2398 (produciendo RM2454 -SEQ ID NO: 2712). Adicionalmente, se digirieron RM409 (SEQ ID NO 463) y RM410 (SEQ ID NO 464) del vector de ensamblaje RM396 con BbsI y BsaI, y se ligaron en el vector RM2105 (SEQ ID NO: 2691) que se había digerido con BbsI y BsaI y se trataron con fosfatasa alcalina intestinal de ternera. El material ligado se transformó en E. coli para el aislamiento clonal, la amplificación del ADN y la verificación de la secuencia usando métodos estándar. Los plásmidos resultantes se digirieron posteriormente con AscI y Sbfl y los fragmentos que codifican una seda se aislaron mediante electroforesis en gel, escisión de fragmentos y extracción en gel. Los fragmentos se ligaron posteriormente en los vectores de ensamblaje RM2086 y RM2089 que habían sido digeridos con AscI y Sbfl. El material ligado se transformó en E. coli para el aislamiento clonal, la amplificación del ADN y la verificación de la secuencia usando métodos estándar. Usando el ensamblaje 2ab, se generó un fragmento de 6 bloques que consistía en RM410 procediendo de RM409 (produciendo RM2456 - SEQ ID NO: 2711). Se digirieron RM2452, RM2454 y RM2456 del vector de ensamblaje RM2081 (SEQ ID NO: 2692) con AscI y Sbfl, y se ligaron en los vectores de ensamblaje RM2088 y RM2089 que se habían digerido con AscI y Sbfl. El material ligado se transformó en E. coli para el aislamiento clonal, la amplificación del ADN y la verificación de la secuencia usando métodos estándar. Usando el ensamblaje 2ab, se generaron secuencias de 18 bloques a partir de cada uno de los tres fragmentos de 6 bloques, lo que dio como resultado las secuencias RM2462 (SEQ ID NO: 2713), RM2464 (SEQ ID NO: 2715) y RM2466 (SEQ ID NO: 2714). A continuación, cada una de las secuencias de 6 bloques y 18 bloques se digirió del vector de ensamblaje usando BsaI y BbsI, y los fragmentos que codifican una seda se aislaron mediante electroforesis en gel, escisión de fragmentos y extracción en gel. Los fragmentos se ligaron posteriormente con el vector de expresión RM1007 (SEQ ID NO: 2707) que había sido digerido con BsmBI y tratado con fosfatasa alcalina intestinal de ternera. El material ligado se transformó en E. coli para el aislamiento clonal, la amplificación del ADN y la verificación de la secuencia usando métodos estándar. Los plásmidos resultantes se linealizaron con BsaI y se usaron para transformar Pichia (Komagataella) pastoris (cepa RMs71, descrita en el ejemplo 3) usando el método PEG (Cregg, J.M. et al., DNA-mediated transformation, Methods Mol. Biol., 389, pg. 27-42 (2007)). Los transformantes se sembraron en placas de agar con medio de peptona dextrosa de extracto de levadura (YPD) que contenían 25 |ig/ml de nourseotricina y se incubaron durante 48 horas a 30 °C. Se inocularon dos clones de cada transformación en 400 |il de medio de complejo de glicerol regulado (BMGY) en un bloque de 96 pocillos cuadrados y se incubó durante 48 horas a 30 °C con agitación a 1000 rpm. Las células se peletizaron mediante centrifugación y el sobrenadante se recuperó para el análisis del contenido de polipéptido de seda mediante análisis de transferencia Western del epítopo 3xFLAG. Los datos de transferencia Western para un clon representativo de cada polipéptido se muestran en la figura 16. La expresión y secreción de cada uno de los polipéptidos permutados circularmente parece comparable a su contraparte sin rotar. Esto sugiere que se puede seleccionar cualquier número de posiciones de partida para identificar bloques en polipéptidos repetidos de seda o similares a seda sin consecuencias sobre la expresión o secreción de polipéptidos compuestos por esos bloques.

Ejemplo 11

Cambio de expresión de un polinucleótido de Argiope bruennichi MaSp2 mediante el control del número de copias y la resistencia del promotor

Se sabe que el grado de transcripción de un polinucleótido introducido exógenamente afecta la cantidad de polipéptido producido (véase, por ejemplo, Liu, H., et al., Direct evaluation of the effect of gene dosage on secretion of protein from yeast Pichia pastoris by expressing EGFP, J. Microbiol. Biotechnol., 24:2, pg. 144-151 (2014); y Hohenblum, H., et al., Effects of gene dosage, promoters, and substrates on unfolded protein stress of recombinant Pichia pastoris, Biotechnol. Bioeng., 85:4, pg. 367-375 (2004)). En Pichia (Komagataella) pastoris, el grado de transcripción se controla comúnmente aumentando ya sea el número de copias de un polinucleótido que se integran en el genoma del hospedador o seleccionando un promotor apropiado para impulsar la transcripción (véase por ejemplo Hartner, F.S., et al., Promoter library designed for finetuned gene expression in Pichia pastoris, Nucleic Acids Res., 36:12 (2008); Zhang, A.L., et al., Recent advances on the GAP promoter derived expression system of Pichia pastoris, Mol. Biol. Rep., 36:6, pg. 1611-1619 (2009); Ruth, C., et al., Variable production windows for porcine trypsinogen employing synthetic inducible promoter variants in Pichia pastoris, Syst. Synth. Biol., 4:3, pg. 181-191 (2010); Stadlmayr, G., et al., Identification and characterisation of novel Pichia pastoris promoters for heterologous protein production, J. Biotechnol., 150:4, pg. 519-529 (2010)). Una adición relativamente reciente al conjunto de promotores usados para la expresión de proteínas heterólogas es pGCW14 (Liang, S., Identification and characterization of P GCW14: a novel, strong constitutive promoter of Pichia pastoris, Biotechnol. Lett. 35:11, pg. 1865-1871 (2013)), que se informa que es de 5 a 10 veces más fuerte que pGAP. Para validar que la expresión y secreción de los polipéptidos de seda y similares a la seda también se pueden ver influenciadas por el número de copias, se generaron y probaron las cepas que contienen 1,3 o 4 copias de pGAP conducen a la expresión de 18B (descrita en el ejemplo 5) y las cepas que contienen 1, 2, 3 o 4 copias de pGCW14 que impulsa la expresión de 18B. Las cepas se describen en la tabla 8.

Tabla 8: Cepas con múltiples secuencias de polinucleótidos o diferentes promotores

La secuencia de polinucleótidos que codifica el factor de emparejamiento alfa 18B etiqueta 3xFLAG se digirió del plásmido descrito en el ejemplo 5 (RM468, SEQ ID NO: 1401, con RM439, SEQ ID NO: 467 clonado) usando la enzima de restricción AscI y Sbfl. El fragmento que codifica el factor de emparejamiento alfa 18B etiqueta 3xFLAG se aisló mediante electroforesis en gel, escisión del fragmento y extracción en gel. El ADN lineal resultante se ligó en los vectores de expresión RM630 (SEQ ID NO: 2697), RM631 (SEQ ID NO: 2698), RM632 (SEQ ID NO: 2699), RM633 (SEQ ID NO: 2700), RM812 (SEQ ID NO: 2701), RM837 (SEQ ID NO: 2702), RM814 (SEQ ID NO: 2703) y RM815 (SEQ ID NO: 2704) que habían sido digeridos con AscI y SbfI. Los atributos clave de los vectores de expresión se resumen en la tabla 9, y las secuencias incluyen SEQ ID NOs: 2691-2707. El material ligado se transformó en E. coli para el aislamiento clonal, la amplificación del ADN y la verificación de la secuencia usando métodos estándar.

Tabla 9: Vectores adicionales

El polinucleótido que codifica 18B en el vector de expresión RM630 se linealizó con Bsal y se transformó en Pichia (Komagataella) pastoris (cepa GS115 - NRRL Y15851) usando el método PEG (Cregg, J.M. et al., DNA-mediated transformaron, Methods Mol. Biol., 389, pg. 27-42 (2007)). Los transformantes se sembraron en placas de agar dextrosa mínima (MD) (sin aminoácidos agregados) y se incubaron durante 48 horas a 30 °C. Esto dio como resultado la creación de la cepa Rm s126, 1x pGAP 18B.

Posteriormente, RMs126 se transformó junto con el polinucleótido que codifica 18B en los vectores de expresión RM632 y RM633 (linealizados con Bsal) usando el método de electroporación (Wu., S., and Letchworth, G.J., High efficiency transformation by electroporation of Pichia pastoris pretreated with lithium acetate and dithiothreitol, Biotechniques, 36:1, pg. 152-154 (2004)). Los transformantes se sembraron en placas de agar con medio de peptona dextrosa de extracto de levadura (YPD) que contenían 25 pg/ml de nourseotricina y 100 ug/ml de higromicina B y se incubaron durante 48 horas a 30 °C. Esto dio como resultado la creación de la cepa RMs127, 3x pGAP 18B.

Posteriormente, RMs127 se transformó con el polinucleótido que codifica 18B en el vector de expresión RM631 (linealizado con Bsal) usando el método PEG. Los transformantes se sembraron en placas de agar con medio de peptona dextrosa de extracto de levadura (YPD) que contenían 300 pg/ml de G418 y se incubaron durante 48 horas a 30 °C. Esto dio como resultado la creación de la cepa RMs134, 4x pGAP 18B.

Para generar las cepas RMs133, RMs138, RMs143 y RMs152 (1x, 2x, 3x y 4x p754 18B, respectivamente), la cepa GS115 (NRRL Y15851) se transformó en serie con el polinucleótido que codifica 18B en los vectores de expresión RM812, RM814, RM815 y RM837 (después de linealizar con BsaI) usando el método PEG.

Se incubó un clon de cada cepa en 400 pl de medio de complejo de glicerol regulado (BMGY) en un bloque de pocillos cuadrados de 96 pocillos y se incubó durante 48 horas a 30 °C con agitación a 1000 rpm. Las células se peletizaron mediante centrifugación y el sobrenadante se recuperó para el análisis del contenido de polipéptido de copolímero en bloques mediante análisis de transferencia Western del epítopo 3xFLAG. Los datos de transferencia Western para un clon representativo de cada polipéptido se muestran en la figura 16. Las intensidades de banda crecientes sugieren que una mayor transcripción resultó en la expresión y secreción de polipéptido de copolímero en bloques adicional, lo que confirma que la estrategia de aumentar las funciones de transcripción en el copolímero en bloques en base a unidades de repetición de polipéptidos de seda y similares a la seda.

Ejemplo 12

Comparación de la expresión y secreción de dominios R individuales con homopolímeros de dominios R

Los dominios R seleccionados adicionales de las SEQ ID NOs: 1-1398 que se expresaban y secretaban bien se concatenaron en dominios de repetición de 4 a 6x usando el ensamblaje 2ab (descrito en el ejemplo 5). Además, se usó el ensamblaje 2ab para concatenar una secuencia 12B con una secuencia 18B (del ejemplo 5), dando como resultado una secuencia 30B. Los productos resultantes se transfirieron a un vector de expresión, de manera que cada secuencia de seda está flanqueada por un dominio de emparejamiento alfa en el extremo 5 'y un dominio 3xFLAG en el extremo 3' y dirigido por un promotor pGAP. Las secuencias generadas se describen en la tabla 10, y las secuencias incluyen SEQ ID NOs: 2734-2748.

Tabla 10: Constructos adicionales de copolímeros de bloque de longitud completa con factor de emparejamiento alfa, dominios de repetición múltiples y dominios 3X FLAG

Los vectores de expresión del copolímero en bloques se transformaron luego en Pichia (Komagataella) pastoris (cepa RMs71, descrita en el ejemplo 3) usando el método PEG (Cregg, J.M. et al., DNA-mediated transformation, Methods Mol. Biol., 389, pg. 27-42 (2007)). Los transformantes se sembraron en placas de agar YPD que contenían 25 pg/ml de nourseotricina y se incubaron durante 48 horas a 30 °C. Se recogieron tres clones de cada transformación en 400 |il de BMGY en un bloque de 96 pocillos cuadrados y se incubaron durante 48 horas a 30 °C con agitación a 1000 rpm. Las células se peletizaron mediante centrifugación y el sobrenadante se recuperó para el análisis del contenido de polipéptido de seda mediante transferencia Western. Un clon representativo para cada construcción de copolímero en bloques, así como la contraparte del dominio 1x R y los constructos del dominio 4x R del ejemplo 6, se muestran en la figura 16. Como se observa en el ejemplo 6, la rayadura y múltiples bandas son evidentes en la transferencia Western. Si bien no se ha identificado la fuente específica de estas variaciones, generalmente son consistentes con los fenómenos por lo general observados, incluida la degradación de polipéptidos y la modificación postraduccional (por ejemplo, glicosilación). Además, la intensidad de banda 4-6x de los polipéptidos del dominio R parece ser más débil que las correspondientes 1x de los constructos del dominio R. Esto también es evidente en las series 6B, 12B, 18B y 30B de los polipéptidos Argiope bruennichi MaSp2. Esto sugiere que los copolímeros en bloques más largos que comprenden secuencias de repetición de seda generalmente se expresan y secretan menos bien que las secuencias de copolímeros en bloques más cortos que comprenden secuencias de repetición iguales o diferentes.

Ejemplo 13

Medición de la productividad de las cepas que expresan y secretan sedas

La tabla 11 enumera las productividades volumétricas y específicas de las cepas que expresan los polipéptidos descritos en el ejemplo 10, ejemplo 11 y ejemplo 12.

Tabla 11: Productividad de cepas productoras de polipéptidos de seda

Para medir la productividad, se inocularon 3 clones de cada cepa en 400 pl de medio de complejo de glicerol regulado (BMGY) en un bloque de 96 pocillos cuadrados y se incubaron durante 48 horas a 30 °C con agitación a 1000 rpm.

Después de la incubación de 48 horas, se usaron 4 |il de cada cultivo para inocular 400 |il recientes de BMGY en un bloque de 96 pocillos cuadrados, que luego se incubó durante 24 horas a 30 °C con agitación a 1000 rpm. A continuación, las células se peletizaron mediante centrifugación, se eliminó el sobrenadante y las células se resuspendieron en 400 |il de BMGY reciente. Las células se peletizaron de nuevo mediante centrifugación, se eliminó el sobrenadante y las células se resuspendieron en 800 |il de BMGY reciente. De esos 800 |il, se dividieron en alícuotas de 400 |il en un bloque de pocillos cuadrados de 96 pocillos, que luego se incubó durante 2 horas a 30 °C con agitación a 1000 rpm. Después de 2 horas, se registró la OD600 de los cultivos, se peletizaron las células mediante centrifugación y se recogió el sobrenadante para análisis adicional. La concentración de polipéptido de copolímero en bloques en cada sobrenadante se determinó mediante análisis de ensayo inmunoabsorbente ligado a enzima directo (ELISA) cuantificando el epítopo 3xFLAG.

Las productividades relativas de cada cepa confirman las observaciones cualitativas realizadas en base a los datos de transferencia de Western. Los polipéptidos permutados circularmente se expresan a niveles similares a las sedas sin rotar, los promotores más fuertes o más copias conducen a una mayor expresión y secreción del copolímero de bloque, y los polipéptidos de copolímero en bloques más largos que comprenden secuencias de repetición de seda generalmente se expresan menos bien que los copolímeros de bloque más cortos que comprenden el mismo o diferentes secuencias de repetición. Curiosamente, los gramos de 12B (55.9 kDa) producidos superan los gramos de 6B (29.5 kDa) producidos, lo que sugiere que los factores que conducen a una disminución de la expresión de copolímeros de bloque más grandes que comprenden secuencias de repetición de seda pueden no volverse dominantes hasta que la expresión de copolímeros de bloque más cercana al tamaño de 18B (82.2 kDa). Es importante destacar que la mayoría de los polipéptidos de copolímero en bloques tienen una productividad específica relativamente alta (> 0.1 mg de seda/g de peso de células secas (DCW)/hora. En algunas realizaciones, la productividad es superior a 2 mg de seda/g de DcW/hora. En otras realizaciones, la productividad es superior a 5 mg de seda/g de DCW/hora), antes de cualquier optimización del nivel de transcripción de polipéptidos. La transcripción adicional mejoró la productividad de 18B en aproximadamente 5 veces hasta 20 (casi 21) mg de polipéptido/g de DCW/hora.

Ejemplo 14

Medición de las propiedades mecánicas de la fibra de seda.

El polipéptido de copolímero en bloques producido en el ejemplo 5 se hiló en una fibra y se probó para determinar diversas propiedades mecánicas. En primer lugar, se preparó una solución de hilado de fibras disolviendo el polipéptido de copolímero en bloques purificado y seco en un disolvente de hilado a base de ácido fórmico, usando técnicas estándar. Se incubaron aditivos de centrifugado a 35 °C en un agitador rotatorio durante tres días con mezclado ocasional. Después de tres días, los aditivos de centrifugado se centrifugaron a 16000 rcf durante 60 minutos y se dejaron equilibrar a temperatura ambiente durante al menos dos horas antes del centrifugado.

Se extruyó el aditivo de hilado a través de un orificio de 50-200 |im de diámetro en un baño de coagulación a base de alcohol estándar. Las fibras se sacaron del baño de coagulación bajo tensión, se estiraron de 1 a 5 veces su longitud y posteriormente se dejaron secar. Se seleccionaron aleatoriamente al menos cinco fibras de los al menos 10 metros de fibras hiladas. Estas fibras se probaron para determinar las propiedades mecánicas de tracción usando un instrumento que incluía un actuador lineal y una celda de carga calibrada. Las fibras se estiraron con una deformación del 1 % hasta que fallaron. Los diámetros de las fibras se midieron con microscopía óptica a un aumento de 20x usando un software de procesamiento de imágenes. La tensión máxima media varío desde 54-310 MPa. El límite elástico medio varío desde 24-172 MPa. La deformación máxima media varío desde 2-200 %. El módulo inicial medio varío desde 1617-5820 MPa. El efecto de la proporción de estiramiento se ilustra en la tabla 12 y la figura 17. También, la tenacidad promedio de tres fibras se midió en 0.5 MJ itt3 (desviación estándar de 0.2), 20 MJ itt3 (desviación estándar de 0.9), y 59.2 MJ itt3 (desviación estándar de 8.9)

Tabla 12: Efecto de la proporción de extracción

Los diámetros de las fibras se determinaron como el promedio de al menos 4-8 fibras seleccionadas al azar de al menos 10 m de fibras hiladas. Para cada fibra, se realizaron seis mediciones en un tramo de 0.57 cm. Los diámetros variaron desde 4.48 a 12.7 |im. Los diámetros de las fibras fueron consistentes dentro de la misma muestra. Las muestras variaron en varios diámetros promedio: 10.3 |im (desviación estándar de 0.4 |im), 13.47 |im (desviación estándar de 0.36 |im), 12.05 |im (desviación estándar de 0.67), 14.69 |im (desviación estándar de 0.76 |im) y 9.85 |im (desviación estándar de 0.38 |im).

Una fibra particularmente eficaz que se hiló a partir de material de copolímero en bloques que se generó a partir de un protocolo optimizado de recuperación y separaciones tenía una resistencia máxima a la tracción última de 310 MPa, un diámetro medio de 4.9 |im (desviación estándar de 0.8) y una deformación máx del 20 %. Los resultados de la prueba de tracción de la fibra se muestran en la figura 18.

Las fibras se secaron durante la noche a temperatura ambiente. Los espectros FTIR se recogieron con un módulo ATR de diamante de 400 cm-1 a 4000 cm-1 con una resolución de 4 cm-1 (Figura 19). La región de amida I (1600 cm-1 a 1700 cm-1) se establece como la línea de base y se ajustó la curva con perfiles gaussianos en la ubicación 5-6 determinada por las ubicaciones de los picos de la segunda derivada de la curva original. El contenido de la lámina p se determinó como el área bajo el perfil gaussiano a -1620 cm-1 y -1690 cm-1 dividida por el área total de la región de amida I. Se probaron fibras hibridadas y sin tratar. Para la hibridación, las fibras se incubaron dentro de una cámara de vacío humidificada a 1.5 Torr durante al menos seis horas. Se encontró que las fibras no tratadas contenían un 31 % de contenido de láminas p, y se encontró que las fibras hibridadas contenían un 50 % de contenido de láminas p.

Las secciones transversales de las fibras se examinaron mediante congelación por fractura usando nitrógeno líquido. Las muestras se recubrieron por pulverización catódica con platino/paladio y se formaron imágenes con un Hitachi TM-1000 a un voltaje de aceleración de 5 kV. La figura 20 muestra que las fibras tienen superficies lisas, secciones transversales circulares, son sólidas y sin vacíos. En algunas realizaciones

Ejemplo 15

Producción de fibras óptimas

Se selecciona un dominio R de sedas similares a MaSp2 de los enumerados en las tablas 13a y 13b, y el dominio R se concatena en dominios de repetición 4x flanqueados por factor de emparejamiento alfa en el extremo 5' y 3X FLAG en el extremo 3' usando el esquema de ensamblaje mostrado en la figura 12. La concatenación se realiza como se describe en el ejemplo 4 y se muestra en la figura 7 y figura 8. La secuencia de polinucleótidos resultante y las secuencias de polipéptidos correspondientes se enumeran en las tablas 13a y 13b.

De las secuencias de las tablas 13a y 13b: (1) el contenido de prolina varía desde 11.35-15.74 % (los porcentajes de las tablas 13a y 13b se refieren a un número de residuos de aminoácidos del contenido especificado, en este caso, prolina-sobre un número total de residuos de aminoácidos en la secuencia polipeptídica correspondiente). El contenido de prolina de dominios R similares también podría variar entre 13-15 %, 11-16 %, 9-20 % o 3-24 %; (2) el contenido de alanina varía entre 16.09-30.51 %. El contenido de alanina de dominios R similares también podría variar entre 15 20 %, 16-31 %, 12-40 % o 8-49 %; (3) el contenido de glicina varía entre 29.66 y 42.15 %. El contenido de glicina de dominios R similares también podría variar entre 38-43 %, 29-43 %, 25-50 % o 21-57 %; (4) El contenido de glicina y alanina varía entre 54.17 y 68.59 %. El contenido de glicina y alanina de dominios R similares también podría variar entre 54-69 %, 48-75 % o 42-81 %; (5) el contenido de giro p varía entre 18.22-32,16 %. El contenido de giro p se calcula usando el método SOPMA de Geourjon, C. and Deleage, G., SOPMA: significant improvements in protein secondary structure prediction by consensus prediction from multiple alignments, Comput. Appl. Biosci., 11:6, pg. 681 684 (1995). El método SOPMA se aplica usando los siguientes parámetros: ancho de ventana -10; umbral de similitud -10; número de estados - 4. El contenido de giro p de dominios R similares también podría variar entre 25-30 %, 18 33 %, 15-37 % o 12-41 %; (6) el contenido de polialanina varía entre 12.64-28.85 %. Un motivo se considera un motivo de polialanina si incluye al menos cuatro residuos de alanina consecutivos. El contenido de polialanina de dominios R similares también podría variar entre 12-29 %, 9-35 % o 6-41 %; (7) el contenido del motivo GPG varía entre 22.95 46.67 %. El contenido de motivo GPG de dominios R similares también podría variar entre 30-45 %, 22-47 %, 18-55 % o 14-63 %; (8) el contenido de GPG y polialanina varía entre 42.21 y 73.33 %. El contenido de GPG y polialanina de dominios R similares también podría variar entre el 25-50 %, el 20-60 % o el 15-70 %. Otros tipos de seda exhiben diferentes intervalos de contenido de aminoácidos y otras propiedades. La figura 21 muestra los intervalos de contenido de glicina, alanina y prolina para diversos tipos de seda de las secuencias de polipéptidos de seda descritas en este documento. La figura 21 ilustra los porcentajes de residuos de aminoácidos de glicina, alanina o prolina sobre un número total de residuos en las secuencias polipeptídicas.

El producto resultante de la concatenación que comprende 4 secuencias de repetición, un factor de emparejamiento alfa y un dominio 3X FLAG se digiere con AscI y Sbfl para liberar la secuencia de seda deseada y se liga en los vectores de expresión RM812 (SEQ ID N: 2701), RM837 (SEQ ID NO: 2702), RM814 (SEQ ID NO: 2703) y RM815 (SEQ ID NO: 2704) (los atributos clave de los vectores de expresión se resumen en la tabla 9) que se han digerido con AscI y Sbfl. Se genera una cepa que contiene 4 copias del polinucleótido de seda bajo el control transcripcional de pGCW14 transformando en serie la cepa GS115 de Pichia (Komagataella) pastoris (NRRL Y15851) con los vectores de expresión resultantes (después de linealizarlos con BsaI) usando el método PEG. Los dominios de cuasirepetición similares pueden variar entre 500-5000, 119-1575, 300-1200, 500-1000 o 900-950 aminoácidos de longitud. El copolímero en bloques completo puede variar entre 40-400, 12.2-132, 50-200, o 70-100 kDa.

Tabla 13a: Propiedades de dominios R seleccionados

Tabla 13b: Propiedades de dominios R seleccionados

Se cultiva un clon de la cepa resultante según las siguientes condiciones: el cultivo se hace crecer en un medio de sal basal mínimo, similar al descrito en [http://tools.invitrogen.com/content/sfs/manuals/pichiaferm_prot.pdf] con 50 g/L de glicerol como materia prima de partida. El crecimiento ocurre en un recipiente de fermentación agitado controlado a 30 °C, con 1 VVM de flujo de aire y agitación de 2000 rpm. El pH se controla a 3 con la adición a demanda de hidróxido de amonio. Se agrega glicerol adicional según sea necesario en base a aumentos repentinos de oxígeno disuelto. Se deja que continúe el crecimiento hasta que el oxígeno disuelto alcanza el 15 % del máximo, momento en el que se recolecta el cultivo, por lo general a 200-300 OD de densidad celular.

El caldo del fermentador se descelulariza mediante centrifugación. Se recoge el sobrenadante del cultivo de Pichia (Komagataella) pastoris. Los componentes de bajo peso molecular se eliminan del sobrenadante usando ultrafiltración para eliminar partículas más pequeñas que los polipéptidos del copolímero en bloques. El sobrenadante del cultivo filtrado se concentra luego hasta 50x.

La solución de hilado de fibras se prepara disolviendo el polipéptido de copolímero en bloques purificado y seco en un disolvente de hilado a base de ácido fórmico. Los aditivos de hilado se incuban a 35 °C en un agitador rotatorio durante tres días con mezcla ocasional. Después de tres días, los aditivos de hilado se centrifugan a 16000 rcf durante 60 minutos y se dejan equilibrar a temperatura ambiente durante al menos dos horas antes del hilado. El aditivo de hilado se extruye a través de un orificio de 150 |im de diámetro en un baño de coagulación estándar a base de alcohol. Las fibras se extraen del baño de coagulación bajo tensión, se estiraron de 1 a 5 veces su longitud y, posteriormente, se dejan secar como una madeja apretada.

Se seleccionan aleatoriamente al menos cinco fibras de al menos 10 metros de fibras hiladas. Las fibras se prueban para determinar las propiedades mecánicas de tracción usando un instrumento personalizado, que incluye un actuador lineal y una celda de carga calibrada. Las fibras se montan con una longitud de calibre de 5.75 mm y se tiran a una tasa de deformación del 1 % hasta que fallan. La resistencia máxima a la tracción de las fibras se mide entre 50 y 500 MPa. Dependiendo de las fibras que se seleccionen: el límite elástico se mide en 24-172 MPa o 150-172 Mpa, la resistencia máxima a la tracción (tensión máxima) se mide en 54-310 MPa o 150-310 MPa, la deformación de rotura se mide en 2-200 % o 180-200 %, el módulo inicial se mide en 1617-5820 MPa o 5500-5820 MPa, y el valor de tenacidad se mide en al menos 0.5 MJ/m3, al menos 3.1 MJ/m3, o al menos 59.2 MJ/m3.

Las fuerzas resultantes se normalizan al diámetro de la fibra, medido por microscopía óptica. Los diámetros de las fibras se miden con microscopía óptica con un aumento de 20x usando un software de procesamiento de imágenes. Los diámetros de las fibras se determinan como el promedio de al menos 4-8 fibras seleccionadas al azar de al menos 10 m de fibras hiladas. Para cada fibra, se realizan seis mediciones en un tramo de 5.75 mm. Dependiendo de qué fibras se seleccionen, los diámetros de las fibras se miden entre 4-100 |im, entre 4.48-12.7 |im o entre 4-5 |im.

Para probar el contenido de cristalinidad de las láminas p de las fibras, las fibras se secan durante la noche a temperatura ambiente. Los espectros FTIR se recogen con un módulo ATR de diamante de 400 citt1 a 4000 cirr1 con una resolución de 4 cm-1. La región de amida I (1600 cm'1 a 1700 cm_1) se establece como línea de base y la curva se ajusta con perfiles gaussianos en la ubicación 5-6 determinada por las ubicaciones de los picos de la segunda derivada de la curva original. El contenido de la lámina p se determina como el área bajo el perfil gaussiano a -1620 cm’1 y -1690 cm_1 dividida por el área total de la región amida I. Para inducir la cristalinidad de la lámina p, las fibras se incuban dentro de una cámara de vacío humidificada a 1.5 Torr durante al menos seis horas. La morfología de la superficie de la fibra y las secciones transversales (tomadas por congelación por fractura usando nitrógeno líquido) se analizan mediante microscopía electrónica de barrido. Las muestras se recubren por pulverización catódica con platino/paladio y se obtienen imágenes con un Hitachi TM-1000 a un voltaje de aceleración de 5 kV.

Claims

REIVINDICACIONES

1. Un copolímero en bloques proteínico capaz de ensamblarse en una fibra, en el que el copolímero comprende al menos dos repeticiones contiguas, donde la repetición consiste en la secuencia de SEQ ID NO: 1396 o variantes permutadas circularmente de la misma.

2. El copolímero en bloques proteínico de la reivindicación 1, en el que el copolímero comprende de 2 a 8 repeticiones contiguas de SEQ ID NO: 1396 o variantes permutadas circularmente de la misma.

3. El copolímero en bloques proteínico de la reivindicación 1 o la reivindicación 2, en el que el copolímero comprende: una composición de alanina del 12-40 % de la secuencia de aminoácidos del copolímero;

una composición de glicina del 25-50 % de la secuencia de aminoácidos del copolímero;

una composición de prolina del 9-20 % de la secuencia de aminoácidos del copolímero;

una composición de giro p del 15-37 % de la secuencia de aminoácidos del copolímero;

un contenido de motivo de aminoácidos GPG del 18-55 % de la secuencia de aminoácidos del copolímero; y un contenido de motivo de aminoácidos de polialanina del 9-35 % de todos los aminoácidos del copolímero.

4. El copolímero de la reivindicación 1 o la reivindicación 2, que consiste en SEQ ID No. 1398.

5. Una fibra que comprende el copolímero en bloques proteínico de cualquier reivindicación anterior.

6. La fibra de la reivindicación 5, en la que la fibra tiene un diámetro de 4.48-12.7 |im.

7. La fibra de la reivindicación 5 o la reivindicación 6, que comprende una sección transversal circular.

8. La fibra de la reivindicación 5, en la que la fibra tiene:

un límite elástico de 24-172 MPa;

una tensión máxima de 54-310 MPa;

una deformación de rotura de 2-200 %;

un módulo inicial de 1617-5820 MPa; o

un valor de tenacidad de al menos 0.5 MJ/m3, opcionalmente a 59.2 MJ/m3.

9. Un vector de expresión que codifica el copolímero en bloques proteínicos de cualquiera de las reivindicaciones 1 a 4.

10. El vector de expresión de la reivindicación 9, que comprende además una señal de secreción unida operativamente a la secuencia codificante del polipéptido de copolímero en bloques, en el que opcionalmente la señal de secreción comprende una secuencia pro y líder del factor de emparejamiento alfa.

11. Una célula hospedadora que comprende el vector de expresión de la reivindicación 9 o la reivindicación 10.

12. Un método de producción del copolímero en bloques proteínico de la reivindicación 1, comprendiendo el método: cultivar la célula hospedadora de la reivindicación 11 en condiciones que permitan la expresión del copolímero en bloques a partir del vector de expresión, opcionalmente condiciones que dan como resultado la secreción del copolímero a una tasa de al menos 2-20 mg de seda / g de DCW / hora; y opcionalmente

recuperar el copolímero en bloques expresado o secretado.

13. Un medio de cultivo celular que comprende un copolímero secretado de la reivindicación 1.

14. Un método de producción de una fibra, que comprende

obtener el medio de cultivo celular de la reivindicación 13;

aislar la proteína secretada; y

procesar la proteína en una solución hilable y

producir una fibra a partir de la solución hilable.