Per iniziare a fabbricare
sete sintetiche che imitino le diverse proprietà meccaniche
osservate in natura, occorre una completa comprensione delle proteine
che controllano le proprietà fisiche delle fibre. Gli
scienziati hanno quindi utilizzato l'analisi di sequenza per la
clonazione dei geni della seta, al fine di rivelare le sequenze di
amminoacidi e meglio comprendere il loro rapporto struttura-funzione.
Analisi di sequenza del DNA di geni di seta diversi, recuperati da
differenti specie di ragno, hanno rivelato proteine comuni
nell'architettura delle sete. Analisi delle sequenze primarie delle
sete dimostrano regolari ripetizioni di peptidi che possono
essere raggruppati in quattro categorie:
Polyalanine (A
n) e (GA)
n,
regioni che in genere contengono da sei a
nove residui hanno dimostrato di formare strutture β-sheet
nella fibra. Queste regioni sono responsabili della trazione ad alta
forza,sono caratterizzate da tratti
ricchi di glicina. Tuttavia, la precisa struttura adottata dalle
regioni ricche di glicina (ripetizione di Gly-Gly-X) è
abbastanza controversa. Regioni ricche di glicina sono state descritte
come una gomma amorfa da studi con diffrazione a raggi X.
Le ripetizioni Gly-Pro-Gly-X-X pare siano coinvolte in una struttura a
spirale o elicoidale; questi moduli sono stati identificati nelle sete
della
flagelliform gland
e MA gland. I distanziali, che contengono
residui di carico, separano le ripetizioni in cluster.
Confronto tra gli amminoacidi che si ripetono individuati nelle diverse
proteine della seta di ragno. Le proteine della seta di ragno sono
modulari in natura, contenenti unità che si ripetono insieme
con diverse caratteristiche molecolari.
Le aree colorate in rosso indicano ripetizione di polialanina o GA; le
lettere blu denotano
ripetizioni di GGX; le lettere in arancione rappresentano ripetizioni
di GPGXX; e le regioni di colore rosa denotano iterazioni di GX.
MaSp1 (DQ409057), MaSp2(DQ409058), TuSp1 (AAZ15706), ECP-1 (AAX92677)
ed ECP-2 (ABC68105) tratte dal ragno
L.hesperus. Flag
silk dalla
Nephila madagascariensis
è (AAF36091); AcSp1 da
Argiope
trifasciata (AAR83925); MiSp1 (AAC14589) e MiSp2
(AAC14591) sono da
Nephila clavipes.
Gli asterischi dopo ECP-1 e ECP-2 indicano che queste
sequenze non presentano le tipiche unità di ripetizione, ma
sono presentati per dimostrare la presenza di moduli brevi che si
trovano comunemente nelle sete.
Tutte
i frammenti di fibre di dragline
silk
hanno dimostrato di contenere più di una proteina il cui
peso
molecolare può arrivare fino a centinaia di kilodalton.
Spidroin 1
(contrazione di
spider e fibroin) e spidroin 2 sono due delle subunità
proteiche
della seta prodotte nei principali nelle Major
ampullate glands.
In base al loro modello di espressione e alle somiglianze nella
sequenza primaria, queste proteine sono state nominato Major
ampullate spidroin
1 e 2, (MaSp1
e
MaSp2). Le MaSp hanno dimostrato di contenere brevi catene peptidiche
che si ripetono più volte in varie combinazioni per formare
moduli
strutturali ripetitivi. Le regioni ripetitive di MaSp1 hanno
dimostrato di essere essenzialmente privi di prolina, mentre sequenze
sequenze ripetute di MaSp2 contengono circa il 15% di prolina. Cloni
parziali di cDNA che codificano le due componenti proteiche sono
state isolate e caratterizzate soprattutto dalla N. Clavipes. Studi
indicano che in N. Clavipes il livello di MaSp1 nella seta è
più
alto di quello di MaSp2. Nel complesso studiando la composizione
degli amminoacidi calcolando la concentrazione di prolina si
è
dedotto che la fibra contiene circa l’81% di MaSp1 e il 19%
di
MaSp2. Non è ancora chiaro se le percentuali siano comuni
alle sete
di altre specie. Prove recenti suggeriscono che specie di ragno
diverse hanno diverse concentrazioni di MaSp1 e MaSp2 rispetto alla
N. Clavipes. Ad esempio Argiope Aurantia produce una fibra di seta
che contiene il 41% di MaSp1 e il 59% di MaSp2. Basandosi sulle ben
documentate variazioni inter e intraspecifiche è plausibile
pensare
che la variazione proteica influenzi le doti meccaniche della seta.
Quando le risorse e le condizioni di filatura sono ideali, il ragno
tesse una tela con prestazioni massime, quando invece le condizioni
non sono buone il ragno produce una seta metabolicamente più
economica e dalle caratteristiche peggiori.
Oltre
alla presenza di moduli ripetitivi all’interno di MaSp1 e
MaSp2,
entrambe hanno dimostrato di contenere
terminali
N e C non ripetitivi. Il terminale
C,
così come la sequenza di amminoacidi, ha dimostrato di
essere
presente in ragni di diversa origine filogenetica. La forte
conservazione della regione C-terminale per diverse centinaia di
milioni di anni implica un importante ruolo strutturale.
Inizialmente, due funzioni sono state proposte per la regione
C-terminale, tra cui (1) il ruolo di peptide segnale e (2) come
partecipante necessario per il controllo della solubilità
del
fibrone nella filatura ad alta concentrazione. Anche se queste
funzioni non si escludono a vicenda, studi recenti hanno rivelato che
le MaSp conservano il loro terminale C dopo l'estrusione.
Poiché le
sequenze segnale sono tipicamente rimosse nella proteina matura, il
loro mantenimento nella fibra estrusa riduce la probabilità
che
abbiano esclusivamente ruolo di segnale. Prove del fatto che il
terminale C sia coinvolto nella trasformazione dalla fase liquida a
quella solida cominciano a guadagnare favore scientifico. Regioni
localizzate del terminale C sono state recentemente determinate come
modulatori della solubilità dei fibroni, in forte dipendenza
dalle
condizioni ambientali.
Un
evento biologico che controlla la filatura è probabilmente
la
concentrazione di idrogeno. Residui entro i terminali C sono stati
proposti come bersaglio per la ionizzazione, che potrebbe avere un
ruolo importante nell'avvio dell’ assemblaggio di proteine
della
seta di ragno.