En guide för metoder för att förutsäga proteinstrukturer och programvara

För att utöva sina biologiska funktioner viker proteiner in i en eller flera specifika konformationer, dikterade av komplexa och reversibla icke-kovalenta interaktioner. Bestämning av strukturen hos ett protein kan uppnås genom tidskrävande och relativt dyra tekniker såsom kristallografi, kärnmagnetisk resonansspektroskopi och dubbel polarisationsinterferometri. Programvara för bioinformatik har utvecklats för att beräkna och förutsäga proteinstrukturer baserat på deras aminosyrasekvenser.

En sammanfattning av proteinstrukturen

Som ett alternativ till experimentell teknik hjälper strukturanalys och prediktionsverktyg att förutsäga proteinstrukturen enligt deras aminosyrasekvenser. Att lösa strukturen för ett givet protein är mycket viktigt inom medicin (till exempel i läkemedelsdesign) och bioteknik (till exempel i utformningen av nya enzymer). Fältet för beräkning av proteinberäkning utvecklas alltså ständigt, efter ökningen av maskinernas beräkningskraft och utvecklingen av intelligenta algoritmer.

Det finns fyra nivåer av proteinstruktur (figur 1). I proteinstrukturprognos används den primära strukturen för att förutsäga sekundära och tertiära strukturer.

Sekundära strukturer av proteiner är lokaliserade vikning inom polypeptidkedjan som stabiliseras av vätebindningar. De vanligaste sekundära proteinstrukturerna är alfa-helices och beta-ark.

Tertiär struktur är den slutliga formen av proteinet när de olika sekundära strukturerna alla har vikts in i en 3D-struktur. Denna slutliga form formas och hålls samman genom jonisk interaktion, disulfidbroar och van de Waals-krafter.

Fyra nivåer av proteinstruktur. Bild från Khanacademy.org.

Proteinstruktur förutsägelsemetoder och programvara

Ett stort antal strukturprognosprogramvaror utvecklas för dedikerade proteinegenskaper och specificitet, såsom störningsförutsägelse, dynamikprognos, strukturbevarande förutsägelse, etc. Metoder inkluderar homologimodellering, proteindrängning, ab initio-metoder, sekundär strukturprognos, och transmembran helix och signalpeptidförutsägelse.

Att välja rätt metod börjar alltid med att använda den primära sekvensen för det okända proteinet och söka i proteindatabasen efter homologer (figur 2).

Beslutsfattande diagram för metod för proteinstrukturer.

Här är några detaljerade metoder för att förutsäga proteinstrukturen:

  • Förutsägningsverktyg för sekundär struktur

Dessa verktyg förutsäger lokala sekundära strukturer baserade endast på proteinets aminosyrasekvens. Förutsagda strukturer jämförs sedan med DSSP-poängen, som beräknas baserat på proteinets kristallografiska struktur (mer om DSSP-poängen här).

Förutsägelsemetoder för sekundärstruktur bygger huvudsakligen på databaser över kända proteinstrukturer och moderna maskininlärningsmetoder såsom nervnät och stödvektormaskiner.

Här är några bra verktyg för sekundär struktur förutsägelse.

  • Tertiär struktur

Tertiär (eller 3-D) struktur förutsägelse verktyg ingår i två huvudmetoder: Ab initio, och jämförande proteinmodellering.

Predikationsmetoder för ab initio (eller de novo) proteinstruktur försöker förutsäga tertiära strukturer från sekvenser baserade på allmänna principer som styr proteinviktsenergi och / eller statistiska tendenser till konformationella funktioner som infödda strukturer förvärvar, utan användning av uttryckliga mallar.

All information om ett proteins tertiära struktur är kodad i dess primära struktur (det vill säga dess aminosyrasekvens). Emellertid kan ett enormt antal av dem förutsägas, bland vilka endast en har den minimala fria energin och stabiliteten som krävs för att vikas ordentligt. Förutsägelse för ab initio-proteinstruktur kräver således enorm mängd beräkningskraft och tid för att lösa den ursprungliga konformationen av ett protein, och är fortfarande en av de största utmaningarna för modern vetenskap.

De populäraste servrarna inkluderar Robetta (med Rosetta-programvarupaketet), SWISS-MODEL, PEPstr, QUARK. Bläddra i en uttömmande lista här.

Om ett protein med känd tertiär struktur delar åtminstone 30% av dess sekvens med en potentiell homolog med obestämd struktur, kan jämförande metoder som täcker den förmodade okända strukturen med den kända användas för att förutsäga den troliga strukturen för det okända. Homologimodellering och proteinsträngning är två huvudstrategier som använder tidigare information om annat liknande protein för att föreslå en förutsägelse av ett okänt protein, baserat på dess sekvens.

Programvara för homologimodellering och proteinsträngning inkluderar RaptorX, FoldX, HHpred, I-TASSER och mer.

referenser

De novo protein struktur förutsägelse. Wikipedia.

Proteinstruktur förutsägelse. Wikipedia