Utilizzando l’intelligenza artificiale, DeepMind prevede la struttura di quasi tutte le proteine conosciute. Questo aiuta, tra le altre cose, a comprendere meglio le malattie ea sviluppare farmaci più rapidamente. “Questo sta rivoluzionando le scienze della vita”.
Se vuoi capire la vita sulla Terra, devi capire come funzionano le proteine. Diventerà molto più facile per gli scienziati ora che la società britannica DeepMind, parte di Google dal 2014, ha messo su Internet una struttura di circa 200 milioni di proteine con l’aiuto dell’intelligenza artificiale.
L’algoritmo AlphaFold prevede l’aspetto di quasi tutte le proteine conosciute. Non solo ci sono quasi 20.000 proteine nel nostro corpo, ma anche piante, animali e microrganismi. “Questo rivela la struttura dell’universo delle proteine”, ha affermato Demis Hassabis, CEO di DeepMind. “Siamo all’alba di una nuova era in biologia”.
“AlphaFold sta rivoluzionando le scienze della vita”, afferma il biotecnologo Lennart Martens (UGent e Istituto fiammingo di biotecnologia). “Le proteine sono gli strumenti della biologia e quando sai che aspetto hanno, puoi capire meglio cosa stanno facendo. Proprio come un martello è diverso da un cacciavite”.
Il codice per la produzione delle proteine è memorizzato nel nostro DNA. Le proteine sono costituite da catene di amminoacidi e un gene contiene le istruzioni per collegare insieme gli amminoacidi in un ordine specifico. La proteina si ripiega quindi in una struttura tridimensionale unica. “Sappiamo che le informazioni al riguardo sono memorizzate nella proteina, quindi è inizialmente possibile prevedere la forma di una proteina in base alla sua sequenza di amminoacidi”, afferma il biologo molecolare Han Rimaut (VUB e VIB). “Ma non siamo ancora stati in grado di comprendere appieno queste regole”.
titano del lavoro
Questo rende lo smontaggio delle strutture proteiche un compito gigantesco. “È un processo costoso e laborioso”, afferma Remaut. “Potrebbero volerci anni per abbattere la struttura di una singola proteina”. Gli scienziati lo fanno, tra le altre cose, irradiando proteine con raggi X e deducendo la struttura dalla dispersione del raggio.
Fino a poco tempo, gli scienziati sono stati in grado di determinare sperimentalmente la struttura di circa 190 mila proteine. DeepMind ha addestrato il suo algoritmo utilizzando sequenze di amminoacidi e strutture proteiche note. AlphaFold cerca modelli in quella grande quantità di dati. L’algoritmo utilizza questa conoscenza per prevedere la struttura di altre proteine.
L’anno scorso AlphaFold ha già pubblicato la struttura di tutte le proteine umane e ha reso pubblicamente disponibile il software, in modo che i ricercatori potessero lavorarci da soli. Da allora, il numero di studi pubblicati utilizzando l’algoritmo è cresciuto in modo esponenziale. “Ha davvero accelerato la ricerca”, afferma Rima, che usa anche lui stesso AlphaFold. Ora che quasi tutte le proteine conosciute sono in un database pubblicamente disponibile, la loro struttura è determinata in base a un commento nella rivista Scienze Semplice come una ricerca su Google.
Sviluppa farmaci più velocemente
AlphaFold è particolarmente utile nella ricerca medica e nello sviluppo di farmaci. “La struttura della proteina ci insegna perché a volte smette di funzionare e può farci ammalare”, afferma Remaut. E le interazioni tra le proteine determinano se agenti patogeni come batteri e virus riescono a infettare i nostri corpi. Grazie a questa tecnologia, possiamo comprendere meglio questi processi”.
Quasi tutti i farmaci agiscono sulle proteine. Il loro obiettivo è attivare o disattivare determinate proteine consentendo a un’altra proteina di legarsi ad esse. Confrontalo con come hai messo la chiave nella serratura. Se non sai che aspetto hanno una serratura e le potenziali chiavi, devi testare casualmente migliaia di particelle fino a trovare una chiave che funzioni per te. “Con la conoscenza della struttura, non navighiamo più alla cieca e lo sviluppo di farmaci può accelerare notevolmente”, afferma Martins.
Ciò non significa che tutti i problemi biologici siano stati risolti in questo modo. AlphaFold non prevede sempre con precisione la struttura di una proteina. “Alcune proteine non sono forti come un martello, ma flessibili come un asciugamano”, dice Martins. “L’algoritmo sta ancora attraversando un periodo difficile”. Secondo l’Istituto Europeo di Bioinformatica (EBI), che è coinvolto nel lancio del database, circa il 35% delle strutture sono altamente accurate. Circa il 45 percento sono meno accurati, ma sono abbastanza buoni da far avanzare la ricerca.
Sembra strano che DeepMind condivida la sua esperienza in modo così altruistico. “Questa non era l’intenzione originale”, dice Remaut. “L’azienda è seduta su una fortuna da questo. Tuttavia, potrebbero decidere che non sarebbe etico non condividere tale conoscenza a causa della grande importanza. Inoltre, in DeepMind vogliono utilizzare la biologia sintetica per progettare molecole. Forse l’azienda fondamentalmente vede in questo un modello di business, e non è solo un primo passo”.
Le applicazioni non si limitano alla medicina. Ad esempio, gli scienziati britannici utilizzano AlphaFold per cercare proteine in grado di scomporre la plastica e i ricercatori norvegesi utilizzano questa tecnologia per saperne di più sulle proteine essenziali per il sistema immunitario delle api. “Questa è una miniera d’oro per la scienza”, dice Martins. “E stiamo appena iniziando a esplorarlo.”