Em 2017, recém-formado em seu doutorado em química teórica, John Jumper ouviu rumores de que o Google DeepMind havia abandonado o desenvolvimento de IA para jogos com habilidades sobre-humanas e estava iniciando um projeto secreto para prever as estruturas de proteínas. Ele se candidatou a uma vaga.
Apenas três anos depois, Jumper comemorou uma vitória impressionante que poucos previram. Junto com o CEO Demis Hassabis, ele co-liderou o desenvolvimento de um sistema de IA chamado AlphaFold 2, capaz de prever as estruturas de proteínas com precisão de até um átomo, igualando a acurácia de técnicas meticulosas usadas em laboratório e fazendo isso muitas vezes mais rápido — apresentando resultados em horas em vez de meses.
O AlphaFold 2 resolveu um grande desafio de 50 anos na biologia. “Essa é a razão pela qual fundei a DeepMind”, Hassabis me disse alguns anos atrás. “Na verdade, é por isso que dediquei toda a minha carreira à IA.” Em 2024, Jumper e Hassabis dividiram o Prêmio Nobel de Química .
Há cinco anos, nesta mesma semana, a estreia do AlphaFold 2 surpreendeu os cientistas. Agora que a euforia passou, qual foi o verdadeiro impacto do AlphaFold? Como os cientistas o estão utilizando? E o que vem por aí? Conversei com Jumper (e com alguns outros cientistas) para descobrir.
“Foram cinco anos extraordinários”, diz Jumper, rindo: “É difícil lembrar de uma época em que eu não conhecia um número tão grande de jornalistas.”
O AlphaFold 2 foi seguido pelo AlphaFold Multimer, capaz de prever estruturas contendo mais de uma proteína, e depois pelo AlphaFold 3 , a versão mais rápida até então. O Google DeepMind também disponibilizou o AlphaFold para o UniProt , um vasto banco de dados de proteínas usado e atualizado por milhões de pesquisadores em todo o mundo. Ele já previu as estruturas de cerca de 200 milhões de proteínas , quase todas as conhecidas pela ciência.
Apesar do sucesso, Jumper mantém-se modesto quanto às conquistas do AlphaFold. “Isso não significa que tenhamos certeza de tudo o que está lá dentro”, afirma. “É um banco de dados de previsões, e isso vem com todas as ressalvas inerentes a previsões.”
Um problema difícil
As proteínas são as máquinas biológicas que fazem os seres vivos funcionarem. Elas formam músculos, chifres e penas; transportam oxigênio pelo corpo e transmitem mensagens entre as células; ativam neurônios, digerem alimentos, fortalecem o sistema imunológico e muito mais. Mas entender exatamente o que uma proteína faz (e qual o seu papel em diversas doenças ou tratamentos) envolve descobrir sua estrutura — e isso é difícil.
As proteínas são formadas por cadeias de aminoácidos que, por forças químicas, se entrelaçam em nós complexos. Uma cadeia não entrelaçada oferece poucas pistas sobre a estrutura que irá formar. Em teoria, a maioria das proteínas poderia assumir um número astronômico de formas possíveis. O desafio é prever qual delas está correta.
Jumper e sua equipe construíram o AlphaFold 2 usando um tipo de rede neural chamada Transformer, a mesma tecnologia que sustenta grandes modelos de linguagem. Os Transformers são muito bons em prestar atenção a partes específicas de um quebra-cabeça maior.
Mas Jumper atribui grande parte do sucesso à criação de um modelo protótipo que pudesse ser testado rapidamente. “Conseguimos um sistema que dava respostas erradas com uma velocidade incrível”, diz ele. “Isso facilitou muito o início da experimentação com as ideias que testamos.”
Eles carregaram a rede neural com o máximo de informações possível sobre estruturas de proteínas, como por exemplo, como proteínas de certas espécies desenvolveram formas semelhantes. E funcionou ainda melhor do que esperavam. “Tínhamos certeza de que tínhamos feito uma descoberta revolucionária”, diz Jumper. “Tínhamos certeza de que se tratava de um avanço incrível em termos de ideias.”
O que ele não previu foi que os pesquisadores baixariam seu software e começariam a usá-lo imediatamente para tantas coisas diferentes. Normalmente, é o que tem o verdadeiro impacto algumas iterações depois, quando os problemas iniciais já foram resolvidos, diz ele: “Fiquei surpreso com a responsabilidade com que os cientistas o usaram, em termos de interpretação e aplicação prática, confiando nele na medida certa, na minha opinião, nem demais nem de menos.”
Algum projeto em particular se destaca?
Ciência das abelhas
Jumper menciona um grupo de pesquisa que usa AlphaFold para estudar a resistência a doenças em abelhas. “Eles queriam entender essa proteína específica enquanto investigam problemas como o colapso das colônias”, diz ele. “Eu nunca teria dito: ‘Sabe, é claro que AlphaFold será usado na ciência das abelhas.'”
Ele também destaca alguns exemplos do que chama de usos não convencionais do AlphaFold — “no sentido de que não havia garantia de que funcionaria” — onde a capacidade de prever estruturas de proteínas abriu novas técnicas de pesquisa. “O primeiro exemplo, muito obviamente, são os avanços no design de proteínas”, diz ele. “David Baker e outros exploraram essa tecnologia ao máximo.”
Baker, um biólogo computacional da Universidade de Washington, foi um dos vencedores do Prêmio Nobel de Química do ano passado , juntamente com Jumper e Hassabis, por seu trabalho na criação de proteínas sintéticas para desempenhar tarefas específicas — como tratar doenças ou decompor plásticos — melhor do que as proteínas naturais.
Baker e seus colegas desenvolveram sua própria ferramenta baseada no AlphaFold, chamada RoseTTAFold. Mas eles também experimentaram o AlphaFold Multimer para prever quais de seus projetos de potenciais proteínas sintéticas funcionarão.
“Basicamente, se o AlphaFold concordar com a estrutura que você estava tentando projetar, você a cria; caso contrário, se o AlphaFold disser ‘Não sei’, você não a cria. Só isso já representou uma enorme melhoria.” Segundo Jumper, isso pode tornar o processo de projeto 10 vezes mais rápido.
Outro uso não convencional que Jumper destaca: transformar o AlphaFold em uma espécie de mecanismo de busca. Ele menciona dois grupos de pesquisa distintos que estavam tentando entender exatamente como os espermatozoides humanos se ligavam aos óvulos durante a fertilização. Eles conheciam uma das proteínas envolvidas, mas não a outra, diz ele: “Então, eles pegaram uma proteína conhecida do óvulo e analisaram todas as 2.000 proteínas da superfície dos espermatozoides humanos, e encontraram uma que o AlphaFold tinha certeza que se ligava ao óvulo”. Eles então conseguiram confirmar isso em laboratório.
“Essa ideia de que você pode usar o AlphaFold para fazer algo que não conseguia fazer antes — você nunca faria 2.000 estruturas procurando por uma única resposta”, diz ele. “Acho esse tipo de coisa realmente extraordinária.”
Cinco anos depois
Quando o AlphaFold 2 foi lançado, perguntei a alguns dos primeiros usuários o que eles achavam. As avaliações foram boas, mas a tecnologia era muito nova para saber ao certo qual seria seu impacto a longo prazo. Entrei em contato com uma dessas pessoas para saber sua opinião cinco anos depois.
Kliment Verba é um biólogo molecular que dirige um laboratório na Universidade da Califórnia, em São Francisco. “É uma tecnologia incrivelmente útil, sem dúvida”, diz ele. “Usamos todos os dias, o tempo todo.”
Mas está longe de ser perfeito. Muitos cientistas usam o AlphaFold para estudar patógenos ou desenvolver medicamentos. Isso envolve analisar as interações entre múltiplas proteínas ou entre proteínas e moléculas ainda menores no organismo. No entanto, sabe-se que o AlphaFold é menos preciso em fazer previsões sobre múltiplas proteínas ou suas interações ao longo do tempo.
Verba diz que ele e seus colegas usam o AlphaFold há tempo suficiente para se acostumarem com suas limitações. “Há muitos casos em que você recebe uma previsão e fica meio sem entender”, diz ele. “Isso é real ou não? Não é totalmente claro — é meio que uma situação ambígua.”
“É mais ou menos a mesma coisa que o ChatGPT”, acrescenta. “Sabe, ele vai te enganar com a mesma convicção com que daria uma resposta verdadeira.”
Ainda assim, a equipe de Verba usa o AlphaFold (tanto a versão 2 quanto a 3, pois cada uma tem suas vantagens, segundo ele) para executar versões virtuais de seus experimentos antes de realizá-los em laboratório. Com os resultados do AlphaFold, eles conseguem definir melhor o foco de um experimento — ou decidir que não vale a pena fazê-lo.
Ele afirma que isso pode realmente economizar tempo: “Não substituiu nenhum experimento, mas os aprimorou bastante.”
Nova onda
O AlphaFold foi projetado para ser usado para uma variedade de propósitos. Agora, diversas startups e laboratórios universitários estão se baseando em seu sucesso para desenvolver uma nova geração de ferramentas mais voltadas para a descoberta de medicamentos. Este ano, uma colaboração entre pesquisadores do MIT e a empresa de IA para medicamentos Recursion produziu um modelo chamado Boltz-2, que prevê não apenas a estrutura de proteínas, mas também a afinidade de moléculas de medicamentos em potencial por seus alvos .
No mês passado, a startup Genesis Molecular AI lançou outro modelo de previsão de estrutura chamado Pearl , que a empresa afirma ser mais preciso que o AlphaFold 3 para determinadas consultas importantes para o desenvolvimento de medicamentos. O Pearl é interativo, permitindo que os desenvolvedores de medicamentos forneçam ao modelo quaisquer dados adicionais que possuam para orientar suas previsões.
O AlphaFold representou um grande avanço, mas ainda há muito a ser feito, afirma Evan Feinberg, CEO da Genesis Molecular AI: “Continuamos inovando fundamentalmente, apenas com um ponto de partida melhor do que antes.”
A Genesis Molecular AI está reduzindo as margens de erro de menos de dois angstroms, o padrão de facto da indústria estabelecido pela AlphaFold, para menos de um angstrom — um décimo milionésimo de milímetro, ou a largura de um único átomo de hidrogênio.
“Pequenos erros podem ser catastróficos para prever a eficácia com que um medicamento se ligará ao seu alvo”, afirma Michael LeVine, vice-presidente de modelagem e simulação da empresa. Isso ocorre porque as forças químicas que interagem a um angstrom podem deixar de interagir a dois. “A interação pode mudar de ‘Elas nunca vão interagir’ para ‘Elas vão interagir’”, explica.
Com tanta atividade nessa área, quando podemos esperar que novos tipos de medicamentos cheguem ao mercado? Jumper é pragmático. A previsão da estrutura de proteínas é apenas uma etapa entre muitas, afirma: “Esse não era o único problema da biologia. Não é como se estivéssemos a um passo de curar qualquer doença com apenas uma estrutura de proteína.”
Pense da seguinte maneira, diz ele. Descobrir a estrutura de uma proteína poderia ter custado US$ 100.000 em laboratório: “Se estivéssemos a apenas cem mil dólares de fazer algo, já teria sido feito.”
Ao mesmo tempo, os pesquisadores estão buscando maneiras de aproveitar ao máximo essa tecnologia, diz Jumper: “Estamos tentando descobrir como fazer da previsão de estrutura uma parte ainda maior da solução do problema, porque temos uma ferramenta poderosa para combatê-lo.”
Em outras palavras, transformar tudo em pregos? “Sim, vamos transformar tudo em pregos”, diz ele. “Como podemos fazer com que essa coisa que produzimos um milhão de vezes mais rápido se torne uma parte maior do nosso processo?”
Qual o próximo passo?
Qual será o próximo passo de Jumper? Ele quer fundir o poder profundo, porém específico, do AlphaFold com o amplo alcance dos LLMs.
“Temos máquinas que conseguem ler ciência. Elas conseguem fazer raciocínio científico”, diz ele. “E podemos construir sistemas incríveis, quase sobre-humanos, para a previsão da estrutura de proteínas. Como fazer com que essas duas tecnologias funcionem juntas?”
Isso me faz pensar em um sistema chamado AlphaEvolve , que está sendo desenvolvido por outra equipe do Google DeepMind. O AlphaEvolve usa um modelo de lógica latente (LLM) para gerar possíveis soluções para um problema e um segundo modelo para verificá-las, filtrando as soluções ineficazes. Pesquisadores já usaram o AlphaEvolve para fazer diversas descobertas práticas em matemática e ciência da computação.
É isso que Jumper tem em mente? “Não vou falar muito sobre os métodos, mas ficarei surpreso se não virmos um impacto cada vez maior do LLM na ciência”, diz ele. “Acho que essa é a questão em aberto mais interessante sobre a qual não direi quase nada. É tudo especulação, claro.”
Jumper tinha 39 anos quando ganhou o Prêmio Nobel. O que vem a seguir para ele?
“Isso me preocupa”, diz ele. “Acredito que sou o laureado mais jovem em química em 75 anos.”
Ele acrescenta: “Estou mais ou menos na metade da minha carreira. Acho que minha abordagem é tentar fazer coisas menores, pequenas ideias que vou desenvolvendo aos poucos. A próxima coisa que eu anunciar não precisa ser, sabe, minha segunda tentativa de ganhar um Nobel. Acho que essa é a armadilha.”




No Comments