Pular para o conteúdo

EaPU com memristores pode cortar o consumo de energia da IA em até 50 vezes

Mulher em datacenter segurando chip de computador, com laptop aberto mostrando gráficos ao lado.

Modelos de linguagem gigantes, geradores de imagem, assistentes inteligentes - a IA está consumindo uma quantidade enorme de energia neste momento.

Agora, um grupo de pesquisa chinês aponta uma saída surpreendentemente simples.

A onda atual de IA tem um custo escondido: data centers aquecendo e contas de luz subindo. Especialmente no treinamento de modelos grandes, o gasto de energia e o custo financeiro sobem a patamares difíceis de sustentar. Pesquisadores da China descrevem uma abordagem que pode reduzir de forma drástica a demanda energética de redes neurais - sem abrir mão da precisão.

Por que a IA moderna consome tanta eletricidade

Seja um chatbot como o ChatGPT, um gerador de imagens ou um sistema de assistência no carro, por trás de tudo há enormes clusters de computação rodando em chips especializados. Treinar redes neurais profundas exige milhões a bilhões de operações de matriz repetidas muitas vezes. Por isso, a infraestrutura costuma se apoiar principalmente em GPUs (processadores gráficos).

Nesse modelo, existem dois grandes pontos de consumo de energia:

  • o trabalho de computação em si, feito por processadores e GPUs
  • a cópia constante de dados entre memória e unidades de processamento

É justamente no segundo item que a nova proposta mexe: realizar as contas dentro da memória - e em uma base de hardware completamente diferente.

Memristores: componentes que “lembram”

A palavra-chave é memristor. Em termos simples, trata-se de um resistor com memória: a resistência elétrica depende de como o componente foi “programado” antes - e esse estado fica armazenado.

Isso faz com que memristores sejam adequados para representar fisicamente os pesos de uma rede neural. O conceito é direto: em vez de guardar números em uma memória convencional e enviá-los o tempo todo para o processador, as operações acontecem no mesmo local em que os pesos estão armazenados. Em teoria, isso economiza uma quantidade enorme de energia.

O obstáculo aparece na prática: memristores não são perfeitos. Eles têm ruído, apresentam variações e não respondem com total exatidão. Erros pequenos já podem desestabilizar modelos de IA.

"O grande desafio consiste em conviver com a imprecisão do hardware - em vez de combatê-la com correções extremamente caras."

Novo método de treinamento: não combater erros, e sim considerá-los

É aqui que entra a técnica apresentada por um time do laboratório de Zhejiang, na China. O método se chama “error-aware probabilistic update”, ou EaPU. A ideia, curiosamente intuitiva, é aceitar que pequenos erros são toleráveis - desde que permaneçam dentro de um limite definido.

Como o EaPU funciona na prática

No treinamento tradicional, a cada etapa o modelo ajusta uma grande parcela de seus pesos. Em hardware com memristores, isso seria muito caro energeticamente, porque reprogramar (reescrever) os componentes consome bastante eletricidade.

O EaPU inverte essa lógica:

  • o sistema tolera pequenas discrepâncias, desde que fiquem abaixo de um limiar estabelecido;
  • um peso só é reescrito no memristor quando a alteração realmente importa;
  • em cada rodada de aprendizado, a rede atualiza menos de 0,1 por cento de todos os parâmetros.

Com isso, quase desaparece o maior custo de energia durante o treinamento: reescrever continuamente incontáveis células de memória.

O consumo de energia despenca e o hardware dura muito mais

Segundo os pesquisadores, ao comparar com métodos anteriores baseados em memristores, surgem vários efeitos marcantes:

  • até 50 vezes menor consumo de energia no treinamento em hardware de memristores;
  • até 1.000 vezes mais vida útil, já que os componentes são reescritos com muito menos frequência;
  • cerca de 60 por cento mais precisão em relação a procedimentos de treinamento mais antigos em memristores.

O contraste fica ainda mais impressionante frente à GPU tradicional. De acordo com o grupo, para a mesma tarefa o EaPU chega a um consumo de energia cerca de seis ordens de grandeza menor - em outras palavras, por volta de um milhão de vezes menos eletricidade do que uma configuração comparável com GPUs.

"Um consumo de energia que, em comparação com sistemas de GPU, cai pelo fator 106 mudaria fundamentalmente a operação dos modelos de IA atuais."

Primeiros testes: remover ruído e melhorar a resolução

O EaPU já foi colocado em prática em uma matriz de memristores com largura de estrutura de 180 nanômetros. Foram treinadas redes neurais para duas tarefas comuns em processamento de imagens:

  • remover ruído de imagens
  • aumentar artificialmente a resolução (super-resolução)

Os resultados ficaram em nível semelhante ao de técnicas consolidadas em hardware clássico - porém com gasto energético muito menor. Isso indica que a proposta não funciona apenas “no papel”, mas também faz sentido em cenários reais.

Modelos de linguagem grandes também podem se beneficiar?

Por enquanto, o tamanho do experimento ainda é limitado pelo hardware disponível. Os chips de memristores usados até aqui são relativamente pequenos. Mesmo assim, o time acredita que a abordagem pode, em princípio, servir também para modelos de linguagem grandes (Large Language Models, LLMs).

Se essa hipótese se confirmar, o impacto seria direto em sistemas como chatbots, assistentes de programação e ferramentas de análise, que hoje exigem recursos computacionais gigantescos. A expectativa dos pesquisadores é testar o EaPU com redes significativamente maiores no futuro.

Outro ponto relevante: a técnica não precisa ficar presa aos memristores. Na visão dos autores, ela poderia ser adaptada a outros tipos de memória emergentes, por exemplo:

  • transistores ferroelétricos
  • RAM magnetorresistiva (MRAM)

Isso amplia o leque de alternativas de hardware para IA com maior eficiência energética.

O que isso pode significar para data centers e para o dia a dia

Se o conceito escalar bem, data centers voltados a IA podem se tornar bem diferentes dos atuais. Em vez de galpões lotados de GPUs, seria possível imaginar chips analógicos compactos que unem armazenamento e computação. Isso não só reduz a conta de energia, como também diminui a necessidade de refrigeração e o impacto em CO₂.

Algumas consequências práticas possíveis:

  • ciclos de treinamento muito mais baratos para empresas
  • chips de IA menores e especializados para smartphones, veículos e instalações industriais
  • mais capacidade de processamento na borda (edge), sem depender o tempo todo do envio de dados para a nuvem

No cotidiano, funções inteligentes poderiam aparecer até onde hoje o consumo elétrico inviabiliza a ideia - como em sensores a bateria, dispositivos vestíveis e robôs autônomos.

Contexto: o que significam os termos técnicos

Para quem não acompanha hardware de perto, alguns conceitos podem confundir. Dois deles são centrais aqui:

  • computação analógica dentro da memória (in-memory): operações são realizadas diretamente no componente de memória, usando correntes e tensões analógicas em vez de apenas zeros e uns digitais.
  • tolerância a ruído: o modelo é treinado para suportar sinais imprecisos ou ruidosos sem que as previsões fiquem instáveis.

Um detalhe interessante é que redes neurais já têm, por natureza, certa robustez a perturbações. O EaPU explora esse “espaço de tolerância” de forma consistente, em vez de insistir em uma exatidão matemática máxima que, na prática, muitas vezes nem é necessária.

Riscos, dúvidas em aberto e próximos passos

A técnica ainda traz pontos sem resposta. Por exemplo, não está claro como o método se comporta em modelos extremamente grandes, com bilhões de parâmetros. Também é cedo para estimar quanto custaria produzir chips de memristores confiáveis em escala industrial.

Além disso, existem riscos em aplicações críticas, como medicina ou direção autônoma. Nesses casos, será preciso avaliar com cuidado quanto de imprecisão de hardware - em conjunto com o EaPU - pode ser aceito sem ultrapassar limites de segurança.

Mesmo com essas incertezas, o trabalho deixa um recado claro: a corrida por modelos cada vez maiores não precisa terminar em um beco sem saída energético. Quando hardware e método de treinamento são pensados em conjunto, dá para conter de forma perceptível o “apetite” de energia das novas gerações de sistemas de IA - talvez, um dia, chegando ao ponto em que um modelo potente caiba em um único chip eficiente.


Comentários

Ainda não há comentários. Seja o primeiro!

Deixar um comentário