A AWS anunciou, no evento global em Las Vegas, o lançamento do Trainium3, em 2025 e novidades para o Trainium2, assim como os chips Graviton e o sistema Nitro. Rahul Kulkarni explicou à businessIT como nasceu esta área da empresa: «O desenvolvimento de chips começou há muito tempo, quando estávamos a desenvolver os nossos próprios chips baseados em Nitro para melhorar os custos gerais associados à virtualização. E à medida que trabalhávamos, descobrimos que havia muitas oportunidades para continuarmos a optimizar a nossa plataforma global».
Assim, visto que a AWS tem «um conhecimento muito bom das cargas de trabalho dos clientes e compreende exactamente quais são essas workloads, está mais sensibilizada para o desempenho que os clientes realmente procuram e fomos capazes de optimizar os chips da forma mais eficaz possível. Esta é a base da nossa história actual na área do silício que começou com o Graviton no sector da computação».
O responsável explica alguns dos benefícios: «Quando optimizamos estes chips, acabamos por ter algumas vantagens. Uma delas é a redução do custo global e a melhoria da potência a que estes chips funcionam, o que, em conjunto, conduz a custos mais baixos e a uma eficiência energética melhorada para o cliente», referiu o responsável.
Adopção a crescer
Nos últimos cinco anos, a AWS teve quatro gerações diferentes de Graviton e viu «os clientes adoptarem a tecnologia «inicialmente de forma lenta, à medida que se habituavam a uma arquitectura diferente», mas isso mudou rapidamente: «Temos visto cada vez mais clientes a adoptarem a Graviton de forma muito agressiva, porque é a solução ideal para eles, representa um custo mais baixo, um melhor desempenho em termos de preço e uma melhor eficiência energética. Actualmente, temos quase 95% dos nossos mil principais clientes a utilizar chips Graviton».
O sucesso no espaço de computação foi tal que decidiram «estender essa mesma estratégia no espaço de IA generativa, e é por isso que, há alguns anos, lançamos nosso primeiro chip inferentia e Trainium», começando inicialmente com o treino de pequenos modelos. Agora com o Trainium2, já «conseguimos executar modelos de última geração que podem suportar milhares e milhões de parâmetros para um treino ao mais baixo custo e com o melhor desempenho/preço», salientou Rahul Kulkarni.
O responsável deu alguns números que mostram a evolução da AWS. «O Trainium 2 é cerca de 4 vezes melhor em termos de eficiência energética em comparação com o Trainium 1 e oferece um desempenho 30% melhor, oferece cerca de 25% mais memória e 20% mais largura de banda de memória, em comparação com os nossos produtos baseados na Nvidia. Estes três aspectos são o que realmente importa para os clientes quando estão a executar workshops de IA generativa».
Dar opção aos clientes
No entanto, como em tantas outras áreas onde actua, a AWS quer continuar a proporcionar «escolha aos clientes» e por isso, apesar de «investir tanto na estratégia de silício personalizado», continuam também a estabelecer parcerias com todos os outros fornecedores. O director product management, compute & AI/ML portfolio disse que, na computação há também espaço para a Intel e a AMD e na IA, para a Nvidia: «O nosso CEO, Matt Garman, mencionou que temos uma relação de 14 anos com a Nvidia, e isso basicamente mostra que estamos empenhados em fornecer o melhor e mais amplo portfólio de produtos baseados na Nvidia na AWS. E também anunciou a família de instâncias P6, que é a próxima geração da Nvidia, baseada em GPU Blackwell. Mais uma vez, mostra que, independentemente do fornecedor, o que importa é oferecer opções aos clientes e garantir que temos o mais vasto portfólio disponível».
Rahul Kulkarni revelou ainda que preparam o futuro «mantendo-se sempre atento ao que os clientes precisam» e explicou a filosofia da empresa: «Como diz o Jeff Bezos, o cliente está eternamente insatisfeito. Assim, começamos sempre com o cliente e trabalhamos de trás para a frente. Esse será sempre o nosso principal desafio, a nossa espécie de Estrela Polar que nos guia na forma como desenvolvemos o nosso portfólio e criamos produtos significativos para os clientes».
A estrela EC2
Os serviços de computação cloud EC2 continuam a ser «a maior fonte de receita» da AWS e o responsável indicou que vai evoluir «a um ritmo muito, muito rápido» e esclareceu por que motivo: «Tendo em conta todos os investimentos que estamos a fazer e a quantidade de compromissos que temos com os clientes. E se olharmos para a utilização global de TI, apenas uma pequena fracção é efectivamente feita na cloud, o que significa que uma grande parte ainda está on-premises, o que nos dá uma tremenda oportunidade de continuar a inovar em nome dos clientes, continuar a impulsionar soluções e sistemas diferenciados para dar resposta às cargas de trabalho mais exigentes, bem como a qualquer outra carga de trabalho que um cliente que esteja a executar. Com todas as inovações que estão a decorrer, esperamos que o EC2 continue a aumentar a taxa de adopção e, nesta altura, o céu é o limite».