LAN/WANRede

Cisco, Arista, HPE e Intel lideram consórcio para adaptar Ethernet às demandas de IA

Apoiado pela Linux Foundation, o novo Consórcio Ultra Ethernet visa aumentar a escala, a estabilidade e a confiabilidade das redes Ethernet para satisfazer os requisitos de rede de alto desempenho da IA.

Espera-se que as cargas de trabalho de IA coloquem demandas de desempenho e capacidade sem precedentes nas redes, e alguns fornecedores de redes se uniram para aprimorar a tecnologia Ethernet atual, a fim de lidar com a escala e a velocidade exigidas pela IA.

CONTEÚDO RELACIONADO – Conectividade é crucial para manter a competitividade dos negócios

AMD, Arista, Broadcom, Cisco, Eviden, HPE, Intel, Meta e Microsoft anunciaram o Ultra Ethernet Consortium (UEC), um grupo hospedado pela Linux Foundation que trabalha para desenvolver avanços Ethernet nas camadas física, de link, de transporte e de software.

A indústria comemorou o 50º aniversário da Ethernet este ano. A marca registrada da Ethernet tem sido a sua flexibilidade e adaptabilidade. Existem preocupações de que as interconexões de rede tradicionais atuais não possam fornecer o desempenho, a escala e a largura de banda necessários para acompanhar as exigências da IA, e o consórcio pretende dar resposta a essas preocupações.

“As cargas de trabalho de IA são exigentes para as redes, pois fazem uso intensivo de dados e de computação. As cargas de trabalho são tão grandes que os parâmetros são distribuídos por milhares de processadores. Grandes modelos de linguagem (LLMs), como GPT-3, Chinchilla e PALM, bem como sistemas de recomendação como DLRM [recomendação de aprendizado profundo] e DHEN [rede de conjunto profundo e hierárquico] são treinados em clusters de milhares de GPUs que compartilham o ‘ parâmetros’ com outros processadores envolvidos na computação”, escreveu o CEO da Arista, Jayshree Ullal, em um blog sobre o novo consórcio. “Neste ciclo de redução de troca de computação, o volume de dados trocados é tão significativo que qualquer lentidão devido a uma rede deficiente/congestionada pode impactar criticamente o desempenho do aplicativo de IA.”

Historicamente, a única opção para conectar núcleos de processador e memória tem sido interconexões como InfiniBand, PCI Express, acesso remoto direto à memória por Ethernet e outros protocolos que conectam clusters de computação com offloads, mas têm limitações quando se trata de requisitos de carga de trabalho de IA.

“Os membros fundadores da Arista e do Ultra Ethernet Consortium acreditam que é hora de reconsiderar e substituir as limitações do RDMA. O RDMA tradicional, conforme definido pela InfiniBand Trade Association (IBTA) há décadas, está mostrando sua idade no tráfego de rede de IA/ML altamente exigente. O RDMA transmite dados em pedaços de grandes fluxos, e esses grandes fluxos podem causar links desequilibrados e sobrecarregados”, escreveu Ullal.

“É hora de começar do zero para construir um protocolo de transporte moderno que suporte RDMA para aplicações emergentes”, escreveu Ullal. “O protocolo UET (Ultra Ethernet Transport) do [consórcio] incorporará as vantagens da Ethernet/IP ao mesmo tempo em que aborda a escala de rede de IA para aplicações, endpoints e processos, e mantém o objetivo de padrões abertos e interoperabilidade de vários fornecedores.”

“O transporte UEC incorpora segurança de rede desde o projeto e pode criptografar e autenticar todo o tráfego de rede enviado entre terminais de computação em um treinamento de IA ou trabalho de inferência. A UEC desenvolverá um protocolo de transporte que aproveite as principais técnicas comprovadas para gerenciamento eficiente de sessões, autenticação e confidencialidade de métodos modernos de criptografia como IPSec e PSP”, escreveu a UEC.

“À medida que os empregos crescem, é necessário apoiar a criptografia sem aumentar o estado da sessão em hosts e interfaces de rede. A serviço disso, o UET incorpora novos mecanismos de gerenciamento de chaves que permitem o compartilhamento eficiente de chaves entre dezenas de milhares de nós de computação que participam de um trabalho. Ele foi projetado para ser implementado de forma eficiente nas altas velocidades e escalas exigidas pelo treinamento e inferência de IA”, afirmou a UEC.

“Não se trata de reformular a Ethernet”, disse o Dr. J Metz, presidente do Ultra Ethernet Consortium, em comunicado. “Trata-se de ajustar a Ethernet para melhorar a eficiência de cargas de trabalho com requisitos de desempenho específicos. Estamos analisando cada camada – desde a física até as camadas de software – para encontrar a melhor maneira de melhorar a eficiência e o desempenho em escala.”

A necessidade de uma melhor tecnologia de conectividade de IA está começando a surgir. Por exemplo, em seu mais recente “Relatório de previsão de data center de julho de 2023 para 5 anos”, o Grupo Dell’Oro afirmou que 20% das portas de switch Ethernet de data center estarão conectadas a servidores acelerados para suportar cargas de trabalho de IA até 2027. O aumento de novas aplicações generativas de IA ajudarão a impulsionar mais crescimento em um mercado já robusto de switches de data center, que deverá ultrapassar US$ 100 bilhões em vendas acumuladas nos próximos cinco anos, disse Sameh Boujelbene, vice-presidente da Dell’Oro.

Em outro relatório divulgado recentemente, o Grupo 650 afirmou que a IA/ML impõe uma enorme quantidade de requisitos de desempenho de largura de banda na rede, e a IA/ML é um dos principais impulsionadores de crescimento para a comutação de data centers nos próximos cinco anos.

“Com o crescimento da largura de banda na IA, a parte da comutação Ethernet ligada à IA/ML e à computação acelerada migrará de um nicho atual para uma parte significativa do mercado até 2027. Estamos prestes a ver remessas recordes de switches e óticas baseados em 800 Gbps como assim que os produtos puderem atingir escala de produção para lidar com IA/ML”, disse Alan Weckel, fundador e analista de tecnologia do 650 Group. Com informações de Agências Internacionais.

Newsletter

Inscreva-se para receber nossa newsletter semanal
com as principais notícias em primeira mão.


    Deixe um comentário

    O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *