Revolução na Inteligência Artificial: Microsoft e Nvidia Unem Forças para Acelerar Treinamento de IA
A Microsoft e a Nvidia se uniram para desenvolver um novo padrão de código aberto chamado Multipath Reliable Connection (MRC), que visa acelerar o treinamento de IA em larga escala.
O Que é o MRC?
O MRC é um protocolo de rede para clusters gigantes de IA que permite dividir uma única transferência de dados em diversos pacotes e espalhá-los simultaneamente entre centenas de caminhos diferentes da rede, evitando que o tráfego se concentre em apenas uma via.
Benefícios do MRC
O MRC pode detectar congestionamentos e falhas em microssegundos e redirecionar os pacotes para caminhos confiáveis, além de permitir que cada pacote traga instruções sobre qual parte da memória da GPU deve ser escrita. Isso evita atrasos imprevisíveis e a necessidade de reiniciar treinamentos enormes se houver pequenas falhas.
Parcerias e Aplicações
O MRC foi desenvolvido em parceria com a Microsoft, Nvidia, Intel, AMD e Broadcom, e já foi integrado aos maiores supercomputadores da startup, como o projeto Stargate, que funciona no Texas (Estados Unidos). Além disso, o MRC também está sendo utilizado no Microsoft Fairwater, localizado em Wisconsin (EUA), e em instalações que usam processadores Nvidia GB200.
O Futuro da IA
Com o MRC, a OpenAI afirma que é possível criar uma rede com menor custo e gastos energéticos abaixo dos registrados em projetos convencionais, ajudando a solucionar problemas enfrentados pelos laboratórios de IA. Isso pode revolucionar a forma como a IA é treinada e aplicada em diversas áreas.
Conclusão
A parceria entre a Microsoft e a Nvidia para desenvolver o MRC é um passo importante para o avanço da IA. Com o MRC, é possível acelerar o treinamento de IA em larga escala, tornando-a mais acessível e eficiente. No Porto Tech, acreditamos que a inovação e a colaboração são fundamentais para o progresso da tecnologia, e o MRC é um exemplo disso.