NVIDIA se une ao Google Cloud em grandes modelos de linguagem e inferência de IA generativa
Plataforma de inferência NVIDIA para IA generativa integrada ao serviço Google Cloud Vertex AI; Primeiro CSP do Google Cloud a disponibilizar instâncias de GPU NVIDIA L4
A NVIDIA anuncia que esta expandindo a parceria com Google Cloud para acelerar o trabalho de empresas que criam aplicações de IA Generativa em rápida expansão.
A colaboração fornecerá aos desenvolvedores acesso à mais recente tecnologia de ponta disponível para ajudá-los a colocar novas aplicações em funcionamento de forma rápida e econômica. Isso inclui a nova plataforma de inferência da NVIDIA para IA generativa baseada na recém-anunciada GPU L4 - uma GPU universal para praticamente qualquer carga de trabalho, com recursos aprimorados de IA de vídeo que podem oferecer 120 vezes mais desempenho de vídeo alimentado por IA do que CPUs,c ombinado com eficiência energética 99% melhor.
O Google Cloud é o primeiro provedor de serviços em nuvem a oferecer L4 aos clientes com o lançamento de suas novas máquinas virtuais G2, disponíveis em visualização privada. Além disso, o Google Cloud integrará a L4 em sua plataforma de machine learning, Vertex AI.
“O crescente interesse em IA generativa está inspirando uma onda de empresas a recorrer à computação baseada em nuvem para dar suporte a seus modelos de negócios”, diz Ian Buck, vice-presidente de Hyperscale and High-Performance Computing da NVIDIA. “Estamos trabalhando com o Google Cloud para ajudar a garantir que os recursos necessários estejam facilmente disponíveis e possam ajudar a alimentar as incríveis novas ferramentas e aplicações que serão criadas.”
“A IA generativa representa uma nova era da computação — que exige velocidade, escalabilidade e confiabilidade que fornecemos no Google Cloud”, afirma Amin Vahdat, vice-presidente de infraestrutura de sistemas e serviços do Google Cloud. “À medida que nossos clientes começam a explorar as possibilidades da Gen AI, estamos orgulhosos de oferecer a eles a mais recente inovação de GPU L4 da NVIDIA como parte de nosso portfólio Compute Engine otimizado para carga de trabalho.”
Ajudando novas aplicações de IA generativa a ganhar vida
O Google Cloud fornece a infraestrutura para uma ampla variedade de organizações que oferecem aplicações generativas de IA, muitos dos quais são projetados para ajudar os profissionais a fazer seu trabalho melhor e mais rápido. A inferência rápida é a chave para a execução bem-sucedida de seus aplicativos.
"É incrível como as tecnologias da NVIDIA podem contribuir para experimentos não só das empresas, mas também artistas e criadores de conteúdo. A IA pode trazer diversos benefícios para uma arte de qualidade e feita em tempo recorde", reforça Marcio Aguiar, diretor da divisão Enterprise da NVIDIA para América Latina.
A Descript é uma empresa de software que torna a criação de um vídeo ou podcast tão fácil quanto editar um documento ou criar slides. Hospedado no Google Cloud e aproveitando os kits de ferramentas da NVIDIA, o Descript coloca o poder da IA nas mãos de podcasters, criadores de vídeo, profissionais de marketing, instrutores e qualquer pessoa que use vídeo para se comunicar.
Os recursos de edição com IA do Descript permitem que os criadores removam palavras de preenchimento, adicionem legendas e criem clipes de mídia social com apenas alguns cliques. Eles também podem usar a clonagem de voz de IA generativa do Descript para corrigir erros de áudio - até mesmo criar trilhas de narração inteiras - apenas digitando.
“A Descript usa o NVIDIA TensorRT para otimizar modelos para acelerar a inferência de IA”, conta Andrew Mason, CEO da Descript. “Ele permite que os usuários substituam seus planos de fundo de vídeo e aprimorem sua fala para produzir conteúdo com qualidade de estúdio, sem o estúdio.”
A IA generativa também está impulsionando uma série de novas aplicações que ajudam as pessoas a se conectar e se divertir. O WOMBO, que oferece um aplicativo de texto para arte digital baseado em IA chamado Dream, teve acesso antecipado à plataforma de inferência L4 da NVIDIA no Google Cloud.
“A WOMBO conta com a mais recente tecnologia de IA para que as pessoas criem obras de arte digitais imersivas a partir das solicitações dos usuários, permitindo que criem arte realista e de alta qualidade em qualquer estilo com apenas uma ideia”, destaca Ben-Zion Benkhin, CEO da WOMBO. “A plataforma de inferência L4 da NVIDIA nos permitirá oferecer uma experiência de geração de imagem melhor e mais eficiente para usuários que buscam criar e compartilhar obras de arte exclusivas.”
Comentários
Postar um comentário