A Samsung e a Hyundai apoiam a startup de IA Tenstorrent Todos querem concorrer com a Nvidia, diz o CEO Keller.

A Samsung e a Hyundai apoiam a startup Tenstorrent de IA para competir com a Nvidia, segundo CEO Keller.

A gigante de chips Nvidia é a força mais poderosa em inteligência artificial hoje, mais poderosa do que a Microsoft, o Google ou a OpenAI. Seus chips GPU são a forma dominante de computação na indústria para programas como o ChatGPT. Um conjunto de startups não conseguiu deter essa dominação, apesar de anos de tentativas.

Também: Os melhores chatbots de IA 

E, no entanto, o mundo ainda anseia por concorrência, e a Nvidia pode estar vulnerável porque, segundo alguns, a economia da dominação da Nvidia não pode ser sustentada.

“A Nvidia tem um monopólio [margens de lucro]”, disse Jim Keller, CEO da startup de chips de IA Tenstorrent, em uma entrevista exclusiva para a ENBLE. “Se você quiser construir uma solução de alto desempenho com IA, a Nvidia comandará a maior parte da margem do produto. O problema com a estratégia de vencedor leva tudo é que ela gera um ambiente econômico em que as pessoas realmente querem uma alternativa.”

Keller é uma estrela do mundo dos chips de computador, conhecido por uma longa lista de sucessos na área, desde a recuperação dos negócios de processadores da Advanced Micro Devices (AMD) até a criação da base do negócio de processadores personalizados da Apple e a construção da plataforma de chips Tesla Autopilot. Ele acredita que a frustração da indústria com o controle da Nvidia e a tecnologia emergente do RISC-V abriram um caminho para alternativas.

Algumas partes poderosas acreditam que ele tem uma chance.

Também: Renascimento do Mac: Como a transição de chips da Apple resultou em um Mac Pro tão estranhamente configurado

Na quarta-feira, Keller anunciou que a Tenstorrent recebeu US$ 100 milhões em investimento do Hyundai Motor Group, a terceira maior montadora de carros do mundo, e do Samsung Catalyst Fund, um braço de investimento da gigante de eletrônicos Samsung Electronics, juntamente com a participação da Fidelity Ventures, Eclipse Ventures, Epiq Capital, Maverick Capital e outros.

O novo dinheiro se soma a um investimento anterior de quase US$ 250 milhões, dando à Tenstorrent, de sete anos, um cofre de guerra amplo para lançar no mercado vários chips de IA.

A Hyundai, como muitas empresas, está interessada em alternativas à Nvidia para coisas como colocar IA em carros, disse Keller. A empresa também possui uma divisão de robótica, tendo comprado a Boston Dynamics, uma spin-off de robótica do MIT, em 2020.

“Eles são uma empresa líder em tecnologia”, disse Keller da Hyundai. “Eles estão ganhando dinheiro e investindo em tecnologia porque veem um caminho para construir produtos de próxima geração com IA.”

Também: Como alcançar hiperpersonalização usando plataformas de IA generativa

Mais especificamente, a Hyundai “quer construir seus próprios produtos e atingir os pontos de custo e desempenho”, disse Keller. “Você não pode dar 60% de margem bruta para a Nvidia em um produto padrão, para ser honesto, e eles estão procurando opções.”

Heung-soo Kim, vice-presidente executivo da Hyundai e chefe do escritório de estratégia global, disse em declaração preparada:

“O potencial de alto crescimento da Tenstorrent e os semicondutores de IA de alto desempenho ajudarão o Grupo a garantir tecnologias competitivas para mobilidades futuras.

“Com este investimento, o Grupo espera desenvolver tecnologia de semicondutor otimizada, mas diferenciada, que auxiliará as mobilidades futuras e fortalecerá as capacidades internas no desenvolvimento de tecnologia de IA.”

Keller e Heung-soo Kim, vice-presidente executivo e chefe do escritório de estratégia global da Hyundai Motor Co.

O investimento da Samsung faz todo o sentido para um dos maiores fabricantes de semicondutores sob contrato do mundo. A empresa produziu muitos dos chips pelos quais Keller é famoso, incluindo o Tesla Autopilot. A Samsung sabe que de pequenas sementes nascem grandes carvalhos, e a startup de hoje pode ser o grande cliente de amanhã na fabricação de chips.

Também: Esses chips baseados em cogumelos poderiam alimentar seus dispositivos e ajudar a salvar nosso planeta

O chefe do Centro de Inovação de Semicondutores da Samsung, Marco Chisari, disse em declaração preparada: “A tecnologia líder do setor da Tenstorrent, a liderança executiva e o roadmap agressivo nos motivaram a co-liderar essa rodada de financiamento.” Ele acrescentou: “Estamos entusiasmados com a oportunidade de trabalhar com a Tenstorrent para acelerar inovações em IA e computação.”

Keller com o chefe do Centro de Inovação em Semicondutores da Samsung, Marco Chisari.

Em declarações preparadas anunciando o financiamento, Keller elogiou ambas as empresas: “A confiança da Hyundai Motor Group e do Samsung Catalyst Fund na Tenstorrent, liderando nossa rodada, é verdadeiramente humilde.”

Para Keller, que construiu muitos dos chips mais rápidos do mundo, o argumento é principalmente econômico, mas também altamente tecnológico.

“Eu não acredito que isso – GPUs rodando CUDA e PyTorch – seja o fim do jogo para IA. “Quando os alienígenas chegarem, eu não acho que eles vão nos perguntar: ‘Nós inventamos o CUDA?'”, brincou Keller, referindo-se à plataforma de software da Nvidia para rodar essas redes neurais.

“Embora as GPUs tenham sucesso hoje, elas não são a resposta óbvia e sim a resposta suficientemente boa que estava disponível”, disse Keller sobre a dominância dos chips da Nvidia, como a GPU H100 “Hopper”, que é o principal produto da Nvidia para rodar redes neurais.

Também: IA generativa e o quarto porquê: construindo confiança com seu cliente

Os modelos de IA generativa mais avançados, especialmente aqueles provenientes da comunidade de software de código aberto, levarão a uma mudança profunda na distinção do campo entre treinamento e inferência. “Acredito que o mecanismo de IA do futuro… terá um conjunto bastante diversificado de capacidades que não se parecerão com inferência versus treinamento, mas mais como uma fusão dos dois.”

Ele admite que a Nvidia obteve uma liderança incrível em IA graças à decisão do co-fundador e CEO Jensen Huang de focar os esforços da empresa no software desde muito cedo.

“O desafio do software de IA é mais difícil do que qualquer um imaginava, para ser honesto”, observou Keller. “A maioria das startups de IA foi iniciada por pessoas de hardware.” A Nvidia, segundo ele, “teve um investimento mais longo nessa pilha de software, em parte porque investiram em HPC [computação de alto desempenho para cargas de trabalho científicas complexas] quando ninguém queria”, disse Keller. Isso exigiu o desenvolvimento de estruturas de programação especiais para a GPU. “Eles investiram e conseguiram fazer algumas coisas funcionarem.”

Mas, segundo Keller, o mundo está mudando. O surgimento de alternativas de código aberto para CUDA, os vários frameworks de IA, como TensorFlow e PyTorch, e os modelos de código aberto criados por empresas como Stability.ai e MosaicML, e hospedados em hubs como Hugging Face, são promissores, disse ele. “O intrigante é a quantidade de colaboração de código aberto que está acontecendo no front do software, que precisamos igualar no front do hardware.”

Para igualar esse esforço de código aberto no hardware, Keller está apostando no RISC-V, o conjunto de instruções de chip de código aberto que foi desenvolvido há mais de uma década na Universidade da Califórnia em Berkeley por um colega de Keller, o renomado pioneiro em chips David Patterson e seus colegas.

Também: IA mudará o papel dos desenvolvedores para sempre. Aqui está o motivo pelo qual isso é uma boa notícia

Para Keller, que é um solucionador de problemas perspicaz em grande escala, há algo crucial se juntando no front econômico e no front tecnológico. “Gosto de explorar o espaço, entendê-lo e depois fazer algo”, disse ele.

Na lendária Digital Equipment Corp., nas décadas de 1980 e 1990, ele construiu o chip mais rápido do mundo na época. Uma das antigas startups de Keller, a P.A. Semi Inc., foi comprada pela Apple em 2008 e se tornou a base do silício da série “A” que agora alimenta todos os dispositivos da Apple, uma separação improvável da Intel. A Tesla era “apenas uma pequena empresa de engenharia” produzindo no máximo um quarto de milhão de carros quando Keller liderou uma equipe para desenvolver o hardware do Autopilot da Tesla, agora presente em todos os carros.

Ele ressuscitou o desenvolvimento de chips moribundos da AMD em um momento em que “Todos me disseram que a AMD iria à falência”, lembrou Keller. Seus esforços lançaram as bases que não apenas trouxeram a empresa de volta da beira do abismo, mas a transformaram em uma potência em chips.

Na Tenstorrent, fundada em 2016, Keller viu algo intrigante. A empresa se concentrou na oportunidade de chip no aumento do tamanho de modelos de IA de aprendizado profundo, como o GPT da OpenAI, programas que exigem desempenho cada vez maior.

Também: GPT-3.5 vs GPT-4: vale a pena assinar o ChatGPT Plus?

Keller, que havia sido investidor-anjo na Tenstorrent quando ainda estava na Tesla, conhecia o fundador Ljubisa Bajic, que havia trabalhado para Keller na AMD. “Tive a chance de analisar uma série de propostas para motores de IA, e achei o que ele estava fazendo bastante interessante”, lembrou Keller.

Ele estava interessado o suficiente para assumir o cargo de destaque na Tenstorrent em janeiro de 2021. “Era, em algum nível, um projeto de pesquisa, e eu senti que estávamos começando a descobrir qual era o projeto de pesquisa”, explicou ele.

O que está claro, disse Keller, é que a chegada da IA está se fundindo com a chegada do RISC-V e a pressão econômica da dominância da Nvidia.

No futuro, “A computação será dominada pela IA”, disse Keller. As redes neurais generativas que a Tenstorrent foi construída para lidar, à medida que aumentam em escala, estão exigindo cada vez mais potência de silício, e assim estão chegando a dominar todo o design de chips.

Assim como em seus esforços passados, Keller não simplesmente adotou o plano conforme o encontrou na Tenstorrent. Ele tomou a decisão surpreendente de não apenas continuar com os chips dedicados de IA, mas também construir uma CPU de propósito geral capaz de lidar com o gerenciamento dos chips de IA.

“Decidimos construir um processador RISC-V para ser um parceiro de computação de propósito geral para o processador de IA porque a computação de propósito geral e a IA vão trabalhar juntas e precisam estar intimamente integradas”, disse ele.

Para fazer isso, “contratei alguns dos melhores designers da AMD, Apple e Nvidia”, disse Keller, que disse estar “em uma aventura de equipe”. “Temos uma ótima equipe de CPU; estou realmente muito animado com isso.”

Também: AMD vs. Intel: Os melhores CPUs para jogos para profissionais, criadores e jogadores casuais

Em um determinado momento, a ARM, a unidade privada da SoftBank Group, que está se preparando para uma oferta pública inicial, era um potencial salvador para a indústria de chips, presa entre a dominância da Intel e da Nvidia. Isso mudou, disse Keller. “Conversei bastante com a ARM, e a ARM tinha dois grandes problemas”, observou Keller.

“Um deles é que eles estão muito caros agora”, disse ele. O que havia sido uma situação econômica viável para empresas que licenciam a tecnologia da ARM se transformou em uma questão de constantemente aumentar os preços, exigindo uma porcentagem cada vez maior dos produtos construídos pelos clientes com a tecnologia da ARM.

O outro problema, disse ele, é que a ARM não faria alterações nas instruções fundamentais para acomodar novas formas de lidar com dados que a IA requer. “A IA está mudando rapidamente”, observou Keller. Ele recorreu à startup do Vale do Silício SiFive, que fez um negócio licenciando uma versão de CPUs de chip baseadas em RISC-V. “Eles [ARM] não queriam fazer as modificações de que eu precisava no meu próximo chip; a SiFive disse: ‘Claro'”.

Com o RISC-V, tanto a Tenstorrent quanto seus clientes podem ter controle, enfatizou Keller, ao contrário de lidar com um monopolista. “Outra missão de design foi, como você constrói uma ótima tecnologia onde as pessoas têm direito de licenciar?”, disse ele.

Como resultado da abertura do RISC-V, “Aos poucos, o RISC-V vai substituir tudo”, disse Keller, ou seja, a ARM, o próprio conjunto de instruções da Nvidia e o código x86 legado em que o império da Intel é construído.

Também: Windows em Arm redux: A Microsoft pode entregar uma surpresa de silício antes do final do ano?

Além da nova CPU baseada em RISC-V, o acelerador de IA da Tenstorrent está passando por uma grande mudança para incorporar a capacidade do RISC-V dentro dele. “Nosso motor de IA tem um grande multiplicador de matrizes, um processador de tensores, um processador vetorial, mas também tem cinco pequenos processadores RISC-V que basicamente emitem a sequência de instruções de IA”, explicou Keller.

A empresa está começando a vender suas duas primeiras gerações de chips e está avançando rapidamente para ter o primeiro silício de uma terceira geração e trabalhando na quarta.

O negócio da Tenstorrent terá várias maneiras de ganhar dinheiro. A CPU de propósito geral que está sendo projetada é um “processador de ponta” que “tem valor de licenciamento”, e há também o chip acelerador de IA que é tanto uma parte que a empresa pode vender quanto “um motor de IA RISC-V que outras pessoas poderiam licenciar”.

Deve haver muitos interessados, uma vez que a indústria está irritada com o imposto da Nvidia, como se poderia chamar os altos preços do H100 e das outras peças.

“Conversei com muitas pessoas que não é tanto que elas não gostem da Nvidia como tecnologia, ou que não gostem do Jensen [Huang]”, disse ele. É puramente uma questão de negócios.

Também: 4 maneiras de detectar o hype da IA generativa da realidade

“Conversei com empresas de fontes de alimentação, empresas de microcontroladores, startups de direção autônoma, fabricantes de servidores de borda de data center”, disse ele. “Se você fabrica seu próprio chip e quer um motor de IA nele, não pode colocar uma GPU de US$ 2.000”, observou ele. “Conversei com duas empresas de robótica que basicamente tinham a mesma opinião: não posso colocar uma GPU de US$ 10.000 em um robô de US$ 10.000”.

É claro que a Nvidia parece atualmente uma empresa sem concorrência. Rotineiramente, ela domina testes de desempenho de chips, como o MLPerf. Seu negócio de centros de dados, que inclui os chips de IA, está acima das vendas de chips de IA da Intel e AMD. A unidade pode dobrar sua receita este ano, chegando a US$ 31 bilhões, quase dois terços da receita anual da Intel.

Um grupo de startups repleto de engenheiros incrivelmente talentosos, como a Cerebras Systems, Graphcore e Samba Nova Systems, não conseguiu abalar a Nvidia, apesar do fato de que todos querem uma alternativa à Nvidia.

Nada disso afeta Keller, que lutou e venceu muitas batalhas em sua vida no projeto de chips. Por um lado, essas empresas não alavancaram o RISC-V, que é um divisor de águas, na opinião dele. “Se tivéssemos desenvolvido o motor de IA RISC-V de código aberto há cinco anos”, que a Tenstorrent está construindo agora, disse Keller, “então 50 startups poderiam estar inovando nisso, em vez de resolver o mesmo problema de 15 maneiras diferentes, 50 vezes”, como a Cerebras e outras têm feito.

Em um nível mais simples, as pessoas sempre assumem que o status quo permanecerá, mas esse nunca é o caso.

“A guerra pela computação já foi vencida muitas vezes”, refletiu Keller. “Os mainframes venceram, depois os mini-computadores venceram, depois as estações de trabalho venceram, depois os PCs venceram, e então os dispositivos móveis venceram – a guerra já foi vencida, então vamos começar a próxima batalha!”

Em um nível ainda mais simples, “eu acho que os computadores são uma aventura”, disse ele. “Eu gosto de projetar computadores; estou envolvido na aventura.”