Nesta conversa, Jesse Eisses, cofundador da Nosana, compartilha insights sobre a abordagem inovadora da Nosana para aproveitar GPUs de consumidor para tarefas de IA. Ele discute os desafios, estratégias e visão por trás da criação de uma infraestrutura de computação mais sustentável e acessível que pode remodelar o futuro da Internet.
Você pode compartilhar sua jornada até a Web3?
Estou na Web3 há algum tempo. Estudei inteligência artificial na universidade há cerca de dez anos e já estava envolvido na Web3 há alguns anos, principalmente por interesse técnico. Eu estava pesquisando sobre Bitcoin, e o conceito de transferir valor sem precisar de bancos era extremamente interessante para mim.
Depois da universidade, eu estava interessado em combinar Web3 e inteligência artificial, que eram minhas duas maiores paixões. Então, eu comecei uma empresa chamada Effect AI, que era sobre fazer conjuntos de dados para treinamento de IA. Nós recompensávamos as pessoas que contribuíam com dados pagando-as em criptomoedas. Eu trabalhei nisso por um longo tempo.
Ao longo dos anos, trabalhei em muitos ecossistemas de blockchain diferentes, como Ethereum, Binance Smart Chain e Solana. Foi uma jornada bem longa. Cerca de três anos atrás, fundei a Nosana com um cofundador que conheci na universidade, Sjoerd. A Nosana é focada em recursos de computação no espaço Web3.
A ideia para o Nosana surgiu do fato de que achamos doloroso que existam tantos produtos descentralizados legais sendo criados, mas todos eles ainda estão sendo executados em hardware de propriedade de três grandes empresas – os grandes provedores de nuvem. Eles estão basicamente fornecendo sua infraestrutura para executar toda a Internet, Web2 e Web3 juntos. Queríamos tornar esse recurso computacional fundamental mais descentralizado.
De que forma o uso de GPUs de consumidores ociosos pela Nosana contribui para a sustentabilidade ambiental no setor de computação de IA?
Acho que tem um impacto positivo muito grande no meio ambiente. O que a Nosana faz é habilitar a computação de GPU a partir do hardware do consumidor. Em vez de usar provedores de nuvem como a AWS, que têm enormes fábricas cheias de hardware especialmente produzido, conectadas em enormes data centers do tamanho de cidades, a Nosana olha para o hardware que as pessoas já têm em casa.
Estamos olhando para jogadores, mineradores e diferentes proprietários de hardware que têm esses dispositivos, e a maioria deles não está sendo totalmente utilizada. Muitos jogadores compram um PC gamer e jogam por talvez uma semana, quatro horas por dia, e então, muitas vezes, esses dispositivos acabam apenas pegando poeira nas prateleiras. Mas eles já foram produzidos e são muito capazes de executar inferência de IA.
Ao utilizar hardware que já está disponível nas casas das pessoas, não precisamos fabricar mais dispositivos. Outra parte disso é que os dispositivos gamer são, por acidente, realmente muito eficientes na execução de inferência de IA. Eles são mais eficientes do que os dispositivos em nuvens. Dispositivos fabricados em nuvem não são tão bons quanto os dispositivos gamer para essa tarefa específica. Então, isso também significa que somos mais eficientes do que nossos equivalentes em nuvem, o que torna esse um modelo mais sustentável e escalável para o meio ambiente.
Além disso, há muito mais GPUs por aí. O número de GPUs de propriedade de jogadores supera em muito o número de GPUs disponíveis em data centers.
Ao integrar essa gama diversa de GPUs de consumidor em uma rede coesa? Quais desafios você enfrenta?
Há muitos desafios. Definitivamente estamos dificultando para nós mesmos ao lidar com o problema dessa forma. Se você tem muitas GPUs em um data center, você tem um ambiente muito controlado e conveniente. A energia é criada especificamente para sustentar essa quantidade de hardware. Eles são todos interconectados com cabos para garantir rendimento e largura de banda realmente altos.
Nosso ambiente consiste em todas essas diferentes famílias que têm uma ou duas GPUs espalhadas pelo mundo. Elas têm diferentes tipos de conectividade de internet, fontes de alimentação e hardware circundante, como CPUs e RAM. Então é um ambiente muito menos controlado com muito mais variantes. Nosso desafio é tornar isso tão confiável e performático quanto as GPUs de data center.
Acreditamos que podemos chegar lá. Atualmente, as GPUs que a Nosana entrega são extremamente performáticas. Conseguimos isso identificando e comparando dispositivos individuais. Somos capazes de classificar quais GPUs têm qual tipo de largura de banda disponível para streaming de dados de entrada e saída. Usando análise de dados e combinando com as necessidades corretas do cliente, somos capazes de fornecer o melhor desempenho possível. Mas tornar todo esse sistema de dispositivos de consumo confiável e performático é o desafio que estamos enfrentando.
Como você atrai novos usuários e empresas para usar seus serviços?
Há dois lados em nosso produto. De um lado, estamos procurando fornecedores de GPU e, do outro lado, estamos procurando empresas para fazer inferência de IA em nossa grade.
No lado da GPU, estamos trabalhando com muitos jogadores. A comunidade Nosana é realmente grande, e temos muitas pessoas inspiradas que estão animadas para contribuir com seu hardware. Temos um excedente de GPUs atualmente conectadas à rede que estão apenas por interesse. Além disso, elas estão tendo um retorno sobre o investimento, então estão motivadas de uma perspectiva financeira também.
A parte mais interessante é fazer com que as empresas comecem a usar essa tecnologia. Essa é a parte mais complicada, e acho que é onde a Web3, em geral, está sofrendo agora – adoção de empresas tradicionais. A maioria das empresas que executam inteligência artificial são baseadas na Web2, não em criptografia. Há uma parcela menor de empresas que já estão na Web3, e elas estão muito animadas para usar mercados de computação descentralizados. Esses são os principais clientes que atualmente executam cargas de trabalho em nossas grades.
Para atingir esse grupo maior de empresas Web2, precisamos construir um nível de confiança. A ideia de inferência sendo executada na casa de outra pessoa em um dispositivo pessoal é assustadora para eles. Então, temos que educá-los sobre os aspectos de segurança e dar a eles interfaces com as quais estejam familiarizados. É uma longa batalha que você vence passo a passo.
Temos sorte de haver uma escassez tão grande de GPUs no mercado agora. As empresas estão procurando ativamente por soluções alternativas para nuvens porque as nuvens são muito caras ou não estão disponíveis. Essa necessidade urgente nos permite dar um grande passo para trabalhar com clientes tradicionais porque eles precisam desesperadamente disso para administrar seus negócios.
Você pode explicar melhor como a Nosana está trabalhando para integrar tecnologias avançadas de GPU, como Tensor Cores ou recursos de Ray Tracing, em suas ofertas para tarefas especializadas de IA?
Nosana é muito mais uma rede que habilita hardware de consumidor. Quando você olha para essas novas tecnologias de GPU como Tensor Cores e Ray Tracing, muitas dessas tecnologias estão disponíveis em GPUs de consumidor. Então, estamos trabalhando ativamente para colocar esses dispositivos em nossa rede. Até mesmo dispositivos móveis estão recebendo muitas novas tecnologias para fazer cálculos de IA.
Nossa rede é especificamente muito boa em ter diferentes tecnologias unidas e classificá-las para torná-las disponíveis para uso das empresas. No momento, estamos apenas usando placas NVIDIA para inferência de IA, mas estamos olhando para o futuro para ver essas novas tecnologias surgindo e ter um lugar para elas no mercado de computação Nosana.
Quais estratégias você usa ou planeja usar para expandir além da NVIDIA para outras GPUs, como AMD, Intel ou Apple Silicon?
Este é interessante. Sou um grande fã da AMD; seus chips são acessíveis e realmente performáticos. Eles só têm outros problemas no nível de software e driver, onde não são tão confiáveis. Acho que isso vai mudar em algum momento.
No momento, a NVIDIA é a rainha. Há muita demanda por placas NVIDIA, mas não muita demanda por placas AMD, Apple Silicon ou outros tipos de GPU. Isso porque toda a indústria está usando NVIDIA e CUDA e as ferramentas disponíveis que a NVIDIA forneceu para executar seus aplicativos de inteligência artificial.
Nossa estratégia é ir para onde o mercado está indo. A NVIDIA é a número um, e esse é o principal dispositivo que oferecemos. Percebemos que se a NVIDIA for derrotada em algum momento por um fabricante de GPU melhor ou um modelo diferente, definitivamente estaremos prontos para isso também. A Nosana não está inerentemente vinculada à NVIDIA.
Espero que vejamos uma AMD mais competitiva, e espero que as pessoas comecem a usar frameworks de aprendizado de máquina que sejam capazes de rodar no Apple Silicon, talvez até mesmo em configurações distribuídas. Por um tempo, estávamos executando uma demonstração do nosso aplicativo que usava o Apple Silicon e podia ser executado no navegador. Essas coisas são muito legais e funcionam muito bem. Só que não há muita demanda no mercado para isso agora.
Nossa estratégia é manter um controle rigoroso sobre as necessidades do mercado e garantir que possamos fornecer o hardware que as pessoas precisam.
Como você planeja lidar com o risco potencial de centralização que pode surgir se fazendas de GPU em larga escala começarem a dominar sua rede?
Isso é algo legal para se pensar, mas não é algo que antecipamos ativamente agora. Um dos elementos poderosos da Nosana é que somos muito descentralizados. O poder que temos das GPUs gamer que estão fragmentadas ao redor do mundo torna nossa rede poderosa.
Temos alguns fornecedores menores de GPU do tipo data center. Mas, no final, eles são um pouco mais caros porque têm mais custos de manutenção. O desempenho que estamos obtendo dos 4090s, que não estão disponíveis em data centers devido ao licenciamento, é muito bom.
Não acho que haja um risco iminente de centralização. Seria interessante se um grande data center surgisse e fosse mais barato do que GPUs de consumo, mas estou bastante confiante de que o hardware de consumo sempre será mais barato. Contanto que seja performático, as pessoas preferirão rodar nesses mercados em vez dos data centers.
Você tem planos de integração com fluxos de trabalho e ferramentas de desenvolvimento de IA existentes para proporcionar uma experiência perfeita para seus usuários?
Sim, pretendemos integrar com algumas dessas estruturas. Acessar o Nosana agora envolve usar nosso SDK, que atualmente está em TypeScript. Provavelmente teremos um SDK em Python em algum momento que tornará a integração mais fácil com as estruturas.
Estamos focados em desenvolvedores e passamos muito tempo em comunidades de desenvolvedores de IA para ver o que as pessoas estão usando para construir. É aí que queremos fornecer as ferramentas que eles acham convenientes para usar a rede. O lado das ferramentas e o lado da integração são coisas que vamos dobrar nos próximos meses. Estamos apenas em uma fase agora em que temos nosso conjunto inicial de clientes usando nossas ferramentas preliminares, mas para aumentar nossa base de clientes, é definitivamente isso que vamos analisar.
Como a abordagem da Nosana para a computação de GPU descentralizada se alinha com as tendências mais amplas da Web3 e da internet descentralizada?
Acho que o que a Nosana faz é levar o termo descentralização muito a sério. Somos completamente descentralizados e de código aberto. Não tenho certeza se essa é uma tendência na Web3 agora. Acho que muitas empresas são basicamente plataformas fechadas com um token para pagar pessoas.
Mas estamos realmente indo em direção à internet descentralizada e à verdadeira abordagem Web3, onde queremos ter certeza de que nossa rede seja completamente de código aberto e aberta para qualquer um participar. Liberdade é um dos valores e elementos centrais dentro da rede Nosana, o que significa que qualquer um pode executar nosso software, compilar nosso software, fazer modificações, e qualquer um pode iniciar um mercado de computação e qualquer GPU pode participar. Não há uma entidade central responsável pelo que acontece na rede Nosana.
Levamos isso muito a sério, e espero que essa seja a tendência. Acho que há dois lados na indústria, e a Nosana está definitivamente do lado do código aberto, seguindo o modelo de descentralização do Bitcoin.
Como você vê o desenvolvimento da indústria em que trabalha nos próximos três anos?
Acho que a indústria da computação descentralizada é muito interessante. A principal motivação para eu começar a Nosana foi que os provedores de nuvem são poderosos demais. Existem muito poucas empresas executando cerca de 70% de toda a internet, Web2 e Web3, e acho que isso precisa mudar.
Nos próximos três anos, olhando para os projetos que estão aqui agora e a tração que estamos obtendo com Nosana, e que estou vendo em outros projetos como Akash, acho que vamos acabar com esse domínio de 70% dos três provedores de nuvem. Vamos começar a hospedar mais coisas em computação descentralizada. Dentro de três anos, acho que é realista que pegaremos um pedaço da computação centralizada e seremos capazes de executá-la em GPUs descentralizadas.
Quando você olha especificamente para o espaço da IA, acho que muita coisa pode acontecer em três anos. Estamos em uma fase de aceleração desde o lançamento do LLaMA e do ChatGPT. Mas três anos também é um curto período de tempo, então acho que veremos IAs mais poderosas e talvez arquiteturas de modelos ligeiramente diferentes. Acho que os requisitos de hardware e o que a Nosana está oferecendo não mudarão muito. Será principalmente sobre crescimento e garantir que capturemos mais do mercado Web2, tornemos os três grandes provedores de nuvem um pouco menos poderosos e demos às pessoas mais liberdade no que elas usam para executar sua tecnologia.
Você pode compartilhar o roteiro do Nosana? O que você planeja fazer no próximo mês ou dois?
Acabamos de anunciar que nossa última fase de testes está chegando ao fim. O Nosana está em um estágio chamado grade de testes, o que significa que temos uma grade de GPU funcional, mas ainda estamos testando algumas funcionalidades principais. Então, não estávamos prontos para o público aberto e estávamos trabalhando apenas com um grupo selecionado de clientes. Esta fase durará até dezembro.
A partir de 14 de janeiro, estamos lançando nossa grade principal, o que significa que a grade de computação do Nosana finalmente estará aberta para todos usarem. Qualquer GPU pode vir a bordo, e qualquer cliente pode usar essa grade de computação poderosa a partir dessa data. É um momento emocionante para nós, e acho que muitas pessoas estavam esperando há muito tempo para que isso acontecesse. Consideramos estável o suficiente para ser usado pela indústria em geral.
A partir daí, muitos dos esforços da Nosana serão direcionados para impulsionar a adoção da rede, já que ela está aberta para ser usada. Vamos nos concentrar muito em comunidades de desenvolvedores e integrações de ferramentas. Veremos muitos eventos legais e divertidos sendo organizados por nós. Estamos mirando em um hackathon global em algum momento no final de 2025, e temos outras coisas muito legais em mente para impulsionar essa adoção.
A postagem O futuro da computação de IA: a abordagem visionária da Nosana para unir Web2 e Web3 por meio do poder de GPU descentralizado apareceu primeiro no Metaverse Post.