🚀 ¡La IA acaba de recibir una actualización de velocidad seria!
¡Together AI ahora está ofreciendo velocidades de inferencia récord — hasta 334 tokens/seg — gracias a su nuevo motor construido para las GPU Blackwell de NVIDIA. Probada por empresas como Zoom y Salesforce, esta tecnología está empujando los límites del rendimiento y la eficiencia.
🧠 Su pila personalizada utiliza:
• Núcleos Tensor de 5ª generación
• Marco de kernel ThunderKittens
• Especulador Turbo para decodificación rápida y precisa
• Cuantización sin pérdidas para mantener la calidad del modelo
Con estos avances, Together AI se está convirtiendo rápidamente en un actor principal en modelos de razonamiento de código abierto e infraestructura de IA.
👉 ¡Síguenos para más actualizaciones en innovación de IA!
#AI #NVIDIA #LLMperformance #GPUspeed #bitinsider