¡Desafía el dominio del software de IA de NVIDIA! Modular crea una plataforma de IA de integración cruzada de hardware para enfrentar a CUDA

robot
Generación de resúmenes en curso

En este momento en que la IA generativa está barriendo el mundo, casi todos los LLM, servicios en la nube y nuevas empresas de IA dependen de la misma infraestructura clave, que es el ecosistema de software CUDA de NVIDIA (. Esta arquitectura de programación, originalmente diseñada para tarjetas gráficas, ha ido expandiéndose durante casi dos décadas para convertirse en el “sistema operativo invisible” que opera realmente en la industria de la IA.

La startup Modular, fundada en 2022, está intentando desafiar de manera directa esta estructura altamente concentrada y dominada por un único proveedor. El objetivo de Modular no es crear un nuevo chip, sino desarrollar una “plataforma de pila de software de IA portátil” que permita a los modelos de IA moverse libremente entre diferentes GPU y aceleradores, sin estar atrapados en el ecosistema de NVIDIA y CUDA.

Punto de partida del emprendimiento en 2022, ingenieros de base se adentran en el núcleo CUDA

Modular fue fundado en 2022 por dos ingenieros de software de Apple y Google. El CEO Chris Lattner creó el sistema de compiladores Swift y LLVM, mientras que el cofundador Tim Davis participó en la arquitectura de software clave del TPU de Google.

Ambos han vivido de primera mano el proceso de cómo el nuevo hardware “abre el mercado gracias al software”, por lo que decidieron dejar las grandes empresas tecnológicas y desafiar directamente el dominio del software de IA que representa CUDA. Esta guerra asimétrica parece casi loca a los ojos de la industria, pero también se considera uno de los pocos equipos con la oportunidad de intentarlo debido a su profundo entendimiento de la base del sistema.

CUDA es difícil de reemplazar, la cadena estructural de la industria de la IA.

CUDA originalmente era solo una herramienta para permitir que las tarjetas gráficas fueran programables, pero con el auge del aprendizaje profundo, se ha expandido gradualmente para convertirse en un ecosistema completo que abarca lenguajes, bibliotecas, compiladores y motores de inferencia.

Para la mayoría de los equipos de IA, casi es imposible evitar CUDA si utilizan GPUs de NVIDIA. Incluso si hay GPUs de AMD, TPUs o chips desarrollados por proveedores de la nube en el mercado, cada tipo de hardware está vinculado a un software exclusivo, por lo que los desarrolladores naturalmente tienden a elegir CUDA, que es el más maduro y completo en herramientas, formando una estructura industrial altamente bloqueada.

La ingeniería sin incentivos, en cambio, se convierte en un punto de ruptura.

Lattner señala que el software de IA portátil que es compatible entre chips y proveedores no es irrelevante, sino que “nadie tiene suficientes incentivos para asumir los costos”. Este tipo de proyectos son extremadamente difíciles, tienen un largo período de recuperación y, a corto plazo, casi no se ven resultados comerciales, pero es una capacidad que toda la industria desea.

Es precisamente esta contradicción la que llevó a Modular a decidir invertir en el desarrollo a largo plazo de sistemas de base antes de la explosión de la IA generativa, y a mantenerse deliberadamente alejado del foco del mercado durante los primeros tres años después de su fundación.

Tres años de trabajo silencioso, el capital y el equipo se han ido colocando gradualmente.

Hasta 2025, Modular ha recaudado aproximadamente 380 millones de dólares en fondos, con inversionistas que incluyen varias firmas de capital de riesgo de primer nivel de Silicon Valley. Después de completar la última ronda de financiamiento en septiembre de 2025, la valoración de la empresa es de aproximadamente 1.6 mil millones de dólares.

Estos recursos permiten a Modular reclutar ingenieros senior de Google y Apple, formando un equipo enfocado en compiladores, software de sistema e infraestructura de IA, y continuar perfeccionando la pila de software completa.

Arquitectura de software de tres capas, desde el lenguaje hasta el clúster de computación.

El núcleo técnico de Modular está compuesto por tres capas, que son:

Capa superior: para Mammoth, utilizado para ayudar a las empresas en la programación y gestión de la potencia de cálculo en entornos de múltiples GPU y múltiples proveedores, resolviendo problemas de implementación y operación.

Capa intermedia: es el motor de inferencia MAX, responsable de la ejecución real del modelo, que ya es compatible con NVIDIA, AMD y Apple Silicon.

Capa más baja: es el lenguaje de programación Mojo, cuya sintaxis se asemeja a Python y su rendimiento es cercano a C++, y se puede integrar con marcos de IA populares.

2025 verificación clave, la capa de computación unificada se forma oficialmente

En septiembre de 2025, Modular anunció resultados clave de pruebas, donde bajo la misma plataforma de software, se impulsaron simultáneamente el NVIDIA Blackwell B200 y el AMD MI355X, logrando un rendimiento de primer nivel, siendo que el MI355X mostró un aumento de aproximadamente el 50% en comparación con el software nativo de AMD.

Luego, el 22/12, se lanzó oficialmente la Plataforma Modular 25.6, que admite completamente centros de datos y GPU de consumo, y por primera vez permite que Mojo soporte directamente Apple Silicon. El oficial lo describe como “Escribe una vez, ejecuta en cualquier lugar”, es decir:

“Los desarrolladores que escriben códigos con Mojo no necesitan escribir una versión para Nvidia, AMD y Apple Silicon; un mismo programa puede ejecutarse en diferentes GPU y hardware de diferentes proveedores.”

La capa de computación AI que simboliza la unificación pasa del concepto a la implementación práctica.

¡Este artículo desafía el dominio del software de IA de NVIDIA! Modular crea una plataforma de IA integrada entre hardware que compite con CUDA, apareció por primera vez en Chain News de ABMedia.

Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
0/400
Sin comentarios
  • Anclado
Opera con criptomonedas en cualquier momento y lugar
qrCode
Escanee para descargar la aplicación Gate
Comunidad
Español
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)