La comunidad de ciberseguridad ha sido alertada recientemente de una vulnerabilidad crítica en el NVIDIA Container , un componente esencial para las aplicaciones aceleradas por GPU en los ámbitos de la IA y el aprendizaje automático (ML). Identificada como CVE-2024-0132, esta falla afecta significativamente a una amplia gama de aplicaciones de IA que dependen de recursos de GPU tanto en entornos en la nube como locales. Tras su descubrimiento en septiembre de 2024, NVIDIA reconoció el problema y lanzó un parche poco después.
Detalles de la vulnerabilidad
La vulnerabilidad presente en NVIDIA Container , especialmente en las versiones hasta la 1.16.1 inclusive, se debe a un fallo de tipo «Time-of-check Time-of-Use» (TOCTOU). Esta vulnerabilidad puede ser aprovechada para elevar privilegios, escapar de los contenedores y manipular las cargas de trabajo de la GPU, lo que podría dar lugar a resultados erróneos de la IA o a interrupciones totales del servicio.
Las vulnerabilidades concretas relacionadas con este incidente son las siguientes:
- CVE-2024-0132: Esta vulnerabilidad crítica, con una puntuación de 9,0 en la escala de gravedad, podría permitir que imágenes de contenedor especialmente diseñadas accedieran al sistema de archivos del host, lo que podría dar lugar a la ejecución de código, la denegación de servicio y la escalada de privilegios.
- CVE-2024-0133: Esta vulnerabilidad de gravedad media, con una puntuación de 4,1, permite que imágenes de contenedor especialmente diseñadas creen archivos vacíos en el sistema de archivos del host, lo que podría dar lugar a la manipulación de datos.
NVIDIA abordó rápidamente la vulnerabilidad mediante la publicación de un boletín de seguridad y la distribución de versiones actualizadas del software afectado.
¿A quién afecta?
Las investigaciones indican que más de un tercio (35 %) de los entornos en la nube que utilizan GPU de NVIDIA están en peligro, según ha descubierto Wiz.
Las organizaciones que utilicen versiones del NVIDIA Container hasta la 1.16.1, ambas incluidas, así como del NVIDIA GPU Operator hasta la 24.6.1, ambas incluidas, deben evaluar sus entornos y tomar las medidas necesarias para mitigar los efectos en cadena de esta vulnerabilidad.
Introducción al NVIDIA Container
El NVIDIA Container está diseñado para facilitar la creación y ejecución de contenedores Docker acelerados por GPU. Por defecto, los contenedores no tienen acceso a las GPU; este kit de herramientas permite a los usuarios poner sus GPU NVIDIA a disposición de sus contenedores. El kit de herramientas consta de bibliotecas de tiempo de ejecución y utilidades que automatizan la configuración de los contenedores, lo que permite a los usuarios aprovechar las GPU NVIDIA para procesar cargas de trabajo de IA de alto rendimiento. En resumen, el Container NVIDIA Container permite a los contenedores acceder a la GPU de NVIDIA para que las aplicaciones que necesitan aceleración por GPU puedan ejecutarse más rápido y de forma más eficiente.
Junto con NVIDIA GPU Operator —que coordina los recursos de la GPU en entornos de Kubernetes—, este conjunto de herramientas desempeña un papel fundamental en las aplicaciones modernas de IA y aprendizaje automático. Básicamente, mejora el rendimiento y la eficiencia de las aplicaciones que requieren HPC (computación de alto rendimiento) para tareas que implican un gran volumen de datos, como el entrenamiento de modelos de IA.
Sin embargo, una vulnerabilidad puede generar riesgos de diversas formas:
- Acceso no autorizado a la GPU: los atacantes podrían acceder a la GPU y provocar el robo de datos o el secuestro de recursos.
- Escalada de privilegios: los atacantes pueden escapar de los contenedores y ejecutar código en el sistema anfitrión para comprometer la infraestructura subyacente.
- Container : un contenedor comprometido podría permitir un acceso no autorizado a los recursos de la GPU de otros contenedores. Esto puede provocar fugas de datos o denegaciones de servicio en varias aplicaciones que se ejecutan en el mismo sistema.
- Exposición de datos confidenciales: en lugar de extraer directamente datos confidenciales, los atacantes a veces buscan vulnerabilidades en diversos componentes del sistema para moverse por el entorno y ampliar sus privilegios. Container añade complejidad a estas vulnerabilidades.
Posible escenario de ataque
Un posible flujo de ataque que aproveche el NVIDIA Container puede resumirse en tres pasos:
- Crear una imagen maliciosa: un atacante puede diseñar una imagen de contenedor maliciosa destinada a aprovechar la vulnerabilidad CVE-2024-0132.
- Acceder al sistema de archivos del host: A continuación, el atacante ejecuta la imagen maliciosa en una plataforma vulnerable, ya sea directamente a través de servicios de GPU compartidos, indirectamente mediante un ataque a la cadena de suministro o mediante ingeniería social. Esto le permite montar el sistema de archivos del host y obtener acceso no autorizado a la infraestructura subyacente y a datos potencialmente confidenciales de otros usuarios.
- Control total: al tener acceso a los sockets críticos de Unix (docker.sock/containerd.sock), el atacante puede ejecutar comandos arbitrarios en el sistema host con privilegios de root y, en última instancia, hacerse con el control del equipo.

Recomendaciones para protegerse contra Container
Este incidente nos sirve como un oportuno recordatorio de que incluso las imágenes de contenedores de confianza procedentes de fuentes acreditadas pueden albergar graves vulnerabilidades. Las organizaciones que utilicen el NVIDIA Container deberían:
Actualiza a la última versión
Se recomienda encarecidamente a los usuarios que actualicen a la versión 1.16.2 de NVIDIA Container y a la versión 24.6.2 de NVIDIA GPU Operator lo antes posible, especialmente en el caso de los servidores de contenedores que puedan ejecutar imágenes no fiables.
Realiza análisis de seguridad periódicos
Implemente procedimientos de análisis periódicos para detectar imágenes de contenedores maliciosas y cualquier otro componente que se incorpore a su aplicación en entornos en la nube. Los análisis periódicos ayudan a evaluar los riesgos e identificar los puntos ciegos de seguridad asociados a estas imágenes. Las herramientas de análisis automatizado pueden ayudar a supervisar de forma continua las vulnerabilidades conocidas y los errores de configuración.
Además, la integración de análisis de seguridad en los procesos de CI/CD garantiza la detección de vulnerabilidades antes de la implementación, mientras que los informes exhaustivos ofrecen información detallada sobre los riesgos identificados y las medidas correctivas recomendadas.
Secure Container con MetaDefender Software Supply Chain
Para mitigar vulnerabilidades como las detectadas en el NVIDIA Container , OPSWAT MetaDefender Software Supply Chain ofrece sólidas capacidades de análisis de amenazas para registros de contenedores y repositorios de código fuente.
Se informará a los equipos Software y DevSecOps de la presencia de imágenes de contenedores potencialmente maliciosas o vulnerables dentro de sus pilas de aplicaciones. Al aprovechar múltiples capas de detección y prevención de amenazas, MetaDefender Software Supply Chain ofrece información y recomendaciones para la corrección, incluidas actualizaciones a versiones seguras de las imágenes de contenedores afectadas.

Puedes evaluar el estado de vulnerabilidad de los paquetes de tus imágenes de contenedor tanto a nivel general como detallado.

Container forma parte de la seguridad basada en la inteligencia artificial
Container han puesto de manifiesto la necesidad de una seguridad vigilante y proactiva para las organizaciones que dependen cada vez más de las tecnologías de IA y aprendizaje automático. Para obtener más información sobre la seguridad de los contenedores y la seguridad de la cadena de suministro de software, consulta nuestros recursos:
MetaDefender Software Supply Chain
¿Las imágenes de Docker: un vector de amenaza en auge?
Secure compilación, desde el código fuente hasta los artefactos


