Tesla encendió su supercomputadora Dojo esta semana, una medida que acelerará significativamente el entrenamiento de conjuntos de datos para la versión Beta de conducción autónoma total (FSD).
Tesla Dojo es una supercomputadora diseñada y construida por Tesla para el procesamiento y reconocimiento de videos por visión por computadora. Se utilizará para entrenar los modelos de aprendizaje automático de Tesla para mejorar su sistema avanzado de asistencia al conductor Full Self-Driving (FSD). Según Tesla había comenzado a utilizarse en producción en julio de 2023.
El nombre “Dojo” está inspirado en el concepto de una sala de entrenamiento en artes marciales japonesas, enfatizando el enfoque de la plataforma en entrenar y refinar las habilidades de los sistemas de inteligencia artificial de Tesla. Así como los artistas marciales entrenan y aprenden de sus experiencias, Tesla Dojo permite que los algoritmos de IA aprendan y mejoren continuamente a través de un entrenamiento iterativo.
El objetivo de Dojo es procesar de forma eficiente millones de terabytes de datos de vídeo capturados en situaciones de conducción de la vida real de los más de 4 millones de coches de Tesla. Este objetivo condujo a una arquitectura considerablemente diferente a los diseños de supercomputadoras convencionales.
Tesla opera varios grupos informáticos masivamente paralelos mientras desarrolla su sistema avanzado de asistencia al conductor Autopilot. Andrej Karpathy promocionó su clúster principal sin nombre que utiliza 5,760 unidades de procesamiento de gráficos (GPU) Nvidia A100 en 2021 en la cuarta Conferencia Internacional Conjunta sobre Visión por Computadora y Reconocimiento de Patrones (CCVPR 2021) como “aproximadamente la supercomputadora número cinco del mundo” con aproximadamente 81.6 petaflops, basado en la escala del rendimiento de la supercomputadora Nvidia Selene, que utiliza componentes similares. Sin embargo, el rendimiento del grupo de GPU principal de Tesla ha sido cuestionado, ya que no estaba claro si se midió utilizando números de punto flotante de precisión simple o doble (FP32 o FP64). Tesla también opera un segundo clúster de 4,032 GPU para entrenamiento y un tercer clúster de 1,752 GPU para el etiquetado automático de objetos.
Dojo se anunció oficialmente en el Día de la Inteligencia Artificial (IA) de Tesla el 19 de agosto de 2021. Tesla reveló detalles del chip D1 y sus planes para el “Proyecto Dojo”, un centro de datos que albergaría 3,000 chips D1; el primer “teja de entrenamiento” se había completado y entregado la semana anterior. En octubre de 2021, Tesla publicó un documento técnico “Dojo Technology” que describe los formatos de punto flotante Configurable Float8 (CFloat8) y Configurable Float16 (CFloat16) y las operaciones aritméticas como una extensión del estándar 754 del Instituto de Ingenieros Eléctricos y Electrónicos (IEEE).