¿Cómo un fallo en la base de datos de Toyota paralizó sus fabricas?

Fiabilidad
Conclusión

Es una historia de advertencia sobre cómo el mantenimiento regular puede salir mal: cómo una pequeña parte del sistema, en este caso el trabajo de rutina en una base de datos, colapsó la productividad de miles de trabajadores y 14 fábricas de Toyota.

Se suponía que era una revisión rutinaria de mantenimiento, pero en lugar de eso, provocó el cierre de 14 fábricas de automóviles durante dos días seguidos.

Las fábricas de Toyota se pararon el 28 de agosto, reduciendo su producción mundial en un tercio, en una empresa famosa por su prolífica fabricación con plazos ajustados.

¿La causa? Un error en el mantenimiento de la base de datos, que sobrepasó el espacio disponible en disco, tanto en el servidor principal como en la copia de seguridad.

Con la base de datos fuera de servicio, Toyota ya no podía hacer las peticiones automatizadas de suministros necesarias para fabricar sus 13.500 coches al día. Y durante dos días, 25 líneas de producción de 14 fábricas estuvieron vacías, ya que el “fallo” impedía pedir piezas nuevas a los proveedores.

Podría no haber sido un problema, hasta que se combina con el famoso enfoque “Just In Time” de la empresa, un cuidadoso acto de equilibrio en el que sólo se reciben los bienes o materias primas que se necesitan justo antes de necesitarlos.

Una historia de “Justo a tiempo”

Just In Time (JIT) puede ser un excelente aliado para la empresa adecuada: maximiza la rotación del inventario, lo que a su vez tiene muchas ventajas para los ingresos y los costes.

Si se maneja con precisión y como un cirujano, la necesidad de espacio de almacén y los costes asociados, como personal y electricidad, pueden ser una fracción de su producción diaria o semanal. Pero si la balanza se tuerce en cualquiera de los dos sentidos, se puede acabar teniendo demasiadas materias primas y ningún lugar donde almacenarlas o ninguna materia prima y las máquinas y el personal inactivos.

Este último parece haber sido el caso de Toyota, donde Reuters calcula que un tercio de su producción mundial se detuvo. La agencia de noticias también sugiere que, debido a la estructura JIT, será difícil recuperar el déficit de dos días.

Una línea de producción extremadamente eficiente que trabaja todos los días casi al máximo de su capacidad no deja mucho margen para aumentar la productividad, lo que significa que Toyota podría estar jugando a recuperar el retraso en las entregas a los clientes durante algún tiempo.

Seiji Sugiura, analista del Tokai Tokyo Research Institute, declaró a U.S. News: “La producción funcionaba a pleno rendimiento, así que hay poco margen adicional para la producción”.

Espacio en disco insuficiente

¿Qué ha pasado con el mantenimiento?

Toyota dijo: “El mal funcionamiento del sistema se debió a la indisponibilidad de algunos servidores múltiples que procesan los pedidos de piezas.

En cuanto a las circunstancias, el 27 de agosto, el día antes de que se produjera el fallo, se llevaron a cabo tareas de mantenimiento regulares. Durante el procedimiento de mantenimiento, se borraron y organizaron los datos que se habían acumulado en la base de datos y se produjo un error debido a la insuficiencia de espacio en disco, lo que provocó la parada del sistema.

Como estos servidores funcionaban con el mismo sistema, se produjo un fallo similar en la función de copia de seguridad y no se pudo realizar la conmutación. Esto provocó la suspensión de las operaciones de la planta nacional.

El sistema se restableció tras transferir los datos a un servidor de mayor capacidad el 29 de agosto, y las plantas reanudaron su funcionamiento al día siguiente.

Nos gustaría informar de que hemos identificado lo anterior como la verdadera causa. También se han puesto en marcha contramedidas replicando y verificando la situación.”

“También nos gustaría reafirmar que el mal funcionamiento del sistema no fue causado por un ciberataque, y pedir disculpas a todas las partes por cualquier preocupación que esto pueda haber causado.”

El resultado final

Es un cuento con moraleja sobre el mantenimiento regular que sale mal: cómo una pequeña parte del sistema, en este caso, el mantenimiento rutinario de una base de datos, hizo caer toda la productividad de miles de trabajadores y 14 fábricas, con un efecto mariposa de perturbación para proveedores, clientes e incluso un bache bursátil temporal.

A medida que el mundo avanza hacia los beneficios de la automatización y la inteligencia artificial (IA), es un recordatorio de que cuantas más partes estén interconectadas, peor puede ser un efecto dominó.

Aun así, el sistema les funciona bien el 99% del tiempo, por lo que el contraargumento es una oda a la eficiencia durante los buenos tiempos.

Y aunque una empresa sólo puede ser tan fuerte como su componente más débil, al menos este agujero en el armazón está parcheado.

Toyota ha añadido:

“De cara al futuro, revisaremos nuestros procedimientos de mantenimiento y redoblaremos nuestros esfuerzos para evitar que se repita, de modo que podamos entregar el mayor número de vehículos a nuestros clientes lo antes posible.”

Eddie Wrenn
Content Editor
Eddie Wrenn
Editor

Eddie Wrenn es un reportero y editor de noticias que ha trabajado en salas de redacción nacionales e internacionales en el Reino Unido y Australia, centrándose en noticias de última hora y reportajes sobre ciencia y tecnología. Actualmente, se encuentra en Londres, Reino Unido.