Comment la maintenance des bases de données a entraîné la fermeture des chaînes de production de Toyota pendant deux jours

Fiabilité
POINTS CLÉS À RETENIR

Il s'agit d'un récit édifiant sur une maintenance régulière qui tourne mal : comment une petite partie du système, en l'occurrence un travail de routine sur une base de données, a fait chuter la productivité de milliers de travailleurs et de 14 usines Toyota.

Il devait s’agir d’un contrôle de maintenance de routine. Mais au lieu de cela, il a entraîné la fermeture de 14 usines de construction automobile pendant deux jours d’affilée.

Les usines de Toyota se sont arrêtées le 28 août, réduisant d’un tiers leur production mondiale, dans une entreprise réputée pour sa production prolifique dans des délais serrés.

La cause ? Un problème de maintenance d’une base de données, qui a entraîné un dépassement de l’espace disque disponible, tant sur le serveur principal que sur le serveur de secours.

La base de données étant hors service, Toyota ne pouvait plus effectuer les demandes automatisées de fournitures nécessaires à la fabrication de ses 13 500 voitures par jour. Pendant deux jours, 25 lignes de production réparties dans les 14 usines sont restées vides, car le “pépin” empêchait de commander de nouvelles pièces automobiles auprès des fournisseurs.

Ce n’était peut-être pas un problème, mais il fallait y ajouter la fameuse approche “flux tendu” de l’entreprise. Un exercice d’équilibre minutieux qui consiste à ne recevoir les marchandises ou les matières premières dont on a besoin que juste avant d’en avoir besoin.

L’histoire du “flux tendu”

Le travail en “flux tendu” peut être un excellent allié pour la bonne entreprise : il maximise la rotation des stocks, ce qui a de nombreuses retombées positives sur les recettes et les coûts.

Manipulés avec précision et à la manière d’un chirurgien, les besoins en espace d’entreposage et les coûts associés, tels que le personnel et l’électricité, peuvent ne représenter qu’une fraction de votre production quotidienne ou hebdomadaire. Mais si l’équilibre est rompu dans un sens ou dans l’autre, vous pouvez vous retrouver soit avec trop de matières premières et aucun endroit pour les stocker, soit sans matières premières et avec des machines et du personnel à l’arrêt.

C’est ce qui s’est produit chez Toyota, où, selon Reuters, un tiers de la production mondiale s’est arrêtée. L’agence de presse suggère également qu’en raison de la structure JAT, il sera difficile de rattraper le retard de deux jours.

Une chaîne de production extrêmement efficace fonctionnant chaque jour à un niveau proche de la capacité maximale ne laisse pas beaucoup de place pour augmenter la productivité, ce qui signifie que Toyota risque de devoir rattraper les retards de livraison à ses clients pendant un certain temps.

Seiji Sugiura, analyste au Tokai Tokyo Research Institute, a déclaré à U.S. News : “La production fonctionnait à plein régime, il y a donc peu de marge de manœuvre supplémentaire pour la production”.

Espace disque insuffisant

Que s’est-il passé du côté de la maintenance ?

Toyota a déclaré : “Le dysfonctionnement du système a été causé par l’indisponibilité de plusieurs serveurs qui traitent les commandes de pièces.

“En ce qui concerne les circonstances, des travaux de maintenance réguliers ont été effectués le 27 août, le jour précédant le dysfonctionnement. Au cours de la procédure de maintenance, les données accumulées dans la base de données ont été supprimées et organisées, et une erreur s’est produite en raison d’un espace disque insuffisant. Ce qui a entraîné l’arrêt du système.

“Comme ces serveurs fonctionnaient sur le même système, une défaillance similaire s’est produite au niveau de la fonction de sauvegarde, et le basculement n’a pas pu être effectué. Cela a entraîné la suspension des opérations de l’usine nationale.

“Le système a été rétabli après le transfert des données vers un serveur de plus grande capacité le 29 août, et les usines ont repris leurs activités le lendemain.

“Nous aimerions signaler que nous avons identifié ce qui précède comme étant la véritable cause. Des contre-mesures ont également été mises en place en reproduisant et en vérifiant la situation.

“Nous souhaitons également réaffirmer que le dysfonctionnement du système n’a pas été causé par une cyberattaque, et nous nous excusons auprès de toutes les parties pour les inquiétudes que cela a pu susciter”.

La ligne de fond

Il s’agit d’un récit édifiant sur une maintenance régulière qui tourne mal : comment une petite partie du système, en l’occurrence une maintenance de routine sur une base de données, a fait chuter toute la productivité de milliers de travailleurs et de 14 usines, avec un effet papillon de perturbation pour les fournisseurs, les clients, et même une secousse boursière temporaire.

Alors que le monde s’oriente vers les avantages de l’automatisation et de l’intelligence artificielle (IA), cet incident nous rappelle que plus il y a d’éléments interconnectés, plus l’effet domino peut être important.

Néanmoins, le système fonctionne bien pour l’entreprise 99 % du temps, de sorte que le contre-argument est une ode à l’efficacité en période de prospérité.

Et bien qu’une entreprise ne puisse être aussi forte que son élément le plus faible, au moins cette faille dans la structure est réparée.

Toyota a ajouté :

“A l’avenir, nous allons revoir nos procédures de maintenance et redoubler d’efforts pour éviter que cela ne se reproduise, afin de pouvoir livrer le plus grand nombre de véhicules à nos clients dans les meilleurs délais”.

Eddie Wrenn
Editor
Eddie Wrenn
Journaliste Tech

Eddie Wrenn est journaliste et rédacteur en chef. Il a travaillé dans des salles de rédaction nationales et internationales au Royaume-Uni et en Australie, et s'est spécialisé dans les nouvelles de dernière heure et les reportages sur les sciences et les technologies. Il est actuellement basé à Londres, au Royaume-Uni.