Des chercheurs de la ZHAW développent une solution d'IA pour nettoyer les données des machines
Des chercheurs de la ZHAW School of Engineering ont développé un framework innovant qui détecte plus efficacement les anomalies et les défauts dans les machines, même lorsque les données d'entraînement sont contaminées. Ce développement répond à un défi central de la recherche en IA : une détection précise des défauts sans pouvoir recourir à des données d'entraînement exemptes de défauts.
La détection de modèles inhabituels ou anormaux dans les données industrielles est l'une des tâches les plus courantes des algorithmes d'intelligence artificielle dans les applications commerciales. Elle permet de détecter à temps les dégradations, les défauts et les erreurs dans la production et permet de résoudre ces problèmes à temps, ce qui permet de réaliser des économies et de réduire les temps d'arrêt.
La détection d'anomalies dans les machines est généralement basée sur "l'apprentissage à partir de la normalité". Cela signifie que les algorithmes d'IA sont entraînés à partir de données provenant de machines fonctionnant correctement, afin de pouvoir détecter ultérieurement les anomalies dans les données de fonctionnement. Cependant, dans la pratique, il n'est souvent pas possible de disposer de données entièrement exemptes d'erreurs, ce qui nuit considérablement à l'efficacité des modèles. L'entraînement avec des données contaminées a pour conséquence que les modèles ne peuvent plus faire la différence entre des conditions de fonctionnement normales et défectueuses - un défi que la recherche n'a guère réussi à relever jusqu'à présent.
Utilisation d'algorithmes d'IA sans intervention humaine
"En travaillant avec différentes entreprises, nous avons réalisé qu'il y avait un besoin pour des algorithmes d'IA qui peuvent être utilisés directement pour l'étiquetage des données sans intervention humaine préalable", explique le Dr Lilach Goren Huber de l'équipe Smart Maintenance à l'Institut ZHAW pour l'analyse des données et la conception des processus (IDP).
Nouveau cadre pour l'affinement non surveillé des données
Pour combler cette lacune, les chercheurs de la ZHAW ont développé un nouveau type de cadre qui évalue automatiquement les données historiques potentiellement contaminées et extrait des échantillons de données fonctionnant normalement, entièrement sans surveillance. De cette manière, les données nettoyées peuvent être utilisées pour l'entraînement d'algorithmes de détection d'anomalies sans qu'un tri manuel fastidieux soit nécessaire.
Un concept simple, un impact fort
Le cadre repose sur une observation centrale : les échantillons de données erronés ont un impact plus important sur la performance des modèles d'IA que les échantillons normaux. Sur la base de ce principe, chaque échantillon de données se voit attribuer un score qui mesure son influence sur l'entraînement. Les échantillons ayant un score élevé sont identifiés comme potentiellement erronés et retirés des données d'entraînement. Lors des tests, le framework a obtenu avec ces données affinées une performance comparable à celle des ensembles de données nettoyés manuellement.
Application réussie et perspectives
La ZHAW a testé la méthode sur un grand nombre de types de machines, dont des pompes, des vannes, des ventilateurs et des moteurs, et a obtenu des résultats prometteurs. Dans la plupart des cas, le framework a pu compenser entièrement le manque de données d'entraînement sans erreur. "Notre approche n'est pas seulement simple et robuste, elle est aussi universelle. Elle peut être combinée avec n'importe quel type de données et avec les méthodes de détection d'erreurs existantes", explique le Dr Lilach Goren Huber.
Source : www.zhaw.ch