Halbüberwachte Anomaliedetektion mittels maschinellen Lernens mit dynamischer Domänenadaption

Alleine in den letzten 12 Jahren gab es in Deutschland 480 Lebensmittelrückrufe aufgrund von Fremdkörpern in Lebensmitteln. Dabei führen die Rückrufe zu einem Imageschaden des Unternehmens und verursachen hohe Kosten. Der Einsatz einer Zustandsüberwachung zur Detektion von Defekten und Fremdkörpern bietet sich daher an, um Lebensmittelrückrufe zu vermeiden. Insbesondere Abfüllanlagen aus der Lebensmittelindustrie sind aufgrund der Vielzahl an verarbeiteten Produkten herausfordernd für eine Zustandsüberwachung. So muss die Zustandsüberwachung auf das jeweilige Produkt zugeschnitten sein, um Defekte und Fremdkörper detektieren zu können. Die unzureichende Anpassungsfähigkeit schränkt die Anwendung der Zustandsüberwachung zur zuverlässigen Erkennung von Defekten unter wechselnden Betriebsbedingungen (z. B. verschiedene Produkte) ein.

Um zeitgleich eine erhöhte Ausfall- und Datensicherheit zu erreichen, wird die Zustandsüberwachung maschinennah ausgeführt und keine Cloud-Lösungen eingesetzt. Dadurch müssen sensible Daten das Unternehmen nicht verlassen. Ebenfalls kann mithilfe des halbüberwachten Lernens auf den Mikrocontrollern (MCUs) eine anlagenspezifische Zustandsüberwachung realisiert werden. Eine Limitierung bisheriger Arbeiten im Bereich der halbüberwachten Anomaliedetektion und Domänenadaption ist jedoch die fehlende Möglichkeit zur Adaption an verschiedene Betriebszustände. Demzufolge kann die Zustandsüberwachung keine Fehler erkennen, wenn mehrere Betriebsbedingungen überwacht werden müssen.

Daher werden in dieser Arbeit drei verschiedene halbüberwachte Anomaliedetektionsmethoden mit dynamischer Domänenadaption vorgestellt. Die entwickelten Methoden verwenden Autoencoder um eine merkmals- und parameterbasierte Domänenadaption mithilfe einer Merkmalsextraktion und Domänenadaption mit gemeinsamen Encoder (Shared Encoder Domain Adaptation, SEDA) zu realisieren. Mithilfe des initialen Training auf dem MCU kann eine anlagenspezifische Zustandsüberwachung ermöglicht werden. Darüber hinaus erlauben diese Methoden eine dynamische Erweiterung der Zustandsüberwachung um weitere Betriebszustände, um bei allen betrachteten Betriebszuständen Defekte zu detektieren. Um eine Adaption durchzuführen, werden nur Trainingsdaten des neuen Betriebszustandes benötigt. Dies ermöglicht eine ressourceneffiziente Zustandsüberwachung, die auch auf eingebetteten Systemen eingesetzt werden kann. 

Mithilfe einer umfangreichen Parameterstudie werden die vorgeschlagenen Methoden anhand von drei Datensätzen evaluiert. Gegenüber den betrachteten Vergleichsmethoden wie Anomaliedetektion mit unabhängiger Darstellung (Invariant Representation Anomaly Detection, IRAD) und zweistufiges domänenkompetetives Netzwerk für mehrere Zieldomänen (Two-Stage Multitarget Adversarial Adaptation Network, TS-MAAN) erreichen zwei der vorgestellten Methoden eine Verbesserung der Fläche unter der Isosensitivitätskurve Area under the Receiver Operating Charateristic, AUROC oder ROCAUC) um bis zu 16,7 %. Zeitgleich kann bei dem Matthews Korrelationskoeffizienten (Matthews Correlation Coefficient, MCC) eine Leistungssteigerung von bis zu 49,5 % verzeichnet werden. Dementsprechend können durch die vorgeschlagenen Methoden bei unterschiedlichsten Betriebsbedingungen die auftretenden Defekte besser als bei den Vergleichsmethoden erkannt werden. Darüber hinaus können weitere Betriebszustände hinzugefügt werden, ohne dass eine Abnahme der betrachteten Metriken für die bisherigen Betriebszustände zu beobachten ist. 

Damit ermöglichen die in dieser Arbeit entwickelten Methoden eine erweiterte Anwendung der Zustandsüberwachung in Umgebungen mit regelmäßig veränderlichen Betriebszuständen. Ihre Anpassungsfähigkeit erlaubt dabei Defekte unter unterschiedlichsten Betriebsbedingungen zu erkennen und eröffnet neue Anwendungsfelder für die Überwachung von industriellen Anlagen und insbesondere für Abfüllanlagen in der Lebensmittelindustrie.
Over the past 12 years, there have been 480 food recalls for foreign objects in Germany alone, highlighting the importance of effective monitoring solutions. These events can affect the company's reputation and lead to substantial additional costs. In the food industry, dispensing machines pose a particular challenge for condition monitoring because they handle various products. Monitoring solutions must be tailored to each product to detect defects reliably and prevent foreign objects in food. One significant limitation of current condition monitoring solutions is their lack of adaptability to various environmental conditions. The insufficient adaptability limits their application to detect defects reliably under changing environmental conditions.

In order to achieve better reliability and security, condition monitoring solutions are typically executed on a computing device close to the corresponding machine instead of cloud-based solutions. Consequently, sensitive data stay in the company. Moreover, the anomaly detection model can be customized and explicitly fine-tuned to the machine's characteristics by semi-supervised learning.
However, current work in semi-supervised anomaly detection and domain adaptation cannot adapt dynamically to different operating conditions. Thus, the condition monitoring solution cannot detect defects when multiple operating conditions need to be monitored.

Therefore, this work suggests three methods for semi-supervised anomaly detection with the ability to perform dynamic multi-target domain adaptation. They utilize autoencoders to perform a feature- and parameter-based domain adaptation by utilizing feature extraction and a shared encoder domain adaptation (SEDA). The initial training of these anomaly detection models on a microcontroller enables individualized anomaly detection. Furthermore, the suggested methods allow additional operating conditions to be added to the condition monitoring solutions at any given time while detecting defects in all observed operating conditions. Only training data of the newly added operating condition is needed to adapt to the new domain. Requiring data only from the operating condition to extend the monitoring solution allows for a resource-efficient solution that can be executed solely on a microcontroller.

A parameter study thoroughly evaluates the proposed methods. Three data sets are used to evaluate the proposed methods' performance compared to state-of-the-art solutions such as invariant Representation Anomaly Detection (IRAD) and Two-Stage Multi-target Adversarial Adaptation Network (TS-MAAN). Compared to the baseline methods, the Area under the Receiver Operating Characteristic (AUROC) is improved by up to 16.7 %. At the same time, the Matthews correlation coefficient (MCC) can be increased by up to 49.5 %. These values suggest improved anomaly detection for the proposed methods under diverse operating conditions. Moreover, the suggested methods allow for adding conditions without a decrease in the observed anomaly detection capability. 

The methods developed in this thesis extend the application of condition monitoring solutions to environments with changing operating conditions. Their adaptability allows a condition monitoring solution to detect defects under diverse operating conditions of industrial machines, particularly those of dosing machines.

Cite

Citation style:
Could not load citation form.

Rights

Use and reproduction:
All rights reserved