Development of reliable machine learning approaches to systems with structural change like human intention behavior and machine diagnosis
Industry 4.0 profoundly focuses on the link between automation, machine learning (ML), and artificial intelligence (AI). The use of the automation, ML, and AI are versatile interdisciplinary fields applied in many systems with structural changes and dynamical behaviors, such as transportation, telecommunications, aerospace, and military systems. Systems with structural changes display changes in their behavior over a period of time based on the operating environment, which can change the system's or operator's state. For an example, in transportation, driving-related accidents on the road have increased significantly over the years due to drivers' behavior. To tackle this issue, the advancement of automation technology has played a key role in the continuous development of advanced driving assistance systems (ADASs) to assist drivers in performing safe maneuvers. These assistance systems assist drivers by detecting and estimating behaviors. Employing ML-based models to generate driving behavior estimations and detections has surged in recent years. Another example of applying ML to other systems with structural changes is the degradation of lithium-ion batteries (LIBs) estimations. Prognostics and health management (PHM) of the batteries are therefore important for monitoring their health (machine diagnosis), as batteries degrade over time. Similar to the driving behavior application, the development of estimation models using ML-based approaches has gained popularity. Common ML approaches used for developing the estimation models are Artificial Neural Network (ANN), Support Vector Machine (SVM), and Convolution Neural Network (CNN). While promising results have been achieved, certain challenges exist, such as unsuitable parameter values, extracting relevant information, models have individual tasks, and different models have varying performance depending on the situation leading to sub-optimal results. In recent years, the state machine approach has been used in various research areas for the estimation of a system's behavior due to its ability to model behaviors using discrete states and its flexibility. Hence, the objective of this thesis is to develop a state machine-based model as a new interpretable ML-based model for the estimation of behaviors (as states) in two domains: driving behavior estimations and degradation behavior of LIBs estimations. State machines are interpretable due to the model's easy state reachability without complex computations, unlike some ML approaches such as SVM, whereby it is difficult to choose an appropriate kernel function. The estimation of driving behaviors is considered in the first part of the thesis. The model is tackled from different angles. In addition, to prove the generalization of the proposed model in other applications with structural variable systems, the model is also applied for the estimation of LIBs degradation behavior (in terms of capacity fade estimation) in the second part.
For the driving behavior estimations, the state-machine models three lane changing behaviors using states that transition between each other to develop the estimations. The lane changing behaviors considered are: lane change to the right (LCR), lane keeping (LK), and lane change to the left (LCL). To further extend the model, an ANN and a Hidden Markov Model (HMM) are combined with the state machine model individually to estimate the lane changing behaviors. The ANN is known for its robustness and learning capabilities, while the HMM is known for its stochastic properties For the ANN-based state machine approach, two different models are designed. The first model only uses one ANN, while the other model integrates three different ANNs. For the HMM-based model, an improved HMM with a prefilter application is considered. In addition, implementing different sub-HMMs for different input variables (features related to the vehicle and environment) are also performed. Driving features also affect the recognition performance. Hence, evaluations of different feature types (as model inputs) are performed to assess their effectiveness on the estimation performance of the state machine model. Features such as environmental (ENV) and eye-tracking (ET) features are considered for the evaluation. In addition, optimization of hyperparameters and model parameters is known to improve the performance of the model. However, selecting the appropriate optimization technique and ranges of selection based on different ML-model designs is challenging. For the driving behavior estimation, both Bayesian optimization (BO) and Genetic algorithm (GA) are applied to optimize the hyperparameters. In addition, model parameters are optimized using the Non-dominated Sorting Genetic Algorithm (NSGA-II) during training, as these parameters directly influence the performance of the model.
For the LIBs, different degradation states are defined in the model, such that the states transition from one to another to estimate the degradation behavior and capacity fade. Capacity associate with each state is estimated using a Nonlinear Auto Regressive Neural Network with Exogenous Input (NARX) model. The model parameters are optimized using NSGA-II as well.
For evaluating the lane changing behavior estimations, driving data from participants based on two different experiments collected using a driving simulator are utilized. The aim is to develop a model with optimal accuracy (ACC), detection rate (DR), and false alarm rate (FAR) to validate the effectiveness of the different models. As for the capacity fade estimation of batteries, data from four experiments are utilized for the application of the model. The mean square error (MSE) and relative mean square error (RMSE) are used for performance evaluations. The results from the application of the model to the driving behavior domain shows that high ACC, DR, and low FAR are achieved, while low RMSE and MSE are generally achieved for the capacity estimation of LIBs. In certain instances, the proposed models outperform the conventional-based models in both applications. In addition, the state estimations are close to the actual states for both domains. Based on the results, the state machine approach shows favorable results as a new ML-based approach.
Industrie 4.0 konzentriert sich stark auf die Verbindung zwischen Automatisierung, maschinellem Lernen (ML), und künstlicher Intelligenz (KI). Der Einsatz von Automatisierung, ML und KI sind vielseitige interdisziplinäre Bereiche, die in vielen Systemen mit strukturellen Veränderungen und dynamischem Verhalten angewendet werden, beispielsweise in Transport-, Telekommunikations-, Luft- und Raumfahrt- und Militärsystemen. Systeme mit strukturellen Veränderungen zeigen im Laufe der Zeit je nach Betriebsumgebung Veränderungen in ihrem Verhalten, die den Zustand des Systems oder des Betreibers verändern können. Im Transportwesen beispielsweise haben fahrbedingte Unfälle im Straßenverkehr im Laufe der Jahre aufgrund des Verhaltens der Fahrer erheblich zugenommen. Um dieses Problem anzugehen, hat die Weiterentwicklung der Automatisierungstechnologie durch die kontinuierliche Entwicklung fortschrittlicher Fahrassistenzsysteme (ADASs) spielt eine Schlüsselrolle, um Fahrern bei der Durchführung sicherer Manöver zu helfen. Diese Assistenzsysteme unterstützen den Fahrer, indem sie Verhaltensweisen erkennen und abschätzen. Der Einsatz ML-basierter Modelle zur Generierung von Schätzungen und Erkennungen des Fahrverhaltens hat in den letzten Jahren stark zugenommen. Ein weiteres Beispiel für die Anwendung von ML auf andere Systeme mit strukturellen Änderungen ist die Schätzung der Verschlechterung von Lithium-Ionen-Batterien (LIBs). Prognosen und Gesundheitsmanagement (PHM) der Batterien sind daher wichtig für die Überwachung ihres Zustands, da Batterien mit der Zeit schwächer werden. Ähnlich wie bei der Fahrverhaltensanwendung hat die Entwicklung von Schätzmodellen mithilfe ML-basierter Ansätze an Popularität gewonnen. Gängige ML-Ansätze zur Entwicklung der Schätzmodelle sind Artificial Neural Network (ANN), Support Vector Machine (SVM) und Convolution Neural Network (CNN). Obwohl vielversprechende Ergebnisse erzielt wurden, bestehen gewisse Herausforderungen, wie z. B. ungeeignete Parameterwerte, das Extrahieren relevanter Informationen, Modelle haben individuelle Aufgaben und verschiedene Modelle weisen je nach Situation eine unterschiedliche Leistung auf, was zu suboptimalen Ergebnissen führt. In den letzten Jahren wurde der State-Machine-Ansatz aufgrund seiner Fähigkeit, Verhalten mithilfe diskreter Zustände zu modellieren, und seiner Flexibilität in verschiedenen Forschungsbereichen zur Abschätzung des Verhaltens eines Systems eingesetzt. Das Ziel dieser Arbeit besteht daher darin, ein auf Zustandsmaschinen basierendes Modell als neues interpretierbares ML-basiertes Modell für die Schätzung von Verhaltensweisen (als Zustände) in zwei Bereichen zu entwickeln: Schätzungen des Fahrverhaltens und Schätzungen des Verschlechterungsverhaltens von LIBs. Zustandsmaschinen sind im Gegensatz zu einigen ML-Ansätzen wie SVM, bei denen es schwierig ist, eine geeignete Kernelfunktion auszuwählen, aufgrund der einfachen Zustandserreichbarkeit des Modells ohne komplexe Berechnungen interpretierbar. Im ersten Teil der Arbeit wird die Einschätzung des Fahrverhaltens betrachtet. Das Modell wird aus verschiedenen Blickwinkeln betrachtet. Um die Verallgemeinerung des vorgeschlagenen Modells in anderen Anwendungen mit Strukturvariablensystemen zu beweisen, wird das Modell im zweiten Teil auch für die Schätzung des LIB-Degradationsverhaltens (im Sinne der Schätzung des Kapazitätsschwunds) angewendet.
Für die Fahrverhaltensschätzungen modelliert die Zustandsmaschine drei Spurwechselverhaltensweisen unter Verwendung von Zuständen, die zwischen einander wechseln, um die Schätzungen zu entwickeln. Die berücksichtigten Spurwechselverhaltensweisen sind: Spurwechsel nach rechts (LCR), Spurhalten (LK) und Spurwechsel nach links (LCL). Um das Modell weiter zu erweitern, werden ein ANN und ein Hidden-Markov-Modell (HMM) einzeln mit dem Zustandsmaschinenmodell kombiniert, um das Spurwechselverhalten abzuschätzen. Das KNN ist für seine Robustheit und Lernfähigkeit bekannt, während das HMM für seine stochastischen Eigenschaften bekannt ist. Für den KNN-basierten Zustandsmaschinenansatz werden zwei verschiedene Modelle entworfen. Das erste Modell verwendet nur ein ANN, während das andere Modell drei verschiedene ANNs integriert. Für das HMM-basierte Modell wird ein verbessertes HMM mit einer Vorfilteranwendung in Betracht gezogen. Darüber hinaus wird auch die Implementierung verschiedener Sub-HMMs für unterschiedliche Eingabevariablen (Merkmale im Zusammenhang mit dem Fahrzeug und der Umgebung) durchgeführt. Auch Fahrmerkmale wirken sich auf die Erkennungsleistung aus. Daher werden Bewertungen verschiedener Merkmalstypen (als Modelleingaben) durchgeführt, um deren Wirksamkeit auf die Schätzleistung des Zustandsmaschinenmodells zu bewerten. Für die Bewertung werden Merkmale wie Umgebungs- (ENV) und Eye-Tracking- (ET) Merkmale berücksichtigt. Darüber hinaus ist bekannt, dass die Optimierung von Hyperparametern und Modellparametern die Leistung des Modells verbessert. Die Auswahl der geeigneten Optimierungstechnik und Auswahlbereiche auf der Grundlage verschiedener ML-Modelldesigns ist jedoch eine Herausforderung. Für die Schätzung des Fahrverhaltens werden sowohl die Bayes'sche Optimierung (BO) als auch der genetische Algorithmus (GA) angewendet, um die Hyperparameter zu optimieren. Darüber hinaus werden Modellparameter während des Trainings mithilfe des Non-Dominated Sorting Genetic Algorithm (NSGA-II) optimiert, da diese Parameter direkten Einfluss auf die Leistung des Modells haben.
Für die LIBs werden im Modell unterschiedliche Abbauzustände definiert, sodass die Zustände von einem zum anderen übergehen, um das Abbauverhalten und den Kapazitätsschwund abzuschätzen. Die mit jedem Zustand verbundene Kapazität wird mithilfe eines NARX-Modells (Nonlinear Auto Regressive Neural Network with Exogenous Input) geschätzt. Die Modellparameter werden ebenfalls mit NSGA-II optimiert. Zur Auswertung der Spurwechselverhaltensschätzungen werden Fahrdaten von Teilnehmern verwendet, die auf zwei verschiedenen Experimenten basieren und mit einem Fahrsimulator gesammelt wurden. Ziel ist die Entwicklung eines Modells mit optimaler Genauigkeit (ACC), Erkennungsrate (DR) und Fehlalarmrate (FAR), um die Wirksamkeit der verschiedenen Modelle zu validieren. Für die Schätzung des Kapazitätsschwunds von Batterien werden Daten aus vier Experimenten für die Anwendung des Modells genutzt. Für Leistungsbewertungen werden der mittlere quadratische Fehler (MSE) und der relative mittlere quadratische Fehler (RMSE) verwendet. Die Ergebnisse der Anwendung des Modells auf den Fahrverhaltensbereich zeigen, dass für die Kapazitätsschätzung von LIBs ein hoher ACC, DR und ein niedriger FAR erreicht werden, während im Allgemeinen niedrige RMSE und MSE erreicht werden. In bestimmten Fällen übertreffen die vorgeschlagenen Modelle die herkömmlichen Modelle in beiden Anwendungen. Darüber hinaus liegen die Zustandsschätzungen für beide Bereiche nahe an den tatsächlichen Zuständen. Basierend auf den Ergebnissen zeigt der State-Machine-Ansatz als neuer ML-basierter Ansatz günstige Ergebnisse.