Numerische Methoden für stochastische Kontrollprobleme
Diese Dissertation behandelt die Konstruktion und Analyse eines gewichtsbezogenen Mesh-Algorithmus zur Lösung von Markov-Entscheidungsprozessen (MDPs) mit allgemeinem Zustandsraum und kompaktem Handlungsraum in diskreter Zeit. Ziel ist es, Strategien in stochastischen Optimierungsproblemen mit endlichem Zeithorizont effizient zu berechnen und ihre Berechnungskomplexität theoretisch zu analysieren. Der betrachtete Algorithmus nutzt gewichtete Stichprobenverfahren und konzentriert sich auf die Approximation von Zustandswertfunktionen mittels gewichteter Regression. Die Ergebnisse zeigen Konvergenz des vorgeschlagenen Verfahrens bei gleichzeitig kontrollierter Komplexität, auch in hochdimensionalen Räumen. Weiterhin wird gezeigt, dass der Algorithmus für linear-quadratische Steuerungsprobleme effizient einsetzbar ist. Die Arbeit enthält die zentrale algorithmische Konstruktion sowie die theoretische Konvergenzanalyse, welche die wissenschaftliche Hauptleistung dieser Arbeit repräsentiert. Darüber hinaus könnte die Komplexitätsanalyse auf MDPs mit unscharfen Zustands- und Aktionsräumen ausgedehnt werden, um robuste Steuerungsstrategien in Umgebungen mit inhärenten Unsicherheiten zu entwickeln. Schließlich könnte die Entwicklung hybrider Methoden, die sowohl deterministische als auch stochastische Ansätze kombinieren, neue Perspektiven eröffnen, um die Grenzen der gegenwärtigen Verfahren zu erweitern und deren Anwendbarkeit in praxisnahen Szenarien zu optimieren.