Novel Machine Learning Algorithms for NP-hard Combinatorial Problems
For many combinatorial problems encountered in practical applications, there are currently no efficient solution algorithms available. In particular, such problems are often NP-hard and thus especially difficult to solve for larger instances. However, exact solutions are often not necessary in practice. While, depending on the specific problem, algorithms for finding approximate solutions might already be available, methods based on machine learning have not yet found widespread use in this domain.
In general, any systematic approach to NP-hard combinatorial problems by means of machine learning techniques faces two major challenges: First, combinatorial problems are discrete in nature, and it is typically difficult to map discrete results with machine learning methods. Second, due to the large solution space of NP-hard problems, it takes large computational effort, or is even practically impossible, to generate labels for supervised machine learning. Therefore, in this dissertation, we present an approach that circumvents these obstacles, and thus allows for efficiently predicting solutions to combinatorial problems with machine learning. More specifically, we overcome the problem of discrete solutions with a relaxation approach. The problem of label generation, on the other hand, is avoided with label-free learning via the loss function: The loss function represents the objective function, which computes the objective value of the combinatorial problem itself. Instead of labels, the loss function thereby immediately directs the adaption of the parameters during the gradient-based training of the machine learning algorithm.
Although the approach presented here is applicable to a much more general class of problems, we will focus on the so-called hybrid flow shop scheduling problem to demonstrate our methods. It consists of two subproblems: a permutation problem and an assignment problem. We analyze the hybrid flow shop in depth, including a formal mathematical description. Additionally, we give an extensive overview of the theoretical foundations of gradient-based machine learning to provide a theoretical foundation for understanding the proposed approach.
Most importantly, we provide a detailed explanation of the suggested approach of learning via the loss function and the literature that has thus far treated the topic.
For each subproblem, we train a neural network and describe the architecture and training method in detail, as well as the connection between the two networks to address the entire hybrid flow shop problem.
To assess the effectiveness of our approach, we compare the results of the neural networks, both individually and combined for the complete approach, with those of a basic Monte Carlo algorithm, as well as a more advanced mixed-integer linear programming approach. The results demonstrate noteworthy benefits in terms of efficiency and scalability of the proposed approach. Finally, we give suggestions for further research concerning the topic.
Für viele kombinatorische Probleme sind derzeit keine hinreichend effizienten exakten Lösungsalgorithmen verfügbar. Insbesondere sind kombinatorische Probleme mit praktischer Relevanz oft NP-schwer und daher für größere Instanzen besonders schwierig zu lösen. Exakte Lösungen sind in der Praxis jedoch oft nicht erforderlich. Obwohl es, je nach Problemstellung, bereits Algorithmen zur Suche nach Näherungslösungen gibt, haben Methoden, die auf maschinellem Lernen basieren, in diesem Bereich bislang noch keine breite Anwendung gefunden.
Systematische Annäherungen an NP-schwere kombinatorische Probleme mittels maschineller Lernverfahren stehen vor zwei großen Herausforderungen: Einerseits sind kombinatorische Probleme von Natur aus diskret, und es ist im Allgemeinen schwierig, diskrete Ergebnisse mit Methoden des maschinellen Lernens abzubilden. Andererseits ist es aufgrund des großen Lösungsraums von NP-schweren Problemen rechenaufwändig bzw. praktisch unmöglich, Labels für überwachtes maschinelles Lernen zu generieren. Diese Dissertation stellt daher einen Ansatz vor, der diese Hürden überwindet und eine effiziente Vorhersage von Lösungen für kombinatorische Probleme durch maschinelles Lernen ermöglicht. Dazu wird das Problem der diskreten Lösungen mit einem Relaxierungsansatz überwunden, während das Problem der Labelgenerierung durch labelfreies Lernen über die Verlustfunktion umgangen wird: Die Verlustfunktion stellt die Zielfunktion dar, die den Zielwert des kombinatorischen Problems selbst berechnet. Anstelle von Labels steuert die Verlustfunktion damit unmittelbar die Anpassung der Parameter während des gradientenbasierten Trainings des maschinellen Lernalgorithmus.
Obwohl der vorgestellte Ansatz auf allgemeinere Probleme anwendbar ist, liegt der Fokus auf der Demonstration der Methoden am sogenannte Hybrid Flow Shop-Problem. Dieses besteht aus zwei Teilproblemen: einem Permutationsproblem und einem Zuordnungsproblem. Das Problem wird eingehend analysiert, einschließlich einer formalen mathematischen Beschreibung. Zudem wird ein umfassender Überblick über die theoretischen Grundlagen des gradientenbasierten maschinellen Lernens bereitgestellt, um eine Basis für das Verständnis des vorgeschlagenen Ansatzes zu schaffen. Insbesondere wird das Lernen über die Verlustfunktion ausführlich erläutert sowie ein Überblick über die Literatur gegeben, die das Thema bisher behandelt hat. Für jedes Teilproblem wird ein neuronales Netz trainiert: Die Architektur sowie die Trainingsmethode werden erklärt und die Verbindung zwischen den beiden Netzen beschrieben, um das Gesamtproblem zu lösen.
Für die Bewertung des Ansatzes erfolgt ein Vergleich der Ausgabe der neuronalen Netze, sowohl separat als auch kombiniert für den gesamten Ansatz, mit den Ergebnissen eines Monte-Carlo-Algorithmus und eines Mixed-Integer-Linear-Programming-Verfahrens (MILP). Dabei zeigen sich signifikante Vorteile in Bezug auf Performance und Skalierbarkeit des vorgestellten Ansatzes.
Vorschau
Zitieren
Rechte
Nutzung und Vervielfältigung:
Dieses Werk kann unter einerCreative Commons Namensnennung - Keine Bearbeitungen 4.0 Lizenz (CC BY-ND 4.0)
genutzt werden.