Predicting HIV-1 Co-receptor Usage of the Viral Quasispecies Using Classifier Ensembles

In this work a new approach to determine the co-receptor tropism of HIV patients is presented and evaluated against different type of clinical patient data. A profound knowledge of co-receptor tropism, the type host-cell co-receptor used for cell-entry by the virus present in a patient, is required for an effective treatment with novel entry inhibitors like Maraviroc. The structural basis for the fusion process of virus and host-cell seems to be the interaction of a short variable loop (V3) of virus protein gp120 with one of the host-cell co-receptors CCR5 or CXCR4. Based on V3 loop sequences of viruses with known tropism, machine learning methods have been trained and are often successful in correctly predicting the tropism from patient derived V3 sequences. These, so called, genotypic methods present a cost-efficient, fast and broadly available alternative to cell-based, phenotypic assays. The machine learning approach developed here, uses ensemble classifiers for an improved prediction performance based on two different properties derived from V3 loop sequences and their 3D structure. The subsequent application to viral quasispecies, the virus population ensemble found in a patient, extracted by next-generation sequencing (NGS), shows that a combination of NGS with genotypic tropism prediction can have great benefits compared to phenotypic testing, making it a desirable part of the diagnostic routine.

Diese Arbeit stellt einen neuen Ansatz zur Bestimmung des korezeptor Tropismus von HIV Patienten vor und erprobt diese anhand verschiedener klinischer Patientendaten. Eine gesicherte Kenntnis des korezeptor Tropismuses, der Art des Wirtszellen-Korezeptors, welcher das Virus im Patienten für den Zelleintritt benutzt, ist nötig um eine effektive Behandlung mit neuen Eintrittsinhibitoren wie Maraviroc zu gewährleisten. Die strukturelle Grundlage für den Fusionsprozess des Virus mit der Wirtszelle scheint die Interaktion einer kurzen, variablen Schleife (V3) des Virusproteins gp120 mit einem der Wirtszell-Korezeptoren CCR5 oder CXCR4 zu sein. Basierend auf V3 Sequenzen mit bekanntem Tropismus wurden bereits Maschinen-Lern-Verfahren entwickelt, welche häufig eine korrekte Vorhersage über den Tropismus neuer V3 Sequenzen aus Patientenvirenstämmen treffen können. Diese, so genannten, genotypischen Methoden stellen eine preiswerte, schnelle und hoch verfügbare Alternative zu Zell-basierten, Phenotypischen Assays dar. Das hier vorgestellte Maschinen-Lern-Verfahren, verwendet Ensemble Classifier für eine verbesserte Vorhersage, basierend auf zwei unterschiedlichen Eigenschaften der V3 Sequenzen und 3D-Strukturen. Die anschließende Anwendung auf Virus-Quasispezies, das Virus Populationsensemble innerhalb eines Patienten, extrahiert durch Next-Generation-Sequencing (NGS), zeigt das die Kombination von NGS mit genotypischer Tropismus Vorhersage große Vorteile gegenüber phenotypischen Tests bietet diese zu einem wünschenswertem Teil der Routinediagnostik macht.

Zitieren

Zitierform:
Zitierform konnte nicht geladen werden.

Rechte

Nutzung und Vervielfältigung:
Alle Rechte vorbehalten