Computational Coiled-Coil Discovery and Modeling

DSpace Repositorium (Manakin basiert)


Dateien:

Zitierfähiger Link (URI): http://hdl.handle.net/10900/168469
http://nbn-resolving.org/urn:nbn:de:bsz:21-dspace-1684692
http://dx.doi.org/10.15496/publikation-109796
Dokumentart: Dissertation
Erscheinungsdatum: 2025-07-30
Sprache: Englisch
Fakultät: 7 Mathematisch-Naturwissenschaftliche Fakultät
Fachbereich: Informatik
Gutachter: Lupas, Andrei (Prof. Dr.)
Tag der mündl. Prüfung: 2024-11-20
DDC-Klassifikation: 500 - Naturwissenschaften
570 - Biowissenschaften, Biologie
Schlagworte: Strukturbiologie , Proteine
Freie Schlagwörter:
Structural biology
proteins
Lizenz: http://tobias-lib.uni-tuebingen.de/doku/lic_ohne_pod.php?la=de http://tobias-lib.uni-tuebingen.de/doku/lic_ohne_pod.php?la=en
Zur Langanzeige

Inhaltszusammenfassung:

Coiled Coils sind ein weit verbreitetes Proteinstrukturmotiv. Sie bestehen aus mehreren Alpha-Helices, die sich um eine mittlere Achse winden, um einen hydrophoben Kern auszubilden. Auf Sequenzebene werden sie durch kurze Sequenzwiederholungen ermöglicht, am häufigsten von Heptaden von 7 Resten. Durch Variation der Anzahl, Zusammensetzung und Länge ihrer Wiederholungen haben Coiled-Coil-Proteine Zugang zu einer außerordentlichen Bandbreite von Strukturen. Dennoch hat ihre äußerst regelmäßige Natur die Untersuchung der Beziehung zwischen ihrer Sequenz und Struktur ermöglicht und sie zu einem Modellsystem der Proteinwissenschaft werden lassen. In dieser Arbeit befassen wir uns mit zwei Aspekten der Coiled-Coil-Forschung: der Entdeckung und der Modellierung. Wir untersuchen bioinformatisch die Verteilung eines bisher wenig untersuchten Coiled-Coil-Wiederholungsmusters, des 11-Reste-Hendecads, im Proteom des Lebens. Zu diesem Zweck führten wir eine umfassende Untersuchung von Proteinen durch, deren Sequenz mit einer hendekaden Struktur kompatibel sind, und führten interaktive Analysen des resultierenden Datensatzes durch. Die von uns gefundenen Proteinfamilien zeigen, dass Hendecads vielfältiger sind als bisher angenommen und dass dieses Motiv den für Coiled Coils zugänglichen topologischen Raum erweitern könnte. Darüber hinaus analysieren wir die Grenzen zur Verfügung stehender Modellierungsmethoden für Coiled-Coil-Strukturen. Wir bewerten die Leistungsfähigkeit von AlphaFold, einem hochaktuellen Tool zur generellen Proteinstrukturvorhersage, bei der Berechnung von Coiled-Coil-Strukturen, indem wir dessen Genauigkeit hinsichtlich lokaler Geometrien analysieren und sein Potenzial für topologische Vorhersagen testen. In vergleichenden Analysen stellten wir fest, dass AlphaFold in beiden Punkten besser abschneidet als spezifisch für Coiled Coils entwickelte Modellierungsprogramme. Dies macht AlphaFold zu einem neuen, wichtigen Werkzeug sowohl bei der topologischen Vorhersage von Coiled Coils als auch zur Berechnung lokaler Faltungspotenziale für Coiled-Coil-Strukturen.

Abstract:

Coiled coils are a widespread protein structure motif, consisting of multiple α-helices that wind around a central axis to bury their hydrophobic core. At the sequence level, they are underpinned by short repeats, the most common of which is the 7-residue heptad. By varying the number, composition, and length of their repeats, coiled-coil proteins have access to an outstanding range of structural diversity. In spite of this, their highly regular nature has facilitated the study of the relationship between their sequence and structure, thus becoming a model system for this paradigm of protein science. In this thesis, I address issues with two aspects of coiled-coil research, the discovery and the modeling. In an effort to discover new coiled-coil families, we bioinformatically investigate the distribution of a hitherto understudied coiled-coil repeat, the 11-residue hendecad, in the proteome of life. To this end, we performed a broad survey for proteins that showed features compatible with hendecad coiled-coil structure, and performed interactive analyses on the resulting dataset. The protein families that we founstructural biologyd show that hendecads are more diverse than previously thought, and that this motif expands the topological space accessible to coiled coils. Further, we address some of the limitations of coiled-coil modeling tools. For this, we evaluated the applicability of AlphaFold, a state-of-the-art protein structure prediction tool, to modeling coiled-coil structures. We benchmarked its performance through two approaches: measuring its accuracy in terms of local geometry, and testing its potential for topological prediction. Our results demonstrate that, even as a general purpose protein structure prediction tool, AlphaFold performs better than coiled-coil specific software. In addition, we also show that it can be leveraged in a coiled-coil framework to improve topological prediction as well as to probe local coiled-coil folding potentials.

Das Dokument erscheint in: