A Realistic Threat Model for Large Language Model Jailbreaks

DSpace Repositorium (Manakin basiert)

A Realistic Threat Model for Large Language Model Jailbreaks

Autor(en): Geiping, Jonas; Hein, Matthias; Voracek, Vaclav; Panfilov, Alexander; Boreiko, Valentyn
Tübinger Autor(en):
Hein, Matthias
Erscheinungsjahr: 2024-10-21
Verlagsangabe: arXiv
Sprache: Englisch
Referenz zum Volltext: https://doi.org/10.48550/arXiv.2410.16222
DDC-Klassifikation: 004 - Informatik
Dokumentart: Preprint
Zur Langanzeige

Das Dokument erscheint in: