31 January 2026, 01:01

PURGE: Revolutionäre Methode löscht sensible Daten aus KI-Modellen ohne Performance-Verlust

Ein Blatt Papier mit der Aufschrift "Nehmen Sie nicht an, dass der Inhalt das aktuelle wissenschaftliche Wissen, die Policies oder die Praktiken widergibt", was darauf hinweist, dass es sich um ein historisches, archiviertes Dokument handelt.

PURGE: Revolutionäre Methode löscht sensible Daten aus KI-Modellen ohne Performance-Verlust

Forscher haben eine neue Methode namens PURGE entwickelt, um sensible oder urheberrechtlich geschützte Daten aus großen Sprachmodellen (Large Language Models, LLMs) zu entfernen. Im Gegensatz zu herkömmlichen Ansätzen vermeidet diese Technik ein vollständiges Neutraining des Modells, während sie gleichzeitig den Großteil der ursprünglichen Leistungsfähigkeit erhält. Erste Tests zeigen, dass sie das "Verlernen" zuverlässiger und effizienter für den praktischen Einsatz machen könnte.

PURGE geht einen anderen Weg, indem es das Verlernen als messbare Aufgabe definiert. Die Methode nutzt eine Reinforcement-Learning-Technik namens Group Relative Policy Optimization in Kombination mit einem intrinsischen Belohnungssystem. Dieses System bestraft verbotene Konzepte, sodass das Modell gezielt spezifische Daten "vergisst", während es allgemeines Wissen bewahrt.

Umfangreiche Tests mit dem Real World Knowledge Unlearning (RWKU)-Benchmark unterstreichen die Stärken der Methode. PURGE erreicht eine 11-prozentige Wirksamkeit beim Entfernen unerwünschter Daten, behält dabei aber 98 % der ursprünglichen Nutzbarkeit des Modells bei. Gleichzeitig reduziert es den Token-Verbrauch um bis zu 46 %, verbessert die Flüssigkeit des Sprachausgabe um 5,48 % und erhöht die robuste Widerstandsfähigkeit gegen adversariale Angriffe um 12,02 %.

Die Methode umgeht gängige Schwächen bestehender Verlerntechniken. Viele aktuelle Ansätze leaken Daten, beeinträchtigen die Modellperformance oder sind auf teure externe Belohnungssysteme angewiesen. PURGE hingegen bietet durch theoretische Ergebnisse formale Garantien: darunter ein geometrischer Rückgang der Wahrscheinlichkeit für verbotene Tokens sowie strenge Grenzen für den Erhalt der Nutzbarkeit – und sorgt so für sowohl Sicherheit als auch Effizienz.

Ein entscheidender Vorteil ist die Skalierbarkeit. PURGE kommt ohne externe Belohnungsmodelle aus, was es besonders praxistauglich für großflächige Einsätze macht. Zudem hebt sich der Ansatz durch seine Fähigkeit ab, erfolgreiches Verlernen nachweisbar zu verifizieren – ein Merkmal, das vielen anderen, weniger transparenten Methoden fehlt.

PURGE bietet eine effizientere und zuverlässigere Möglichkeit, sensible Daten aus LLMs zu entfernen, ohne das Modell komplett neu trainieren zu müssen. Die Kombination aus theoretischen Garantien, erhöhter Sicherheit und praktischer Effizienz könnte einen neuen Standard in der Verlernforschung setzen. Die vielversprechenden Ergebnisse in Benchmark-Tests deuten darauf hin, dass die Methode bald vermehrt in realen Anwendungen zum Einsatz kommen wird.

Cashback bei deinen
Lieblingsrestaurants und Services

Kaufe Gutscheine und spare in deinen Lieblingsorten in deiner Nähe

Plakat für das Bayerische Bierfest in München, Deutschland, mit einem gekrönten Gesicht umgeben von Text.

Heldentaten und langjähriger Einsatz: Landkreis Aschaffenburg ehrt mutige Bürger

Von lebensrettendem Mut bis zu stiller Fürsorge: Diese Menschen aus Aschaffenburg zeigen, wie viel Gutes im Alltag möglich ist. Ihre Geschichten berühren – und machen Hoffnung.

Großraumbüro mit Menschen an Schreibtischen mit Monitoren, Tastaturen und anderen Büromaterialien, mit Deckenleuchten und Säulen, einem sichtbaren Feuerlöscher und einer Tafel mit Text auf der rechten Seite.

Münchner Startup Eventpage AI sichert sich 320.000 Euro für KI-basierte Eventplanung

Von null auf sechsstelligen Umsatz in Monaten: Wie zwei Gründer mit KI die Eventbranche aufmischen. Investoren setzen auf ihre Vision.

Essen Sie in Ihren
Lieblingsrestaurants
günstiger

Exklusive Gutscheine für Abendessen, Frühstück und Kaffee

Frau mit LiberSave App auf dem Smartphone

PURGE: Revolutionäre Methode löscht sensible Daten aus KI-Modellen ohne Performance-Verlust