Datensicherheit bei Generativer KI – Geht das?

Drache mit einem Schutzschild mit einem Paragraphen darauf

Besonders in NGOs und Vereinen zögern viele von euch beim Einsatz von KI-Tools weil sie unsicher mit dem Datenschutz sind. Die meisten glauben auch, dass sie KI trainieren, wenn sie Daten eingeben. Das stimmt zwar so nicht, aber dennoch ist der Datenschutz bei KI-Systemen heikel.

Deshalb hier die Basics und meine drei Vorgehensweisen als Video und im Kurz-Beitrag.

(Ich bin keine Juristin und dies ist keine Rechtsberatung.)

1. Der selektive Ansatz: Keine sensiblen Daten teilen

Die meisten KI-Tools wie ChatGPT speichern Eingaben in amerikanischen Clouds. Ohne rechtsgültige Auftragsverarbeitung haben personenbezogene und sensible Daten dort nichts verloren. Selbst wenn Tools wie ChatGPT die Option bieten, das Training mit deinen Daten zu deaktivieren, ändert das nichts an der fehlenden Auftragsverarbeitung.
Meine Faustregel: Gib nur Daten ein, die auch öffentlich werden dürften.

2. Der sichere Mittelweg? Europäische Hosting-Lösungen

Da ihr mit euren Daten nie direkt KI trainiert (sondern nur Kontext liefert), lassen sich die Clouds auch sicher ein Europa/D nutzen. (Mehr zur Funktionsweise und dem Nicht-Training lest ihr in meinem Blogbeitrag: Die 3 größten Irrtümer über KI.)

Ein paar Anbieter bieten euch dieses Hosting an: Z.B. Fobizz, Langdock, Text.Cortex, ggf. auch Copilot oder ChatGPT Enterprise. Wenn ihr mit sensiblen oder personenbezogenen Daten arbeiten wollt, müsst ihr solche Tools auf Herz und Nieren mit euren Datenschutzbeauftragten checken. Technisch möglich ist Datensicherheit aber!

3. Die Königsklasse: Eigene Modelle auf eigenen Servern

Ein niedlicher Roboterdrache baut mit Legosteinen

Die sicherste – aber auch aufwändigste – Lösung ist das Hosting eigener KI-Modelle. Dank OpenSource-Lösungen wie Llama oder Mixtral ist dies inzwischen realistisch. Diese Modelle kommen in den Fähigkeiten nämlich an die kommerziellen Angeboten wie ChatGPT oder Claude heran.
Die Herausforderung für das Hosting liegt im Ressourcenbedarf: Eigene Modelle benötigen leistungsstarke Server und die Administration dann auch technische Fachkenntnis. Allerdings entwickeln sich immer mehr kleinere Modelle, die dann auch auf dem eigenen Rechner oder kleinen Server betrieben werden und viele Alltagsaufgaben gut bewältigen.

Mein Traum: Ich hoffe, dass wir uns bald als zivilgesellschaftliche Akteure zusammentun, um gemeinsam große, flexible Modelle zu betreiben – sicher und transparent. Das würde den KI-Einsatz in sensiblen Bereichen revolutionieren!

Meine praktische Lösung: Kombination aus Ansatz 1 und 2

In meiner täglichen Arbeit verbinde ich die ersten beiden Strategien: Ich verzichte auf die Eingabe sensibler Daten und nutze Hosting-Lösungen, die meinen Datenschutzanforderungen entsprechen. Dabei teile ich keine hochsensiblen Daten.

Mehr verstehen

Möchtest du dich vertiefen und lernen, wie du KI sicher und effektiv in deinem Team einsetzen kannst? Dann komm doch gern zu einem meiner Kurse:

Wie gehst du mit Datenschutz um?

Diskutiere mit mir auf Linkedin oder schreib mir eine Mail. Ich freu mich auf den Austausch.