Was ist ein Deepfake genau?
Ein Deepfake ist ein Bild-, Video- oder Audioinhalt, der mit Methoden des maschinellen Lernens verändert oder neu erzeugt wurde. Das Ziel ist fast immer, dass eine Person etwas zu tun oder zu sagen scheint, was sie in Wirklichkeit nie getan oder gesagt hat. Anders als bei einer klassischen Bildbearbeitung, bei der jemand Pixel von Hand retuschiert, lernt hier ein Programm aus vielen echten Beispielen, wie ein Gesicht oder eine Stimme aussieht und klingt, und setzt das Ergebnis dann eigenständig zusammen.
Deepfakes gibt es in mehreren Formen. Beim Gesichtstausch wird das Gesicht einer Person in ein bestehendes Video einer anderen Person eingesetzt. Bei der Lippensynchronisation bleibt das Gesicht gleich, aber Mund und Sprache werden so verändert, dass die Person einen fremden Text zu sprechen scheint. Beim Stimmklonen wird allein die Stimme nachgebildet, oft schon aus wenigen Sekunden Audiomaterial. Und es gibt vollständig erzeugte Gesichter von Menschen, die gar nicht existieren.
Nicht jeder Deepfake ist böse gemeint. Dieselbe Technik steckt hinter harmlosen Filtern, hinter Filmsynchronisation oder Satire. Problematisch wird es, wenn eine Fälschung absichtlich täuscht, ohne dass die Betroffenen oder die Zuschauer es wissen.
So entstehen Deepfakes technisch
Hinter den meisten Deepfakes stecken neuronale Netze, also Programme, die aus großen Mengen an Beispielmaterial Muster lernen. Vereinfacht gesagt: Wer ein Gesicht fälschen will, füttert das System mit vielen Aufnahmen dieses Gesichts aus verschiedenen Winkeln und bei unterschiedlichem Licht. Das Netz lernt daraus, wie dieses Gesicht in jeder Situation aussehen muss, und kann es anschließend auf neue Aufnahmen übertragen.
Eine lange verbreitete Methode sind sogenannte GANs, generative gegnerische Netze. Dabei arbeiten zwei Programme gegeneinander: Eines erzeugt Fälschungen, das andere versucht, sie als Fälschung zu entlarven. Durch dieses ständige Ringen werden die erzeugten Bilder immer besser. Neuere Systeme arbeiten oft mit Diffusionsmodellen, die ein Bild Schritt für Schritt aus zufälligem Rauschen herausschälen, bis ein scharfes, realistisches Ergebnis entsteht. Diese Technik steckt auch hinter vielen bekannten Bildgeneratoren.
Für Stimmen funktioniert das Prinzip ähnlich. Ein Modell analysiert Tonhöhe, Sprechtempo und Klangfarbe einer echten Stimme und kann danach beliebige Sätze in dieser Stimme erzeugen. Was früher Stunden an Aufnahmematerial brauchte, gelingt heute teils mit sehr kurzen Audioschnipseln, etwa aus einem öffentlichen Video oder einer Sprachnachricht.
Deepfake erkennen: Worauf du im Video achten kannst
Es gibt eine Reihe sichtbarer Hinweise, die auf eine Fälschung deuten können. Keiner davon ist für sich ein sicherer Beweis, aber je mehr davon zusammenkommen, desto eher solltest du misstrauisch werden. Schau dir das Video möglichst groß und in guter Qualität an und stoppe an einzelnen Stellen, statt es nur einmal durchlaufen zu lassen.
Besonders verräterisch sind oft die Übergänge am Gesichtsrand, die Augen und der Mund. Wenn diese Bereiche unnatürlich wirken oder nicht zum Rest des Körpers passen, lohnt sich ein zweiter Blick. Auch Beleuchtung und Hauttöne sind ein guter Prüfpunkt, weil eine Maschine das Licht auf Gesicht, Hals und Umgebung nicht immer stimmig zusammenfügt.
- Das Blinzeln wirkt zu selten, zu häufig oder seltsam mechanisch
- Am Rand von Gesicht, Haaransatz oder Kinn flackert oder flimmert es leicht
- Die Lippenbewegung passt nicht genau zum gesprochenen Wort
- Beleuchtung und Schatten an Haut und Hals wirken widersprüchlich
- Zähne, Haare oder Ohren sehen verschwommen oder unnatürlich aus
- Die Hauttextur ist auffällig glatt oder wechselt von Bild zu Bild
Gefahren und Missbrauch von Deepfakes
Der größte praktische Schaden entsteht heute durch Betrug. Beim sogenannten CEO-Fraud geben sich Täter mit geklonter Stimme oder gefälschtem Video als Vorgesetzte aus und weisen Mitarbeitende an, eilig Geld zu überweisen. In der privaten Variante, einer modernen Form des Enkeltricks, ruft eine vertraut klingende Stimme an und gibt vor, in Not zu sein und dringend Geld zu brauchen. Weil die Stimme echt wirkt, fallen selbst vorsichtige Menschen darauf herein.
Daneben werden Deepfakes zur Rufschädigung und Belästigung eingesetzt, etwa indem Gesichter in kompromittierende oder erfundene Szenen montiert werden. Im öffentlichen Raum dienen sie der Desinformation, wenn Politikerinnen und Politikern Aussagen untergeschoben werden, die sie nie getroffen haben. Und in der Werbung tauchen gefälschte Promi-Auftritte auf, die für fragwürdige Produkte oder für Anlagebetrug werben.
Allen Fällen ist gemeinsam, dass sie auf Vertrauen zielen. Ein bekanntes Gesicht oder eine vertraute Stimme senkt unsere Wachsamkeit. Genau das machen sich die Täter zunutze.
Was du bei Verdacht auf einen Deepfake tun kannst
Wenn dich ein Video oder ein Anruf stutzig macht, ist die wichtigste Regel: nicht unter Zeitdruck handeln. Fälscher erzeugen bewusst Eile, damit du nicht zum Nachdenken kommst. Lege auf, halte inne und prüfe in Ruhe nach.
Bei Geldforderungen per Stimme oder Video gilt: Überweise nichts und gib keine Daten heraus, bevor du die Person über einen zweiten, dir bekannten Weg erreicht hast. Ruf die echte Nummer zurück oder vereinbart innerhalb der Familie ein festes Codewort. Bei öffentlichen Inhalten lohnt es sich zu prüfen, ob seriöse Quellen dasselbe berichten und woher das Material ursprünglich stammt.
- Ruhe bewahren und künstlich erzeugten Zeitdruck ignorieren
- Die Person über einen unabhängigen, bekannten Kanal gegenprüfen
- Quelle und Erstveröffentlichung des Materials zurückverfolgen
- Verdächtige Inhalte auf der jeweiligen Plattform melden
- Bei Betrug oder Bedrohung Anzeige bei der Polizei erstatten
Warum rein visuelles Erkennen an Grenzen stößt
Die genannten Merkmale helfen heute noch oft, doch wir wollen ehrlich sein: Sie verlieren an Wert. Früher waren falsches Blinzeln oder grobe Kanten am Gesichtsrand zuverlässige Hinweise. Moderne Modelle haben genau diese Schwächen weitgehend behoben. Was gestern ein klares Erkennungszeichen war, kann morgen schon unsichtbar sein.
Deshalb ist es riskant, sich allein auf das eigene Auge zu verlassen. Ein Inhalt, der sauber und überzeugend aussieht, ist kein Beweis dafür, dass er echt ist. Umgekehrt kann ein schlecht komprimiertes, ruckelndes Video echt sein und trotzdem nach Fälschung aussehen. Das bloße Bauchgefühl täuscht in beide Richtungen.
Aus diesem Grund gewinnt die technische Prüfung an Bedeutung. Spezielle Analyseverfahren untersuchen ein Bild oder Video auf Spuren, die für das menschliche Auge unsichtbar sind, etwa typische Muster im Bildrauschen oder Unstimmigkeiten in der Kompression. Auch solche Verfahren liefern allerdings nie ein Urteil mit hundertprozentiger Sicherheit. Sie geben eine begründete Einschätzung, kein endgültiges Ja oder Nein. Am verlässlichsten bleibt die Kombination: gesunder Menschenverstand, das Prüfen der Quelle und, im Zweifel, eine technische Analyse.