Schlaue Kameras

Le Monde diplomatique –

KI hält Einzug in der Videoüberwachung

Überwachungskameras am Domvorplatz in Köln
Überwachungskameras am Domvorplatz in Köln Foto: HORST GALUSCHKA/picture alliance/dpa

Souheil Hanoune ist technischer Leiter beim Unternehmen XXII. Wenn es um die Vorzüge seiner Videoanalysesoftware geht, schreckt er nicht vor Paradoxien zurück: „Ich nenne es ‚Humanisierung durch Automatisierung‘, oder wie die künstliche Intelligenz uns hilft, Zeit zu gewinnen für die Dinge, die uns als Menschen ausmachen.“1

Sein Kompagnon William Eldin übertrifft ihn dabei sogar noch, wenn er über die Möglichkeiten der „Computer Vision“ (computerbasiertes Sehen) spricht: „Die Magie besteht darin, dass ihre Möglichkeiten unendlich sind, nur unser Vorstellungsvermögen setzt ihr Grenzen.“ Technisch gesehen handelt es sich bei der Software um Algorithmen, die die Pixel eines Bilds verarbeiten und analysieren.

Seit einigen Jahren drängen Start-ups wie XXII auf den Markt für Sicherheitsdienstleistungen. Mit intelligenter Videoüberwachung wollen sie den Einsatz von Kameras im städtischen Raum revolutionieren. Ein Werbeslogan verspricht, die Städte würden dadurch „sicherer, nachhaltiger und lebenswerter“.

Gedränge in der U-Bahn und Staus auf den Straßen könnten vermieden, der Energieverbrauch für die Straßenbeleuchtung um 90 Prozent reduziert werden, so das Versprechen. Ein verloren gegangenes Kind könne man inmitten einer Menschenmenge wiederfinden. Und Personen, die etwa aufgrund eines Herzinfarkts stürzen, würden automatisch erkannt; außerdem könnten Brände verhindert werden, weil der Ausbruch eines Feuers frühzeitig registriert wird.

In Frankreich gibt es etwa eine Million Kameras im öffentlichen Raum; für die Verfechter der intelligenten Videoüberwachung ist das eine riesige Goldgrube ungenutzter Daten. Um sie nutzbar zu machen, bräuchte es neue technische Lösungen. Technische Lösungen mit „hohem gesellschaftlichem Wert“, wie Quentin Barenne vom Start-up Wintics sie nennt.2

Aber wer nutzt diese Technologie? Und auf welche Bedürfnisse genau reagiert sie? Die ersten Videokameras wurden 1991 im Pariser Vorort Levallois-Perret installiert. 1995 wurde die Videoüberwachung in Frankreich legalisiert und seitdem mit üppigen staatlichen Subventionen bedacht. 2021 erreichte der französische Markt ein Umsatzvolumen von 1,7 Milliarden Euro.3 Dieser Boom beruht vor allem auf dem falschen, aber sich hartnäckig haltenden Glauben, dass Kameras die Kriminalität eindämmen könnten.

Wissenschaftliche Studien aus Frankreich und anderen Ländern zeigen, dass die Videoüberwachung weder signifikant zur Aufdeckung noch zur Prävention von Gewaltverbrechen, Drogendelikten oder Störungen der öffentlichen Ordnung im städtischen Raum beiträgt.4 Dafür gibt es mehrere Gründe, etwa die fehlende Koordination zwischen privaten, nationalen und kommunalen Sicherheitskräften oder die schlechte Bildqualität und falsch positionierte oder verschmutzte Kameras. Das größte Problem ist jedoch, dass die riesigen Datenmengen von vergleichsweise wenigen Beamt:innen ausgewertet werden müssen.

„Nehmen Sie den Bahnhof Part-Dieu in Lyon“, sagt Dominique Legrand, Präsident der Nationalen Vereinigung

für Videoprotektion (AN2V). „Da gibt es ein Netzwerk von 600 Kameras, Sie können Ihre Augen aber nicht überall haben. Was macht man also mit den 600 Streams?“ Legrand liefert die Antwort gleich mit: „Option 1: Man macht nichts damit. Option 2: Man nutzt die Möglichkeiten der modernen Software, die etwa einen Stream erst dann darstellt, wenn eine Person rennt.“5

Um die konkrete Anwendung dieser neuen Technologie besser zu verstehen, habe ich mehrere Monate bei einem Unternehmen in dieser expandierenden Branche gearbeitet. Die Programme, die auf Grundlage von Deep Learning funktionieren und für die Computer mit gewaltiger Rechenleistung nötig sind, verarbeiten riesige Datenmengen. Der Grundgedanke ist einfach: Ingenieur:innen füttern die Software mit Bildern von ausgewählten Gegenständen (ein Auto, ein Fahrrad, ein Mensch, ein Motorroller und so weiter), aufgenommen aus allen Perspektiven und in unterschiedlichen Situationen.

Um die Fehlerquote zu reduzieren, „assistiert“ ein Techniker dem Algorithmus, indem er angibt, wann ein bestimmter Gegenstand im Bild zu sehen ist. Sobald die Fehlerquote bei der automatischen Erkennung klein genug ist, wird die Software mit dem Videoüberwachungssystem verbunden. Für den Fall, dass ein bestimmtes Objekt im Sichtfeld einer Kamera auftaucht, hat der Benutzer verschiedene Möglichkeiten: Die Software kann das Objekt einfach nur erkennen, es einordnen oder es verfolgen.

Diese Anwendungen richten sich in Frankreich – aber auch in anderen Ländern (siehe Kasten im Anschluss an diesen Text) – in erster Linie an zwei Arten von Kunden, die zusammengenommen mehr als die Hälfte des Markts für Videoüberwachung ausmachen: erstens Großunternehmen, die Flughäfen, Bahnhöfe, touristische Sehenswürdigkeiten, Häfen, Fabriken, Stadien, Bürokomplexe, Parkhäuser oder Warenlager betreiben; und zweitens die Kommunen mit ihren Überwachungszentren, den „Centres de supervision urbains“ (CSU).

In den CSUs laufen die Streams aller kommunalen Kameras zentral zusammen. Beamt:innen sitzen hier vor dutzenden Monitoren und suchen die Bilder in Echtzeit ab. Entdecken sie beispielsweise eine Ordnungswidrigkeit im Straßenverkehr, können sie mit Hilfe des erfassten Nummernschilds direkt ein Knöllchen verteilen. Außerdem können die CSUs die Polizei bei Patrouillen und Einsätzen aus der Ferne unterstützen.

In der Praxis zielen die Softwarehersteller in erster Linie auf Polizeistationen und CSUs ab. Ihr Angebot ist verführerisch: Die Käufer brauchen keine teure, neue Hardware anzuschaffen, denn die Programme mit der Erkennungssoftware passen sich an das bestehende Kamerasystem an. Sie sind auch mit anderen Software-Anwendungen wie dem Videoverwaltungssystem kompatibel, das unverzichtbar ist, um die Monitorwände zu steuern und das Archiv zu verwalten.

Was die Kunden aber in der Regel am meisten überzeugt, ist die einfache Bedienung. Sobald die Software installiert ist, können die Beamten mit wenigen Klicks eine Kamera anwählen, die auf eine bestimmte Straße oder Kreuzung gerichtet ist, einen Bildbereich eingrenzen und dann aus einem Dropdown-Menü ein oder mehrere Objekte auswählen, die analysiert werden sollen.

KI gegen Bettler und Falschparker

Die eigentliche Stärke der Algorithmen ist jedoch das automatische Erkennen definierter Ereignisse, wie etwa das „Herumlungern“ oder die „längere Verweildauer“: Für eine vorher eingegrenzte Zone im überwachten Raum wählt man das Objekt „Person“ aus, legt eine Zeitspanne fest (zum Beispiel 5 Minuten) und klickt auf „Bestätigen“. Tritt das „Ereignis“ ein, erscheint eine Warnmeldung auf dem Bildschirm. Eine solche automatische Erkennung ist ideal, um in Einkaufszonen bettelnde Menschen zu identifizieren oder fliegende Händler ohne Konzession – mit 9237 Fällen das in Paris am dritthäufigsten geahndete „Vergehen“ zwischen dem 1. Januar und dem 31. Oktober 2022.

Einige Unternehmen haben ihre Software erweitert, um für weitere Problemfälle die passenden Lösungen anzubieten. Florent Castagnino, Professor am Institut Mines-Télécom in Nantes, bestätigt, dass intelligente Videoüberwachung immer breiter eingesetzt wird. Sie sei mittlerweile ein „Allzweckwerkzeug“ in der Stadtverwaltung, ob es um Müllentsorgung, Straßenbau, Verkehrsunfälle oder Grünanlagen geht.

Während rechts und rechtsextrem regierte Rathäuser meist den Sicherheitsaspekt betonen, verweisen moderate und linke Stadtregierungen gern darauf, dass die Software den Umbau zur Smart City ermögliche. So heißt es auf der Website der Stadt Paris, die von der Sozialistin Anne Hidalgo regiert wird: „Die erhobenen Daten erlauben es, den Verkehr in Echtzeit zu verstehen, um ihn dann besser fließen zu lassen.“

Doch wer die Kontrolle von Einwohner:innen als Beitrag zum Gemeinwohl verklärt, blendet allzu schnell aus, dass die Kamera ein Überwachungsinstrument bleibt. Wenn man sich die von den wichtigsten Herstellern angebotenen Funktionen anschaut, überwiegen diejenigen zur Aufrechterhaltung der öffentlichen Ordnung und zur Strafverfolgung.

Dazu gehört etwa das Aufspüren von wilder Müllentsorgung, Menschenansammlungen, herrenlosen Gepäckstücken, von Hausfriedensbruch oder Schlägereien und eine ganze Palette von Verkehrsdelikten: vom Überfahren roter Ampeln über die Benutzung verbotener Wege bis zum Falschparken.

Es ist zwar gesetzlich verboten, dass eine künstliche Intelligenz einen Strafzettel ausstellt – das darf nur ein vereidigter Beamter. Aber dank der neuen Technik muss er nicht mehr ein Dutzend Monitore im Blick behalten. Er kann einfach für kritische Bereiche die Funktion „Falschparken“ oder „Missachtung einer roten Ampel“ einschalten und warten, bis die Meldung kommt, dass ein Verstoß stattgefunden hat.

Dieser automatisierte Vorgang liefert ihm alle notwendigen Informationen, um den Bußgeldbescheid auszustellen: die Art des Verstoßes, die Tatzeit und das Autokennzeichen. Die intelligente Videoüberwachung kann damit auch zu kräftigen Mehreinnahmen durch mehr Bußgeldbescheide beitragen – ein Argument, das in den Rathäusern gut ankommt.

Während sich Unternehmen wie XXII oder Wintics als Zulieferer der „Smart Citys“ einen Namen gemacht haben, sind andere auf den Bereich Sicherheit spezialisiert. „Der Algorithmus muss eine Person erfassen, ihr Attribute zuordnen und sie von Kamera zu Kamera verfolgen können“, erklärte Philippe Latombe, Abgeordneter der liberalen Partei MoDem (Mouvement Démocrate) am 15. November auf der Messe Expoprotection.

Er ist zwar Mitglied der Commission nationale de l’informatique et des libertés (Cnil), doch was den Respekt vor der Privatsphäre betrifft, ist Latombe nicht zimperlich: „Wenn dem Beamten nur mitgeteilt wird, dass der Verdächtige 1,80 Meter groß ist, ein weißes Hemd und eine blaue Jacke anhat, bringt das nichts. Was wir brauchen, ist, dass der Beamte genau weiß, wo sich die Zielperson befindet, und ihren Weg zurückverfolgen kann.“

Auf dem französischen Markt sind das französische Unternehmen Two-i und sein israelischer Konkurrent Briefcam führend. Briefcam, das 2018 von der Canon-Gruppe gekauft wurde, hat etwa 200 französische Städte mit KI-gestützten Videoanalyseprogrammen ausgestattet.

Beide Firmen bieten Funktionen zur Verhaltensanalyse und zur Personensuche an. In der von Briefcam angebotenen Software kann der Kunde zwischen einer Vielzahl von Filtern auswählen, die auf „menschliche Objekte“ angewendet werden können: Das Programm erkennt, ob die Person, die durchs Bild läuft, ein Mann, eine Frau oder ein Kind ist, ob ihre Kleidung langärmelig ist und übers Knie reicht, ob sie eine Kopfbedeckung, eine Kapuze oder eine Maske trägt und ob sie eine Handtasche, einen Rucksack oder einen Koffer dabeihat.

Sollten die angebotenen Filter nicht ausreichen, um eine Person zu identifizieren, kann der Beamte dann noch die Gesichtserkennung aktivieren. Wenn die Auflösung gut genug ist, wird ein Foto vom Gesicht gemacht, in die Suchdatenbank importiert und einem „Gesichtsvergleich“ unterzogen.

Wenn die gesuchte Person polizeibekannt ist, kann die Software für den Gesichtsvergleich auch ein Foto aus den sozialen Netzwerken herunterladen. Und als letzte Möglichkeit gibt es noch das nationale Vorstrafenregister (TAJ) mit 19 Millionen Datensätzen (9 Millionen davon mit Foto).6

Es mangelt nicht an Gelegenheiten, um bei der elektronischen Überwachung aufzurüsten. Während der Olympischen Spiele 2024 in Paris soll die intelligente Videoüberwachung flächendeckend erprobt werden. Als Begründung wird angeführt, so könne man gefährliche Menschenansammlungen frühzeitig erkennen – dabei gab es in den letzten hundert Jahren in Frankreich nur eine tödliche Massenpanik: 2002 in Brest bei einer Studentenparty auf dem Messegelände Penfeld.

Diese technischen und institutionellen „Innovationen“ verwischen auf beunruhigende Weise die Kategorien. Die Hersteller und die Kommunen behaupten, die Städte würden durch die IT-Infrastruktur nachhaltiger, dabei ist gerade diese Technik sehr energieintensiv. Zudem bildet die massive Ausweitung der polizeilichen Kontrollmöglichkeiten die materielle Grundlage für eine potenzielle Totalüberwachung.

Im offiziellen Diskurs dient das elektronische Panoptikum Chinas, dessen Eingriffe in die Privatsphäre viel tiefer gehen und das – etwa mit seinem Sozialkreditsystem7 – weitere Formen der Überwachung etabliert hat, den liberalen Demokratien noch immer als Antimodell. Die automatische visuelle Erkennung von bestimmten Verhaltensmustern bringt aber auch uns einer solchen Überwachungsdystopie näher.

1 Souheil Hanoune, „Lévolution de notre société passera par lIA“, www.science-et-vie.com, 24. Juli 2022.

2„Intelligence artificielle: comment Wintics exploite le potentiel de la vidéo-surveillance?“, bigmedia.bpifrance.fr, 8. November 2022.

3„Pixel. Le Guide des technologies de sûreté 2022“, L’Arbresle (Association nationale de la vidéoprotection), 2021.

4 Eric L. Piza und andere, „CCTV surveillance for crime prevention. A 40-year systematic review with meta-analysis“, in: Criminology and public policy, Bd. 18, Nr. 1, Ohio State University, Februar 2019.

5„Le nouveau business de la vidéosurveillance algorithmique automatisée“, nextinpact.com, 9. Mai 2022.

6 La Quadrature du Net, „Le Conseil d’État sauve la reconnaissance faciale du fichier TAJ“, laquadrature.net, 3. Mai 2022.

7 Siehe René Raphaël und Ling Xi, „Der dressierte Mensch“, LMd, Januar 2019.

Aus dem Französischen von Anna Lerch

Thomas Jusquiame ist Journalist.

Praxistest in Berlin

Auch in Deutschland wird mit KI-gestützter Videoüberwachung im öffentlichen Raum experimentiert. So erprobte die Bundespolizei gemeinsam mit der Deutschen Bahn am Berliner Bahnhof Südkreuz eine „intelligente Videoanalyse“, die mithilfe eines Gesichtserkennungssystems verdächtige Personen in großen Menschenmengen identifizieren sollte. Dazu wurden auf dem Bahnhofsgelände mehrere Kameras von drei verschiedenen Anbietern installiert.

Der Praxistest brachte jedoch nicht die gewünschten Erfolge – die Erkennungsrate der eingesetzten Systeme lag im Durchschnitt bei lediglich 80 Prozent. Bei der Kamera am Bahnhofseingang wurden tagsüber aufgrund des Gegenlichts teils sogar noch schlechtere Trefferquoten von unter 20 Prozent gemessen. Der Chaos Computer Club (CCC) sprach von einem „Debakel“. Für den geplanten Abgleich mit polizeilichen Datenbanken seien solche Erkennungsraten „völlig unbrauchbar“, so die Kritik. Denn in der Praxis bedeuten hohe Falschtrefferraten, dass gesuchte Straftäter durchs Raster fallen und unbescholtene Bürger verdächtigt werden.

Bereits 2007 war ein ähnliches Projekt in Mainz aus denselben Gründen gescheitert. Im Realbetrieb sind die Ergebnisse aufgrund der schlechteren Lichtverhältnisse meist weniger gut als im Labor. Trotzdem setzen Polizeibehörden weiter unbeirrt auf Videoüberwachung. So nutzt die Polizei in Mannheim seit 2018 eine KI-Software, die auf den Bildern von Überwachungskameras in Echtzeit „grobmotorische Verhaltens- und Bewegungsmuster“ wie beispielsweise Schlagen oder Treten erkennt und im Verdachtsfall Alarm schlägt. Damit soll die Reaktionszeit der Einsatzkräfte verkürzt werden.

In Trier jagt die Polizei mit einer Spezialkameratechnik Handysünder hinterm Steuer. Die an einer Autobahnbrücke installierte Monocam erkennt mithilfe einer künstlichen Intelligenz auch bei fließendem Verkehr, ob der Fahrer einen handyähnlichen Gegenstand hält. Wer auf sein Telefon starrt, wird geblitzt. Das Beweisfoto wird anschließend von Polizeibeamten überprüft. Zwar werden Fotos in negativen Verdachtsfällen wieder gelöscht. Datenschützer kritisieren allerdings, dass die Objekterkennung eine Aufnahme aller, das heißt auch unbescholtener Verkehrsteilnehmer erforderlich mache und Bußgeldbescheide wegen eines Eingriffs in Persönlichkeitsrechte anfechtbar seien.

Auch in der Schweiz kommen biometrische Kamerasysteme zum Einsatz. So können sich am Flughafen Zürich einreisende Flugpassagiere bei der automatisierten Grenzkontrolle durch einen Livebild-Abgleich ihres Gesichts mit ihrem eingescannten Pass ausweisen. Der Reisende blickt frontal in eine Kamera, dann wird das Livebild mit den ausgelesenen Daten des Gesichtsscanners abgeglichen. Eigentlich ist die Nutzung des Systems freiwillig. Medienberichte legen allerdings nahe, dass Passagiere teils gezielt zu den Scannern geschleust werden, ohne dass vorher das datenschutzrechtlich erforderliche Einverständnis eingeholt wurde.

Adrian Lobe