Foto: Christian Haschek

Wiener Entwickler jagt Kinderpornos mit Minicomputern

18. Juni 2018, 10:51

Raspberry Pis und Intel-Neural-Compute-Sticks suchen problematisches Material – Tausende Fotos bei Bilderhoster aufgespürt

Christian Haschek ist ein Entwickler aus der texanischen Hauptstadt Austin, der in Wien lebt. Er programmiert, seit er zwölf Jahre alt ist, und betreibt eine quelloffene Image-Hosting-Plattform namens Pictshare. Diese hatte er ursprünglich für eigenen Bedarf programmiert, jedoch wurde sie zunehmend auch von anderen Personen genutzt. Vor kurzem, so berichtet er in seinem Blog, stellte sich ihm allerdings ein neues Problem: Kinderpornos.

Ein Nutzer hatte ihm mitgeteilt, dass jemand ein entsprechendes Foto hochgeladen hatte. Eine Angabe, die sich als wahr herausstellte. Ein Anruf bei der Polizei verlief jedoch wenig hilfreich. "Der Polizist hatte keine Ahnung, was ein Image Hoster ist, und sagte mir, ich solle das Foto herunterladen und ausdrucken, um es auf den Polizeiposten mitnehmen zu können", schildert Haschek.

foto: christian haschek

Minicomputer auf USB-Stick

Letztlich fand er heraus, dass die internationale Polizeiorganisation Interpol sich intensiv mit diesem Problem befasste. Diese teilte ihm mit, er solle das Bild löschen und melden, wenn von der gleichen IP-Adresse weitere Uploads getätigt werden. Haschek wollte jedoch eine weiter reichende Lösung schaffen und möglichst viele einschlägige Fotos von seiner Plattform entfernen. Die vielen tausend Fotos auf Pictshare manuell durchzusehen ist aber freilich aufgrund des Zeitaufwands keine Option.

Also griff er zum Intel Movidius Neural Compute Stick. Dabei handelt es sich um einen Rechner im Format eines USB-Sticks, der dafür designt ist, neurale Netzwerke für Bilderkennung auszuführen. Dieser lässt sich auch an einen Raspberry Pi anschließen und verbraucht deutlich weniger als ein Grafikchip.

Erfolgreicher Testlauf

Der Entwickler schaltete schließlich drei Raspberry Pis zusammen, an zwei davon hängte er einen Compute Stick. Auf den Sticks läuft ein neurales Netzwerk mit einem "vortrainierten" Modell namens "open nsfw" von Yahoo. Mit einem Skript wurden die Raspberry Pis schließlich genutzt, um die Sticks mit heruntergeladene Bildern von Pictshare zu "füttern".

Diese liefern nun für jedes ausgewertete Foto eine Zahl zurück, die angibt, mit welcher prozentualen Wahrscheinlichkeit das jeweilige Bild Nacktheit enthält. Das Resultat wird in einer Datenbank gespeichert und die Datei selbst danach gelöscht. Für jedes Bild, bei dem eine Wahrscheinlichkeit von über 30 Prozent ausgegeben wird, erstattet das System eine Meldung an den Entwickler.

Das Diagramm des Systems.
foto: christian haschek

Das ermöglichte es, eine große Menge an Fotos vorab auszusortieren, und letztlich die Entdeckung 16 weiterer kinderpornografischer Aufnahmen, deren Fund Haschek an Interpol meldete.

Fast 3.300 Kinderporno-Fotos entdeckt

Nach dem Testlauf einer eigenen Seite wandte sich der Entwickler an eine "sehr große Bilderhosting-Plattform". Dort zeigte man sich sehr interessiert an dieser Vorgehensweise und ermöglichte ihm den automatisierten Zugriff. Rund eine Woche lang waren die Rasperry Pis und Movidius-Sticks im Einsatz. Fast 3.300 Kinderporno-Fotos konnten aufgespürt werden, die von den Betreibern bei ihren lokalen Strafverfolgungsbehörden gemeldet wurden.

Das ganze System mit drei Rasperry Pis und zwei Neural-Computing-Sticks sowie einer Platine zur Überwachung des Stromverbrauchs kommt mit einer Stromzufuhr von nur zehn Watt aus und wird mit einem Solarpanel versorgt. Dazu lässt es sich problemlos "horizontal" erweitern, im Prinzip kann man so viele Raspberry Pis und Neural-Compute-Sticks kombinieren, wie man möchte, um die Auswertung zu beschleunigen.

Testtool online

Haschek will nun auch an andere Bilderhosting-Plattformen herantreten und ihnen Hilfe anbieten, auch andere Unternehmen können sich bei Interesse melden. Wer möchte, kann die Genauigkeit über eine Website selber testen. Es gibt auch eine Programmierschnittstelle, mit der man online gespeicherte Bilder überprüfen lassen kann. Hochgeladene Bilder werden laut Angabe auf der Seite automatisch gelöscht und IP-Adressen nach einer Woche anonymisiert. Alle erfassten Daten – Hashes der Bilder, Auswertungsergebnis und anonymisierte IP-Adressen – werden in einem österreichischen Rechenzentrum gespeichert. (red, 18.6.2018)

>> Folgen Sie dem WebStandard auf Whatsapp, Telegram und Facebook Messenger! <<