Neuigkeiten:

Harzer Skigebiete auf der Startseite ergänzt (Danke Schneemann!).

Hauptmenü

Pixray Bot

Begonnen von Doppelmayr, 28 Nov 2012, 16:58

Vorheriges Thema - Nächstes Thema

Doppelmayr

Wer ist denn die Hetzner AG wenn ich das fragen darf???

playjam

Bei Hetzner ist der Pixray-Crawler gehostet, der sich in kurzen Abständen die Bilder aus diesem Forum schlürft, um festzustellen, ob hier jemand das Copyright verletzt.

Harzwinter

Und was für Bilder genau bzw. für wen sucht der? Meine Fotos auf www.harzwinter.de wurden vielfach von Harzer Pensionsbesitzern gekl ... äh, "übernommen". Für mich sucht kein Crawler nach Copyrightverletzungen.

playjam

Pixray ist ein Bezahldienst. Die kannst Du anheuern um Deine Bilder im Netz zu suchen und dann die gefundenen Harzer Pensionsbesitzer mit kostenpflichtigen Abmahnungen beglücken. Da die Websites der Pensionsbesitzer in der Regel kommerzieller Natur sind, lohnt sich das finanziell sogar sehr, da Du im Falle einer Klage gute Chancen auf Erfolg hättest.

Harzwinter

Zzzzzzzzz ... danke für die Info. Wird das Pixray-Tool gezielt gegen Websites eingesetzt, auf denen der zahlende Kunde oder Hetzler Urheberrechtsverletzungen vermuten? Oder crawlt diese Nervensäge einfach ziellos alles ab?

playjam

Ziellos alles und häufiger als der Google Image-Bot. Ich habe den richtig lieb.

Harzwinter

Mit welcher Methode grenzt Pixray ab, was Bildmaterial mit fremdem Urheberrecht ist und was nicht? Erkennt es Bilder mit fremdem Urheberrecht per Abgleich der "digitalen Fingerabdrücke" der Bilddateien? Und für welche Art geschützter Bilder lohnt es sich überhaupt, einen solchen Bezahldienst einzuschalten?

playjam

#7
Siehe http://www.pixray.com/technologie
Zitat
FUNKTIONEN
- Ermittlung und Beseitigung von Bildern mit unerwünschten Inhalten (z.B. sexuell explizite Inhalte)
- Suchen und Auffinden von Bildern Einhaltung bestimmter Kriterien (z.B. Profilbilder)
- Suchen und Auffinden von urheberrechtlich geschütztem Material (wo originale oder bearbeitete Bilder ohne Ihre Zustimmung verwendet)
- Suchen und Auffinden ähnlicher Bilder (z.B. Bilder mit einer bestimmten Farbe)
- Hochladen und Vergleichen von Bildern

Für diesen Funktionsumfang ist ein einfaches Hash-Wert-Verfahren ("digitaler Fingerabdruck") nicht ausreichend. Die Pixray-Engine verwendet sehr wahrscheinlich Verfahren aus der statistischen Mustererkennung.

Prinzipiell finde ich die Technik (Neuronale Netze etc.) ja sehr interessant. Da der Pixray-Bot offensichtlich eindeutig nicht-kommerzielle Foren wie diese sehr gerne besucht, geht es denen auch um Copyright Verstöße durch Privatpersonen. Damit begeben die sich imho auf die dunkle Seite der Macht.

Weiterführende Literatur z.B: von Paulus (hatte vor Ewigkeiten seine Vorlesung besucht) hier: http://www.der-andere-verlag.de/buecher/paulus.pdf

Harzwinter

Hier ein sehr guter Kurzreport über Pixray: http://www.deutsche-startups.de/2011/06/28/pixray-analysiert-fotos-aller-art-automatisch-zielgruppe-datingsites-communitys-und-bildagenturen/

Bei den Kundenzielgruppen muss man zwischen interner Nutzung von Pixray und externer Nutzung auf Fremdservern unterscheiden.

Die interne Nutzung sehe ich unkritisch. Datingagenturen, soziale Netzwerke und selbst Holidaycheck überprüfen mit Pixray den Content der von Usern hochgeladenen Bilder. Hier geht es weniger um Urheberrechtsverletzungen als um die Einhaltung von Vorschriften für den Fotoupload.

Kunden für die externe Nutzung von Pixray auf Fremdservern sind offiziell Bildagenturen, Rechtinhaber von Markenlogos oder Hersteller von Straßen- und Landkartenmaterial. Angeblich erkennt Pixray sogar farblich oder größenmäßig veränderte Bilder. Hier sinkt die Wahrscheinlichkeit für eine fehlerfreie Erkennung m.E. aber rapide. Fehler der Maschine muss hier zwingend der Mensch korrigieren ... ich hoffe, dass das geschieht. Wie will Pixray in diesem Zusammenhang fast identische Motive verschiedener Urheber unterscheiden, z.B. Fotos von Sehenswürdigkeiten?

playjam

Für mich ist Pixray insofern nervig, da durch Pixray der Serverupdate früher als erwartet notwendig wurde. Google und Co schauen zwar auch mehrmals am Tag vorbei, erzeugen aber wesentlich weniger Last, weil sie sich hauptsächlich für Text und nur unregelmäßig für Bilder interessieren. Die externe Nutzung von Pixray auf Fremdservern im Auftrag von Rechteinhabern halte ich für eine windige Geschichte. Pixray hält sich zwar nicht an die robots.txt, bei Bedarf kann man Pixray aber anhand der IPs aussperren. D.h. den unbedarften Laien wird man erwischen und mit Abmahnungen beglücken, die bewusst Kriminellen wissen sich zu schützen und können nicht von Pixray erfasst werden.

Pixray analysiert Fotos aller Art (deutsche-startups.de, 28. Juni 2011)
Zitat
[...]
Das Pixray-System kann dagegen automatisch erkennen, ob auf dem jeweiligen Bild tatsächlich nur eine Person abgebildet ist, ob es ein echtes Foto ist oder ob die Person ordnungsgemäß bekleidet ist. "Keine andere technische Lösung ist derzeit in der Lage, digitales Bildmaterial in gleicher Quantität und Qualität zu prüfen", sagt Mitgründer Wetzig.
[...]

Die Aussage ist natürlich Quatsch bzw. sehr laut getrommelt. Als ich Ende des letzten Jahrtausends Aussteller auf der Cebit war, hatte ich ein Gespräch mit einem Herren (vermutlich Verfassungsschutz) der sich für die PC-Videotechnik interessiert hat. Einsatzbereich sollte Gesichts- und Nummernschild-Erkennung und Identifikation aus dem laufenden Video sein (auf einem damals handelsüblichen PC, ca. Pentium II 400MHz). OCR und Spracherkennung beruhen auf denselben Prinzipien und laufen auch seit mindestens 20 Jahren mit zufriedenstellender Erkennungsrate. Zu meinen Uni-Zeiten war die Entwicklung einer OCR-Software sogar Thema einer Studienarbeit, d.h. Methoden und Algorithmen sind bekannt und schnell umzusetzen. Daher gehe ich davon aus, sollte Pixray finanziell erfolgreich sein, werden sich leider sehr schnell sehr viele Nachahmer finden. Forenbetreiber werden entweder in mehr Bandbreite und/oder in technische Abwehrmaßnahmen investieren müssen.

Harzwinter

Wenn Pixray tatsächlich so viele Webserver-Admins nervt, dürfte eine Anti-Pixray-Software für Webserver inkl. IP-Update-Service schnell noch mehr Erfolg haben als Pixray selbst.   :D   Hat noch kein Anbieter diese Marktlücke gefüllt?

@Nummernschilderkennung: Die hatten wir erstmalig ganz öffentlich im Italien-Sommerurlaub 2012 auf dem City-Großparkplatz von Padua. Beim Befahren des Parkplatzes merkt man noch nicht mal, dass das Auto fotografiert wird, und staunt beim Bezahlen am Automaten nicht schlecht, dass man das Autokennzeichen eingeben muss und der Parkautomat damit ermittelt, wann man auf den Parkplatz gefahren ist. Für die Ausfahrt gibt's keine Parkmünze, nein, das Kennzeichen wird erneut fotografiert und ausgelesen ... gruselig.

XXLRay

Den Bot müsste man doch einfach über die .htaccess aussperren können.

playjam

Ja, oder iptables. Eigentlich reicht es den kompletten IP-Pool von Hetzner zu sperren, da ein Forum sowieso nur an echten Besuchern interessiert ist. Da wir hier aber immer mehr werden und Sternengucker ab und zu seine Twits aufs Forum schiebt, habe ich einfach ein paar Brickets mehr in den Brennraum nachgelegt.