HTML5 überholt Flash in Sachen Cookies

Die Zahl der Cookies auf Websites stieg 2011 nur moderat. Als besonders aktiven Verteiler machen die Wissenschaftler erneut Google aus. [...]

Im Internet kursieren immer mehr lokale Speicherobjekte auf HTML5-Basis. Dafür nimmt immerhin die Zahl an Flash Cookies ab. Diesen Eindruck legt jedenfalls eine Studie des Berkeley Center for Law and Technology der Universität Berkeley mit Unterstützung des Anbieters Abine und Good Research nahe.

Stoßrichtung des schon seit einigen Jahren bestehenden Studienprojektes ist es, eine empirische Grundlage für den Schutz der Privatsphäre im Internet zu liefern. „Unser Ziel ist die Definition und Quantifizierung von Vektoren zum Verbraucher-Tracking im Internet“, heißt es in der Studie. „Indem wir das unter Anwendung konsistenter Methoden langfristig machen, können wir empirische Aussagen zur aktuellen Lage beim Internet-Tracking und beim Datenschutz machen.“

Wechsel von Flash Cookies zu HTML5-Technologie
Im Vergleich zum Vorjahr hat sich diese Lage offenbar nicht alarmierend verschlimmert. Am Ausmaß des Problems ändert das gleichwohl wenig. Überdies findet derzeit eine signifikante Verschiebung von Flash Cookies auf HTML5-Technologie statt, und insbesondere Google ist nach wie vor auch eine gigantische Cookie-Verteilungsplattform. Das Berkeley Center erinnert daran, dass vor 15 Jahren lediglich 23 der meistbesuchten Websites Cookies verwendeten, während es mittlerweile alle tun.

Methodisch basiert die Studie auf einem großangelegten Scan. Die 25.000 meistbesuchten Websites laut Quantcast wurden allesamt angesurft, hinzu kamen längere Aufenthalte auf den 100 und 1000 populärsten Seiten. Ein Login erfolgte nirgendwo. Wie in den Vorjahren wurde hinterher ausgewertet, was via Mozilla-Browser alles verteilt wurde. Selbstverständlich dient nicht jedes Cookie und auch nicht jedes HTML5-Local-Storage-Objekt dem Sammeln von Nutzerdaten zu kommerziellen Zwecken. Die Studie misst nur deren Verbreitung in der Annahme, dass sich so auch das Ausmaß an Tracking-Aktivitäten grob nachvollziehen lässt.

Im Vergleich zum Sommer 2011 habe es einen deutlichen Anstieg beim HTML5-Storage und einen starken Rückgang bei Flash Cookies gegeben, fasst das Institut die Ergebnisse der Studie zusammen. „Flash hat seine Dominanz verloren und wird folgerichtig auf weniger Seiten verwendet“, heißt es in der Studie. Allerdings steige die Gesamtzahl an Cookies weiter an, es gebe auch immer mehr Cookies aus dritter Hand. „Cookies sind auf jeder Website der Top-100 präsent, rund 34 Prozent davon verwenden HTML5-Storage – das ist eine Verdopplung gegenüber unserer Zählung in 2011“, so das Berkeley Center.

312 Cookies auf einer Website
Insgesamt fanden die Forscher in der detaillierten Untersuchung der 100 größten Websites 5795 Cookies – zwar nur 120 mehr als 2011, aber fast 2200 mehr als 2009. Die Zahl der Flash Cookies sank von 54 in 2009 über 37 im Vorjahr auf aktuell 13. Der Rückgang wiegt fast auf den Punkt den Anstieg beim HTML5-Storage auf.

Die meisten Cookie-Keys lauten laut Studie utmb,utma,utmc,utmz und uid. „Viele dieser Keys werden gewöhnlich mit individuellem User-Tracking und Google Analytics assoziiert“, heißt es in der Studie. 84 Prozent der Cookies auf den Top-100 seien von einem Dritten platziert worden. Die kalifornischen Forscher entdeckten mehr als 440 Hosts. Google selbst streue auf 16 der Top-100-Seiten Cookies, Googles Werbe-Tracking-Netzwerk Doubleclick.net auf 73. Nur auf 22 der 100 Seiten seien überhaupt keine Google-Cookies zu finden.

21 Seiten verteilten 100 und mehr Cookies, 6 davon sogar mehr als 150. Der ungenannte Spitzenreiter kommt auf 242, 234 davon von Dritten. Auf der Tracking-Rangliste folgen nach Doubleclick.net mit 58 Cookies Scorecardresearch.com, mit 48 Adnxs.com, mit 47 Quantserve.com und mit 42 ad.yieldmanager.com.

Auch Twitter weit vorne
Die großflächige Untersuchung von 25.000 Seiten bestätigt im Kern diesen Mikrobefund. Die genannten Tracker liegen auch hier vorne, allerdings nimmt Twitter.com hier ebenfalls einen Spitzenrang ein. Insgesamt fanden die Forscher hier 442.055 Cookies, auf einer Website sogar 312 Stück. Drei Viertel der Cookies stammen von einem Third Party Host, Google ist auf fast 9000 der Seiten präsent.
Die Aktivitäten des Suchmaschinenriesen ordnet die Studie so ein: „Wir beobachten auf den Top-100-Seiten weniger Google-Cookies als bisher.“ Höchstwahrscheinlich sei dies eine unvermeidbare Folge davon, dass man die Daten anders als in den Vorjahren automatisch statt manuell gesammelt habe.

HTML5-Storage: Tendenz steigend

Für die Zukunft erwartet das Forschungszentrum einen weiteren Anstieg von HTML5-Storage auf Kosten von Flash Cookies, auch ein weiterer Anstieg beim Third Party-Tracking wird prognostiziert. Das Berkeley Center will die Entwicklung künftig jedes Vierteljahr untersuchen und auch analysieren, welche Auswirkungen permanenter Log-In auf diversen Websites auf den Datenschutz im Internet hat.
*Werner Kurzlechner ist Autor der deutschen Schwesterzeitschrift CIO.


Mehr Artikel

Gregor Schmid, Projektcenterleiter bei Kumavision, über die Digitalisierung im Mittelstand und die Chancen durch Künstliche Intelligenz. (c) timeline/Rudi Handl
Interview

„Die Zukunft ist modular, flexibel und KI-gestützt“

Im Gespräch mit der ITWELT.at verdeutlicht Gregor Schmid, Projektcenterleiter bei Kumavision, wie sehr sich die Anforderungen an ERP-Systeme und die digitale Transformation in den letzten Jahren verändert haben und verweist dabei auf den Trend zu modularen Lösungen, die Bedeutung der Cloud und die Rolle von Künstlicher Intelligenz (KI) in der Unternehmenspraxis. […]

News

Richtlinien für sichere KI-Entwicklung

Die „Guidelines for Secure Development and Deployment of AI Systems“ von Kaspersky behandeln zentrale Aspekte der Entwicklung, Bereitstellung und des Betriebs von KI-Systemen, einschließlich Design, bewährter Sicherheitspraktiken und Integration, ohne sich auf die Entwicklung grundlegender Modelle zu fokussieren. […]

News

Datensilos blockieren Abwehrkräfte von generativer KI

Damit KI eine Rolle in der Cyberabwehr spielen kann, ist sie auf leicht zugängliche Echtzeitdaten angewiesen. Das heißt, die zunehmende Leistungsfähigkeit von GenAI kann nur dann wirksam werden, wenn die KI Zugriff auf einwandfreie, validierte, standardisierte und vor allem hochverfügbare Daten in allen Anwendungen und Systemen sowie für alle Nutzer hat. Dies setzt allerdings voraus, dass Unternehmen in der Lage sind, ihre Datensilos aufzulösen. […]

Be the first to comment

Leave a Reply

Your email address will not be published.


*