Big Data: Forscher tappen in Social-Media-Falle

Datenauswertungen aus Social-Media-Portalen wie Facebook, Twitter, Google+ und Co. bergen für die Forschung große Interpretationsrisiken, wie Wissenschaftler der Carnegie Mellon University ermittelt haben. [...]

Zwar lassen sich die von Social-Media-Portalen gewonnenen Daten auswerten, um Zusammenhänge herzustellen – etwa in Bezug auf das Geschlecht, die Zahl der Kontakte oder politische Überzeugungen. Die Experten fordern jedoch die Einhaltung und Weiterentwicklung wissenschaftlicher Standards.

„Im Bereich Social Media herrscht derzeit eine Art Goldgräberstimmung. Es wird unkritisch mit Daten umgegangen und es wird nötig sein, dass Informatiker hier künftig besser mit Sozialwissenschaftlern zusammenarbeiten“, unterstreicht Axel Maireder vom Institut für Publizistik- und Kommunikationswissenschaft der Universität Wien im Gespräch mit dem Nachrichtenportal pressetext.

Die Fachleute weisen darauf hin, dass weder Facebook noch Twitter oder Instagram einen Spiegel der Gesamtgesellschaft darstellen. So sei die Zusammensetzung der Nutzer der Netzwerke nicht unbedingt repräsentativ für die Gruppe von Menschen, über die Forscher Aussagen treffen wollen.

Instagram ist zum Beispiel mit Vorsicht zu genießen: Der Durchschnitts-User ist weiblich, zwischen 18 und 29 Jahre alt, afroamerikanischer oder lateinamerikanischer Herkunft und städtisch. Wissenschaftler, die sich dessen bei der Verarbeitung der auf Instagram gesammelten Daten bewusst sind, können methodisch gegensteuern und Verzerrungseffekte, sogenannte Bias, reduzieren.

„KNOW YOUR DATA!“
Zunehmend setzen im Zusammenhang mit Social-Media-Daten Wissenschafter darauf, dass Verzerrungseffekte durch eine sehr große Fallzahl ausgeschaltet werden können. Doch auch wenn der Reiz groß sei, gratis und schnell an riesige Datensätze zu kommen, dürfe nicht das alte Credo sozialwissenschaftlicher Forschung vergessen werden: „Know your Data!“, betont Jürgen Pfeffer, einer der beiden Studienleiter.

Auch wichtig: In sozialen Medien verhalten sich Menschen nicht wie im „realen Leben“: Nicht alle Menschen nutzen gleichsam eine bestimmte Social-Media-Plattform. Darüber hinaus unterscheidet sich menschliches Verhalten im Internet vom Verhalten in anderen Lebenssituationen. Versuche, hier Erkenntnisse über Verhaltensweisen von Usern außerhalb der Plattformen zu gewinnen, sollten demnach stets mit Vorsicht angestellt werden.

Auch die Social-Media-Unternehmen leisten ihren Beitrag zu den wissenschaftlichen Defiziten: Sie erlauben es meist nicht, dass Forscher die von den Unternehmen zur Verfügung gestellten Daten teilen oder weitergeben. Jedes Forschungsprojeket bekommt andere, aktuelle und teilweise auch auf Basis neuer Algorithmen entstandene Daten. „Das stellt das ganze Selbstverständnis der Wissenschaft infrage, weil ein Forscher seine Daten nicht mehr teilen kann, ein anderer Forscher dessen Arbeitsweise nicht überprüfen kann“, so Maireder abschließend. (pte)


Mehr Artikel

Gregor Schmid, Projektcenterleiter bei Kumavision, über die Digitalisierung im Mittelstand und die Chancen durch Künstliche Intelligenz. (c) timeline/Rudi Handl
Interview

„Die Zukunft ist modular, flexibel und KI-gestützt“

Im Gespräch mit der ITWELT.at verdeutlicht Gregor Schmid, Projektcenterleiter bei Kumavision, wie sehr sich die Anforderungen an ERP-Systeme und die digitale Transformation in den letzten Jahren verändert haben und verweist dabei auf den Trend zu modularen Lösungen, die Bedeutung der Cloud und die Rolle von Künstlicher Intelligenz (KI) in der Unternehmenspraxis. […]

News

Richtlinien für sichere KI-Entwicklung

Die „Guidelines for Secure Development and Deployment of AI Systems“ von Kaspersky behandeln zentrale Aspekte der Entwicklung, Bereitstellung und des Betriebs von KI-Systemen, einschließlich Design, bewährter Sicherheitspraktiken und Integration, ohne sich auf die Entwicklung grundlegender Modelle zu fokussieren. […]

News

Datensilos blockieren Abwehrkräfte von generativer KI

Damit KI eine Rolle in der Cyberabwehr spielen kann, ist sie auf leicht zugängliche Echtzeitdaten angewiesen. Das heißt, die zunehmende Leistungsfähigkeit von GenAI kann nur dann wirksam werden, wenn die KI Zugriff auf einwandfreie, validierte, standardisierte und vor allem hochverfügbare Daten in allen Anwendungen und Systemen sowie für alle Nutzer hat. Dies setzt allerdings voraus, dass Unternehmen in der Lage sind, ihre Datensilos aufzulösen. […]

Be the first to comment

Leave a Reply

Your email address will not be published.


*