Neun Millionen defekte Wikipedia-Links repariert

Das Internet Archive, eine Non-Profit-Bibliothek mit Millionen von frei zugänglichen Webinhalten wie Büchern, Videos oder Websites, hat es geschafft, insgesamt neun Mio. fehlerhafte Verlinkungen in der Online-Enzyklopädie Wikipedia http://wikipedia.org zu korrigieren. [...]

"Fehler 404 Page not found": Freiwillige und Software haben drei Jahre lang Einträge überarbeitet. (c) pixabay
"Fehler 404 Page not found": Freiwillige und Software haben drei Jahre lang Einträge überarbeitet. (c) pixabay

Damit Nutzer dort nicht mehr ständig mit der Meldung „Fehler 404 Page not found“ genervt werden, wenn sie auf ältere, nicht mehr aktive Links klicken, haben unzählige Freiwillige in Kooperation mit einer speziellen Software insgesamt drei Jahre lang 22 verschiedene Wikipedia-Ausgaben durchforstet und überarbeitet.

Web als „sehr fragiler Ort“

„Wir beim Internet Archive haben uns das Ziel gesetzt, ein besseres und verlässlicheres Internet zu erschaffen“, erklärt Mark Graham, einer der freiwilligen Mitarbeiter der Non-Profit-Bibliothek via Blog-Meldung. Nun sei man diesem Ziel einen gravierenden Schritt nähergekommen. „Es freut uns sehr, dass wir vermelden können, dass neun Mio. vorher nicht mehr aktive Links auf Wikipedia jetzt wieder funktionieren“, betont Graham. Die betroffenen Verlinkungen hat man nämlich einfach auf alternative Versionen von Webseiten umgeleitet, die von der hauseigenen „Wayback Machine“ archiviert worden sind.

„Mehr als fünf Jahre lang hat das Internet Archive fast jede URL archiviert, auf die in beinahe 300 WikipediaSeiten referenziert wird“, betont der Experte. Doch das Web sei nun einmal ein „sehr fragiler Ort“, denn Unternehmen, Regierungen, Bildungseinrichtungen, Organisationen und Individuen würden immer wieder Websites abschalten oder unter neuen Adressen online stellen. „Das führt dann dazu, dass Links plötzlich nicht mehr funktionieren. Mithilfe unserer Wayback Machine, in der mehr als 338 Mrd. Seiten erfasst sind, konnten wir dieses Problem nun zumindest für eine der wichtigsten Wissensquellen im Netz lösen“, so Graham.

Eigene Software entwickelt

Um möglichst viele sogenannte „broken links“ in Wikipedia-Einträgen aufspüren zu können, hat Maximilian Doerr, ein langjähriger Freiwilliger bei der Online-Enzyklopädie, der auch als Berater beim Internet Archive fungiert, eine eigene Software namens „IABot“ entwickelt. Diese hat zunächst 22 verschiedene Wikipedia-Ausgaben nach fehlerhaften Verlinkungen durchsucht. Wenn dabei ein 404-Fehler gefunden wurde, wechselte sie automatisch in die Datenbank des Internet Archive, um eine archivierte Version der eigentlich nicht mehr verfügbaren Seite zu finden und diese dann im entsprechenden Eintrag zu verlinken.

„Auch wenn das aktuelle Projekt ein voller Erfolg war, ist das noch lange nicht das Ende. Wir werden unsere Anstrengung in Bezug auf die Kontrolle und die Verbesserung von WikipediaSeiten in Zukunft noch weiter verstärken und auch an der Geschwindigkeit arbeiten, mit der wir Fehler finden und ausbessern können“, meint Graham.


Mehr Artikel

Rüdiger Linhart, Vorsitzender der Berufsgruppe IT der Fachgruppe UBIT Wien. (c) WeinwurmFotografie
Interview

IT-Berufe im Fokus: Innovative Lösungen gegen den Fachkräftemangel

Angesichts des anhaltenden IT-Fachkräftemangels ist schnelles Handeln gefordert. Die Fachgruppe IT der UBIT Wien setzt in einer Kampagne genau hier an: Mit einem breiten Ansatz soll das vielfältige Berufsbild attraktiver gemacht und innovative Ausbildungswege aufgezeigt werden. IT WELT.at hat dazu mit Rüdiger Linhart, Vorsitzender der Berufsgruppe IT der Fachgruppe UBIT Wien, ein Interview geführt. […]

News

ISO/IEC 27001 erhöht Informationssicherheit bei 81 Prozent der zertifizierten Unternehmen

Eine Umfrage unter 200 Personen verschiedener Branchen und Unternehmensgrößen in Österreich hat erstmals abgefragt, inwiefern der internationale Standard für Informationssicherheits-Managementsysteme (ISO/IEC 27001) bei der Bewältigung von Security-Problemen in der Praxis unterstützt. Ergebnis: Rund 81 Prozent der zertifizierten Unternehmen gaben an, dass sich durch die ISO/IEC 27001 die Informationssicherheit in ihrem Unternehmen erhöht hat. […]

News

Public Key Infrastructure: Best Practices für einen erfolgreichen Zertifikats-Widerruf

Um die Sicherheit ihrer Public Key Infrastructure (PKI) aufrecht zu erhalten, müssen PKI-Teams, sobald bei einer Zertifizierungsstelle eine Sicherheitslücke entdeckt worden ist, sämtliche betroffenen Zertifikate widerrufen. Ein wichtiger Vorgang, der zwar nicht regelmäßig, aber doch so häufig auftritt, dass es sich lohnt, PKI-Teams einige Best Practices für einen effektiven und effizienten Zertifikatswiderruf an die Hand zu geben. […]

News

UBIT Security-Talk: Cyberkriminalität wächst unaufhaltsam

Jedes Unternehmen, das IT-Systeme nutzt, ist potenziell gefährdet Opfer von Cyberkriminalität zu werden, denn die Bedrohung und die Anzahl der Hackerangriffe in Österreich nimmt stetig zu. Die Experts Group IT-Security der Wirtschaftskammer Salzburg lädt am 11. November 2024 zum „UBIT Security-Talk Cyber Defense“ ein, um Unternehmen in Salzburg zu unterstützen, sich besser gegen diese Bedrohungen zu wappnen. […]

Be the first to comment

Leave a Reply

Your email address will not be published.


*