Die wahre Anzahl an Open Source Entwicklern

Gibt es wirklich mehr als 40 Millionen Softwareentwickler auf GitHub? Nicht einmal annähernd. [...]

Github veröffentlichte einen Report, der 40 Millionen Entwickler anführte. Dabei handelt es sich aber lediglich um die Anzahl der vorhandenen Accounts (c) Pixabay.com

GitHub hat gerade seinen neuesten State of the Octoverse Bericht mit einigen erstaunlichen Zahlen veröffentlicht. Leider sind einige dieser Zahlen – wie die Behauptung von 40 Millionen Entwicklern – nicht nur erstaunlich, sie sind auch falsch.

Ich unterstelle keine ruchlose Absicht, um zu täuschen. Die Leute von GitHub sind nicht so. Aber durch die Zusammenführung von Konten mit Entwicklern hilft uns GitHub nicht, den genauen Daten über die Entwicklerpopulation näher zu kommen. Noch wichtiger ist, dass wir die Entwicklerzahlen nicht künstlich aufblasen müssen, um ihre Bedeutung zu ermitteln.

40 Millionen, sicher. Aber 40 Millionen wovon?

Es ist überraschend, dass GitHub sich bemüht, mit der 40-Millionen-Zahl überhaupt die Führung zu übernehmen, da es sofort einen Vorbehalt hinzufügt: 40 Millionen beziehe sich auf „die Gesamtzahl der Non-Spam-Benutzerkonten auf GitHub zum 30. September 2019, unabhängig von ihrem Aktivitätsstatus“. OK, wir sprechen hier also nicht von Entwicklern, aber 40 Millionen Konten sind immer noch beeindruckend, oder?

Irgendwie schon.

Analyst Lawrence Hecht war der erste, der sich über die Zahlenparade hinwegsetzte und argumentierte: „Nur weil jemand ein GitHub-Konto erstellt, bedeutet das nicht, dass er auch als Entwickler angesehen werden sollte. Es ist faszinierend, wie viele dieser Konten innerhalb eines Monats nach ihrer Erstellung „inaktiv“ werden.“ Uff.

Nein, GitHub-Konten entsprechen nicht unbedingt einer Entwicklerzahl. Schließlich habe ich ein GitHub-Konto, aber ich bin wohl kaum ein Entwickler – und ich kenne viele Leute im Produktmarketing und Produktmanagement, die auf GitHub sind, aber dort oder anderswo keine Software entwickeln. Nicht nur das, viele dieser gleichen Konten werden sofort inaktiv. Oder liegen einfach jahrelang brach, wie es bei Tom Krazit der Fall ist. Dann gibt es viele echte, individuelle Entwickler, die mehrere gleichzeitig Konten besitzen, wie beispielsweise Ian Massingham.

Sicherlich, wenn wir uns überhaupt für die Entwickler interessieren, sollten wir uns vor allem für diejenigen interessieren, die aktiv Code beisteuern. Hecht beklagte, dass „die meisten dieser [Octoverse] Zahlen inaktive Personen darstellen“. Im Gegensatz dazu konzentrieren sich andere Bemühungen, wie die Versuche von Adobe, die Rankings von Unternehmensbeiträgen zu messen, auf aktive Mitwirkende. Das ist etwas, was GitHub ohne weiteres tun könnte, aber nicht tut. GitHub vermerkt aktive Mitwirkende an einer Vielzahl von Projekten im Octoverse-Bericht, sie verfügen also über diese Daten.

Kein Grund zur Sorge. Analystenfirmen haben ihr Bestes getan, um die Entwicklerpopulationen zu messen. Bei IDC-Pins zählt man die Entwickler beispielsweise wie folgt:

  • 5 Millionen Vollzeit-Softwareentwickler
  • 7 Millionen Teilzeit-Softwareentwickler
  • 7 Millionen nicht entschädigte Softwareentwickler

Das macht 24,2 Millionen Softwareentwickler weltweit. Dies gilt auch für andere Schätzungen wie die von Evans Data im Jahr 2018, die von 23 Millionen Entwicklern berichteten und bis 2023 27,7 Millionen erwarten.

OK, soviel dazu. Aber, wie Jono Bacon fragt: „Ich weiß nicht, warum sich der durchschnittliche Benutzer/Entwickler darum kümmern muss“, wie viele Entwickler es auf GitHub oder anderswo gibt.

Die wichtigsten Entwicklerzahlen

Einige, wie der Investor Ethan Kurzweil, setzen auf echtes Geld, basierend auf Schätzungen der aktuellen und zukünftigen Entwicklerpopulationen. Unter Bezugnahme auf die 40-Millionen-Zahl von GitHub erklärte er sie beispielsweise zu einem „starken Frühindikator[], der besagt, dass der Markt für Entwicklertechnologien von morgen sehr positiv verlaufen wird“. Er hat mit ziemlicher Sicherheit Recht, aber nicht wegen der fehlerhaften 40 Millionen.

So listet beispielsweise der Octoverse-Report von GitHub das First Contributions Repository als eines der Top-Repositories für Beiträge (Platz vier insgesamt) im vergangenen Jahr auf. Das ist erstaunlich, denn, wie Hecht betonte, soll dieses Repo Anfängern helfen, zu lernen, wie man an Open Source Projekten mitwirkt. Angesichts der ständig wachsenden Bedeutung von Open Source für Einzelpersonen und Organisationen ist das Wachstum der Zahl von Mitwirkenden an diesem Repository (mehr als 15.000 und steigend) bedeutender als 40 Millionen Gesamtkonten, real oder imaginär.

Oder, was ist mit den 1,3 Millionen erstmalig Beitragenden im Jahr 2019? Oder dass Asien im Jahr 2019 36% der privaten Repositorien ausmacht? Tatsächlich sind Hongkong, Singapur und Japan weltweit die am schnellsten wachsenden Länder in Bezug auf das Beitragswachstum, während China nur in Bezug auf die Open-Source-Nutzung (gemessen an Klonen und Forks) hinter den USA liegt.

Das sind die Zahlen, die wichtig sind, denn diese Art von Zahlen prägen die Industrien, ja, aber auch die Gesellschaften. Wir haben keine 40 Millionen globalen Entwickler, aber wir haben eine wachsende Anzahl von Entwicklern, wobei die meisten Aktivitäten außerhalb der USA durchgeführt werden. Die 40 Millionen Marketing-Zahlen spielen keine Rolle, aber diese Fakten tun es.

*Matt Asay schreibt unter anderem für InfoWorld.com


Mehr Artikel

Gregor Schmid, Projektcenterleiter bei Kumavision, über die Digitalisierung im Mittelstand und die Chancen durch Künstliche Intelligenz. (c) timeline/Rudi Handl
Interview

„Die Zukunft ist modular, flexibel und KI-gestützt“

Im Gespräch mit der ITWELT.at verdeutlicht Gregor Schmid, Projektcenterleiter bei Kumavision, wie sehr sich die Anforderungen an ERP-Systeme und die digitale Transformation in den letzten Jahren verändert haben und verweist dabei auf den Trend zu modularen Lösungen, die Bedeutung der Cloud und die Rolle von Künstlicher Intelligenz (KI) in der Unternehmenspraxis. […]

News

Richtlinien für sichere KI-Entwicklung

Die „Guidelines for Secure Development and Deployment of AI Systems“ von Kaspersky behandeln zentrale Aspekte der Entwicklung, Bereitstellung und des Betriebs von KI-Systemen, einschließlich Design, bewährter Sicherheitspraktiken und Integration, ohne sich auf die Entwicklung grundlegender Modelle zu fokussieren. […]

News

Datensilos blockieren Abwehrkräfte von generativer KI

Damit KI eine Rolle in der Cyberabwehr spielen kann, ist sie auf leicht zugängliche Echtzeitdaten angewiesen. Das heißt, die zunehmende Leistungsfähigkeit von GenAI kann nur dann wirksam werden, wenn die KI Zugriff auf einwandfreie, validierte, standardisierte und vor allem hochverfügbare Daten in allen Anwendungen und Systemen sowie für alle Nutzer hat. Dies setzt allerdings voraus, dass Unternehmen in der Lage sind, ihre Datensilos aufzulösen. […]

Be the first to comment

Leave a Reply

Your email address will not be published.


*