Snowflake schlägt zurück gegen... wen?

Snowflake gibt sich große Mühe, seine Closed-Source-Software anzupreisen, und versucht möglicherweise, ein Publikum zu überzeugen, das sich nicht wirklich dafür interessiert. [...]

Snowflake ist sicher im Recht, seine Software geschlossen zu halten (c) pixabay.com

Disclaimer: Matt Asay arbeitet für AWS, aber die hier geäußerten Ansichten sind seine eigenen und spiegeln nicht die seines Arbeitgebers wider.

In zwei kürzlich erschienenen Blog-Beiträgen („Striking a balance with ‚open‘ at Snowflake“ und („Where open helps and where it hurts„) hat Snowflake 6.064 Wörter damit verbracht, ein sehr einfaches Konzept zu argumentieren: Nicht jede Software muss offen sein – offene Quellen, offene Standards, offene APIs. Es ist kein besonders verwerfliches Argument und spiegelt die Realität wider, dass zwar praktisch jede Software Open-Source-Code enthält, aber die meiste Software nicht als Open Source lizenziert ist. Mit anderen Worten: Snowflake ist sicher im Recht, seine Software geschlossen zu halten.

Und doch hatte das Unternehmen offensichtlich das Bedürfnis, seine Entscheidung (zweimal) zu rechtfertigen, was die starke Anziehungskraft von Open Source, offenen Standards und offenen APIs widerspiegelt, selbst wenn die Kunden nicht danach zu verlangen scheinen.

Offenes Sourcing von Daten

Vor fast einem Jahrzehnt gab der Cloudera-Mitbegründer Mike Olson eine kühne Erklärung ab: „Keine dominante Software-Infrastruktur auf Plattformebene ist in den letzten 10 Jahren in Closed-Source- und proprietärer Form entstanden.“ Olson hatte größtenteils recht. Splunk war in dieser Zeit entstanden und vielleicht ein paar andere Beispiele, aber unterm Strich hatte er recht.

Spulen Sie vor ins Jahr 2021 und Olsons Ausspruch ist bis auf wenige Ausnahmen ziemlich genau geblieben. Snowflake ist eine davon. Das Unternehmen, das sich selbst als Daten-Cloud-Unternehmen bezeichnet, hat es geschafft, ein großes Geschäft mit einem proprietären SaaS-Angebot in einer Branche aufzubauen, die von außergewöhnlichen Open-Source-Dateninfrastrukturen wie Apache Hadoop, Apache Arrow, Apache Spark und anderen überschwemmt wird.

Dies spiegelt vielleicht eine differenziertere Realität wider: Unternehmen mögen intuitiv „open“ wollen, aber sie legen einen größeren Wert auf „working“. Dies wird seit Jahren deutlich, da Unternehmen Managed Services eingeführt haben, um die Nutzung von Open-Source-Software zu erleichtern, oder, im Fall von Unternehmen wie Fauna und Snowflake, Managed Services anbieten, die überhaupt nicht auf Open Source basieren.

Beides, „Open Source“ und „einfach zu bedienen“ in einem Service zu vereinen, ist der heilige Gral, aber wenn Unternehmen sich für eines entscheiden müssen, werden sie die Lösung wählen, die für sie am einfachsten ist. Schließlich kann sich ein Kunde an Apache Spark, Dremio oder eine beliebige Anzahl von Tools wenden, um Data Warehouses oder Data Lakes zu erstellen, dennoch haben Tausende von Kunden im letzten Jahr rund eine halbe Milliarde Dollar mit Snowflake ausgegeben.

Warum also verteidigt Snowflake eine Position, die seinen Kunden zu gefallen scheint?

Produktentwicklungsprozess: Zur Hardware per Open Source

Das sind eine Menge Worte

Zwischen den beiden Beiträgen hat Snowflake eine Menge Aufwand betrieben (3.798 Wörter im Snowflake-Blog und 2.266 im InfoWorld-Beitrag), um zu sagen: „Wir denken nicht, dass alles Open sein sollte.“ Das ist eine Menge digitaler Tinte, die verschwendet wurde, um eine klare und vollkommen akzeptable Botschaft zu verschleiern, der so ziemlich jeder Anbieter auf dem Planeten zustimmt. Im InfoWorld-Blog preist das Unternehmen zum Beispiel die hervorragenden Beiträge seiner Mitarbeiter zur Open-Source–Datenbank FoundationDB an, die das Unternehmen in seiner Infrastruktur verwendet. Großartig!

Aber dann folgt dieser Aussage ein peinlicher Zusatz: „Allerdings leiten wir daraus nicht ab, dass Open-Source-Software einen inhärenten Vorteil hat.“ Die Autoren verdoppeln dann das Argument, dass „Open kein Allheilmittel ist. Wir bemühen uns, fehlgeleitete Anwendungen von Open zu vermeiden, die kostspielige Komplexität anstelle von kostengünstiger Benutzerfreundlichkeit schaffen.“

Das Unternehmen beabsichtigt einfach (und sagt letztlich), dass Open Source ein Mittel ist, nicht der Zweck. Das ist wahr. Aber auf dem Weg dorthin stellt es auch irrige Behauptungen über Open Source auf, indem es suggeriert, dass es irgendwie die Fähigkeit der Firma, ihre Software zu sichern, verringern würde, was einfach nicht stimmt. „Bei Snowflake glauben wir an den Wert von Open Standards und Open Source, aber auch an den Wert von Data Governance und Sicherheit“, sagt der Mitbegründer des Unternehmens im InfoWorld-Blog. Dieses „aber“ ist völlig unnötig und impliziert, dass offene Standards und Open Source die Data Governance und Sicherheit untergraben. Beides ist nicht wahr.

Es ist auch die falsche Prämisse, dass Quellcode für alle nützlich sein muss, um überhaupt nützlich zu sein. Auf dem Firmenblog sagen die Autoren: „Der Abfrageprozessor einer anspruchsvollen Datenplattform wird typischerweise von Dutzenden von Absolventen eines PhD-Programms gebaut, über Jahre hinweg weiterentwickelt, verfeinert und optimiert. Die Verfügbarkeit von Quellcode erhöht nicht unbedingt die Fähigkeit, sein Innenleben zu verstehen.“

Michael Fischer, ein Container-Experte bei AWS, greift dies auf: „Bei Open Source ging es nicht darum, den Benutzern zu ermöglichen, die Software zu verstehen und zu verbessern. Es geht darum, der Welt zu ermöglichen, dies zu tun. Nur weil relativ wenige Leute in der Lage sind, den Code des Linux-Kernels zu verstehen oder zu patchen, bedeutet das nicht, dass seine Offenheit wenig Einfluss hatte. Es ist ein wenig selbstgefällig und beleidigend, vorzuschlagen, dass sie nicht teilen sollten, weil nur Doktoranden es verstehen würden. In der Tat macht die Wissenschaft Fortschritte durch das Teilen und Veröffentlichen. Das ist der Sinn von wissenschaftlichen Journalen und Konferenzen. Die Kunst schreitet durch Offenlegung voran.“

Fischer hat recht, aber natürlich gibt es kein Gesetz, das vorschreibt, dass Snowflake seinen Code, seine Dateiformate oder irgendetwas anderes offenlegen muss oder sogar sollte. Dave McCrory, VP of Growth und Global Head of Insights and Analytics bei Digital Realty und langjähriger Cloud– und Open-Source-Beobachter, weist darauf hin: „Nicht jede Software muss oder sollte Open-Source sein. Open Source ist ein geeignetes Lizenz-/Modell für eine Menge Software, aber nicht für alle.“

Ob Snowflake das tun sollte, ist letztendlich eine Entscheidung für seine Kunden, und basierend auf den Umsätzen scheint es, dass es den Kunden von Snowflake egal ist. Also noch einmal, warum die Beiträge schreiben?

Verkaufen nach Ladenschluss

Die meisten der großen Konkurrenten von Snowflake bieten ebenfalls eigene Datenwolken/Plattformdienste an. (Offenlegung: Ich arbeite für AWS, einem Partner und Konkurrenten von Snowflake, aber ich bin nicht an diesem Teil des Geschäfts beteiligt). Es ist zum Beispiel höchst unwahrscheinlich, dass Oracle-Verkäufer Snowflake fertig machen, weil es proprietäre Software anbietet. Vielleicht kommt der Druck von Databricks oder anderen Open-Source-Anbietern?

Databricks hat vor kurzem sein Delta-Sharing-Projekt gestartet, ein offenes Protokoll für den sicheren Austausch von großen Datensätzen in Echtzeit. Dies war nur eine der Ankündigungen von Databricks auf dem Data + AI Summit, der den Slogan „The future is open“ trug. Auch ist Databricks nicht allein mit der Positionierung seiner Daten-Cloud als offene Alternative zu Lösungen wie Snowflake. Der Journalist Sean Kerner sagte mir: „Sie sollten mal meinen Posteingang sehen… Jeder zweite Pitch lautet ‚X ist eine offene Alternative zu Snowflake.‘ „

Gaia-X: Floppt die europäische Daten-Cloud?

Snowflake seinerseits beharrt darauf, dass offen nicht die richtige Antwort ist, was Dateiformate, Quellcode und mehr angeht. Zumindest nicht immer. Vielleicht ist es richtig. Aber Tausende von Wörtern zu schreiben, um gegen Open zu argumentieren, anstatt einfach den Wert für die Kunden durch seine Angebote zu demonstrieren ist schlechtes Marketing. Wie ich im Jahr 2020 über den Snowflake-Börsengang schrieb:

„Entwickler waren noch nie übermäßig überzeugt von Open Source. Der Grund für [Olsons Bemerkung über einen] „umwerfenden“ Trend ist einfach, dass Open Source es Entwicklern leichter gemacht hat, ihre Arbeit zu erledigen, dank einer qualitativ hochwertigen, leicht zugänglichen, quelloffenen Dateninfrastruktur. Es gibt natürlich noch andere Vorteile, wie die Communities, die oft mit Open-Source-Projekten einhergehen, gepaart mit dem Wunsch, mehr granulare Kontrolle über den eigenen Software-Stack zu haben. Aber letztendlich hat sich Open Source durchgesetzt, weil es Entwicklern ermöglicht, „—- zu erledigen“. Das ist auch der Grund, warum es Entwickler gibt, die gerne Open-Source-Software wie Apache Airflow verwenden, um Daten in ihre proprietäre Snowflake-Datenplattform zu laden. Das ist keine kognitive Dissonanz. Es ist Pragmatismus.“

Indem Snowflake seine Entscheidungen rationalisiert, anstatt den Kunden einfach nur einen Mehrwert zu liefern, verwirrt es am Ende mehr, als dass es Klarheit schafft. Unternehmen wissen eindeutig zu schätzen, was es verkauft. Es gibt keinen Grund, sich dafür zu entschuldigen, nicht offen genug zu sein.

*Matt Asay schreibt unter anderem für InfoWorld.com.