MIT-Forscher haben ein Modell entwickelt, das anstatt mit Hilfe von Big Data vielmehr durch Verwendung von limitierten Daten ("Small Data") bessere Ergebnisse liefert als Analysten. [...]
Forscher am Massachusetts Institute of Technology (MIT) haben ein automatisiertes Modell entwickelt, das die vierteljährlichen Absatzzahlen von Unternehmen signifikant besser vorhersagen kann als Experten. Der Clou: Dabei werden Daten in stark eingeschränktem Ausmaß verwendet.
In der Finanzwelt gibt es ein wachsendes Interesse daran, ungenaue, aber häufig generierte Verbraucherdaten – so genannte „alternative Daten“ – zu verwenden, um die Gewinne eines Unternehmens für Handels- und Investitionszwecke vorhersagen zu können. Alternative Daten können Kreditkartenkäufe, Standortdaten von Smartphones oder auch Satellitenbilder sein, die zeigen, wie viele Autos auf dem Parkplatz eines Händlers geparkt sind. Die Kombination von alternativen Daten mit klassischen, aber spärlicher vorhandenen Finanzdaten, wie z.B. Quartalsergebnissen, Pressemitteilungen und Aktienkursen, kann ein klareres Bild der finanziellen Situation eines Unternehmens zeichnen – und das sogar auf täglicher oder wöchentlicher Basis.
Die MIT-Forscher ließen mit ihrem Modell die Quartalsgewinne von 34 Unternehmen prognostizieren (insgesamt 306 Quartalsprognosen) und übertrafen dabei die kombinierten Schätzungen der Wall Street-Experten bei 57,2 Prozent der Vorhersagen. Insbesondere hatten die Analysten Zugang zu allen verfügbaren privaten oder öffentlichen Daten und anderen maschinellen Lernmodellen, während das Modell der Forscher einen sehr kleinen Datensatz der beiden Datentypen verwendete.
„Alternative Daten sind diese seltsamen Stellvertretersignale, die helfen, die zugrunde liegenden Finanzzahlen eines Unternehmens zu verfolgen“, sagt MIT-Postdoc Michael Fleder vom Labor für Informations- und Entscheidungssysteme (LIDS). Er und seine Kollegen haben für ihr Modell zunächst anonymisierte wöchentliche Kreditkartendaten als zusätzliche Informationsquelle zu den Quartalszahlen genutzt.
Small Data schlägt Big Data
Die MIT-Methode widerspricht der bisher dafür verwendeten Big-Data-Ansatz. Denn jeder finanzielle Input, wie z.B. ein Quartalsbericht oder eine wöchentliche Kreditkartensumme, ist nur ein Datenpunkt. Quartalsberichte aus zwei Jahren kommen solcherart auf insgesamt acht Datenpunkte. Kreditkartendaten aus dem gleichen Zeitraum liefern nur etwa 100 weitere „schwammige“ und unstrukturierte Datenpunkte, d.h. sie enthalten potenziell uninterpretierbare Informationen. „Wir haben ein ‚Small Data‘-Problem„, folgert Fleder. „Mann bekommt nur einen kleinen Ausschnitt daraus, was die Leute ausgeben, und muss aus diesem Bruchteil Daten extrapolieren und schließen, was wirklich vor sich geht.“
Als nächsten Schritt arbeitet das MIT-Team daran, die Kreditkartendaten mit anderen Informationen wie Standortdaten zu kombinieren, um die Vorhersagen noch genauer zu machen. Doch nicht nur für den Finanzbereich sei das Modell sinnvoll, auch in der Sozial– und Politikwissenschaft kann es helfen, aggregierte, anonyme Daten zu untersuchen. „Es ist für jeden nützlich, der herausfinden will, was die Menschen tun“, ist Fleder überzeugt.
Be the first to comment