Wie Tinder mit der Bilderkennung von AWS noch bessere Übereinstimmungen generiert

Die beliebte Dating-App Tinder verwendet die Bilderkennungs-technologie von Amazon Web Services (AWS), um Premium-Nutzer besser kategorisieren und aufeinander abstimmen zu können. [...]

Die Bilderkennung von Amazon Web Services ermöglicht es der Dating-App noch bessere Übereinstimmungen zu generieren (c) Pixabay.com

Auf der AWS re: Invent letzte Woche in Las Vegas erläuterte Tom Jacques, Vice President of Engineering bei Tinder, wie das Deep Learning orientierte AWS Rekognition genutzt wird, um die wichtigsten Merkmale eines Benutzers zu ermitteln, indem er die 10 Milliarden täglich hochgeladenen Fotos abruft und dementsprechend auswertet.

„Wir stehen vor der Herausforderung, genau zu verstehen, wen unsere Mitglieder sehen wollen, mit wem sie zusammenpassen, wer mit wem chatten wird, welche Inhalte wir ihnen zeigen und wie wir diese am besten präsentieren können“, erklärte Jacques.

Tinder nimmt täglich 40 TB an Daten in seine Analyse- und ML-Systeme auf, um Übereinstimmungen zu ermöglichen, die wiederum von AWS Cloud Services gestützt werden.

Tinder ist außerdem sehr wohl bekannt, dass das Hauptkriterium dafür, wer gematcht wird und wer nicht, Fotos sind: „Wir sehen es an den Daten: Je mehr Bilder jemand hat, desto höher ist die Wahrscheinlichkeit, dass er mit jemand anderem gematcht wird.“

Wenn ein Benutzer sich neu auf Tinder registriert, postet er normalerweise eine Reihe von Bildern von sich selbst und eine kurze Biografie. Auf letztere verzichten – laut Jacques – immer mehr Menschen, weshalb die Entwickler einen Weg finden mussten, sich ihre Daten woanders zu holen, ohne dabei die Qualität der jeweiligen Empfehlungen zu beeinflussen.

Rekognition ermöglicht es Tinder, diese unzähligen Fotos automatisch mit Persönlichkeitsmarkierungen – also z. B. eine Person mit einer Gitarre als „Musiker“ oder „kreativ“ oder jemanden mit einer Kletterausrüstung als „abenteuerlich“ oder „im Freien“ – zu kennzeichnen.

Neben strukturierten Daten wie Bildungs- und Jobinformationen und unstrukturierten Rohtextdaten verwendet Tinder diese Tags zur Anreicherung seiner Benutzerprofile. Im Hintergrund extrahiert Tinder jedoch „all diese Informationen und führt sie in [seinen] Features Store ein, einen einheitlichen Service, der es [ihnen] ermöglicht, Online, Streaming und Batch-Processing zu verwalten.“ Diese Daten werden wiederum vom Tagging-System dazu genutzt, um festzulegen, was in einem Profil hervorgehoben werden soll.

Kurz gesagt, Rekognition bietet Tinder die Möglichkeit, „skalierbar auf das zugreifen zu können, was im Inneren dieser Fotos liegt, wichtig ist und unseren Datenschutz- und Sicherheitsanforderungen entspricht“, erklärte Jacques.

„Es bietet nicht nur eine Cloud-Skalierbarkeit, die mit den vorhandenen mehreren Milliarden von Bildern zurechtkommt, sondern auch leistungsstarke Funktionen, die unsere Experten und Data Scientists nutzen können, um ausgefeilte Modelle zu erstellen, mit deren Hilfe die komplexe Probleme innerhalb der Tinder-App gelöst werden können“, fügte er hinzu. „Auch Datenschutz ist uns wichtig und Rekognition liefert uns separate APIs, um die notwendige Kontrolle zu ermöglichen und nur auf die entsprechend gewünschten Funktionen zuzugreifen. Wenn wir auf Rekognition aufbauen, können wir die Tag-Abdeckung mehr als verdoppeln.“

Premium-Mitglieder auf Tinder erhalten außerdem Zugriff auf die sogenannte Top-Picks-Funktion. Das im September gestartete Programm bietet Gold-Nutzern – der teuersten Gruppe bei rund 28 Euro pro Monat – einen kuratierten Feed an „qualitativ hochwertigen Übereinstimmungen“.

Alle Tinder-Benutzer erhalten zusätzlich einen kostenlosen Top-Pick-Tag pro Tag. Gold-Abonnenten können jedoch jederzeit auf das vorhandene Diamant-Symbol tippen, um täglich aktualisierte Top-Picks zu erhalten.

„Wenn ein Mitglied seine (oder ihre) Top-Auswahl wünscht, fragen wir unser Empfehlungscluster ab – dieselbe zugrunde liegende Technologie, die unsere Kern-Erkennungen betreibt –, doch mit Fokus darauf, welche Ergebnisse die Nutzer erzielen möchten, und mit dem Ziel, wirklich personalisierte und qualitativ hochwertige Übereinstimmungen zu erzielen“, meint Jacques.

„Im Vergleich zu unseren Kern-Empfehlungen haben die Top-Picks einen starken Zuwachs an Aktivität gezeigt. Wenn wir diese Tags also in Profilen sehen, können wir daran eine deutliche Steigerung von weiteren 20 Prozent festmachen“, so Jacques.

Mit Blick in die Zukunft meint Jacques, er „freue sich sehr darauf, einige der neuesten Funktionen [von AWS] zu nutzen, um die Genauigkeit des Modells noch weiter zu erhöhen, hierarchische Daten hinzuzufügen, um den Inhalt besser zu kategorisieren und zu clustern sowie zu verstehen, welche Objekte in den jeweiligen Fotos vorhanden sind, wo sie sich befinden und wie mit ihnen interagiert wird. [Tinder] kann dies nutzen, um wirklich tief in das Geschehen [seiner] Mitglieder einzutauchen und ihnen einen noch besseren Service zu bieten.“

*Scott Carey ist Redakteur bei Computerworld.com


Mehr Artikel

Gregor Schmid, Projektcenterleiter bei Kumavision, über die Digitalisierung im Mittelstand und die Chancen durch Künstliche Intelligenz. (c) timeline/Rudi Handl
Interview

„Die Zukunft ist modular, flexibel und KI-gestützt“

Im Gespräch mit der ITWELT.at verdeutlicht Gregor Schmid, Projektcenterleiter bei Kumavision, wie sehr sich die Anforderungen an ERP-Systeme und die digitale Transformation in den letzten Jahren verändert haben und verweist dabei auf den Trend zu modularen Lösungen, die Bedeutung der Cloud und die Rolle von Künstlicher Intelligenz (KI) in der Unternehmenspraxis. […]

News

Richtlinien für sichere KI-Entwicklung

Die „Guidelines for Secure Development and Deployment of AI Systems“ von Kaspersky behandeln zentrale Aspekte der Entwicklung, Bereitstellung und des Betriebs von KI-Systemen, einschließlich Design, bewährter Sicherheitspraktiken und Integration, ohne sich auf die Entwicklung grundlegender Modelle zu fokussieren. […]

News

Datensilos blockieren Abwehrkräfte von generativer KI

Damit KI eine Rolle in der Cyberabwehr spielen kann, ist sie auf leicht zugängliche Echtzeitdaten angewiesen. Das heißt, die zunehmende Leistungsfähigkeit von GenAI kann nur dann wirksam werden, wenn die KI Zugriff auf einwandfreie, validierte, standardisierte und vor allem hochverfügbare Daten in allen Anwendungen und Systemen sowie für alle Nutzer hat. Dies setzt allerdings voraus, dass Unternehmen in der Lage sind, ihre Datensilos aufzulösen. […]

Be the first to comment

Leave a Reply

Your email address will not be published.


*