Promotion

News

„Humanity’s Last Exam“ bringt KI an ihre Grenzen

Ein neuer Test, „Humanity’s Last Exam“, zeigt die Grenzen aktueller Large Language Models auf. Selbst Spitzenmodelle wie GPT-4 und Google Gemini scheitern in vielen Bereichen kläglich. Ihre Erfolgsquote liegt unter zehn Prozent. Dr. Sören Möller, einer der Mitautoren von „Humanity’s Last Exam“, erklärt im Interview was diesen Test so besonders macht und welche Lehren sich daraus ziehen lassen. […]

News

Tuning-Tool für große Sprachmodelle als Open-Source-Programm

Große Sprachmodelle (LLMs) haben das Potenzial, die Arbeitslast zu automatisieren und zu reduzieren, einschließlich der von Cybersicherheitsanalysten. Generischen LLMs fehlt jedoch das domänenspezifische Wissen, um diese Aufgaben gut zu bewältigen. Aus diesem Grund hat das SophosAI-Team ein Framework zusammengestellt, das DeepSpeed nutzt. […]

News

Eignen sich KI-Chatbots fürs Krankenhaus?

Large Language Models bestehen medizinische Examen mit Bravour. Sie für Diagnosen heranzuziehen, wäre derzeit aber grob fahrlässig: Medizin-Chatbots treffen vorschnelle Diagnosen, halten sich nicht an Richtlinien und würden das Leben von Patientinnen und Patienten gefährden. Zu diesem Schluss kommt ein Team der Technischen Universität München. […]