6. April 2025

24. August 2023 it-daily.net | Georg Kostner*; Würth Phoenix

Monitoring Excellence: Die Kunst der Observability für moderne IT-Strukturen

Monitoring und Observability sind essenzielle Konzepte in einer dynamischen und sich ständig weiterentwickelnden IT-Landschaft. [...]

banner-909710_640 — Foto: GerdAltmann/Pixabay

Das Monitoring konzentriert sich dabei auf die kontinuierliche Datenerfassung und -analyse, um die Performance eines Systems zu überwachen und potenzielle Probleme frühzeitig zu erkennen – ähnlich einem Frühwarnsystem, das wertvolle Infos über den Zustand der IT liefert.

Die Vielfalt und Bedrohungen moderner IT-Infrastrukturen sind mittlerweile aber so komplex geworden, dass traditionelle Monitoring-Methoden zunehmend an ihre Grenzen stoßen. Oft liefern sie nur isolierte Datenpunkte, die es erschweren, Zusammenhänge zwischen verschiedenen Systemkomponenten im Detail zu erkennen und umfassende Analysen durchzuführen.

Als Analogie können wir uns ein IT-System wie ein komplexes Labyrinth vorstellen, in dem unzählige Pfade und Hindernisse verborgen sind. Um dieses Labyrinth erfolgreich zu durchqueren und den reibungslosen Betrieb und die Sicherheit zu gewährleisten, ist nicht nur eine Überwachung von außen erforderlich, sondern auch eine gezielte Orientierung über das Geschehen innerhalb des Systems.

Genau hier kommt Observability ins Spiel. Im Gegensatz zur traditionellen Überwachung, die sich auf herkömmliche Messgrößen beschränkt, konzentriert sich Observability in einem 3-Säulenmodell auch auf folgende Aspekte:

Metriken als quantitative Datenpunkte, die das Verhalten eines Systems messen, z. B. CPU-Auslastung, Speicherverbrauch oder Anzahl der Anfragen pro Sekunde. Diese Datenpunkte sind entscheidend, um die Gesundheit und Leistungsfähigkeit eines IT-Systems zu bewerten.
Log-Daten, die detaillierte Einblicke in die Ereignisse und Vorgänge innerhalb eines IT-Systems geben. Sie umfassen Protokolle, Fehlermeldungen, Warnungen und andere relevante Informationen, die bei der Diagnose von Problemen und der Fehlerbehebung von entscheidender Bedeutung sind.
Schließlich Traces für Application Performance Management: Dies sind Transaktionsverfolgungsdaten, die den Weg einer Anfrage durch das IT-System zeigen. Sie helfen dabei, Engpässe und Flaschenhälse zu identifizieren und die Ursachen von Leistungsproblemen zu ermitteln.

Ein entscheidender Schritt zur Maximierung der Observability besteht nun darin, übergreifende Leistungsindikatoren (KPIs) als zentrale Messgrößen für das Säulenprinzip zu integrieren. Diese KPIs ermöglichen es, die Performance und Effizienz der IT-Systeme zu bewerten und die Auswirkungen auf die Benutzererfahrung zu verstehen.

Im Rahmen unseres Modells sind insbesondere folgende KPIs von besonderer Bedeutung:

Scalability (Skalierbarkeit) und damit die Fähigkeit eines IT-Systems, mit wachsenden Anforderungen und Lasten umzugehen, ohne dabei die Leistung zu beeinträchtigen. Dieser KPI gibt Aufschluss darüber, wie gut das System mit steigender Nutzerzahl oder Datenmenge skalieren kann.
Response Time (Reaktionszeit), das heißt die Zeit zu erfassen, die ein IT-System benötigt, um auf eine Anfrage zu reagieren. Eine schnelle Response Time ist entscheidend, um eine reibungslose und zufriedenstellende Benutzererfahrung zu gewährleisten.
Latency (Verzögerungszeit) erfasst schließlich die Verzögerungszeit, die bei der Übertragung von Daten zwischen verschiedenen Komponenten im IT-System auftritt. Eine geringe Latenz ist wichtig, um eine reibungslose Kommunikation zwischen den Komponenten sicherzustellen und Verzögerungen für Benutzer zu minimieren.
Throughput (Durchsatz) beschreib die Anzahl der Anfragen, die ein IT-System pro Zeiteinheit verarbeiten kann. Ein hoher Durchsatz zeigt die Effizienz und Skalierbarkeit des Systems.

Durch die Datenerfassung und -analyse von Metriken, Log-Daten und Traces können wir diese KPIs genau messen und verstehen, wie sie sich auf die Gesamtleistung des IT-Systems auswirken. Wenn eines der KPIs sich verschlechtert oder ein Problem auftritt, ermöglicht uns die Observability, die Ursache schnell zu identifizieren und gezielte Maßnahmen zur Optimierung des Systems zu ergreifen.

Opentelemetry als immer beliebterer Standard für Observability

Im Streben nach einer noch umfassenderen Observability-Lösung hat sich Opentelemetry als ein vielversprechender neuer Standard herauskristallisiert. Es bietet eine innovative Möglichkeit, unser Säulenmodell nahtlos zu integrieren und gleichzeitig die Erfassung und Analyse relevanter KPIs zu erleichtern.

Durch die effektive Verknüpfung von Metriken, Log-Daten und Traces entsteht damit ein ganzheitliches Bild der IT-Systemleistung, wodurch KPIs wie Scalability, Response Time, Latency und Throughput präziser gemessen und analysiert werden können. Systemadministratoren verfügen damit über vielfältige Möglichkeiten, um IT-Systeme genauer zu verstehen, Leistungsprobleme frühzeitig zu erkennen und gezielte Maßnahmen zur Verbesserung zu ergreifen.

Nahtlose Integration in jede Umgebung

OpenTelemetry bietet im Vergleich zu ähnlichen Lösungen auch einen deutlichen Vorteil durch seine Offenheit und Flexibilität. Als Open-Source-Projekt wird es von der Cloud Native Computing Foundation (CNCF) unterstützt und setzt auf eine breite Community, die aktiv an der Entwicklung und Verbesserung beteiligt ist.

Ein weiterer Pluspunkt ist seine plattformübergreifende Natur, die es ermöglicht, verschiedene Programmiersprachen und Technologien zu unterstützen. Dadurch kann es nahtlos in bestehende Anwendungen integriert werden, unabhängig davon, ob diese in einer Cloud-Umgebung, lokal oder in einem Container ausgeführt werden.

Die Rolle von Künstlicher Intelligenz und Machine Learning

Ein weiterer wichtiger Aspekt der Observability ist die Einbindung von künstlicher Intelligenz (AI) und maschinellem Lernen (ML). KI und ML können dazu beitragen, Muster und Anomalien in den Observability-Daten zu erkennen, um frühzeitig auf potenzielle Probleme hinzuweisen und prädiktive Analysen durchzuführen. Dies ermöglicht es Unternehmen, proaktiv auf Leistungsprobleme zu reagieren und Ausfällen vorzubeugen.

Fazit

OpenTelemetry bietet eine wertvolle Ergänzung für jede Monitoring- und Observability-Strategie, dank seiner Kombination aus Offenheit, Flexibilität und Detailliertheit in der Analyse und Auswertung. Die Integration von KI und ML erleichtert es den IT-Teams zudem, proaktiv auf potenzielle Probleme zu reagieren und eine hochgradig performante IT-Infrastruktur zu gewährleisten. Dies führt zu einem umfassenden Verständnis des Verhaltens und der Interaktionen im System, was wiederum zu einer schnelleren Diagnose von Problemen führt.

Die Anpassungsfähigkeit von OpenTelemetry ermöglicht es darüber hinaus, spezialisierte Tools und Funktionen anzubieten, um OpenTelemetry nahtlos in bestehende Monitoring-Infrastrukturen zu integrieren, wie etwa dem Monitoringsystem NetEye von Würth Phoenix, das diese Lösung bereits vollständig unterstützt.

Weiterführende Informationen zu Observability und Opentelemetry finden Sie auch in diesem Artikel unseres Partners Elastic.

*Georg Kostner ist der Business Unit Leiter bei Würth Phoenix und verfügt über mehr als 20 Jahre umfangreiche Erfahrung in den Bereichen IT-System Management, Unified Monitoring und IT-Sicherheit. Sein tiefgreifendes Fachwissen und seine umfassende Expertise machen ihn auch zu einem gefragten Experten auf dem Gebiet der Observability.

Datenschutzverstöße in Österreich nehmen zu

4. April 2025

2024 kam es in Europa zu 130.000 Datenschutzverstößen – davon rund 1.300 in Österreich. Für Österreich bedeutet das einen Anstieg der Datenschutzverstöß von 21 Prozent im Vergleich mit dem Jahr 2023. Nur 4 Länder verzeichneten Rückgänge bei den Verstößen. Seit dem DSGVO-Start wurden in der EU 5,9 Milliarden Euro Bußgelder verhängt. […]

Erster Pre-6G Videostream in Österreich

4. April 2025

Im A1 Technologiezentrum in Wien haben A1 und Technologiepartner Nokia den nächsten Schritt in der Evolution des Mobilfunks gesetzt: Erstmals in Mitteleuropa wurde ein Pre-6G Videostream im oberen 6-GHz-Spektrum durchgeführt. […]

Best Practices zum Umgang mit Lookalike-Domains

4. April 2025

Bei Cyberangriffen, die Lookalike-Domains nutzen, registrieren Angreifer für sich Domains, die legitimen Domains echter Unternehmen sehr ähnlich sehen. Nachdem sie sich die entsprechende Domain gesichert haben, beginnen sie dann, die dazugehörigen E-Mail-Server für eine E-Mail-Angriffskampagne herzurichten. […]

Europas digitale Souveränität beginnt mit IT-Sicherheit „made in EU“

4. April 2025

Die geopolitischen Herausforderungen der letzten Jahre zeigen: Europa muss unabhängiger werden – auch in der IT-Sicherheit. Der europäische IT-Sicherheitshersteller ESET warnt davor, sich auf Anbieter außerhalb der EU zu verlassen und fordert Unternehmen sowie Behörden auf, sich bewusst für europäische Lösungen zu entscheiden. […]

Digitalisierung der Immobilienbranche schreitet voran

4. April 2025 Simon Müller *

Die Digitalisierung stellt die Immobilienwirtschaft vor zahlreiche Herausforderungen. Ein zentraler Aspekt ist der Fachkräftemangel, der laut Umfragen 79 Prozent der Unternehmen dazu drängt, KI als Schlüsseltechnologie für die Automatisierung von Routineaufgaben einzusetzen. […]

Ein Großteil der Unternehmen stuft seine Sicherheitslage als stabil oder verbessert ein. (c) Pexels

Deloitte-Studie: Zwischen Realität und gefühlter Sicherheit

4. April 2025 Wolfgang Franz

Österreichische Unternehmen stehen vor einer zunehmend komplexen Cyber-Bedrohungslage, die durch den technologischen Fortschritt – insbesondere durch künstliche Intelligenz – weiter verschärft wird. Der Deloitte Cyber Security Report 2025 zeigt auf, wie Unternehmen auf diese Herausforderungen reagieren. ITWelt.at hat sich die Studie angesehen. […]

Rainer Schneemayer, Geschäftsführer bei Timewarp (c) timeline / Rudi Handl

Maßgeschneiderte Lösungen zur Steigerung der Resilienz

3. April 2025 Klaus Lorbeer

In Zeiten multipler Krisen spielt eine hohe Unternehmensresilienz sowie ein gutes Business Continuity Management eine wichtige Rolle. Wie man sein Unternehmen resilienter machen und im Fall eines Falles die Ausfallzeiten so gering wie möglich halten kann, erklärt Rainer Schneemayer, Geschäftsführer bei Timewarp, im ITWELT.at-Interview. […]

Raiffeisen Bank International etabliert internationales FinTech-Scout-Netzwerk. (c) Unsplash

RBI setzt auf globale FinTech-Scouts

3. April 2025 pi/cb

Die Raiffeisen Bank International (RBI) verstärkt ihre Bemühungen im Bereich Finanzinnovationen durch die Etablierung eines global verteilten Teams von FinTech-Scouts. Diese Experten sollen Marktentwicklungen und neue Geschäftsmodelle aufzeigen sowie direkten Zugang zu relevanten Technologieanbietern weltweit ermöglichen. […]

Hightech-Crime-Report: Advanced Persistent Threats setzen Europa unter Druck

3. April 2025

Mit einem Anstieg von 22 Prozent gegenüber dem Vorjahr nahmen betrügerische Machenschaften 2024 weltweit zu. Europäische Finanzdienstleister waren mit 34 Prozent aller Betrugsfälle am stärksten betroffen, gefolgt von der Transportbranche und dem Regierungs- und Militärsektor. Auch bei Phishing-Angriffen setzte sich der Aufwärtstrend fort: Mehr als 80.000 Phishing-Websites wurden 2024 enttarnt – ein Anstieg um 22 Prozent gegenüber dem Vorjahr. […]

Monitoring Excellence: Die Kunst der Observability für moderne IT-Strukturen

Monitoring und Observability sind essenzielle Konzepte in einer dynamischen und sich ständig weiterentwickelnden IT-Landschaft. [...]

Opentelemetry als immer beliebterer Standard für Observability

Nahtlose Integration in jede Umgebung

Die Rolle von Künstlicher Intelligenz und Machine Learning

Fazit

Mehr Artikel

Datenschutzverstöße in Österreich nehmen zu

Erster Pre-6G Videostream in Österreich

Best Practices zum Umgang mit Lookalike-Domains

Europas digitale Souveränität beginnt mit IT-Sicherheit „made in EU“

Digitalisierung der Immobilienbranche schreitet voran

Deloitte-Studie: Zwischen Realität und gefühlter Sicherheit

Maßgeschneiderte Lösungen zur Steigerung der Resilienz

RBI setzt auf globale FinTech-Scouts

Hightech-Crime-Report: Advanced Persistent Threats setzen Europa unter Druck

Be the first to comment

Leave a Reply Antworten abbrechen