Künstliche Intelligenz Nexus

Monitoring

IT-Monitoring ist der Prozess zur Erfassung von Kennzahlen zum Betrieb der Hardware und Software einer IT-Umgebung, um sicherzustellen, dass alle Funktionen erwartungsgemäß zur Unterstützung von Anwendungen und Diensten funktionieren.

Die grundlegende Überwachung wird durch Gerätebetriebsüberprüfungen durchgeführt, während die erweiterte Überwachung detaillierte Ansichten des Betriebsstatus bietet, einschließlich durchschnittlicher Antwortzeiten, Anzahl der Anwendungsinstanzen, Fehler- und Anforderungsraten, CPU-Auslastung und Anwendungsverfügbarkeit.

Das IT-Monitoring umfasst drei Bereiche, die als Basis, Software und Interpretation bezeichnet werden.

  • Foundation: Die Infrastruktur ist die unterste Schicht eines Software-Stacks und umfasst physische oder virtuelle Geräte wie Server, CPUs und VMs.
  • Software. Dieser Teil wird manchmal auch als Überwachungsabschnitt bezeichnet und analysiert, was auf den Geräten in der Basisstation funktioniert, einschließlich CPU-Auslastung, Last, Arbeitsspeicher und Anzahl der ausgeführten VMs.
  • Interpretation: Die gesammelten Metriken werden in Diagrammen oder Datendiagrammen dargestellt, häufig auf einem GUI-Dashboard.

Das IT-Monitoring kann sich auf Agenten verlassen oder agentenlos sein. Agenten sind unabhängige Programme, die auf dem überwachten Gerät installiert werden, um Daten zu Hardware- oder Software-Leistungsdaten zu sammeln und diese an einen Verwaltungsserver zu melden. Die Überwachung ohne Agenten verwendet vorhandene Kommunikationsprotokolle, um einen Agenten mit vielen der gleichen Funktionalitäten zu emulieren. Um beispielsweise die Servernutzung zu überwachen, installiert ein IT-Administrator einen Agenten auf dem Server. Ein Management-Server empfängt diese Daten vom Agenten und zeigt sie dem Benutzer über die Schnittstelle der IT-Überwachungssoftware an, häufig als grafische Darstellung der Leistung im Zeitverlauf. Wenn der Server nicht mehr wie vorgesehen funktioniert, weist das Tool den Administrator darauf hin, der das Element reparieren, aktualisieren oder ersetzen kann, bis es dem Betriebsstandard entspricht.