Es gibt nicht nur Voice of Switzerland, GNTM, Oscars, MTV Music Awards usw. Auch in der IT werden regelmässig “Awards” vergeben.

Bereits zum siebten Mal in Folge wurde im Rahmen der LinuxQuestions.org Members Choice Awards 2012 die OpenSource Monitoring Lösung Nagios zum Sieger gekürt.

Nagios hat mit mehr als 55 % der Stimmen seine schärften Konkurrenten wie Zabbix (14.7 %) , Zenoss (4.7 %) und OpenNMS (4.7 %) in die Schranken gewiesen. Auch der Nagios Fork “Icinga” ist mit 4.12 % keine wirkliche Gefahr für das Original.

Die Dominanz von Nagios auf dem Monitoring Markt wird noch deutlicher, wenn alle Monitoring Lösungen welche ihre Wurzeln in Nagios haben zusammenzählt werden. Zu diesen Nagios Kindern gehören: GroundWork Monitor, Icinga, op5, Opsview und Shinken.

Wie bei allen IT Produkten hängt der Erfolg immer damit zusammen, wie ein Produkt in eine bestehende IT Infrastruktur eingebunden werden kann. Zu diesem Zweck gibt es z.B. bei Nagios die Möglichkeit professionellen Support und Services von IT Dienstleistern einzukaufen. Nagios unterhält ein weltweites Partner Netzwerk aus Resellern und Service Partnern. Gerade für die erfolgreiche Einführung ist die Wahl des richtigen Partners wichtig und bei Nagios gibt es dazu qualifiziert Service Partner welche im Gegensatz zu reinen Resellern jahrelange Projekt-Erfahrung und entsprechende Referenzen mitbringen.

Interessantes Seminar über die Möglichkeiten, wie ein Monitoring Projekt scheitern kann:

Learn from the suffering of others!

At GroundWork, we’ve seen hundreds of ways people can monitor their infrastructure and application performance and availability. Some of those have been bad ideas. We’ve collected some of the best (or worst) and extracted the key lessons that can be learned.

Join GroundWork’s Mark Carey, Director of Support, and Hans Kriel, Chief Solution Architect, as they recount some war stories and how to avoid problems in your IT monitoring. Topics will include:

  • Mistakes of active and passive checks
  • Performance destroyers in virtual environments
  • Lies SLAs tell and how to avoid them
  • Autodiscovery: the double-edged sword

The webcast will take place on July 26 at 10am PST and will last 45 minutes.

Click Here to register.

VMware hat neben einem neuen Lizenzmodell in der neusten vSphere Version 5 auch neue Features für die Überwachung eingebaut. Für die Analyse des Netzwerkverkehrs zwischen virtuellen Maschinen untereinander, sowie auch zwischen virtuellen Maschinen und der physikalischen Netzwerkinfrastruktur sind die Virtuellen Distributed Switches VDS fähig sogenannte NetFlow v5 Records aufzuzeichnen und an einen NetFlow Collector weiterzuschicken. Weitere Informationen sind in folgendem Blog-Beitrag beschrieben. VMware Networking Blog

Um NetFlow Daten auszuwerten wird ein sogenannter NetFlow Collector benötigt. Neben kommerziellen Produkten hat sich in den letzten Jahren besonders die OpenSource Lösung ntop für die Analyse und grafische Darstellung von Netzwerk Verkehr etabliert. Für die Kapazitätsplanung, Troubleshooting, Performancemonitoring in grösseren VMware vSphere 5 Umgebungen ist diese neue Möglichkeit sehr hilfreich. Bis anhin konnte der Netzwerkverkehr auf Protokollebene zwischen virtuellen Maschinen nur ungenügend analysiert werden. Engpässe im virtuellen Netzwerkbereich konnten nur ungenügend erkannt werden.

Monitoringlösungen für den Enterprise Bereich sollten aus diesem Grund die Möglichkeit bieten NetFlow Analysen durchzuführen. Der führende Monitoringlösungsanbieter GroundWork OpenSource bietet in seiner aktuellen Version 6.5 das NetFlow Analyse Tool ntop kostenlos als NMS Modul für seine Enterprise Edition Kunden an.

Der amerikanische IT Monitoring Softwarehersteller GroundWork hat heute ein neues Lizenzierungsmodell für Non Profit Organisationen angekündigt. Weiter können auch Hersteller von Open Source Software profitieren und die Enterprise IT Monitoring Lösung von GroundWork kostenlos einsetzen.
Hier registrieren

Die schweizer Exportindustrie, Banken etc. müssen wegen dem hohen Schweizer-Franken und der Schuldenkrise an allen Rädchen schrauben um ihre Kosten in den Griff zu bekommen.

Warum nicht bei den IT Betriebskosten sparen und eine kostengünstigere Monitoringlösung einsetzen. Bereits mehrere schweizer Firmen haben sich dafür entschieden teure Wohlfühllösungen von BMC, HP, IBM und CA durch kommerzielle OpenSource basierende Monitoringlösungen zu ersetzen.

Die Lizenzkosten solcher Lösungen, z.B. GroundWork Monitor OpenSource werden meistens in US$ oder Euro verrechnet. Dadurch entsteht ein doppelter Spareffekt, einerseits sind die Lizenzen im Verhältnis zu rein kommerziellen Lösungen ein Bruchteil und weiter kann von den günstigen Währungskursen profitiert werden.

Kosteneinsparungen von bis zu 80 % pro Jahr sind keine Seltenheit. Da eine Planung und Umsetzung einer solchen Umstellung in grösseren Umfeldern mehrere Monate in Anspruch nimmt, ist der Zeitpunkt jetzt richtig um eine solche Lösung für das Jahr 2012 zu prüfen. Verschiedene schweizer Informatikfirmen bieten professionelle Dienstleistungen im IT-Monitoring mit OpenSource an. Als Marktführer hat sich in den letzten Jahren die RealStuff Informatik AG aus Bern in den Bereichen Beratung und Realisierung von Ablöseprojekten bei Banken, Versicherungen, Telekommunikationsanbietern, öffentliche Verwaltung etc. einen Namen gemacht.

Für die Überwachung von Microsoft Windows Systemen (Server, Exchange, SQL Server etc.) stellt Microsoft seit längerer Zeit mittels Windows Management Instrumentation (WMI) eine auf dem Common Interface Model (CIM) basierendes Technologie zur Verfügung. CIM ist der Industrie Standard welcher durch die Distributed Management Task Force (DMTF) unterhalten wird. In der DMTF sind alle grossen Hard- und Softwarehersteller Mitglied. (z.B. Microsoft, IBM, HP, RedHat, Oracle, Intel, VMware, Cisco usw.)

Die WMI Architektur bietet Schnittstellen (API) für sogenenannte WMI Consumer (Management Applikationen) an. Monitoring Systeme wie z.B. System Center Operations Manager (SCOM) verwenden diese Schnittstelle um Daten von logischen und physikalischen Komponenten (Harddisk, Netzwerkadapter, Datenbanksystem, Betriebsystem, Prozess, Services usw.) zu erhalten. Durch die offene Schnittstelle via WMI Scripting API können auch kostengünstige Monitoringlösungen wie z.B. Nagios, Zenoss, etc. von diesem Standard profitieren.

Die Verwendung der WMI Scripting API wird in einem aktuellen 15 Minuten dauernden Video durch den Monitoringsoftware Hersteller GroundWork aufgezeigt.

Bei der Planung eines IT Monitoringsystemes stellt sich immer wieder die Frage wie möglichst ein Systemunterbruch vermieden werden kann. Gerade in grösseren IT-Infrastrukturen oder als Service Provider ist eine hohe Verfügbarkeit ein wichtiges Thema. Neben der reinen Überwachung dienen heutige Monitoringlösung oft auch zum Messen von so genannten KPIs (Key Performance Indicators) welche die Einhaltung von Service Level Agreements (SLA) wiederspiegeln sollen.
Damit ein hoher Nutzen aus einer Monitoringlösung gezogen werden kann und eine zeitnahe Alarmierung im Fehlerfall möglich ist sind nach meiner Erfahrung die folgenden Punkte zu beachten.

  1. Das Monitoringsystem sollte entsprechend den Verfügbarkeitsanforderungen des IT Betriebes ausgelegt sein. Es macht keinen Sinn einen 7×24 Betrieb mit einer Anforderung von 99,9 % durch eine Monitoringlösung zu überwachen die diese Verfügbarkeit nicht erbringen kann.
  2. Mit einem möglichst einfachen Systemaufbau kann eine bessere Verfügbarkeit erreicht und die Gefahr von Ausfällen einzelner Komponenten reduziert werden. Ein Monitoringsystem welches aus verschiedenen Komponenten, verteilt auf mehrere Systeme, wie z.B. DatenbankServer, WebServer, ReportingServer, ManagementServer etc. besteht, wird immer eine schlechtere Verfügbarkeit als eine Single-Server Installation haben.
  3. Abhängigkeiten von Storage oder Virtualisierungs-Infrastrukturen sollten möglichst vermieden werden. Im Falle eines Problemes der Virtualisierungs-Umgebung wird ein virtualisiertes Monitoringsystem evtl. nicht mehr korrekt funktionieren und z.B. eine Alarmierung nicht mehr möglich sein. Dasselbe gilt auch für Storage (SAN) Infrastrukturen.
  4. Für das Monitoringsystem sollte möglichst eine dedizierte Serverhardware verwendet werden. Redundanzen von Netzwerkkarte, Netzteilen und RAID-System sollten selbstverständlich sein.
  5. Ein direkt an das Monitoringsystem angeschlossenes GSM-Modem wird auch bei einem Netzwerkausfall noch eine SMS versenden können.
  6. Eine Benutzerverwaltung via LDAP (z.B. Active Directory) birgt die Gefahr, dass bei einem Ausfall oder Störung desselben keine Authenfizierung mehr möglich ist und das Anmelden am Monitoringsystem nicht mehr korrekt funktioniert. Für solche Notfälle muss das Monitoringsystem zusätzlich über eine lokale Benutzerauthenfizierung verfügen.
  7. Sogenannte HA (High Availability) Lösungen können nur durch den Einsatz von entsprechender Clustering-Software erreicht werden. Virtuelle Fault Tolerance Lösungen genügen diesem Anspruch nicht, diese bieten nur eine höhere Verfügbarkeit bei Hardware- oder Betriebssystemausfällen. Fehlfunktionen oder Komplettausfälle von Applikationen (z.B. Monitoringapplikation) = Service Availability (SA), können nur mit entsprechenden Zusatzprodukten erkannt und vermieden werden.
  8. Nur HA und SA taugliche Cluster-Lösungen erlauben die unterbruchsfreie Wartung des Monitoringsystems wie z.B. Systemupgrades, Hardwareausbau etc.. Dadurch ist die Überwachung der IT-Infrastruktur immer gewährleistet und eine lückenlose Messung von SLA relevanten Daten möglich.
  9. Für den Disaster Fall muss natürlich immer der Zugriff auf zeitnahe Datenbackups gewährleistet sein. Regelmässige Tests der Backupdaten und des Recovery Prozesses sind ebenfalls nötig.

Ein mögliche Lösung einer HA tauglichen Monitoringumgebung wurde durch die Firma RealStuff Informatik AG für die Migros realisiert. Dazu wurde das Produkt Lifekeeper von SIOS (vormals SteelEye) eingesetzt. mehr…. (nur in Englisch)

Der amerikanische Softwarehersteller GroundWork Inc. hat eine neue Version der erfolgreichen Monitoringplattform GroundWork Monitor veröffentlicht.

Neben vielen Bugfixes sind in der Version 6.4  vor allem Neuerungen in den folgenden Bereichen implementiert worden:

  • Verbesserter Monitoring Agent (GDMA) für die Überwachung von Microsoft Windows Server Systemen inkl. Cluster Server
  • Rollenbasierende “Views” von NagVis Maps und Diagrammen
  • Zentralisierte Konfigurations und PlugIn Updates für Monitoring Agenten (Windows, Linux, Unix)
  • Verbesserte Authentifikations und Zugriffskontrolle  via Active Directory, LDAP und JOSSO

Alle Neuerungen können in der Produktbeschreibung und den Release Notes von GroundWork nachgelesen oder als Live Demonstration via Webcast angeschaut werden.

GroundWork Monitor ist eine offene Plattform und besteht aus verschiedenen OpenSource Projekten. Unter anderem sind dies Nagios, NagVis, Cacti, MySQL, RRDTool, JBoss, Eclipse BiRT.

Der Berner Informatik Dienstleister, RealStuff Informatik AG bietet umfangreiche Schulungsangebote für den professionellen Einsatz von IT Monitoring basierend auf OpenSource an.

Neben Standardkursen für die beiden Tools Nagios und GroundWork Monitor, sind weiterführende Kurse unteranderem zu Themen wie Reporting, Monitoring von Datenbanken und virtuellen Umgebungen im Angebot. Es werden auch individuelle Kurse auf Wunsch von Kunden angeboten.

Die RealStuff Informatik AG ist der führende Anbieter von Monitoringlösungen basierend auf OpenSource Tools in der Schweiz.

Interessant ist, dass viele bekannte OpenSource IT-Monitoring Projekt sehr viel “Swissness” enthalten. Einige Projekte wurden komplett durch Schweizer “erfunden” oder durch ausländische Studenten welche in der Schweiz studierten entwickelt.

Hier die bekanntesten Projekte und ihr Bezug zur Schweiz.

RRDtoolMRTG SmokePing
Tobi Oetiker, Schweizer, ETH Zürich

NeDi
Remo Rickli, Schweizer, PSI Paul Scherrer Institut

ntop
Luca Deri, Italiener, Universität Bern

Zenoss
Erik Dahl CTO, USA, EPFL Lausanne

GroundWork
Roger Ruttimann Chief Engineer, Schweizer, Haute Ecole Neuchatel

NagiosQL Configurations Gui für Nagios
Martin Willisegger, Schweizer

NConf Configurations Gui für Nagios
Sunrise Communications AG, Zürich, Schweiz

Wie es scheint führen die “typischen” Schweizer Tugenden wie Pünktlichkeit, Zuverlässigkeit etc. zu einer Fülle von OpenSource Tools welche den täglichen Betrieb von IT Infrastrukturen qualitativ steigern helfen. ;-)

© 2011 monitoringblog.ch Suffusion theme by Sayontan Sinha