Datenkonsistenz bei der Datenerfassung

Die Maschinendatenerfassung (MDE) hat zum Ziel den aktuellen Zustand aller betrachteten Maschinen und Anlagen zu einem bestimmten Zeitpunkt zu erfassen. Eine Voraussetzung hierfür ist, dass keine Inkonsistenzen bei der Datenerhebung entstehen können.
Nachdem wir den Lebenszyklus von Maschinendaten erläutert haben, befassen wir uns in diesem Artikel mit der Konsistenz von Daten.
Inhaltsverzeichnis
Inkonsistente Daten
Inkonsistente Daten entstehen zum Beispiel, wenn die Zeitpunkte ihrer Erfassung versetzt zueinander sind. Dies kann bei einer späteren Interpretation der Daten immense Auswirkungen haben, da falsche Schlüsse aus den Daten gezogen werden.
Seriöse Analysen auf Basis der erfassten Daten sind nur möglich, wenn das erfassende System zwei Eigenschaften unterstützt. Zum einen müssen die Uhren synchronisiert sein und zum anderen muss sichergestellt sein, dass während der Datenerfassung keine Inkonsistenzen auftreten können.
Synchronisierte Uhren
Da sich die MDE in der Regel nicht nur auf eine Maschine oder Anlage bezieht, sondern übergreifend für ganze Betriebe erfolgt, muss die Datenerfassung über alle Anlagen hinweg harmonisiert werden können. Für diese Harmonisierung sind genau gehende Uhren und deren Synchronisation von großer Bedeutung.
Ohne synchronisierte Uhren wird es schwierig, den Zustand aller Anlagen in Korrelation zu betrachten. Man muss schließlich Werte anhand ihres Zeitstempels in Bezug stellen, um zum Beispiel nachzuvollziehen wie sich der Stromverbrauch aller Anlagen zueinander verhält.
Snapshot Isolation
Neben synchronisierten Uhren ist eine weitere Eigenschaft bei der MDE essentiell. Wenn mehrere Datenpunkte einer Anlage erfasst werden, muss sichergestellt sein, dass die Werte aller Datenpunkte zu dem Zeitpunkt, an dem sie in der MDE-Lösung abgelegt werden, aktuell sind. Insbesondere darf sich während des Speicherns von erfassten Werten in der MDE-Lösung kein Wert ändern und so das Ergebnis verfälschen.
Um diese Eigenschaft sicherzustellen, muss die MDE-Lösung bei Erfassung der Maschinendaten einen so genannten Snapshot (Schnappschuss) der Daten anlegen, in dem der Zustand quasi eingefroren wird. Während der Snapshot erstellt wird, darf keine parallel laufende Aktion die Daten verändern, da ansonsten die Aussage des Schnappschusses nicht mehr konsistent wäre.
Der Begriff Snapshot Isolation bedeutet, dass die MDE-Lösung garantiert, dass es während der Aufnahme eines Snapshots zu keinerlei Veränderungen der Werte kommen kann. Die Operation muss also atomar ausgeführt werden.
In Maschinen und Anlagen, in denen sich manche Werte sehr schnell verändern, ist diese Eigenschaft besonders wichtig. Ansonsten könnte es sein, dass die Werte mancher Datenpunkte aktueller wären als andere, und man kein konsistentes Bild auf die Daten zu einem definierten Zeitpunkt hätte.
Resilienz gegen Datenverlust
Bei jedem Zusammenspiel von Computersystemen über Netzwerke muss damit gerechnet werden, dass Systeme ausfallen oder es zu unerwarteten Kommunikationsproblemen kommt. Diese Technologien sind grundsätzlich nicht ausfallsicher, so dass jede darauf aufbauende Anwendung so gestaltet sein muss, dass sie mit diesen Ausnahmesituationen umgehen kann. Wir bezeichnen die Eigenschaft eines Systems sich gegen Datenverlust bei Ausfall von Teilsystemen zu schützen als Resilienz gegen Datenverlust.
Für die MDE bedeutet dies, dass Anlagen oder IT-Systeme temporär nicht erreichbar sein können, und so erfasste Daten eventuell nicht weitergereicht werden. In solchen Situationen muss die MDE-Lösung in der Lage sein, die Daten so lange zwischenzuspeichern bis die betroffenen Systeme wieder verfügbar sind.
Neben der Resilienz gegen Datenverlust darf ein temporärer Ausfall bei der MDE niemals Auswirkungen auf den eigentlichen Prozessablauf haben. Die Produktion muss weiter reibungslos ablaufen können, auch wenn zeitweise keine Maschinendaten erhoben werden können.
Synchronisierte Uhren, Snapshot Isolation und Absicherung gegen Datenverlust sind elementar für die moderne MDE. Wenn diese Anforderungen erfüllt sind, hat man sichergestellt, dass man konsistente Daten hat, die bereit sind für die weitere Verarbeitung. Mit ihrer Erhebung beginnt der Lebenszyklus der Daten, der sich in der Weiterverarbeitung fortsetzt. Im Folgenden erläutern wir einige Grundlagen zu diesem Lebenszyklus und gehen der Frage nach, wie lange die erfassten Daten für welchen Zweck zur Verfügung stehen müssen.