Community / Kommentare zu aktuellen Nachrichten / Massive IT-Panne hält Lufthansa Car...

Beitrag 1 - 7 von 7
Beitrag vom 18.09.2024 - 18:32 Uhr
Usermpilot
User (449 Beiträge)
19.07.2024 Seit Freitagmorgen fallen weltweit IT-Systeme von Nutzern und Geschäftskunden von Microsoft wegen eines technischen Problems aus. Unternehmen, Banken, Fluggesellschaften, die Londoner Börse und Notdienste hatten mit größeren Ausfällen zu kämpfen.

Heute hat es aktuell auch mal wieder bei der LH geknallt. Grund soll ein fehlgeschlagenes Update eines "Kernsystems" sein. Die Basics der IT OPSystems sind doch absolut gegen Ausfall zu schützen, scheinbar haben die IT Hansel, CIO genannt, weltweit ihre Systeme nicht mehr im Griff. Und wir sollen zu allem Überfluss unsere Patientenakte in die Google cloud abstellen lassen, fortschrittsgläubiger geht es nicht mehr.
Beitrag vom 18.09.2024 - 20:53 Uhr
UserEricM
User (5848 Beiträge)
Die Basics der IT OPSystems sind doch absolut gegen Ausfall zu schützen

Kein IT System kann man "absolut gegen Ausfall zu schützen".
Schon gar nicht Systeme, die in unserer heutigen, hochgradig vernetzten kommerziellen Infrastruktur, bei der die Grenze zwischen einem "Kernsystem" und den Systemen von allen möglichen Interaktionspartnern (Zulieferen, Dienstleistern und Kunden) komplett fließend ist, aktiv sein müssen.
Da sind dann nämlich "keine Updates", wie man das früher mal für bestimmte kritische Systeme gemacht hat, auch keine Option mehr.
 https://augengeradeaus.net/2024/07/modernisierung-der-brandenburg-klasse-mach-mir-eine-floppy/


Auch bei der LH Cargo haben die gleichen Updates auf den Testsystemen bestimmt keine Probleme gemacht, sonst hätten sie einen Update der Produktionssysteme erst gar nicht versucht.

Dieser Beitrag wurde am 18.09.2024 20:57 Uhr bearbeitet.
Beitrag vom 18.09.2024 - 22:00 Uhr
Userunit-er
User (92 Beiträge)
Mitunter werden die Kunden - egal ob Business oder Privat - auch schlicht und einfach als Beta-Tester quasi missbraucht.

Das Durchlaufen aller Testparameter mitsamt der dazugehörigen Protokollierung usw. verlangt nicht nur nach Zeit sondern auch nach Geld.
Zeit und Geld sind jedoch in der heutigen schnelllebigen Wirtschaftswelt begrenzte Güter.

So entscheiden diverse Firmen mitunter, dass eine Software oder Hardware zu einem Datum X als gut befunden wurde, auch wenn noch Tests und Protokolle fehlen, und schieben das mehr oder weniger fertige Produkt in den Livebetrieb bzw. Verkauf.

Eine dann wie auch immer notwendige Fehlerbehebung wird dann im Nachgang angegangen.
Updates für Updates und Patches für Patches sind gerade in der IT-Branche keine Seltenheit.
Beitrag vom 18.09.2024 - 22:53 Uhr
UserEricM
User (5848 Beiträge)
Das Durchlaufen aller Testparameter mitsamt der dazugehörigen Protokollierung usw. verlangt nicht nur nach Zeit sondern auch nach Geld.

Das Understatement das Tages.
Mal angenommen Sie haben ein einziges, kleines Programm, das 32 Parameter bekommt, von denen jeder 0 oder 1 (der einfachst mögliche Fall) sein kann, und das daraus ein Ergebnis berechnet.

Sie sollen jetzt die Funktion des Programms für alle Kombinationen von Parametern testen.
Frage: Wie viele Tests müssen Sie durchführen?
Antwort: 2 ^32, also etwas über 4 Milliarden.
Und Sie brauchen natürlich eine anders formulierte Kontrollfunktion, eine 2., Implementierung, die die Ergebnisse der zu testenden Funktion auch kontrollieren kann ... die muss aber ebenfalls getestet worden sein ...

Und das stellen wir uns jetzt zusätzlich im Kontext einer großen Anwendung wie SAP mit hunderttausenden von Funktionen vor.
SW Firmen sind nicht einfach nur zu faul oder zu geizig um ihre Produkte wirklich vollständig zu testen, sondern die Unbeweisbarkeit der Korrektheit von Code ist ein prinzipielles Problem.

Eine dann wie auch immer notwendige Fehlerbehebung wird dann im Nachgang angegangen.
Updates für Updates und Patches für Patches sind gerade in der IT-Branche keine Seltenheit.

Das ist dann eine Folge uA der o.g. Problematik.

Dieser Beitrag wurde am 18.09.2024 22:54 Uhr bearbeitet.
Beitrag vom 18.09.2024 - 23:40 Uhr
Userfbwlaie
User (5038 Beiträge)
Man kann ohne Kenntnis des Vorganges alles Mögliche ein- und ausschliessen.
Man wird sicherlich den Ablauf hinterfragen. Mich überraschte nur, dass so spät das alte System wieder eingesetzt wurde.
Ein Programm mit 32 Parameter ist meist recht gross. Falls im oben genannten Beispiel die Parameter zusammenhängen, legt man eine Datei mit den gültigen Parametern an und prüft gegen diese.

Programme, die man nicht testen kann, kann/sollte man nicht in Produktion geben. Kritisch sind Schnittstellen von Rechner zu Rechner, wenn es keine Systemschnittstellen gibt. Hier wird der Aufwand für die Realisierung und den Test leicht unterschätzt.
Natürlich werden Fehler gemacht. Deshalb wurde die alte Version bei LH wieder eingeführt.


Dieser Beitrag wurde am 18.09.2024 23:44 Uhr bearbeitet.
Beitrag vom 19.09.2024 - 06:47 Uhr
UserEricM
User (5848 Beiträge)
Update 16:53Uhr: Lufthansa Cargo fährt wieder hoch

Danke an den Autor, dass diesmal der Update des Artikels deutlich markiert wurde.
Beitrag vom 19.09.2024 - 06:53 Uhr
UserEricM
User (5848 Beiträge)
Falls im oben genannten Beispiel die Parameter zusammenhängen, legt man eine Datei mit den gültigen Parametern an und prüft gegen diese.

Richtig, man schränkt man die Tests ein, zB auf sinnvolle Kombinationen von Parametern und sinnvolle Wertebereiche.
Genau das hat aber zur Folge, dass das Programm nicht _vollständig_ getestet wurde und bei unerwarteten Parameter-Kombinationen oder Wertebereichen diese fehlende Testabdeckung dann zum Absturz/Ausfall führen kann.

Der Erstflug der Ariane 5 ist hier ein gutes Beispiel.
Die fertig getstete Steuerungs-Software wurde unverändert von der Ariane 4 übernommen. Die Beschleunigung der Ariane 5 war jedoch höher, so dass einige Eingangsparameter außerhalb der bereits getesteten Bereiche lagen und die Lagekontrolle 30s nach dem Start vertikal um 180° falsche Werte berechnete.
Das Ergebnis ist bekannt.

Dieser Beitrag wurde am 19.09.2024 08:03 Uhr bearbeitet.