Community / Kommentare zu aktuellen Nachrichten / Lufthansa ist down

Beitrag 16 - 23 von 23
1 | 2 | « zurück | weiter »
Beitrag vom 15.02.2023 - 16:46 Uhr
UserJordanPensionär
Pensionär
User (2376 Beiträge)
Was mich nur verwundert:

das Kabel wurde Dienstag Abend durchtrennt. Dienstag Abend und heute ganz früh lief aber bei LH in FRA noch alles (siehe Flightrader24.com - die ersten LH Maschinen heute morgen gingen noch normal raus) normal.

Und wieso betrifft es nur die LH, nicht die Töchter OS, LX, SN etc. und auch nicht den Airport selber?

Bin absolut kein IT Fachmann, aber die Antwort würde mich schon sehr interessieren.
Beitrag vom 15.02.2023 - 16:58 Uhr
UserDaedalos1504
User (523 Beiträge)
Was mich nur verwundert:

das Kabel wurde Dienstag Abend durchtrennt. Dienstag Abend und heute ganz früh lief aber bei LH in FRA noch alles (siehe Flightrader24.com - die ersten LH Maschinen heute morgen gingen noch normal raus) normal.

Und wieso betrifft es nur die LH, nicht die Töchter OS, LX, SN etc. und auch nicht den Airport selber?

Bin absolut kein IT Fachmann, aber die Antwort würde mich schon sehr interessieren.

Bin jetzt auch kein IT-Fachmann, aber vielleicht wurden die verbliebenen Kabel im Zuge der Reparatur gekappt. Aber das ist reine Spekulation von mir.
Beitrag vom 15.02.2023 - 18:12 Uhr
Usersuper_uschi
User (86 Beiträge)
Ich hoffe die Baufirma hat ne gute Unternehmens-Haftpflicht. Und hoffentlich sind die Kollegen eindeutig nach den gängingen Zertifikaten geschult. Sonst sieht es sehr düster aus was Schadenersatzansprüche angeht.
Beitrag vom 15.02.2023 - 19:07 Uhr
UserEricM
User (5512 Beiträge)
Was mich nur verwundert:

das Kabel wurde Dienstag Abend durchtrennt. Dienstag Abend und heute ganz früh lief aber bei LH in FRA noch alles (siehe Flightrader24.com - die ersten LH Maschinen heute morgen gingen noch normal raus) normal.

Das ist wie bei Flugunfall-Untersuchungen: Man sollte eigentlich den Bericht abwarten :)

Aber es gibt durchaus einige Prozesse, die zeitverzögert zu einem IT Ausfall führen können.
Ganz vorne dabei sind klassische OLTP Datenbanken, die vermutlich auch bei der LH den Kern der Anwendungen bilden.

Wenn die ihre Transaktions Logs dank Bandbreitenproblem nicht mehr schnell genug an den Backup loswerden, läuft erst mal alles normal weiter, da ein bestimmter Puffer eingebaut ist.
Aber halt nur, bis die entsprechenden Speicher voll sind.

Abends/Nachts ist wenig los, die verminderte Bandbreite reicht zusammen mit den Puffern aus.
Gegen morgen kommt das System dann allmählich unter Last, die Transaktionsrate und damit die Menge der pro Zeiteinheit zu sichernden Daten steigt an und die Logs laufen langsam voll.
Irgendwann ist dann Ende Gelände und das System bleibt aus Sicherheitsgründen stehen.

Dieser Beitrag wurde am 15.02.2023 19:07 Uhr bearbeitet.
Beitrag vom 15.02.2023 - 19:58 Uhr
UserJordanPensionär
Pensionär
User (2376 Beiträge)
Was mich nur verwundert:

das Kabel wurde Dienstag Abend durchtrennt. Dienstag Abend und heute ganz früh lief aber bei LH in FRA noch alles (siehe Flightrader24.com - die ersten LH Maschinen heute morgen gingen noch normal raus) normal.

Das ist wie bei Flugunfall-Untersuchungen: Man sollte eigentlich den Bericht abwarten :)

Aber es gibt durchaus einige Prozesse, die zeitverzögert zu einem IT Ausfall führen können.
Ganz vorne dabei sind klassische OLTP Datenbanken, die vermutlich auch bei der LH den Kern der Anwendungen bilden.

Wenn die ihre Transaktions Logs dank Bandbreitenproblem nicht mehr schnell genug an den Backup loswerden, läuft erst mal alles normal weiter, da ein bestimmter Puffer eingebaut ist.
Aber halt nur, bis die entsprechenden Speicher voll sind.

Abends/Nachts ist wenig los, die verminderte Bandbreite reicht zusammen mit den Puffern aus.
Gegen morgen kommt das System dann allmählich unter Last, die Transaktionsrate und damit die Menge der pro Zeiteinheit zu sichernden Daten steigt an und die Logs laufen langsam voll.
Irgendwann ist dann Ende Gelände und das System bleibt aus Sicherheitsgründen stehen.

Danke für die umfangreiche Erläuterung. Wieder was gelernt👍.
Beitrag vom 15.02.2023 - 20:14 Uhr
UserBlotto
User (349 Beiträge)
Was mich nur verwundert:

das Kabel wurde Dienstag Abend durchtrennt. Dienstag Abend und heute ganz früh lief aber bei LH in FRA noch alles (siehe Flightrader24.com - die ersten LH Maschinen heute morgen gingen noch normal raus) normal.

Gestern abend reichte der Backupkanal noch. Heute morgen dann nicht mehr und irgendwann hagelt es nur noch Timeouts.


Und wieso betrifft es nur die LH, nicht die Töchter OS, LX, SN etc. und auch nicht den Airport selber?

Man benutzt ja nicht "ein" System sondern immer eine Kombination von vielen. Wenn jetzt zum Beispiel der LH-spezifische Login nicht funktioniert, kann so ein Altea weltweit verfügbar sein, aber internes Personal kann sich nicht mehr einloggen und dann boardet eben niemand mehr. Ohne dass das jetzt der Grund gewesen sein muss, nur als Beispiel warum Auswirkungen so selektiv sein können.

Beitrag vom 15.02.2023 - 20:53 Uhr
UserJordanPensionär
Pensionär
User (2376 Beiträge)
Was mich nur verwundert:

das Kabel wurde Dienstag Abend durchtrennt. Dienstag Abend und heute ganz früh lief aber bei LH in FRA noch alles (siehe Flightrader24.com - die ersten LH Maschinen heute morgen gingen noch normal raus) normal.

Gestern abend reichte der Backupkanal noch. Heute morgen dann nicht mehr und irgendwann hagelt es nur noch Timeouts.


Und wieso betrifft es nur die LH, nicht die Töchter OS, LX, SN etc. und auch nicht den Airport selber?

Man benutzt ja nicht "ein" System sondern immer eine Kombination von vielen. Wenn jetzt zum Beispiel der LH-spezifische Login nicht funktioniert, kann so ein Altea weltweit verfügbar sein, aber internes Personal kann sich nicht mehr einloggen und dann boardet eben niemand mehr. Ohne dass das jetzt der Grund gewesen sein muss, nur als Beispiel warum Auswirkungen so selektiv sein können.


Auch an Sie ein herzliches DANKE.
Beitrag vom 16.02.2023 - 09:48 Uhr
UserGroße Krügerkl..
User (1383 Beiträge)
Man bereitet sich in der IT bei kritischen System auch auf Probleme vor und fährt verschiedene Szenarien.

Ausfall der Verbindung zum nächsten Internet Knotenpunkt bzw. ausfall des Rechenzentrums wird wohl dazu gehören.
Man hat in der Regel dort kein 100% backup system, das ist einfach eine Kostenfrage.
In einem SLA definiert man das Verfügbarkeitslevel und das Szenario,
und ich schätze das die Auslegung dort nicht darauf ausgelegt war, 24h abgeschnitten zu sein - im wahrsten Sinne des Wortes.

Das ist dann leider der Gau für die IT Systeme, die Backup Systeme laufen unter Last an ihre Auslegungsgrenze, gehen in die Knie und dann geht halt irgendwann nichts mehr.

Erklärt ziehmlich gut das Fehlerbild, man wird daraus lernen.
1 | 2 | « zurück | weiter »