Varför katastrofscenariotester bortom tillverkning är avgörande för säkerheten i kritisk infrastruktur

Det aldrig tidigare skådade FAA-avbrottet som resulterade i att alla inrikesflyg ställdes på grund får alla att ställa frågor:

Hur gick det här till?

Vem är ansvarig?

Hur förhindrar vi att något liknande inträffar igen?

Det här avbrottet har gjort oss uppmärksammat och framhållit att även de system som vi anser vara de mest säkra, pålitliga och validerade kan misslyckas.

Även om denna typ av avbrott som når upp till allmänhetens medvetenhet är sällsynt, kan det, när det inträffar i ett livskritiskt system, leda till en lavin av katastrofala resultat som påverkar säkerhet, säkerhet och ekonomi. Vi ser detta nu med avbrott i transporten och konsekvenserna av överbelastningen av webb-/apptjänster som översvämmas av tusentals passagerare som försöker ta sig till sina destinationer.

Medan dagens FAA-avbrott anses vara ett systemfel, var det ett graciöst nedbrytningsfel. Det betyder, som tur är, inga dödsfall orsakade av felet och systemet stängdes av innan mer skada skedde.

Detta är tur, men inte uppmuntrande.

Testning har alltid använts i tillverkningen för att upptäcka defekter – felsimulering var till exempel en metod för att på konstgjord väg "bryta sönder" en enhet för att se om diagnostiska tester skulle upptäcka och isolera fel ner till deras rotorsaker. När man designar programvara lär ingenjörer att designa efter specifikationen av vad den ska göra funktionellt. Mycket mindre ansträngning lades ner på att leta efter de katastrofala scenarierna eller en "perfekt storm" av förhållanden som måste inträffa som leder till systemfel. Att förutse dessa förhållanden kan hjälpa oss att proaktivt bygga in mekanismer för att proaktivt upptäcka och förhindra katastrofala misslyckanden.

Förebygga framtida avbrott och andra kritiska infrastrukturfel

Med spridningen av molnberäkningar och lösningar för artificiell intelligens har vi nu tillräckligt effektiv beräkningskraft för att utvärdera miljontals driftsscenarier för att upptäcka vilka fall som kan resultera i katastrofala scenarier.

För FAA borde det nu vara möjligt att proaktivt analysera förhållanden och data från alla inrikesflygplatser, flygplan i himlen och på marken, såväl som de som är planerade för framtida användning, kontrolltornskommunikation och relaterad infrastruktur, passagerare, väder, och säkerhet för att spela ut scenarier som kan resultera i systemfel.

Om man betänker komplexiteten i detta systems interaktioner och ömsesidiga beroenden är det tydligt att det är ett skrämmande förslag att titta på alla punkter av misslyckande.

Artificiell intelligens kan hjälpa till att analysera denna överväldigande mängd data för att proaktivt leta efter mönster och beteenden som kan utgöra utmaningar för FAA-systemen.

Detta är inte enastående, eftersom artificiell intelligens har använts för att bättre undersöka trafikmönster för optimerad schemaläggning och logistik.

Tekniken kan också användas som en kraftfull försvarsmekanism för att ge tidig upptäckt av cyberattacker och/eller onormala beteenden i system. Nyckeln till att effektivt distribuera sådana system kommer att vara att isolera de specifika extremvärdena och förhållandena så att de kan granskas av mänskliga experter.

Det finns många lärdomar att dra av FAA-avbrottet, och med tiden kommer vi att få en tydligare bild av vad som hände. Men för närvarande är det uppenbart att framväxande teknologier, såsom artificiell intelligens, som möjliggör proaktiv upptäckt av systemfel och andra utmaningar som kan uppstå har en framträdande roll att spela i hur vi underhåller vår kritiska infrastruktur framåt.

Källa: https://www.forbes.com/sites/karenpanetta/2023/01/11/the-perfect-storm-of-the-faa-outage-why-catastrophic-scenario-testing-beyond-manufacturing-is- väsentlig-för-kritisk-infrastruktur-säkerhet/