Netflix Chaos Monkey And Supply Chain

Jag hade nyligen ett samtal med Carlos Crespo, Chief Operating Officer för Zaras moderbolag Inditex, där han nämnde ett mjukvaruverktyg skapat av Netflix för över ett decennium sedan för att institutionalisera systemets motståndskraft. Namnet är catchy, och för supply chain-ledare som försöker återuppfinna sina leveransnätverk för turbulenta tider är det oemotståndligt. Och ändå, en GoogleGOOG
sökning efter "försörjningskedja kaos apa" gav exakt ett citat, från 2012.

Varför tillämpar vi inte denna idé på motståndskraft i leveranskedjan?

Vad är Chaos Monkey?

Det är ett programvaruverktyg, och mer allmänt, en ingenjörsprincip som slumpmässigt stänger av delar av ett komplext system som tvingar operatörer att återhämta sig live. Ungefär som en överraskningsövning, men dagligen och på slumpmässiga sätt och platser. Tanken är att att bli bra på att lösa systemproblem snabbt är en inlärningsprocess som borde dra nytta av en brantande inlärningskurva.

Bakgrunden handlar om hur Netflix utökade sin streamingverksamhet på Amazon Web Services medan den gick från att skicka DVD-skivor till kundens tröskel. Vid första rodnad är det ett logiskt tillvägagångssätt för systemredundansplanering, som vad du kan förvänta dig av NASA, men i praktiken utnyttjar det en Netflix kulturell norm för att låta enskilda bidragsgivare lösa sina egna problem. Som krönikas i "Kaosteknik” en bok från 2020 av Casey Rosenthal och Nora Jones som var pionjärer för praktiken på Netflix, den kokar ner till fem principer:

  • Bygg en hypotes kring steady-state beteende
  • Variera verkliga händelser
  • Kör experiment i produktion
  • Automatisera experiment så att de körs kontinuerligt
  • Minimera sprängradien

Blandningen av kultur och process på Netflix är viktig eftersom den främjade och utnyttjade ett tillvägagångssätt för problemlösning med öppen källkod, samtidigt som man systematiskt vrider på ratten med slumpmässiga avstängningar påskyndar inlärningen i hela det utökade teamet.

Supply Chain Resilience och Chaos Engineering

Digital transformation i leveranskedjan har varit hett i år eftersom det hjälper leveranskedjor att stödja nya affärsmodeller och driva mot hållbar verksamhet (se BCG X-studien), men också för att den lovar "resiliens". Tyvärr kokar praktiska tillämpningar av digital transformation för motståndskraft i försörjningskedjan fortfarande i allmänhet ner till plattformar för bättre "synlighet", med stöd av ett gäng traditionella taktiker som lagerbuffring och dubbel inköp. Detta tillvägagångssätt ligger till grund för ytterligare ett lager av analytiskt arbete tid att återhämta sig av David Simchi-Levi vid MIT, och en våg av simuleringar med digitala tvillingar. Allt det låter bra, men det som saknas är något systematiskt sätt att experimentera med verkligt fel i leveranskedjan för att lära sig hur man bäst återhämtar sig i praktiken.

Tillämpa Chaos Monkey på leveranskedjor

Läkare avlägger den hippokratiska eden innan de skär upp oss, inklusive det berömda "gör ingen skada först." Ingen dålig idé för alla som tillämpar Chaos Monkey-principer på leveranskedjor, vilket innebär att slumpmässigt stänga av en riktig maskin någonstans. Detta är icke-trivialt, och så vitt jag vet, händer det ännu inte någonstans.

  • Den första principen som citeras ovan säger att fokusera på systemutgångar snarare än interna attribut. Kontrollera att systemet fungerar istället för att försöka förstå varför det fungerar.
  • Den andra principen säger att man ska bryta olika saker på realistiska sätt. Inget behov av att simulera ett globalt termonukleärt krig, stäng bara av en strömbrytare eller förlora en order och lär dig vad som fungerar bäst.
  • Den tredje principen säger att det bästa stället att lära sig är i produktionen. Att lära sig genom att göra är bättre än att lära sig genom simulering – dvs digitala tvillingar är fantastiska, men de kanske inte räcker för att bygga en kultur av motståndskraft.
  • Den fjärde principen institutionaliserar kaosapprinciper eftersom den möjliggör skalning av experimentprocessen, vilket tar dig till en brantare inlärningskurva. Använd datavetenskap om brandbekämpning.
  • Sist, minimera sprängradien. Detta betyder "gör ingen skada" och översätts till någon form av buffring (inventering, ledtid, snabbare leverans) för att skydda kunderna från att känna ditt experiment. Lär dig hantera kontrollerade explosioner.

Man skulle kunna hävda att de senaste tre åren av Covid, krig, arbetsro, och ekonomisk turbulens har varit en stor kaosapa torrkörning för alla. Netflix lärdom var att den här typen av kris inte bara är något att planera för, utan något att bemästra som ett permanent faktum i livet.

Den perfekta stormen kanske aldrig tar slut, så vi kanske borde lära oss att leva med den.

Källa: https://www.forbes.com/sites/kevinomarah/2022/12/22/netflix-chaos-monkey-and-supply-chain/