Facebooks fiasko viser, hvorfor vi ikke bør stole på det for alt

Indholdsfortegnelse:

Facebooks fiasko viser, hvorfor vi ikke bør stole på det for alt
Facebooks fiasko viser, hvorfor vi ikke bør stole på det for alt
Anonim

Key takeaways

  • Facebooks tekniske problemer var uheldige, men problemet ville sandsynligvis være blevet løst meget hurtigere, hvis det ikke var afhængigt af så mange sammenkoblede systemer.
  • Der er ingen måde at forhindre systemfejl fuldstændigt, men der er måder at gøre dem mindre sandsynlige.
  • At have backup-planer for hvornår (ikke hvis, hvornår) et system fejler, kan gøre forskellen mellem 'irriterende' og 'katastrofisk'.
Image
Image

Det nylige Facebook-debacle demonstrerer, hvordan sammenkoblede systemer er bundet til at fejle, og hvorfor vi ikke bør bruge dem til alt.

At miste Facebook, WhatsApp og Instagram i flere timer i mandags var ubelejligt, skadeligt for virksomheder og i nogle tilfælde næsten katastrof alt. Ifølge Facebook skyldtes det hele konfigurationsændringer af dets netværkskoordinerende routere.

Det er en rimelig forklaring, men det faktum, at en enkelt fejl som den kunne få ikke bare Facebook, men andre Facebook-ejede systemer til at gå i stå, er en smule alarmerende.

Én forkert routerkonfigurationsændring fik flere tjenester, og endda VR-headset, til at holde helt op med at fungere. Oven i det havde det, efter Facebooks egen indrømmelse, også en kaskadeeffekt på, hvordan virksomhedens datacentre kommunikerer, hvilket bragte alle deres tjenester i stå.

"Tilhængigheden af sammenkoblede systemer medfører en iboende risiko for system- eller endda servicefejl," sagde Francesco Altomare, senior teknisk salgsingeniør hos GlobalDots, i et e-mailinterview med Lifewire, "For at imødegå denne skræmmende risiko bruger virksomheder princippet om SRE (System Reliability Engineering) samt andre værktøjer, som alle håndterer forskellige niveauer af redundans indbygget i hvert lag af et systems infrastruktur."

Image
Image

What Can Go Wrong

Det er værd at bemærke, at når et system som det fejler, kræver det norm alt en perfekt storm af ting, der går g alt. Det er mindre som et korthus, der venter på at falde og mere som en blotlagt termisk udstødningsport på en rumstation på størrelse med en lille måne.

De fleste virksomheder tager skridt til at forsøge at sikre, at den ene ting, der kunne kaste alt ud i kaos, aldrig sker – men uanset hvad, det kan ske.

"Uventede fejl er en del af forretningen og kan opstå som følge af arbejdstagernes uagtsomhed, fejl i internetudbyderens netværk eller endda cloud-lagringstjenester, der oplever problemer," sagde Sally Stevens, medstifter af FastPeopleSearch, i et e-mailinterview.

"…Så længe de nødvendige skridt til at beskytte systemet - såsom sikkerhedskopier, on-site router og trindelt adgang - er på plads, er disse fejl ganske usandsynlige." Selvom selv med en hær af sikkerhedsbokse, er det stadig muligt for lynchnålen at fejle.

Hvis systemet, der styrer ting som primære kontaktformer, apparater, døre osv., fejler, kan resultaterne være betydelige. Fra mild besvær til fuldstændig katastrofal, afhængigt af hvor meget enkeltpersoner og virksomheder er afhængige af det hele.

Image
Image

"Der er også risiko for, at hackere kommer ind i systemet fra enhver af de mindst beskyttede enheder, såsom køleskabe og ovnbrødristere," tilføjede Stevens, "hvilket kan føre til datatyveri og ransomware."

Sådan kan vi forberede os

Der er ingen måde at garantere, at et system aldrig vil fejle, men der er trin, der kan tages for enten at gøre fejl mindre sandsynlige eller for at løse fejl mere smidigt. En kombination af de to tilgange, der kombinerer sikkerhedsbokse og modforanst altninger med beredskabsplaner og backupsystemer, ville være ideel.

"For at eliminere disse farer skabt af tredjepartsprodukter og -tjenester, der håndteres effektivt, skal roller og pligter vedrørende tredjepartsrisikostyring være nøje beskrevet," sagde Daniela Sawyer, grundlægger og teknologichef hos FindPeopleFast, i et e-mailinterview: "For at blomstre i disse nye omgivelser skal risikomanagere forstå de væsentlige dele af et så sofistikeret økosystem."

Det der skete med Facebook, WhatsApp og Instagram var uheldigt, men forhåbentlig også øjenåbnende. Folk, der er afhængige af sammenkoblede systemer, skal forstå, at det rigtige, der går g alt, kan forstyrre alt. Og foranst altninger skal indføres (eller granskes og forfines) for at gøre sådanne forstyrrelser mindre sandsynlige og mindre virkningsfulde.

I Facebooks tilfælde var dets problem ikke routerproblemerne, men snarere at næsten hele sit økosystem var forbundet med alt andet. Således med Facebook (tjenesten) nede, skulle Facebook (virksomheden) bruge meget mere tid og energi på blot at organisere og adressere problemet. Hvis det enten ikke brugte et så dybt rodfæstet, sammenkoblet system eller havde backup-planer på plads til at håndtere et sådant udfald, ville det sandsynligvis have taget langt kortere tid at rette.

Anbefalede: