Facebook se mislukking wys hoekom ons nie vir alles daarop moet staatmaak nie

INHOUDSOPGAWE:

Facebook se mislukking wys hoekom ons nie vir alles daarop moet staatmaak nie
Facebook se mislukking wys hoekom ons nie vir alles daarop moet staatmaak nie
Anonim

Sleutel wegneemetes

  • Facebook se tegniese probleme was jammer, maar die probleem sou waarskynlik baie vinniger opgelos gewees het as dit nie op soveel onderling gekoppelde stelsels staatgemaak het nie.
  • Daar is geen manier om stelselfoute heeltemal te voorkom nie, maar daar is maniere om dit minder waarskynlik te maak.
  • Om rugsteunplanne te hê vir wanneer (nie as, wanneer) 'n stelsel misluk, kan die verskil maak tussen 'irriterend' en 'katastrofies'.
Image
Image

Die onlangse Facebook-debakel demonstreer hoe onderling gekoppelde stelsels waarskynlik sal misluk en hoekom ons dit nie vir alles moet gebruik nie.

Om Facebook, WhatsApp en Instagram Maandag vir etlike ure te verloor was ongerieflik, skadelik vir besighede, en in sommige gevalle amper katastrofies. Volgens Facebook was dit alles te wyte aan konfigurasieveranderinge aan sy netwerkkoördinerende roeteerders.

Dit is 'n redelike verduideliking, maar die feit dat 'n enkele fout soos dié nie net Facebook nie, maar ander stelsels wat deur Facebook besit word tot stilstand kan bring, is 'n bietjie kommerwekkend.

Een verkeerde roeteerderopstellingsverandering het veroorsaak dat verskeie dienste, en selfs VR-kopstukke, heeltemal ophou werk het. Boonop het dit, volgens Facebook se eie toelating, ook 'n deurlopende effek gehad op hoe die maatskappy se datasentrums kommunikeer, wat al hul dienste tot stilstand gebring het.

"Die vertroue op onderling gekoppelde stelsels hou wel 'n inherente risiko van stelsel- of selfs diensonderbrekings in," het Francesco Altomare, senior tegniese verkoopsingenieur by GlobalDots, in 'n e-posonderhoud met Lifewire,gesê

"Om hierdie skrikwekkende risiko teë te werk, gebruik maatskappye die beginsel van SRE (System Reliability Engineering), sowel as ander instrumente, wat almal handel oor verskillende vlakke van oortolligheid wat in elke laag van 'n stelsel se infrastruktuur ingebou is."

Image
Image

Wat kan verkeerd gaan

Dit is opmerklik dat wanneer so 'n stelsel misluk, dit gewoonlik 'n perfekte storm van dinge wat verkeerd loop, vereis. Dit is minder soos 'n kaartehuis wat wag om te val en meer soos 'n blootgestelde termiese uitlaatpoort op 'n ruimtestasie die grootte van 'n klein maan.

Die meeste maatskappye neem stappe om te probeer verseker dat die een ding wat alles in chaos kan gooi, nooit gebeur nie - maar ongeag, dit kan gebeur.

"Onverwagte mislukkings is 'n deel van besigheid en kan ontstaan as gevolg van werkersnalatigheid, foute in internetdiensverskaffer se netwerk, of selfs wolkbergingsdienste wat probleme ondervind," sê Sally Stevens, medestigter van FastPeopleSearch, in 'n e-posonderhoud.

"…Solank as wat die nodige stappe om die stelsel te beskerm, soos rugsteun, roeteerder op die perseel en vlaktoegang ingestel is, is hierdie mislukkings redelik onwaarskynlik." Alhoewel selfs met 'n leër van faalkluise, is dit steeds moontlik vir die lynchpin om te misluk.

As die stelsel wat dinge soos primêre vorme van kontak, toestelle, deure, ens. beheer, misluk, kan die resultate betekenisvol wees. Van ligte ongerief tot heeltemal katastrofies, afhangend van hoeveel individue en maatskappye op dit alles staatmaak.

Image
Image

"Daar is ook die risiko dat kuberkrakers in die stelsel kom vanaf enige van die minste beskermde toestelle, soos yskaste en oondbroodroosters," het Stevens bygevoeg, "wat kan lei tot datadiefstal en losprysware."

Hoe ons kan voorberei

Daar is geen manier om te waarborg dat 'n stelsel nooit sal misluk nie, maar daar is stappe wat geneem kan word om óf mislukking minder waarskynlik te maak óf om mislukking gladder aan te spreek.'n Kombinasie van die twee benaderings wat faalkluise en teenmaatreëls met gebeurlikheidsplanne en rugsteunstelsels verbind, sal ideaal wees.

"Om hierdie gevare uit te skakel wat geskep word deur derdeparty-produkte en -dienste wat doeltreffend hanteer word, moet rolle en pligte rakende Derdeparty-risikobestuur streng uiteengesit word," het Daniela Sawyer, stigter en hooftegnologiebeampte van FindPeopleFast, gesê, in 'n e-posonderhoud, "Om in hierdie nuwe omgewing te floreer, moet risikobestuurders die noodsaaklike dele van so 'n gesofistikeerde ekosisteem begryp."

Wat met Facebook, WhatsApp en Instagram gebeur het, was jammer, maar hopelik ook ooglopend. Mense wat op onderling gekoppelde stelsels staatmaak, moet verstaan dat die regte ding wat verkeerd gaan, alles kan ontwrig. En maatreëls moet in plek gestel word (of nagegaan en verfyn word) om sulke ontwrigtings minder waarskynlik en minder impakvol te maak.

In Facebook se geval was sy probleem nie die router-probleme nie, maar eerder dat byna sy hele ekosisteem aan alles anders gekoppel is. Dus, met Facebook (die diens) af, moes Facebook (die maatskappy) baie meer tyd en energie spandeer om bloot die kwessie te organiseer en aan te spreek. As dit óf nie so 'n diepgewortelde, onderling gekoppelde stelsel gebruik het nie óf rugsteunplanne in plek gehad het om 'n onderbreking soos dié te hanteer, sou dit waarskynlik baie minder tyd geneem het om reg te stel.

Aanbeveel: