Негізгі ұсыныстар
- Facebook-тің техникалық ақаулары өкінішті болды, бірақ егер ол өзара байланысты көптеген жүйелерге сүйенбесе, мәселе әлдеқайда жылдам шешілетін еді.
- Жүйе ақауларының алдын алудың ешқандай жолы жоқ, бірақ олардың ықтималдығын азайтудың жолдары бар.
- Жүйенің сәтсіздікке ұшырау сәтіне (егер емес, қашан) сақтық көшірме жасау жоспарлары болуы «тітіркендіргіш» және «апатты» арасындағы айырмашылықты жасай алады.
Жақында Facebook-тің бұзылуы өзара байланысты жүйелердің қалай сәтсіздікке ұшырайтынын және неге біз оларды барлық нәрсе үшін пайдаланбау керектігін көрсетеді.
Дүйсенбіде Facebook, WhatsApp және Instagram желілерін бірнеше сағат бойы жоғалту ыңғайсыз болды, бизнеске зиян келтірді, ал кейбір жағдайларда апатты дерлік болды. Facebook мәліметтері бойынша, мұның барлығы желілік үйлестіру маршрутизаторларының конфигурациясының өзгеруіне байланысты.
Бұл ақылға қонымды түсініктеме, бірақ мұндай бір қателік тек Facebook-ті ғана емес, сонымен қатар Facebook-ке тиесілі басқа жүйелерді де тоқтатып тастауы аздап алаңдатады.
Маршрутизатор конфигурациясын бір қате өзгерту бірнеше қызметтердің, тіпті VR гарнитураларының жұмысын толығымен тоқтатты. Оның үстіне, Facebook-тің өзі мойындағандай, бұл компанияның деректер орталықтарының байланысына каскадты әсер етіп, олардың барлық қызметтерін тоқтатты.
«Бір-бірімен байланысты жүйелерге тәуелділік жүйенің немесе тіпті қызметтің істен шығуына тән тәуекелді тудырады», - деді GlobalDots компаниясының аға техникалық сату инженері Франческо Альтомаре Lifewire электрондық поштасына берген сұхбатында, "Бұл қорқынышты тәуекелге қарсы тұру үшін компаниялар SRE (Жүйе сенімділігі инженериясы) принципін, сондай-ақ жүйе инфрақұрылымының әрбір қабатында орнатылған резервтік деңгейлердің әртүрлі деңгейлерімен айналысатын басқа құралдарды пайдаланады."
Не қате болуы мүмкін
Осындай жүйе істен шыққанда, әдетте дұрыс емес нәрселердің керемет дауылын талап ететінін атап өткен жөн. Бұл құлауды күтіп тұрған карталар үйіне ұқсамайды және ғарыш станциясындағы кішкентай ай көлеміндегі ашық жылу шығару портына ұқсайды.
Көптеген компаниялар барлығын хаосқа әкелетін бір нәрсе ешқашан болмайтынына көз жеткізу үшін қадамдар жасайды, бірақ бәрібір болуы мүмкін.
"Күтпеген сәтсіздіктер бизнестің бір бөлігі болып табылады және жұмысшының немқұрайлылығы, интернет-провайдер желісіндегі ақаулар немесе тіпті бұлтты сақтау қызметтерінің ақаулары салдарынан туындауы мүмкін", - деді FastPeopleSearch негізін қалаушы Салли Стивенс. электрондық пошта сұхбаты.
"…Сақтық көшірмелер, сайттағы маршрутизатор және деңгейлі кіру сияқты жүйені қорғау үшін қажетті қадамдар орындалса, бұл сәтсіздіктердің болуы екіталай." Тіпті апатқа қарсы сейфтер армиясы болса да, линчпиннің істен шығуы мүмкін.
Байланыстың негізгі түрлері, құрылғылар, есіктер, т.б. сияқты нәрселерді басқаратын жүйе сәтсіз болса, нәтиже маңызды болуы мүмкін. Жеке адамдар мен компаниялардың барлығына қаншалықты сенетініне байланысты жеңіл қолайсыздықтан толық апатқа дейін.
"Сонымен қатар хакерлердің жүйеге тоңазытқыштар мен пеш тостерлері сияқты ең аз қорғалған құрылғылардың кез келгенінен кіру қаупі бар", - деп қосты Стивенс, "бұл деректер ұрлануына және төлем бағдарламасына әкелуі мүмкін."
Қалай дайындалуға болады
Жүйенің ешқашан істен шықпайтынына кепілдік берудің ешқандай жолы жоқ, бірақ сәтсіздік ықтималдығын азайту немесе сәтсіздікті жеңілірек шешу үшін қабылданатын қадамдар бар. Төтенше жағдайлар жоспарлары мен сақтық көшірме жүйелерімен апаттан қорғайтын және қарсы шараларды біріктіретін екі тәсілдің үйлесімі тамаша болар еді.
"Тиімді түрде өңделетін үшінші тарап өнімдері мен қызметтері тудыратын қауіптерді жою үшін Үшінші тарап тәуекелдерін басқаруға қатысты рөлдер мен міндеттер қатаң түрде көрсетілуі керек ", - деді Даниэла Сойер, FindPeopleFast негізін қалаушы және бас технологиялық директоры, электрондық поштаға берген сұхбатында: "Осы жаңа ортада өркендеу үшін тәуекел менеджерлері осындай күрделі экожүйенің маңызды бөліктерін түсінуі керек."
Facebook, WhatsApp және Instagram-да болған оқиға өкінішті болды, бірақ сонымен бірге көзді ашты деп үміттенемін. Бір-бірімен байланысқан жүйелерге сүйенетін адамдар дұрыс емес нәрсенің барлығын бұзуы мүмкін екенін түсінуі керек. Сондай-ақ мұндай үзілістердің ықтималдығы аз және әсерлі болуы үшін шаралар қолдану (немесе мұқият тексеріліп, нақтылануы) керек.
Фейсбук жағдайында оның проблемасы маршрутизатордағы ақаулар емес, оның барлық дерлік экожүйесінің басқалармен байланысты болуы болды. Осылайша, Facebook (қызмет) жұмыс істемей тұрғанда, Facebook (компания) мәселені ұйымдастыруға және шешуге көбірек уақыт пен күш жұмсауға мәжбүр болды. Егер ол соншалықты тамыры терең, өзара байланысты жүйені пайдаланбаса немесе мұндай ақауды жою үшін сақтық көшірме жасау жоспарлары болса, оны түзетуге әлдеқайда аз уақыт кетуі мүмкін еді.