Kegagalan Facebook Menunjukkan Mengapa Kita Tidak Perlu Bergantung Padanya untuk Segala-galanya

Isi kandungan:

Kegagalan Facebook Menunjukkan Mengapa Kita Tidak Perlu Bergantung Padanya untuk Segala-galanya
Kegagalan Facebook Menunjukkan Mengapa Kita Tidak Perlu Bergantung Padanya untuk Segala-galanya
Anonim

Key Takeaway

  • Masalah teknikal Facebook adalah malang, tetapi masalah itu mungkin akan diselesaikan dengan lebih cepat jika ia tidak bergantung pada begitu banyak sistem yang saling berkaitan.
  • Tiada cara untuk menghalang kegagalan sistem sepenuhnya, tetapi ada cara untuk mengurangkan kemungkinannya.
  • Mempunyai pelan sandaran untuk bila (bukan jika, bila) sistem gagal boleh membuat perbezaan antara 'menjengkelkan' dan 'malapetaka.'
Image
Image

Masalah Facebook baru-baru ini menunjukkan bagaimana sistem yang saling berkaitan pasti akan gagal dan mengapa kita tidak sepatutnya menggunakannya untuk segala-galanya.

Kehilangan Facebook, WhatsApp dan Instagram selama beberapa jam pada hari Isnin adalah menyusahkan, merosakkan perniagaan, dan dalam beberapa kes, hampir membawa malapetaka. Menurut Facebook, ini semua disebabkan oleh perubahan konfigurasi pada penghala penyelaras rangkaiannya.

Ini adalah penjelasan yang munasabah, tetapi hakikat bahawa satu ralat seperti itu boleh menyebabkan bukan sahaja Facebook tetapi sistem milik Facebook lain terhenti agak membimbangkan.

Satu perubahan konfigurasi penghala yang salah menyebabkan pelbagai perkhidmatan, malah set kepala VR, berhenti berfungsi sepenuhnya. Selain itu, dengan pengakuan Facebook sendiri, ia juga mempunyai kesan bertingkat pada cara pusat data syarikat berkomunikasi, menghentikan semua perkhidmatan mereka.

"Pergantungan pada sistem yang saling berkaitan membawa bersamanya risiko sistem atau kegagalan perkhidmatan, " kata Francesco Altomare, jurutera jualan teknikal kanan di GlobalDots, dalam temu bual e-mel dengan Lifewire, "Untuk mengatasi risiko yang menakutkan ini, syarikat menggunakan prinsip SRE (System Reliability Engineering), serta alatan lain, yang kesemuanya menangani pelbagai tahap redundansi yang dibina dalam setiap lapisan infrastruktur sistem."

Image
Image

Apa yang Boleh Silap

Perlu diingat bahawa apabila sistem seperti itu gagal, ia biasanya memerlukan ribut masalah yang tidak betul. Ia kurang seperti sekumpulan kad yang menunggu untuk jatuh dan lebih seperti pelabuhan ekzos haba terdedah pada stesen angkasa sebesar bulan kecil.

Kebanyakan syarikat mengambil langkah untuk mencuba dan memastikan bahawa satu perkara yang boleh menyebabkan segala-galanya huru-hara tidak pernah berlaku-tetapi walau apa pun, ia boleh berlaku.

"Kegagalan yang tidak dijangka adalah sebahagian daripada perniagaan dan boleh timbul akibat kecuaian pekerja, kerosakan dalam rangkaian penyedia perkhidmatan internet, atau perkhidmatan storan awan yang mengalami masalah, " kata Sally Stevens, pengasas bersama FastPeopleSearch, di temu bual e-mel.

"…Selagi langkah-langkah yang diperlukan untuk melindungi sistem-seperti sandaran, penghala di tapak dan akses berperingkat-dilaksanakan, kegagalan ini agak tidak mungkin." Walaupun dengan pasukan penyelamat gagal, pin lynchpin masih mungkin gagal.

Jika sistem yang mengawal perkara seperti bentuk sentuhan utama, perkakas, pintu, dsb., gagal, hasilnya boleh menjadi ketara. Daripada kesulitan ringan kepada malapetaka sepenuhnya, bergantung pada jumlah individu dan syarikat bergantung pada semuanya.

Image
Image

"Terdapat juga risiko penggodam masuk ke dalam sistem daripada mana-mana peranti yang paling kurang dilindungi, seperti peti sejuk dan pembakar roti ketuhar, " tambah Stevens, "yang boleh menyebabkan kecurian data dan perisian tebusan."

Bagaimana Kami Boleh Menyediakan

Tiada cara untuk menjamin bahawa sistem tidak akan gagal, tetapi terdapat langkah yang boleh diambil untuk sama ada mengurangkan kemungkinan kegagalan atau menangani kegagalan dengan lebih lancar. Gabungan dua pendekatan yang menggabungkan peti keselamatan gagal dan tindakan balas dengan pelan kontingensi dan sistem sandaran adalah ideal.

"Untuk menghapuskan bahaya yang dicipta oleh produk dan perkhidmatan pihak ketiga yang dikendalikan dengan berkesan, peranan dan tugas berkenaan Pengurusan Risiko Pihak Ketiga mesti digariskan dengan ketat," kata Daniela Sawyer, pengasas dan ketua pegawai teknologi FindPeopleFast, dalam temu bual e-mel, "Untuk berkembang dalam persekitaran baharu ini, pengurus risiko mesti memahami bahagian penting ekosistem yang canggih itu."

Apa yang berlaku dengan Facebook, WhatsApp dan Instagram adalah malang, tetapi juga diharapkan membuka mata. Orang yang bergantung pada sistem yang saling berkaitan mesti memahami bahawa perkara yang betul berlaku salah boleh mengganggu segala-galanya. Dan langkah-langkah mesti dilaksanakan (atau diteliti dan diperhalusi) untuk menjadikan gangguan sedemikian kurang berkemungkinan dan kurang memberi kesan.

Dalam kes Facebook, masalahnya bukanlah masalah penghala, tetapi mempunyai hampir keseluruhan ekosistemnya disambungkan kepada semua yang lain. Oleh itu, dengan Facebook (perkhidmatan) menurun, Facebook (syarikat) terpaksa menghabiskan lebih banyak masa dan tenaga hanya untuk mengatur dan menangani isu tersebut. Jika ia sama ada tidak menggunakan sistem yang berakar umbi, saling berkaitan atau mempunyai rancangan sandaran untuk menangani gangguan seperti itu, kemungkinan besar ia akan mengambil masa yang lebih singkat untuk diperbaiki.

Disyorkan: