Gangguan besar yang terjadi pada Amazon Web Services (AWS) pada Senin sore tanggal 20 Oktober bukan disebabkan oleh serangan siber, melainkan terkait masalah internal dalam infrastruktur cloud yang sangat besar ini. Ketidakstabilan yang muncul ini menggugah perhatian banyak pihak, terutama indikasi bahwa jika kerentanan ini dijadikan target oleh peretas, konsekuensinya bisa sangat serius.
Penyebab gangguan tersebut telah diidentifikasi sebagai masalah pada “sistem subsistem internal” yang bertanggung jawab untuk memantau kesehatan load balancer jaringan. Dampak dari gangguan ini sangat luas, mencakup berbagai layanan populer dan situs besar, hingga kios check-in di Bandara LaGuardia yang juga terkena imbasnya.
Dalam pernyataan resmi terbaru, Amazon mengonfirmasi bahwa mereka sedang melakukan pemantauan terhadap pemulihan konektivitas dan API untuk layanan AWS. Para ahli menyatakan bahwa insiden ini bisa menjadi peringatan tentang potensi kerusakan lebih besar jika kerentanan serupa dieksploitasi oleh aktor jahat.
Penyebab dan Dampak Gangguan di AWS
Masalah tersebut dimulai sekitar tengah malam waktu Pasifik di wilayah Amazon Northern Virginia, yang merupakan pusat layanan cloud paling tua dan utama. Gangguan serupa pernah terjadi di wilayah yang sama pada tahun-tahun sebelumnya, menunjukkan bahwa masalah ini perlu ditangani dengan serius.
Pada awal pengumuman, AWS menyebutkan bahwa gangguan ini juga terkait dengan masalah resolusi DNS pada produk DynamoDB yang mereka alami. Sehingga, banyak aplikasi yang bergantung pada layanan database ini mengalami kesulitan dalam menemukan informasi yang dibutuhkan.
Insiden terakhir ini menyoroti betapa pentingnya redundansi dalam desain infrastruktur. Banyak situs web gagal menerapkan strategi pemulihan yang memadai untuk beralih ke penyedia cloud lain atau wilayah lain dalam situasi darurat seperti ini.
Pentingnya Strategi Redundansi dalam Infrastruktur Cloud
Seorang direktur operasi keamanan dari sebuah perusahaan teknologi menyatakan bahwa organisasi yang menggunakan layanan cloud publik seperti AWS seharusnya mengikuti pedoman yang telah ditetapkan untuk meningkatkan ketahanan mereka. Hal ini termasuk implementasi metode failover multi-wilayah untuk aplikasi kritis dan, jika memungkinkan, failover multi-penyedia untuk mengurangi dampak dari gangguan yang terjadi.
Kurangnya redundansi ini menjadi masalah yang krusial di tengah meningkatnya ketergantungan pada satu penyedia seperti AWS. Kelemahan ini menunjukkan bahwa jika terjadi masalah, dampaknya tidak hanya dirasakan oleh satu organisasi, melainkan oleh banyak pemangku kepentingan lainnya.
Provokasi terhadap ketidakberagaman penyedia layanan juga diangkat sebagai isu fundamental. Sebuah “monokultur teknologi” dalam infrastruktur global menjadikan sistem ini rentan terhadap gangguan besar.
Analisis dari Para Ahli Mengenai Risiko yang Dihadapi
Salah satu pakar di King’s College London menyebutkan bahwa ketergantungan yang berlebihan pada penyedia tunggal boleh jadi berbahaya, mirip dengan monokultur di sektor pertanian. Keadaan ini membuat seluruh sektor rentan terhadap satu masalah teknis yang sama, yang dapat menghancurkan berbagai layanan sekaligus.
Dia memberikan contoh bahwa meskipun pelanggan diberi kesempatan untuk merancang redundansi mereka sendiri, penyedia layanan juga memiliki tanggung jawab dalam mengembangkan infrastruktur yang beragam. Dengan melakukan hal tersebut, mereka dapat meningkatkan resilien dan kemampuan bersaing dalam ekosistem mereka sendiri.
Melihat ke depan, penting bagi organisasi untuk terus mengevaluasi dan memperbarui strategi infrastruktur mereka agar tidak terjebak dalam sistem yang rentan. Fleksibilitas dan adaptasi merupakan kunci dalam menghadapi tantangan ini.