Cloudflare sta attraversando una giornata difficile a seguito di segnalazioni di problemi con la sua dashboard e il servizio API a seguito di problemi di alimentazione nei Datacenter.
Il provider di sicurezza web ha dichiarato che i file memorizzati nella cache serviti tramite il servizio CDN di Cloudflare e altre funzionalità di sicurezza sul Cloudflare Edge non sono stati influenzati, ma la dashboard e l’API sono decisamente in difficoltà.
Ha dichiarato: “I seguenti prodotti sono attualmente influenzati a livello di piano dati/edge, il che significa che la piena funzionalità del prodotto è parzialmente o completamente compromessa: Logpush, WARP/Zero Trust device posture, Magic WAN, la Dashboard Cloudflare, API Cloudflare, API Stream, API Workers, sistema di notifiche di allarme, operazioni nel namespace Workers KV.”
Questa interruzione arriva giorni dopo che l’azienda ha segnalato problemi di disponibilità con Cloudflare Pages e Workers KV. Cloudflare è anche pronta a annunciare i risultati del terzo trimestre terminato il 30 settembre dopo la chiusura dei mercati statunitensi più tardi oggi.
In breve, Cloudflare ha rilasciato una nuova versione di KV in produzione. Si è scoperto che lo strumento di distribuzione aveva un bug e alcuni dati sono stati deviati verso la destinazione sbagliata, scatenando un rollback… che è fallito. Il risultato è stato che gli ingegneri hanno dovuto passare manualmente alla versione precedente funzionante di Workers KV.
Il problema è che molte funzionalità e servizi di Cloudflare dipendono da Workers KV, il che significa che quando c’è un problema con la piattaforma, l’area di impatto può essere notevole.
In questa ultima occasione, sembra che il problema sia stato causato da una perdita di alimentazione che ha colpito i datacenter anziché da un codice difettoso. Si dice che i servizi stiano tornando in funzione.
In una dichiarazione inviata a The Reg, Cloudflare ha dichiarato:
“Operiamo in diversi data center ridondanti nell’Oregon che alimentano il piano di controllo di Cloudflare (dashboard, registrazione, ecc.). C’è stato un problema di alimentazione a livello regionale che ha colpito diverse strutture nella regione. Le strutture non sono riuscite a generare energia durante la notte. Poi, stamattina, si sono verificati più guasti dei generatori che hanno portato le strutture completamente offline.”
“Ci siamo spostati sul datacenter backup di emergenza e la maggior parte dei nostri servizi sono stati ripristinati. Questa interruzione dei data center ha colpito la dashboard e le API di Cloudflare, ma non ha influenzato il traffico che scorre attraverso la nostra rete globale. Stiamo collaborando con i nostri fornitori di data center per indagare sulla causa radice dell’interruzione di alimentazione regionale e sui guasti dei generatori.”
“Ci aspettiamo di pubblicare diversi articoli basati su ciò che apprendiamo e possiamo condividerli con voi quando saranno disponibili.”