OT/ICS İçin Disaster Recovery: Tatbikat Yapmadan Plan Olmaz
OT/ICS ortamlarında Disaster Recovery planı yalnızca dokümana yazıldığında güven vermez; planın çalıştığı ancak kontrollü tatbikatlarla doğrulanabilir. Özellikle SCADA sunucuları, historian veritabanı, lisans servisleri ve üretim reçete sistemleri için kurtarma sıralaması açıkça tanımlanmalı, hangi sistemin hangi bağımlılıktan sonra ayağa kalkacağı adım adım belirtilmelidir. Aksi halde gerçek kesinti anında ekipler aynı anda farklı önceliklere koşar.
Tatbikat tasarımında en kritik konu senaryonun gerçekçiliğidir. Tek bir sunucu arızası yerine ağ segment kaybı, storage bozulması, domain servis kesintisi veya uzaktan erişim altyapısı devre dışı kalması gibi birleşik senaryolar test edilmelidir. Ayrıca tatbikata sadece IT ekipleri değil, bakım, üretim, kalite ve bilgi güvenliği temsilcileri dahil edilmelidir. Operasyonel karar zinciri test edilmezse teknik kurtarma başarılsa bile üretime dönüş gecikir.
Her tatbikat için ölçümler standartlaştırılmalıdır: algılama süresi, eskalasyon süresi, onay süresi, geri yükleme süresi ve üretime güvenli dönüş zamanı ayrı ayrı izlenmelidir. Hedef RTO/RPO değerleri bu ölçümlerle karşılaştırılmalı ve sapma nedenleri kök neden analiziyle kapatılmalıdır. Sadece başarıyı değil, gecikme yaratan adımları da raporlamak bir sonraki denemede ciddi hız kazancı sağlar.
Tatbikat sonrası runbook güncellemesi zorunlu bir çıktıdır. İletişim kişileri, erişim yetkileri, yedek lokasyon bilgileri, onay akışları ve rollback adımları güncellenmeden plan güncel kabul edilmemelidir. Yılda bir kez yapılan göstermelik testler yerine, kısa periyotlu ve kapsamı artan tatbikat modeli benimsenirse kurumlar hem denetim açısından güçlenir hem de gerçek kriz anında daha sakin ve kontrollü hareket eder.
Ana Sayfaya Dön