Business Continuity - RTO, RPO, MTPD

Recovery Point Objective (RPO), Recovery Time Objective (RTO), Maximum Tolerable Period of Discuption (MTPD)

Recovery Point Objective (RPO): Titik waktu terakhir dimana system IT dan aplikasi dapat dipulihkan. RPO biasanya digunakan pada teknologi replikasi seperti backup, replikasi storage, replikasi data secara terus menerus.

Recovery Time Objective (RTO): Seberapa cepat aplikasi dapat dipulihkan dan dapat beroperasi kembali. RTO ini dipengaruhi oleh proses pemulihan secara manual atau automatis, seperti urutan booting VM, re-directing trafik jaringan, pemulihan aplikasi secara konsisten.

Maximum Tolerable Period of Disruption (MTPD): Durasi waktu yang setelah melewati waktu tersebut, keberlangsungan organisasi menjadi rusak (dari segi finansial maupun reputasi) dan jika suatu layanan atau produk tersebut tidak bisa dipulihkan dalam durasi waktu tersebut.



Recovery Time Objective (RTO)

RTO adalah Recovery Time Objective merupakan maksimum waktu yang dapat ditoleransi untuk komputer, sistem, jaringan, atau aplikasi dalam keadaan mati setelah terjadi kegagalan atau bencana. RTO mempengaruhi berapa lama waktu yang dibutuhkan menghidupkan komputer sistem cadangan di saat keadaan normal terganggu. Pada akhirnya RTO akan mempengaruhi berapa banyak pendapatan perusahaan yang hilang per satuan waktu akibat ganguan bencana. Faktor-faktor ini pada gilirannya bergantung pada peralatan dan aplikasi yang terpasang. RTO diukur dalam detik, menit, jam, atau hari dan merupakan pertimbangan penting dalam perencanaan pemulihan bencana (Disaster Recovery Plan – DRP).

Ketika bencana melanda dan mengakibatkan seluruh data hilang, maka secara otomatis Data Center Anda akan berusaha untuk memulihkan diri dari bencana tersebut untuk bisa melangsungkan fungsi IT kembali normal. Waktu yang dibutuhkan oleh masing-masing produk layanan untuk pemulihan ini berbeda-beda. Dengan demikian, Inilah yang dimaksud dengan Recovery Time Objective.

Jadi dengan kata lain, Recovery Time Objective adalah upaya melakukan pengaturan waktu terkait berapa lama sebuah layanan produk dapat berjalan normal kembali setelah bencana terjadi. Seperti kata pepatah, waktu adalah uang, maka semakin cepat sebuah layanan untuk melakukan pemulihan atau recovery maka akan semakin baik. Apalagi bagi perusahaan besar. Setiap detik sangat berarti, bukan?

Tentu saja, hal ini akan berimbas pada harga yang harus Anda bayar. Semakin cepat Anda menginginkan layanan tersebut untuk pulih maka semakin mahal biaya yang harus Anda bayar. Misalnya Anda ingin suatu layanan dapat berjalan kembali lima jam setelah bencana terjadi, maka Anda harus membayar berkali-kali lipat lebih mahal daripada dibanding pemulihan yang memerlukan waktu lima hari misalnya.

Hal ini disebabkan karena semakin singkat waktu yang diminta, maka akan semakin banyak sumber daya yang diperlukan sehingga berimbas pada biaya yang lebih mahal untuk pengadaan sumber daya tersebut.



Recovery Point Objective (RPO)

Meskipun Recovery Point Objective (RPO) sering dianggap sama dengan Recovery Time Objective (RTO), namun keduanya memiliki perberbedaan yang cukup signifikan. Jika RTO lebih berorientasi pada lamanya waktu pemulihan bencana, maka RPO lebih kepada pemulihan datanya. RPO adalah kondisi di mana waktu maksimal yang bisa ditoleransi saat terjadi kehilangan data.

Misalnya saat terjadi bencana, kira-kira berapa banyak kehilangan data yang bisa Anda toleransi? Apakah dua jam data, atau satu hari data, atau satu minggu data? Kapasitas data dalam waktu hitungan hari tersebut yang disebut dengan RPO. Cukup berbeda dengan RTO, bukan? RPO ini berhubungan erat dengan frekuensi backup yang Anda lakukan. Lamanya waktu RPO memengaruhi jadwal backup berkala Anda. Misalnya, waktu RPO yang Anda tentukan adalah 24 jam, maka Anda harus melakukan backup setiap 24 jam sekali dan jika lebih sedikit, maka artinya Anda juga harus lebih seiring melakukan backup.



RPO dan RTO dalam solusi Disaster Recovery?

Recovery Point Objective (RPO) dan Recovery Time Objective (RTO) adalah dua parameter terpenting dari rencana pemulihan bencana (Disaster Recovery Plan – DRP) atau perlindungan data (Data Protection). Ini adalah tujuan yang dapat memandu perusahaan untuk memilih pencadangan cloud dan rencana pemulihan bencana yang optimal.

RPO / RTO, bersama dengan analisis dampak bisnis, memberikan dasar untuk mengidentifikasi dan menganalisis strategi yang layak untuk dimasukkan ke dalam rencana kesinambungan bisnis. Opsi strategi yang layak mencakup apa pun yang memungkinkan dimulainya kembali proses bisnis dalam kerangka waktu di atau dekat RPO / RTO.

Sekilas, kedua istilah ini terlihat sangat mirip. Cara terbaik untuk memahami perbedaan di antara keduanya adalah dengan mengaitkan “RP” dalam “RPO” dengan membayangkan bahwa mereka adalah singkatan dari “Rewrite Parameters” dan “RT” dalam “RTO” sebagai “Real-Time.”

Disaster Recovery tidak hanya tentang perlindungan terhadap bencana alam. Tetapi lebih kepada memastikan bahwa apapun yang terjadi terhadap infrastruktur IT, bisnis kita tidak mengalami downtime yang lama.


Maximum Tolerable Period of Disruption (MTPD)

Dampak atas pelanggaran ketentuan Undang-undang/regulasi, dampak pada staf/publik, kerusakan reputasi, kerusakan terhadap kelayakan leungan, kerusakan kualitas produk atau jasa, dan kerusakan lingkungan adalah beberapa foktor yang dapat dipertimbangkan saat menghitung MTPD. Perhitungan kuantitatif (analisis data historis/estimasi teknikal) dan perhitungan secara kualitatif (pertimbangan stake holder) dapat pula diambil dalam mengindentifikasi MTPD.


Langkah-langkah yang dapat diambil dalam menentukan Business Continuity Strategy:

  1. Mengindentifikasi Maximum Torelable Period of Disruption (MTPD) dan menentukan Recovery Time Objective (RTO) disetiap produk atau layanan (RTO labih kecil dari MTPD)
  2. Mengindentifikasi stategi agar RTO dapat tercapai
  3. Menganalisa strategi agar efektif untuk pembiayaan
  4. Menentukan arsitektur disaster recovery center berdasar hasil analisis Business Impact Analysis, Risk Analysis, dan Continuity Requirement Analysis.


Definisi dari Disaster Recovery dan Disaster Recovery Plan

Disaster Recovery (DR) adalah pemulihan bencana yang dirancang untuk melindungi organisasi dari kegagalan operasi sistem informasi dari pengaruh peristiwa negatif yang signifikan. Memiliki strategi pemulihan bencana memungkinkan organisasi untuk mengembalikan atau mempertahankan operasi sistem informasi dengan cepat untuk melanjutkan fungsi penting setelah terjadi gangguan.

Disaster Recovery Plan (DRP) adalah pendekatan yang terdokumentasi dan terstruktur yang menjelaskan bagaimana organisasi dapat dengan cepat melanjutkan pekerjaan setelah insiden yang tidak direncanakan. DRP adalah bagian penting dari rencana kesinambungan bisnis (BCP). Ini diterapkan pada aspek organisasi yang bergantung pada infrastruktur TI yang berfungsi. DRP bertujuan untuk membantu organisasi mengatasi kehilangan data dan memulihkan fungsionalitas sistem sehingga dapat berfungsi setelah insiden, bahkan jika beroperasi pada tingkat minimal.


Business Continuity Plan (BCP) adalah dokumen yang berisi informasi penting yang dibutuhkan organisasi untuk mempertahankan kelangsungan operasi bisnis selama terjadi bencana yang tidak terduga. BCP harus menyatakan fungsi penting bisnis, mengidentifikasi sistem dan proses mana yang harus dipertahankan, dan merinci cara mempertahankan kelangsungannya. Ini harus memperhitungkan kemungkinan gangguan bisnis. Dengan risiko mulai dari serangan siber hingga bencana alam hingga kesalahan manusia, sangat penting bagi organisasi untuk memiliki rencana kesinambungan bisnis untuk menjaga kesehatan dan reputasinya. BCP yang tepat mengurangi kemungkinan pemadaman yang mahal.

Disaster Recovery Plan dan Business Continuity Plan adalah dua sisi dari mata uang yang sama. Masing-masing mulai beraksi saat bencana melanda. Perbedaan antara BCP dan DRP adalah sebagai berikut:

  • Business Continuity Planning berkaitan dengan menjaga operasi bisnis tetap berjalan – mungkin di lokasi lain atau dengan menggunakan alat dan proses yang berbeda – setelah bencana melanda.
  • Disaster Recovery Plan berkaitan dengan pemulihan sistem informasi (komputer, network, aplikasi & datacenter) untuk memastikan operasi bisnis bisa berjalan normal setelah bencana terjadi.

High Availability (HA) adalah kemampuan sistem informasi untuk beroperasi terus menerus tanpa gagal dalam jangka waktu yang ditentukan. HA bekerja untuk memastikan sistem memenuhi tingkat kinerja operasional yang disepakati. Dalam teknologi informasi (TI), standar ketersediaan yang dimiliki secara luas tetapi sulit dicapai dikenal sebagai ketersediaan lima-sembilan, yang berarti sistem atau produk tersedia 99,999% setiap saat.

High Availability dan Disaster Recovery, dimana perbedaanya?

Disaster recovery (DR) merupakan bagian dari perencanaan keamanan yang berfokus pada pemulihan dari peristiwa bencana, seperti bencana alam yang menghancurkan fisik data center atau infrastruktur lainnya. DR adalah tentang memiliki rencana ketika sistem atau jaringan mati, dan hasil dari kegagalan sistem atau jaringan harus ditangani. Strategi High Availability, di sisi lain, menangani kegagalan atau kesalahan yang lebih kecil dan lebih terlokalisasi daripada itu.

Ada banyak tumpang tindih antara infrastruktur dan strategi yang diterapkan untuk DR dan HA. Proses backup dan failover harus tersedia untuk semua komponen penting dari sistem ketersediaan tinggi, dan mereka juga ikut berperan dalam skenario DR. Beberapa komponen ini mungkin termasuk server, sistem penyimpanan, node jaringan, satelit, dan seluruh pusat data. Komponen cadangan harus dibangun ke dalam infrastruktur sistem. Misalnya, jika server database gagal, organisasi harus dapat beralih ke server cadangan.

Dalam lingkungan HA, cadangan data diperlukan untuk menjaga ketersediaan jika terjadi kehilangan data, kerusakan, atau kegagalan penyimpanan. Pusat data harus menjadi tuan rumah cadangan data pada server yang berlebihan untuk memastikan ketahanan data dan pemulihan cepat dari kehilangan data dan memiliki proses DR otomatis.

Bagaimana cara menghitung RPO?

Ada banyak faktor yang memengaruhi RPO untuk bisnis Anda dan itu akan berbeda-beda untuk setiap aplikasi. Berikut adalah beberapa faktor yang dapat mempengaruhi RPO:

  • Kehilangan data maksimum yang dapat ditoleransi untuk organisasi tertentu
  • Faktor khusus industri – bisnis yang berurusan dengan informasi sensitif seperti transaksi keuangan atau catatan kesehatan harus lebih sering diperbarui
  • Pilihan penyimpanan data, seperti file fisik versus penyimpanan cloud, dapat memengaruhi kecepatan pemulihan
  • Biaya kehilangan data dan operasi yang hilang
  • Skema kepatuhan mencakup ketentuan untuk pemulihan bencana, kehilangan data, dan ketersediaan data yang dapat mempengaruhi bisnis
  • Biaya penerapan solusi pemulihan bencana

Selalu ada kesenjangan antara aktual – Recovery Time Actual (RTA) dan Recovery Point Actual (RPA) – dan tujuan yang diperkenalkan oleh berbagai langkah manual dan otomatis untuk memunculkan aplikasi bisnis. Hal-hal aktual ini hanya dapat diekspos oleh bencana dan latihan gangguan bisnis.


Sumber: https://datacommcloud.co.id, https://sharingvision.com, https://blog.lintasarta.net



Komentar

Postingan populer dari blog ini

Menghitung Service Level Agreement