Giải pháp backup cho doanh nghiệp – Part 3 – RTO, RPO 2 khái niệm cần nắm khi triển khai backup

Giải pháp backup cho doanh nghiệp – RECOVERY POINT OBJECT và RECOVERY TIME OBJECT

Qua 2 bài chém gió của mình chắc hẳn các bạn cũng mường tượng sơ sơ về những thứ mình cần làm trước khi triển khai 1 giải pháp backup cụ thể cho doanh nghiệp mình.

Trong bài nầy tôi sẽ giới thiệu 2 món mà bất kỳ phần mềm backup nào cũng phải tuân thủ theo đó là RTO, RPO.

1.Vậy RPO là gì? như thế nào là hợp lý?

– RPO được viết tắt của Recovery Point Object hay gọi na ná bình dân dể hiểu là ” thời điểm phục hồi”.

– Thời điểm ở đây là thời điểm cụ thể, ví dụ như 1 phút trước, 1 ngày trước, 1 tuần trước hoặc 1 tháng trước, đạ khái là 1 thời điểm đã xẫy ra và business họ muốn dữ liệu được phục hồi vào đúng thời điểm mà họ mong muốn.

Ví dụ như: Công ty ABC muốn hệ thống backup của họ có khả năng phục hồi dữ liệu 1 ngày trở về trước từ thời điểm cần phục hồi dữ liệu thì RTO là 1 ngày. Hay ví  công ty liên xô chấm mỹ muốn có thể khôi phục lại dữ liệu ở bất kỳ thời điểm nào thì RTO của họ là zero.

RTO lớn và nhỏ thì kéo theo những gì cần quan tâm trong giải pháp backup?

+ RTO càng nhỏ đòi hỏi hệ thống backup của bạn phải hoạt động real time, nghĩa là bên cạnh hệ thống production bạn đang sài thì phải có 1 hệ thống backup chạy song song. Đối với server có thể là cluster, đối với mặt dữ liệu có thể là backup file ra, hay backup hệ thống hệ điều hành ra 1 thiết bị lưu trữ khác. Chung quy là RTO = 0 tương ứng với việc chi phí và nhân lực đầu tư đẻ vận hành và duy trì hệ thống backup sẽ rất đắt đỏ.

+ Đối với 1 số doanh nghiệp đòi hỏi RTO = 0, điển hình là các ngân hàng, các công ty cung câp service IT cho khách hàng với cam kết on time 24/24 kể cả động đất sóng thần. Với các doanh nghiệp loại nầy, thay vì họ chỉ tốn 1 triệu $ đầu tư cho hệ thống production chạy thì giờ họ sẽ tốn thêm 2, 3 triệu $ thậm chí nhiều hơn để đầu tư những site tương tự ở vị trí khác nhau và hệ thống backup chạy real time cùng production vận hành liên tục.

+ Đối với nhiều công ty lớn ví dụ như google, microsoft, amazon, thì RTO của họ gần như là zero, và họ có những hệ thống backup của backup của backup, có nghĩa là nhiều lần backup, cùng 1 lúc ra lệnh thực thi ghi chép 1 file dữ liệu có thể được ghi và lưu trữ ở nhiều nơi khác nhau trên thế giới và việc backup cho các loại dữ liệu nầy hầu như real time. Nên bất kỳ thời điểm nào chúng ta cần phục hồi lại

=> Túm lại RTO = 0 tương ứng với việc ta phải đầu tư chi phí cực cao.

=> Chính vì vậy nên chúng ta nên hiểu rõ để khi ông Sếp nói cần backup real time mà không có đủ tiền thì tốt nhất nói thẳng là bỏ ý định real time đi.

Việc triển khai giải pháp backup cho doanh nghiệp thì RTO như thế nào là hợp lý?

– Một lần nữa việc nầy phụ thuộc hoàn toàn vào business, lại một lần nữa bạn thấy rõ vai trò quan trọng của việc hiểu business support đến việc triển khai giải pháp trong IT là như thế nào.

– Nếu công ty bạn việc tương tác với khách hàng 24/24 ,1 giờ off time cũng gây thiệt hại lớn cho doanh nghiệp, thì chắc chắn khỏi phải bàn, RTO phải là zero.

– Nếu doanh nghiệp của bạn lở xui có mất dữ liệu hay hệ thống có down 1 vài giờ hay 1 ngày, công ty đóng cửa cho nhân viên nghĩ sớm, mai làm lại bình thường, coi như nghỉ ngơi 1 ngày cho khỏe, dữ liệu không quá quan trọng đến mức là phải phục hồi lại ngay thời điểm từ lúc hệ thống die 1 – 2 h hay thậm chí 1 ngày, thì việc bạn chọn RT0 = 0, sẽ là gánh nặng cho doanh nghiệp bạn để nuôi hệ thống backup. Với trường hợp nầy RTO có thể là 1 ngày hoặc 1 tuần, tùy thuộc vào mức độ mà business bạn có thể chấp nhận được.

– Việc tính toán RTO phải dựa trên tiêu chí là lượng dữ liệu mất quy ra bao nhiêu tiền, và đầu tư vào hệ thống backup có mang lại giá trị tương xứng hay không, ví dụ như bạn mất dữ liệu 1 ngày, thiệt hại tính ra là 1 triệu VNĐ, nhưng bạn tốn chi phí để duy trì hệ thống backup là 10 tr/ ngày thì chắc chắn là phải xem lại 2 yếu tố, 1 là RTO có phù hợp hay chưa, 2 hệ thống backup của bạn đầu tư có phù hợp với chi phí mà doanh nghiệp bạn tạo ra hay chưa. Và dĩ nhiên đứng về góc độ quản lý chủ doanh nghiệp họ phán ngay, thôi thì tao vứt 1 triệu còn hơn là mất 10 tr nuôi backup.

2.RTO là gì và vai trò nó như thế nào trong việc triển khai hệ thống backup cho doanh nghiệp ?

– RTO (Recovery Time Object), dịch nôm na là thời gian phục hồi tính từ thời điểm chủ doanh nghiệp hoặc business owner đưa ra yêu cầu restore lại RPO chỉ định.

– Ví dụ như phòng nhân sự mất file tính lương và họ yêu cầu bạn trong vòng 1 tiếng phải phục hồi cho họ ngay, như vậy lúc nầy RTO = 1 giờ. Hay hệ thống công ty bị sự cố và bussiness ra chỉ thị cho bạn là trong vòng 30 phút phải phục hồi lại hiện trạng, như vậy lúc nầy RTO = 30 phút.

– Cũng như RPO, RTO cũng đóng vai trò tỷ lệ nghịch với chi phí, RTO càng nhỏ thì chí phí càng cao.

– RTO càng ngắn thì ảnh hưởng đến bussiness càng nhỏ, RTO càng cao thì doanh nghiệp thất thu càng lớn ( đối với  những hệ thống đặc biệt quan trọng).

– Thông thường RTO và RPO là cặp đôi đồng hành, thường RPO ngắn thì đòi hỏi RTO cũng ngắn, không có lý nào 1 doanh nghiệp yêu cầu bạn phục hồi dữ liệu và hệ thống cho tôi tính từ thời điểm sự cố xẫy ra và thời gian phục hồi cho phép là 1 tuần.

– Trong RTO vai trò năng lực của đội ngũ thực hiện công tác phục hồi hệ thống là cực kỳ quan trọng, đối với RPO bạn có thể set lịch để task backup tự động chạy, và công việc chính chỉ là monitoring thì RTO đòi hỏi bạn phải bắt tay vào restore, và việc nầy hết sức cẩn trọng và tỉ mỉ, đối với những hệ thống lớn chỉ cần 1 sai lần nhỏ sẽ dẫn đến hậu quả vô cùng nghiêm trọng, đối với 1 hệ thống vừa và nhỏ việc bạn restore sai thời điểm sẽ làm cho mục đích của việc phục hồi dữ liệu không đúng như yêu cầu, thậm chí làm mất luôn những file đang có.

3.RPO vs RTO và góc nhìn giải pháp

– Thông thường RTO và RPO là bộ đôi đi cùng với nhau để quyết định giá trị của 1 hệ thống backup và những giải pháp đi kèm.

– Với những hệ thống đòi hỏi RPO tính bằng 1 vài  phút đến 1 vài giây  thông thường người ta hay sử dụng những hệ thống Synchronous Replication (Nhân rộng đồng bộ) dữ liệu được đặt ở nhiều site khác nhau và đồng bộ liên tục.

– Với RPO được tính bằng 1 vài giờ đến 1 ngày thông thường người ta sử dụng Asynchronous Replication (Nhân rộng không đồng bộ). Dữ liệu được đặt ở nhiều site khác nhau và thời gian đồng bộ được tính bằng giờ , ngày.

– Đối với những hệ thống yêu cầu RPO không quá rush ( được tính bằng vài ngày cho đến 1 tuần) thì việc lưu trữ backup trên tape thường được sử dụng nhiều, thông thường sau khi hoàn thành task backup dữ liệu được lưu vào tape và đặt ở 1 nơi khác cách xa công ty ( thường là đặt trong các safe box tại  ngân hàng).

– Việc đòi hỏi thời gian up-time 24/24 kể cả lúc sự cố xẫy ra (RTO=0) đòi hỏi bạn phải trang bị hệ thống HA ở nhiều site khác nhau, đối với việc HA thời gian down time hầu như là zero.

– Khi sự cố xẫy ra, việc phục hồi nguyên hệ thống được tính bằng nhiều giờ đến nhiều ngày thông thường anh em hay dùng hot site.

+ Hot site là 1 nơi đặt cách xa công ty và có trang bị đầy đủ các hạ tầng tối thiểu để vận hành 1 hệ thống mà site chính đang có, bao gồm từ hạ tầng về công nghệ thông tin và nơi làm việc cho nhân viên và dĩ nhiên dữ liệu định kỳ vẫn được sync lên hot site.

+ Trong thời gian chuyện hoạt động tạm thời lên hot site, bạn tiến hành xây dựng lại site chính. Khi site chính đã phục hồi, công việc cần làm là sync dữ liệu từ hot site về site chính.

+ Đối với các công ty lớn thông thường hot site luôn nằm trong kế hoạch BCP(Business Continueus Plainning)  của họ

—Hết—

Trong bài tiếp theo mình sẽ đi chi tết về các Type backup thông thường mà  1 hệ thống backup phải có

Tác giả:  NGUYỄN VĂN TÀI – ITFORVN.COM

Bạn có thể tương tác và cập nhật thông tin mới nhất của Nhóm Facebook ITFORVN, Các khóa học mới do group tổ chức tại «Portal»

 

 

 

Đánh giá post