(alokapidakaldim.com) – Raid có mục đích lúc đầu là kết hợp hai hoặc nhiều ổ đĩa cứng vật lý để rồi sau đó tạo ra một thiết bị lưu trữ ảo duy nhất trên hệ thống máy chủ.

Bạn đang xem: Card raid là gì

Bài Viết: Card raid là gì

Bạn thực sự biết gì về RAID? RAID có phải là backup không? Nói về bảo vệ dữ liệu thì RAID có thực sự là công cụ bảo vệ kho dữ liệu HD của bạn một phương pháp hiệu quả hay không? Bạn hãy cùng tôi thử tìm hiểu về RAID đứng dưới góc độ của dân chơi HD xem nó như vậy nào nhé.


*

Khi nói đến việc bảo vệ dữ liệu, người ta thường nghĩ đến việc backup dữ liệu và rồi điều trước tiên mà bạn hay liên tưởng ngay đến đó là RAID. Tôi cũng xin thưa ngay từ đầu – backup không phải là RAID. Có chăng chúng dính dáng nhau một chút trong mục đích bảo vệ dữ liệu mà thôi, còn ngoài ra thì chúng trọn vẹn khác nhau.

Trước tiên tôi xin nói một chút về backup (hai chữ backup luôn viết liền nhau) là gì.

Thứ nhất, phục hồi những dữ liệu bị mất (vì ngẫu nhiên lý do gì).

Thứ hai, phục hồi dữ liệu về trạng thái tại một thời hạn trước đó mà mình thích.

Bởi vì, như định nghĩa nói, hệ thống sao lưu chứa tối thiểu một bản sao của tất cả những dữ liệu quý giá mà nó copy được nên yêu cầu về nơi lưu trữ dữ liệu là rất quan trọng. Việc tổ chức nơi có đủ dung tích lưu trữ cũng như việc quản trị sao lưu sao cho hiệu quả là cả một quá trình phức tạp. Và chính điều này đã tạo ra sự khác biệt đáng kể so với RAID.

Sẽ được gọi là backup đúng nghĩa nó phải đáp ứng 2 tiêu chí: Offline và offsite.

Offline – Quá trình backup được thực thi cũng như bản backup phải tọa lạc ngoài hệ thống mà nó đang sao lưu dữ liệu. Nói phương pháp khác dân dã cho dễ hiểu. Dữ liệu được sao lưu tọa lạc ở một máy, còn backup phải chạy trên máy khác. Chứ nếu không giả sử như thằng PSU nó chết thì không nói, nghe lời bằng hữu làm viên thuốc lắc khiến nó cà giựt làm điện trồi sụt rồi toi cả đám hdd vừa dữ liệu vừa backup thì ta chỉ có nước cắn lưỡi.

Offsite – Máy chạy backup phải tọa lạc ngoài khu vực những máy chủ mà nó đang backup dữ liệu như khác lầu, khác building và tóm lại càng xa càng tốt. Việc này nhằm tránh những tình huống thiên tai địch họa cháy nổ làm sụp toàn hệ thống một lúc.

Nhìn chung backup thường được cần sử dụng cho những doanh nghiệp to, nhà băng, cơ quan nhà nước những nơi có những dữ liệu nhiều và quan trọng cần phải bảo vệ (vấn đề bảo mật dữ liệu tọa lạc ngoài phạm vi bài này). Tôi có làm việc với một vài đồng nghiệp (chung việc làm nhưng khác bộ phận). Họ phụ trách việc sao lưu và lưu trữ dữ liệu thông tin của cả quốc gia. Mỗi lần làm backup xong (với những dữ liệu nổi trội quan trọng nhưng không thay đổi thường xuyên), tôi thấy họ có những nhân viên vũ trang đưa xe bọc thép chở những tape dữ liệu vào những hầm chứa ở một nơi ít người được phép biết để cất giữ. Sau này vì lý do an ninh, họ xây hẳn một trung tâm backup và backup qua hệ thống network cáp quang nội bộ (fiber cables 10Gb). Đương nhiên backup còn rất nhiều điều lý thú khác như những mức độ backup, những hình thức backup, những phương tiện backup, những vấn đề về nén dữ liệu, encryption, …. Một lần nữa nó lại tọa lạc ngoài phạm vi bài viết nên ai có hứng thú, thì sẽ trao đổi thêm sau.

Tôi cố tình nói hơi kỹ về backup để chúng ta có thể hiểu và sau này dễ dàng phân biệt với Raid.

Ưu điểm của backup thì hầu như ai cũng biết rồi, vậy những điểm yếu kém của nó là gì?

– Tốn kém thiết bị lưu trữ. Thật vậy, nếu bạn có 1TB mà muốn backup nó thì phải có 1TB nữa để chứa (backup) cái 1TB gốc. Có nén lắm cũng chỉ tiết kiệm chút đỉnh, mà càng nén nhiều thì tỉ lệ thất bại khi giải nén trong quá trình restore càng cao, do đó càng hồi hộp, nguy hiểm.

– Thời điểm backup bị hạn chế. Khi chúng ta phục hồi dữ liệu thì đó chính là dữ liệu tại thời hạn mà chúng ta làm backup mà thôi. Còn những thay đổi dữ liệu ngay sau khi backup được thực thi sẽ không được lưu giữ lại (cái này quan trọng và nên nhớ).

– Thời gian thực hiện backup thường kéo dài so với Raid (thời gian thực).

– Phiền phức, tốn kém thêm khi lưu trữ những backup.

Trở về đề tài chính đó là RAID. Ai cũng biết RAID là tên viết tắt của Redundant Array of Inexpensive Disks hoặc sau này nghe kỹ thuật hơn là Redundant Array of Independent Disks.


Theo trang tài liệu Wiki, Raid lần trước tiên được phát triển bởi những nhà khoa học máy tính thuộc trường Đại học California tại Berkeley vào năm 1987. Mục đích lúc đầu là họ muốn kết hợp hai hoặc nhiều ổ đĩa cứng vật lý để rồi sau đó tạo ra một thiết bị lưu trữ ảo duy nhất trên hệ thống máy chủ. Nói khác đi, OS của máy chủ lúc này chỉ có thể thấy một ổ duy nhất được dựng từ 2 hay nhiều HDD có trong máy.


*

Qua quá trình nghiên giúp và sử dụng, phương pháp mới này được bổ sung cập nhật làm cho nó lại có 2 khả năng hay hơn so với một ổ HDD đơn độc thông thường.

Thứ nhất: Giải quyết được lỗi hư hỏng của một (sau này là nhiều hơn) ổ HDD trong RAID.

Thứ hai: tăng hiệu suất đọc/ chép trên RAID.

Nói phương pháp khác, RAID được nâng cấp nhằm giúp tăng khả năng chịu lỗi và nâng mức thông lượng I/O throughput cao hơn so với một ổ cứng duy nhất hoặc một nhóm những ổ đĩa cứng độc lập.

Nhớ hồi xưa khi tập làm quen với máy tính, nghe tới Raid ai cũng xanh mặt run tay vì tính chất lưu trữ phức tạp và tương đối nổi trội của nó. Ngày nay tôi chắc là phần nhiều trong chúng ta nếu cứng tay một chút thì chí ít cũng một vài lần set up một cái Raid cho riêng mình, nổi trội là khi mức độ lưu trữ ngày càng được nâng lên về dung tích và thiết yếu cho một loạt những ứng dụng client / server.

Xem thêm: Động Từ Chỉ Trạng Thái ( State Verbs Là Gì, Động Từ Chỉ Trạng Thái ( State Verb Là Gì

Có hai khái niệm chính mà ta nên nhớ khi nói về Raid.

1/ Parity

Yếu tố cơ bản để giúp cho ta có thể phục hồi dữ liệu trực tuyến (tức lúc máy chủ vẫn đang vận hành) trong trường hợp một đĩa cứng bị hư hỏng bằng phương pháp sử dụng một hình thức dự trữ được gọi là parity. Để nói cho dân dã đơn giản hơn , parity là phần bổ sung cập nhật của tất cả những ổ đĩa được sử dụng trong cái Raid đó. Khi ta muốn tạm đọc dữ liệu từ một HDD bị hư nào đó (tôi nói tạm là vì khi ấy vận tốc truy xuất dữ liệu của toàn mảng Raid sẽ rất chậm, chúng chỉ được phục hồi vận tốc khi đã được thay bằng một ổ cứng mới), Raid sẽ thực hiện bằng phương pháp đọc những dữ liệu tốt còn lại và kiểm tra nó bằng phương pháp đối chiếu lại với dữ liệu pairty được lưu trữ trong mảng.

Tôi lấy ví dụ đơn giản để chúng ta đễ tưởng tượng Raid đã tính parity như vậy nào.

Giả sử ta có 4 ổ cứng tạo nên Raid và lần lượt những ổ cứng này chứa những dữ liệu mang giá trị cũng lần lượt là 1, 2, 3, và 4. Khi đó Raid sẽ gán giá trị của parity là 10 (giả sử thôi chứ thực tiễn không phải vậy đâu)

1 + 2 + 3 + 4 = 10

Khi ổ thứ 3 bị toi thì ta sẽ có

1 + 2 + X + 4 = 10

Để biết cái ổ cứng thứ 3 trước đó có chứa dữ liệu gì, khi đó Raid sẽ tính

7 + X = 10 hay X = 10 -7 hay X = 3.

Cũng vì tính toán dài dòng như vậy nên, nếu chúng ta để ý, khi một ổ bị tèo trong Raid 5 chẳng hạn, đồng ý là vẫn không có một dữ liệu nào bị mất, nhưng vận tốc truy xuất bị chậm hẳn đi.

Lưu ý parity chỉ được sử dụng ở những cấp độ RAID 2 , 3, 4 , và 5.

RAID 1 không sử dụng parity bởi vì tất cả dữ liệu là trọn vẹn sao chép ( nhân đôi).

Còn RAID 0 chỉ được sử dụng để tăng hiệu suất truy xuất. Vì không trang bị chức năng dự trữ dữ liệu nên nó không có parity .

Một thắc mắc gợi mở so với chúng ta nè. Chúng ta đã lúc nào set up một cái Raid 5 trên Windows hay Linux chưa? Nếu có thì có lúc nào gặp một trường hợp là 1 ổ cứng bị hư chưa? Khả năng thành công khi phụ hồi dữ liệu trở lại (sau khi thay ổ cứng mới) là bao nhiêu phần trăm?

2/ Khả năng chịu lỗi hư hỏng ổ cứng

Ngày nay người ta vẫn còn đang tranh luận gay gắt liệu công nghệ RAID có thật sự bảo vệ dữ liệu hay không? Có ngăn ngừa những lỗi hư ổ đĩa không. Gần đây thôi trên forum này cũng có vài ý kiến bài bác thẳng thừng Raid. Ví dụ như ở Raid 5, nếu chẳng may có từ 2 ổ cứng rù nhau cùng về chầu Diêm vương thì toàn bộ dữ liệu chết sạch, không phương pháp gì giúp vãn được. Theo ý kiến cá nhân, thì tôi cũng cho là Raid không bảo vệ dữ liệu hoàn hảo như backup, nhưng…. Vâng nhưng RAID vừa ý sự bảo hiểm an toàn và đáng tin cậy ổn định khi nó có thể chống đỡ sự hư hỏng của ổ đĩa (nhiều hay í thì còn tùy loại Raid) bằng phương pháp được phép kéo dài thời gian để phục hồi dữ liệu.


Những khả năng chịu lỗi của những Raid cũng có thể được tăng cường đáng kể bằng phương pháp chọn loại Raid lưu trữ đúng đắn (sẽ nói ở sau).

Ở trên ta đã biết parity được Raid tạo ra và tính toán ra sao, thì khi nhìn vào phương pháp phân bố parity trong một Raid, ta có thể biết khả năng chịu lỗi hư hỏng HDD của Raid đó dư lào ngay, ví dụ:

– Raid 5, những phần tử parity Ap, Bp, Cp, Dp,… được phân bố tuần tự lần lượt trên từng HDD trong Raid. Nếu cộng tất cả lại ta sẽ thấy chúng chiếm vừa đứng dung tích (nhỏ nhất) của một ở cứng trong Raid đó. Đó là lý do tại sao ta thấy ở những Raid 5, chúng ta phải hy sinh 1 ổ cho Raid và Raid thường bắt (hay nói đúng hơn nó chỉ bảo kê) chúng ta sử dụng những HDD có cùng dung tích. Thằng HDD nào to chuẩn sẽ bị nó vạc bớt ráng chịu. Và cũng từ đây ta có thể biết rằng, trong Raid 5, nó chỉ được phép 1 HDD toi mạng mà thôi, còn hơn nữa thì khi đó chính người mua … toi mạng.


*

*

Vì đề tài về Raid rất rộng, trong bài này tôi không thể nói cụ thể Raid là gì, nguyên tắc họat động của nó ra sao, có mấy cấp độ Raid và chúng khác nhau thế nào, hy vọng đến đây bạn vẫn chưa bị “bơi”. Mà muốn biết có đang bị “bơi” hay không dễ lắm. Nếu bạn vấn đáp được những thắc mắc này thì bạn cũng có thể yên tâm đi tiếp phần còn lại của bài:

Backup và Raid 1 giống và khác nhau ở điểm nào?

Tại sao nói Raid ngày nay có khả năng chịu được mức độ hư hỏng của một đến vài ổ cứng trong mảng Raid?

Cái gì làm cho Rai có khả năng đọc/ chép nhanh hơn là những ổ cứng độc lập?

Những yếu tố làm gia tăng sự phát triển của Raid trong giai đoạn hiện nay

Ngày nay ngày càng có nhiều công ty to đã tạo ra những mạng lưới nội bộ riêng cho mình trên toàn doanh nghiệp để nâng cao năng suất và sắp xếp luồng thông tin. Trong khi đó thì những cơ sở dữ liệu lại được lưu trữ phân tán trên những máy chủ riêng rẽ. Bằng phương pháp kết hợp nhiều ổ đĩa vào một mảng duy nhất – được xem bởi những hệ điều hành mạng như một ổ đĩa duy nhất, ứng dụng Raid gom về một kho dữ liệu duy nhất trên mạng, nó vừa ý lợi ích đáng kể là giảm kinh phí , những khoản tiết kiệm có thể được, đồng thời nhanh chóng phục hồi nếu thông tin thường xuyên bị mất hoặc không thể truy cập.

Chúng ta cũng biết, những ứng dụng hiện nay tạo ra những tập tin to hơn do đó nhu cầu lưu trữ mạng đã tăng lên tương ứng. Ngoài ra, sự tăng tốc của vận tốc CPU đã vượt xa vận tốc truyền tải dữ liệu để lưu trữ, tạo ra tắc nghẽn trong hệ thống hiện nay. Vì thế giải pháp lưu trữ RAID vượt qua những thử thách này bằng phương pháp vừa ý một sự kết hợp của tính sẵn sàng dữ liệu , hiệu suất nổi bật, khả năng mở rộng, năng suất cao và phục hồi mà không làm mất dữ liệu hoặc gián đoạn truy cập của người mua.

Những loại RAID

Chúng ta biết hiện nay có bao nhiêu loại Raid không? Có người sẽ nhau nhẩu nói ngay Raid 0, Raid 1, Raid 5, v.. v… Không phải bạn ơi, đó chỉ là cấp độ Raid mà thôi và tùy thuộc theo nhu cầu lưu trữ và sử dụng mà người ta quyết định lựa chọn cho mình cấp độ Raid nào cho phù hợp.

Còn Raid hiện nay thì tựu chung có 3 loại: Software RAID, Fake RAID và Hardware RAID.

Như đã nói, RAID là mảng đề tài quá to, quá rộng, nếu như nói cho hết, cho đủ thì có lẽ bài viết sẽ phải kéo dài lê thê. Do đó, tôi chỉ nói tóm gọn đặc điểm của từng loại RAID này là gì để sau này bạn cũng có cái cơ sở để phân biệt, không bị người khác chê… ‘Hai lúa”!

Chúng ta nên nhớ một điều cho dù là loại RAID gì, chúng đều có chung một đặc điểm là chạy trên những mã RAID viết dựa trên ứng dụng. Sự khác biệt giữa những loại RAID là nơi mà những mã ứng dụng này được thực thi hoặc trên bộ xử lý (CPU) máy chủ (như software RAID, Fake RAID ) hoặc ‘bán cái’ lại cho một bộ xử lý on-board ( Hardwar RAID).

1/ Software RAID

Cái này thì dễ rồi, sau khi cài xong HĐH, bạn tiến hành dùng luôn Windows để thiết lập RAID (0, 1, 5, gì đó) tùy ý bạn muốn – Windows based RAID. Còn bạn nào sử dụng Linux thì có sẵn mdadm utility không cần suy nghĩ nhiều cho nặng đầu. Ngày nay, đã và đang có khá nhiều software RAID được viết trên nền Linux và ngày càng chứng tỏ khả năng vượt trội so với hai anh kia. Chỉ gói gọn trong một câu như vậy này, tôi không nghĩ chúng ta sẽ hiểu hết. Vì sự hạn chế độ dài của bài, nên tôi chỉ có thể nói ngắn là basic RAID sẽ dần chết và bị thay thế bởi những software RAID viết dựa trên những mã nguồn mở.


Những software RAID dựa trên ứng dụng chủ yếu được sử dụng với những máy lưu trữ hộ gia đình, những máy chủ entry-level . Điểm chủ yếu để nhận diện là nó thực hiện tất cả những lệnh I / O và những thuật toán toán học RAID chuyên sâu trực tiếp trên những CPU của máy chủ lưu trữ. Chính điều này làm chậm hiệu suất hệ thống bằng phương pháp tăng lưu lượng truy cập máy chủ qua PCI bus , sử dụng vào ngay luôn tài nguyên của hệ thống CPU, memory, …. Ưu điểm chính của software RAID là giá thành rẻ hơn (nhiều software RAID cho free luôn) so với những lựa chọn thay thế RAID khác như hardware RAID có mức giá cao hơn nhiều.

2/ Fake RAID hay Host RAID

Tôi không hiểu lắm tại sao người ta lại nói là fake RAID, mà nếu dịch ra tiếng Việt cho sát nghĩa thì nghe nó trớt quớt. Trong khi tôi ưa thích từ Host RAID vì nó sát thực tiễn hơn. Vậy Fake RAID (RAID giả) là gì?

Tôi chắc rằng có 80 – 90% trong số chúng ta không biết gì về nó, thậm chí mới nghe lần đầu trong khi mình xài nó hà rầm mỗi ngày.

Khi bạn mới tậu một cái mainboard mới toanh về, trong lúc cài Windows, ta nhấn F6 để cài driver (chắc chúng ta vẫn còn nhớ) nhằm để thiết lập RAID trong BIOS ngoài trời Windows. Rõ ràng đâu có gì dính đến software nào đâu vì ngay cả OS còn chưa có huống là. Do đó nó rõ ràng là hardware RAID (hardware là motherboard đó!)

Cũng vậy, khi bạn mới tậu một cái card Sata rời 4 hoặc 8 cổng Sata. Ta set up RAID trên những ổ cứng gắn trên nó và cũng chả có cái software tên là A hay B nào can thiệp vào đây. Vâng, rõ ràng nó cũng chính là một hardware RAID.

Không phải thật sự như vậy đâu chúng ta ạ. Một lần nữa ta phải dính lâu vào một nguyên tắc đơn giản nhưng cơ bản là: Cho dù cái RAID đó được hình thành (xuất sứ) từ đâu một khi nó vẫn còn sử dụng nguồn tài nguyên là chính cái CPU và bộ nhớ memory của máy chủ để hoạt động (tính toán RAID, truy xuất dữ liệu,…) thì nó vẫn bị coi là software RAID như thường. Tuy nhiên vì ở đây nó có liên quan chút đỉnh tới mobo hoặc card rời. Nó sử dụng firmware nhận diện/ đánh giá ổ cứng trước khi HĐH được khởi động. Và sau khi HĐH khởi động xong (lấy quyền kiểm soát lại từ Bios) thì khi đó nó giao quyền điều khiển RAID cho OS luôn. Vì lẽ đó mà nó mang tên gọi Host RAID là vậy. Trời, khó quá, thế thì như vậy nào mới được gọi là hardware RAID, mặt mũi nó như vậy nào?

3/ Hardware RAID

Nó thường ở dưới hình thức là một dạng card add-in. Loại card RAID controller này cắm vào một khe cắm bus chủ PCI. Giảm tải hệ thống máy chủ trong một số hoặc tất cả những lệnh I / O, dành những hoạt động tính toán RAID cho một hoặc nhiều bộ vi xử lý thứ cấp mà nó có.

Theo tôi biết, vài cái tên nổi tiếng được những tay có máu mặt trang bị cho những tệp tin servers tại gia là 3ware, Areca, Intel, LSI vì chúng đem lại hiệu suất thực sự. Còn giá thì vô chừng từ vài trăm và cả ngàn USD tùy thuộc theo con chip đi theo nhanh hay chậm, dung tích memory tích hợp, số cổng Sata có thể kết nối, v..v…

Ví dụ như em này:3ware 9650SE-8LPML PCI Express SATA II Controller Card RAID


*

Tóm lại, đứng dưới góc nhìn của dân lưu trữ HD, khi mà dung tích phim ảnh nhạc nhẽo ngày càng phình to ra thì nhu cầu tìm hiểu về RAID để trợ giúp cho việc lưu trữ trở nên một chủ đề nóng và nó quan trọng hơn lúc nào hết.

Xem thêm: " Self Actualization Là Gì, Nhu Cầu Hiện Thực Hóa Lý Tưởng Của Bản Thân

Không mong muốn bài này không thể dài hơn nên chỉ cho ta một cái nhìn tổng quan kể cả tất cả hóa thân của RAID thôi chứ không kể cả chiều sâu trong chúng. Một đều an ủi là, chí ít qua bài này, bạn hiểu được phần nào về RAID để từ đó có quyết định đúng đắn khi lựa chọn một phương pháp bảo vệ cho kho lưu trữ dữ liệu HD của tôi.

Bài viết liên quan

Trả lời

Email của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *