RAID在手,安全高效一应俱全

2022-12-17 23:42:03

您是否遇到过导致所有数据丢失的计算机硬盘驱动器故障?

得知数据无法恢复后,欲哭无泪。一想到保存了几年的多年积累的生活影像、学习资料和实验数据,辛辛苦苦积累起来的实验数据就这样消失了,心痛得透不过气来!

个人数据的丢失已经是不可接受的。如果企业级服务器的存储系统崩溃,比如银行的金融服务器或者互联网公司的培训服务器数据丢失,其影响就更加不可估量了。

为了避免这种情况,提高海量数据的读写速度,RAID(Redundant Arrays of Independent Disks,独立磁盘冗余阵列)应运而生。

为了更好的理解RAID,我们先来了解以下几个概念。

即硬盘作为现代计算机的主要存储设备,容量大,读写速度快。主要分为新型固态硬盘、传统机械硬盘和混合硬盘。

既然有硬盘,当然也有软盘(也就是软盘)。软盘是早期个人计算机中使用的可移动存储介质。当时普遍使用的是容量只有1.4MB的3.5英寸软盘,读写速度较慢,早已淡出市场。

软、硬盘统称为磁盘,“磁”是指利用磁记录技术来存储数据。

RAID是由独立的磁盘组成的冗余阵列,简称磁盘阵列。

一般一台电脑配备1块或2块硬盘就可以满足基本需求,而企业服务器对数据存储容量和读写速度的要求极高,是普通硬盘远远不能满足的。因此,工程师将多个独立的硬盘组成一个大容量组,以提供比单个硬盘更高的存储性能、I/O性能和可靠性。

如果您是 RAID 的新手,您可能对这个概念还有一些疑问。先回答一些简单的问题吧~

原来RAID是大硬盘叠加了多层不同的buff?

严格来说,RAID是一种多硬盘操作方式,是一种高性能的存储技术。为便于理解,RAID可以看作:由多个普通硬盘以不同形式组合而成的具有加成效果的大硬盘。

就是这样~RAID和单纯加硬盘有区别吗?

加一块硬盘只是为了增加存储空间,一次只能读写一块硬盘。一旦硬盘损坏,数据就会丢失。在RAID中,数据分散存储在多个硬盘上,通过并行处理提高带宽和读写数据的速度。并且多个硬盘同时工作,增加了平均无故障时间。即使一块硬盘出现故障,及时更换也不会影响整个阵列的正常运行,故障硬盘中的数据也可以得到恢复。

明白了!也就是说,RAID可以大大提高硬盘组的数据吞吐量,并提供容错功能,保证数据安全。

这波总结到位!下面介绍一下RAID是如何结合硬盘来实现这些功能的。

RAID主要使用条带化、镜像、数据校验三种技术来组合硬盘。首先介绍四种标准的RAID类型。

也称为条带化或切片,将连续数据(A1~A8)分布式写入多个硬盘,可以并发读写,充分利用总线带宽,实现最高存储性能。一旦单盘出现故障,数据安全就会受到威胁,只适用于不求安全只求速度的场景。

有更安全的解决方案吗?

又称为镜像,将一段数据(A1~A4)分别写入工作盘和镜像盘,相当于全自动实时备份,具有最高的数据安全性。但实现成本高,硬盘利用率低,仅适用于金融、监控服务器等安全性有充分保障的场景。

是否有平衡性能和安全性的解决方案?

将连续的数据(A1~A3、B1~B3、C1~C3、D1~D3)和相应的奇偶校验信息(Ap、Bp、Cp、Dp、Ep)分别分配到不同的硬盘中。当单个磁盘发生故障时,可以通过对正常磁盘数据和奇偶校验信息进行异或来恢复数据。 RAID5兼顾了存储性能、成本和可靠性,普遍用于各种民用私有NAS服务器。

如果两个硬盘同时损坏怎么办?

在RAID5的基础上,增加了一组奇偶校验信息(Aq、Bq、Cq、Dq、Eq)。两组独立的奇偶校验信息可以实现双重校验,即使两个硬盘同时损坏。数据恢复。 RAID6 的读性能和容错性更高,但写性能较低,实现成本高。

通过“添加”标准RAID,可以获得以下三种兼顾性能和可靠性的混合RAID。

RAID10可以理解为:用四块硬盘(Disk0和Disk1,Disk2和Disk3)组成两个RAID1,然后将两个RAID1组合成一个RAID0。 RAID10兼有两者的优点,但硬盘利用率不高。

在RAID50中,一个RAID0由多个RAID5卷组成。 RAID50可以同时承担多个卷中的单盘故障风险,大大提高了容错性,继承了RAID0的高存储性能。

RAID60的整体结构和特点与RAID50相似,也继承了RAID6的优点。即使多个RAID6卷同时出现两块磁盘故障,也不会影响数据的安全。

每个级别的 RAID 都有其对读写性能和安全可靠性的强调。小编得出以下结论:

从表中可以看出,RAID的特点是:容量更大,I/0性能更高,数据安全性和可靠性更强。

读到这里,相信您已经知道了RAID的优势,但是对于如何使用RAID,您可能还是一头雾水。实际上,RAID有以下三种实现方式:

集成在服务器操作系统中,配置管理简单,成本低。所有任务都由CPU执行,导致CPU负载大,整体性能差。

它配备计算单元和 I/O 处理器,独立于操作系统管理 RAID 配置。例如,外部磁盘阵列柜和内部磁盘阵列卡。虽然成本高,但在使用和配置上更加灵活,可以提供更好的性能,充分发挥RAID的特点,因此应用规模更大。

具有 RAID 控制器和驱动程序,但缺少 I/O 处理器并且仍然依赖驱动程序来执行任务。

PCIe RAID卡的外部结构如下图所示。

RAID卡不仅结合了RAIDCache来提高数据的读写和传输性能,还提供了一些强大的功能,例如:

■ 硬盘直通:用户命令直接传送到硬盘。

■硬盘节能:允许硬盘在闲置时降速。

■数据断电保护:提供超级电容供电和功率校准。

■热备份:提供热备盘,自动替换故障磁盘。如果没有设置热备盘,它会自动用空闲磁盘替换故障磁盘。

■ 一致性检查:定期对数据进行计算,并与相应的冗余数据进行比较。如果不一致,会自动修复并保存错误信息。

随着硬盘接口、处理器等技术的逐步发展,RAID技术日趋成熟。凭借其大容量、高性能、可靠性和可控性等优势,被广泛应用于中大型数据库、高性能计算、互联网应用等领域,满足大众需求。企业用户在数据存储容量、I/O性能、数据安全、业务连续性等方面有着不同的需求。

目前,针对RAID已经出现了负载均衡、故障检测、隔离恢复等多种技术。预计未来会出现革命性的新技术,推动RAID的快速进步。

本文来自微信公众号:中兴文档(ID:ztedoc)