[ 상식 정보 ]/Server2009. 6. 6. 01:37

RAID (Redundant Array of Independent Disks)

 

# RAID의 개념
 RAID는 본래 Redundant Array of Inexpensive(or Independent) Disks의 약어로, 1988년 미국 U.C.버클리 소속 과학자 David a Patterson, Garth Gibson, Randyh Kats에 의해 정의되었다. 기본적인 RAID의 개념은, 작고 값싼 드라이브들을 연결해 비싼 대용량 드라이브 하나(Single Large Expensive Disk)를 대체하자는 것이었지만, 그동안 하드 디스크를 포함한 스토리지 기술의 지속적인 발달로 인해 이제는 그 의미가 퇴색되어 버렸다.

 

# RAID의 정의
 여러 개의 하드 디스크를 하나의 Virtual Disk로 구성하여 대용량 저장장치로 사용 여러 개의 하드 디스크에 데이터를 분할·저장하여 전송속도를 향상시켜주며 또한 시스템 가동 중 생길 수 있는 하드 디스크의 에러를 시스템 정지 없이 교체, 데이터 자동복구 하는 것을 말한다.

 

# RAID의 레벨
 RAID의 제안자들로부터 6개로 구분되었던 RAID의 각 레벨은 그간 보다 다양화되었으며, 그 구성과 기능면에 있어 서로 다르기 때문에, 사용자의 목적에 맞는 RAID 레벨 구성이 필수다. 현재는 이 중 RAID 0, 1, 0+1 이렇게 3개정도가 보편적으로 사용되고 있다. 

 

# RAID의 장점
1. 운영 체제에서 여러 개의 물리적 드라이브가 하나의 논리적 드라이브로 사용됨으로서

   논리적 드라이브 수의 제한을 피할 수있다.

 

2. 여러 드라이브의 집합을 하나의 저장 장치처럼 다룰 수 있다.

3. 장애가 발생했을 때 데이터를 잃어버리지 않게 각각에 대해 독립적으로 동작한다.

 

4. 다수의 하드 디스크에 데이터를 분할하여 병렬 전송함으로서 전체적인

   Virtual 하드 디스크의 데이터 전송 속도는 향상된다.

 

5. 시스템 가동 중 하드 디스크에 문제가 발생하더라도 시스템 정지 없이

   새로운 하드 디스크로 교체(Hot Swap)할 수 있다.

 

6. 데이터가 항상 안정적으로 유지되어야 할 때나 입출력이 많은 업무에 편리하다.


 

 

RAID level 0,1,5에 대하여.

 

- RAID 0 (Striping)
@ 가장 기본적인 구현 방식으로 '데이터 Striping'이라고도 하며

   빠른 입출력이 가능하도록 여러 드라이브에 분산 저장.

@ 추가적인 오류 교정 데이터 없이 데이터가 분산 저장되기 때문에

   비교적 중요하지 않은 응용 프로그램에서 사용.

@ 성능은 매우 뛰어나지만 어느 한 드라이브에서 장애가 발생하게 되면 데이터는 손실 됨

RAID 레벨 0에서 데이터는 빠른 입·출력이 가능하도록
여러개의 하드 디스크에 분산되어 저장된다.
즉, 하나의 디스크에 저장하는데 8분이 소요되는 데이터를
4개의 디스크에 동시분산하여 저장하면, 2분만에 모든 데이터의 저장이 완료되는 식으로,
이것은 장애 발생에 대비한 여분의 데이터 기록과 저장공간을 갖지 않기 때문에
성능이 매우 뛰어난 반면, 단 하나의 디스크에서 장애가 발생하더라도
데이터를 전부 손실할 수 있는 위험이 있다.
최소 2개의 하드 디스크만 있으면 구성 가능하다. 
 
 
- RAID 1 (Mirroring&Duplexing)
@ 하나의 드라이브에 기록되는 모든 데이터를 다른 드라이브에 복사해 놓는 방법으로
   Mirroring'이라고도 한다.
 
@ 하나의 드라이브가 고장나더라도 다른 드라이브가 작동 중이므로
   속도와 안정성 측면에서 상당히 우수함.
 
@ 두 대의 드라이브만으로 구현이 되기 때문에 큰 볼륨을 구현하기가 어려우며
   전체 공간의 50%의 용량만 데이터를 저장할 수 있으므로 설치 비용이 비싸다.
 
@ 복구 능력을 제공하며 읽기 능력은 뛰어나지만 쓰기 능력은 약한 편이다.

흔히 Mirroring이라고도 불리는 RAID 레벨 1은 단순히 한 드라이브에 기록되는

모든 데이터를 다른 드라이브에 복사하는 방식이다.

하나의 드라이브가 고장나더라도, 또 다른 드라이브를 통해 완벽한 복구가 가능한데,

이러한 복구능력을 제외한 단순 성능에 있어선

하나의 드라이브를 사용할 때보다 큰 잇점은 없다.

두 개의 드라이브를 사용함으로 읽기성능은 하나를 사용할 때보다 빠르지만,

쓰기성능은 약간 느린편이다.

최소 두 개의 드라이브로 구성되며, 전체 하드디스크 용량의 50%만을 사용할 수 있다.

속도때문에 레이드를 사용 하는게 아닌 자료의 안전한 보관을 위해서

레이드를 사용하는데는 이와 같은 시스템이 좋다.

 
 

- RAID 5

@ 일반적으로 가장 많이 사용되는 RAID 방식으로

   RAID 3 방식과 RAID 4 방식의 단점을 극복한 방식이다.

 

@ 고정적인 패리티 드라이브 대신 패리티가 모든 드라이브에 분산되어 저장되므로

   병목 현상을 줄여준다.

 

@ RAID 3 방식의 패리티 분산 알고리즘이 없는 관계로

   Sequential 읽기에서는 더 뛰어나다.


자료 처리 비율의 읽는 속도가 매우 빠르며, 자료 처리 비율의 쓰기 속도는 느리다.

집합의 번역 비율이 좋다.

단 출력량에 중간의 충돌이 있으면 처리가 실패할 수도 있으며,

설계하는데 매우 복잡하다.

 

Posted by 무소유v