본문으로 바로가기

RAID [redundant array of inexpensive disk]

category 하드웨어 2019. 1. 30. 23:26
본문
데이터를 분할해서 복수의 자기 디스크 장치에 대해 병렬로 데이터를 읽는 장치 또는 읽는 방식. 1987년 캘리포니아 대학 버클리 분교의 패터슨, 깁슨, 카츠에 의해 발표되어 논문 ‘A Case for Redundant Arrays of Inexpensive Disks’에서 등장한 기술이다. 1~5단계로 제안된 자기 기억 장치의 새로운 기술과 SLED(single large expensive disk)를 비교하여 설명하였다. 그 후로 여러 업체에서 제안한 0, 6, 10수준 등이 있다. 여러 디스크를 병렬로 연결하여 사용하는 기법으로서 접근(access) 속도와 데이터 보존 신뢰가 우수할수록 높은 등급을 받는 5단계로 구분된다.

 

 

RAID (Redundant Array of Independent Disks)는 여러 개의 하드디스크를 통하여


대용량 디스크 또는, 데이타 속도 증가, 데이타 백업, 안정성을 높이는데 사용이 된다.


RAID는 설치 할 때 용도에 맞게 선택을 잘 하여야만 하는데, 이는 득이 될 수도 있고


실이 될 수도 있으니 초기 세팅시에 주의를 하여야 한다.


왜냐하면, 사용 도중 다른 레벨로 세팅을 하거나 다른 환경 변화에 따라 대용량의


주요 데이타를 유실되거나 백업하는 수고가 생기가 된다.


수 많은 RAID가 있지만 가장 많이 사용하고 있는 몇 가지 레벨만 기술하려 한다.

 

1. 개별하드 방식
  1) 최소 하드디스크 개수 : 1
  2) 최대 용량 : 하드디스크 용량
  3) 설명 : 컴퓨터 내부에 있는 하드디스크의 D: E: F: G: 처럼 사용을 하는 것인데, 대부분
         JBOD라고 하지만 실제적으로 JBOD의 의미와는 다른 것이다.
         또한, RAID에는 개별하드 방식이란 것은 없다. 
         다만, RAID를 설명하기 위하여 기술을 하였다.
  4) 장점 : RAID를 사용하지 않기 때문에 디스크를 이리 저리 옭기는 이동성이 좋다.
         디스크 장애시에 장애 디스크의 데이타만 유실된다.
  5) 단점 : 컴퓨터에 많은 디스크가 보여 관리하기 힘들고, 대용량 파일 저장이 힘들다.

 

2. RAID 0 (스트라이핑(striping))
  1) 최소 하드디스크 개수 : 2
  2) 최대 용량 : 하드디스크의 수 x 하드디스크 용량
  3) 설명 : 
    -. 일반적으로 데이타 속도를 높인다던가 대용량 디스크로 만들어 사용하는 영상편집 
       작업용 스토리지에 사용된다.
    -. 컴퓨터에서 1개의 하드디스크 처럼 보이는데, 각 하드디스크를 계속 합하는것과 같다.
    -. 하드디스크가 증가 할 수록 디스크 용량 및 속도가 증가한다.
  4) 장점 : 
    -. 데이타 속도가 가장 빠르다.(이론상 하드디스크 1개 속도 x 하드디스크의 수)
    -. 컴퓨터에서 1개의 디스크만 보이므로 관리하기 편하다.
    -. 대용량 디스크가 되므로 대용량 파일을 용이하게 저장 할 수 있다.
    -. 150MB/s 이상 속도의 영상편집의 작업용으로 적합하다.
  5) 단점 :
    -. 1개의 하드디스크가 장애가 나면 전체 하드디스크의 데이타를 유실하므로
       가장 불안전하다.
    -. 필히 디스크의 데이타를 실시간 백업을 해야한다.

 

3. RAID 1 (미러링(mirroring))
  1) 최소 하드디스크 개수 : 2
  2) 최대 용량 : (하드디스크의 수/2) x 하드디스크 용량
  3) 설명 : 
    -. 원본 하드디스크와 복사본 하드디스크가 있다고 생각하면 된다.
    -. 전체 하드디스크 중 반은 원본 데이타가 있고 반은 복사본 데이타가 있다고

       생각하면 된다.
    -. 따라서, 실제적으로 절반의 하드디스크만 사용하게 된다.
    -. 데이타를 안전하게 보존 하는 용도로 사용 된다.
    -. 컴퓨터에서는 2개 중 1개만 보이게 된다.(4개 중 2개......) 
  4) 장점 : 
    -. RAID 중 가장 데이타를 안전하게 보존한다.
    -. 1개의 하드디스크 장애시 새로운 하드디스크 장착으로 데이타를 복구 시킬 수 있다.
  5) 단점 : 
    -. 하드디스크를 절반만 사용하게 되므로 백업 디스크가 매우 아깝고 그 만큼 돈도

       많이 든다.


   
4. RAID 5 (Parity)
  1) 최소 하드디스크 개수 : 3
  2) 최대 용량 : (하드디스크의 수-1) x 하드디스크 용량
  3) 설명 : 
    -. 각 하드디스크에 데이타 정보가 들어있는 Parity를 저장한다.
    -. 1개의 하드디스크 장애시 새로운 하드디스크 장착으로 데이타를 복구 시킬 수 있다.
    -. 데이타를 안전하게 보존 하는 용도로 사용 된다.
    -. 컴퓨터에서 1개의 하드디스크 처럼 보인다.
  4) 장점 : 
    -. RAID 1에 비하여 더 많은 용량의 데이타를 사용 할 수 있다.
    -. 데이타를 안전하게 보존한다.
  5) 단점 :
    -. 2개 이상의 하드디스크 장애시 데이타 손실이 일어난다.
    -. 디스크 생성 및 복구(rebuild)시에 많은 시간이 소요된다.
       (예 : 500G x 4EA = 2Tera 구성시 최소 12시간 이상 소요)
    -. 데이타 갱신시에 Parity 정보를 갱신해야 하기 때문에 속도가 느릴 수 있다.

 

5. RAID 0+1
  1) 최소 하드디스크 개수 : 4
  2) 최대 용량 : (하드디스크의 수/2) x 하드디스크 용량 
  3) 설명 : 
    -. RAID 0 생성 후에 RAID 1를 생성 한다고 생각하면 된다.
    -. 하드디스크를 합하고 복사본 하드디스크를 만드는 것과 같다.
    -. 대용량 데이타를 안전하게 보관하는 용도로 사용된다.
    -. RAID 1과 같이 실제적으로 절반의 하드디스크만 사용하게 된다.
    -. 컴퓨터에서 1개의 하드디스크 처럼 보인다.
  4) 장점 : 
    -. 데이타 속도가 빠르다.(이론상 하드디스크 1개 속도 x (하드디스크의 수/2))
    -. 컴퓨터에서 1개의 디스크만 보이므로 관리하기 편하다.
    -. 대용량 디스크가 되므로 대용량 파일을 용이하게 저장 할 수 있다.
    -. 데이타를 안전하게 보존 한다.
    -. 1개의 하드디스크 장애시 새로운 하드디스크 장착으로 데이타를 복구 시킬 수 있다.
  5) 단점 :
    -. 하드디스크를 절반만 사용하게 되므로 백업 디스크가 매우 아깝고 그 만큼 돈도

        많이 든다.

 

6. RAID 레벨 비교
  1) 안정성 : RAID 1 > RAID 5 > RAID 0+1 > 개별하드방식 > RAID 0
  2) 속  도 : RAID 0 > RAID 0+1 > RAID 5 > 개별하드방식 > RAID 1

 

출처 : www.fgint.com www.colossus.co.kr

 

 

 

 

 

RAID(Redundant Array of Independent Disks)

 

# RAID의 개념
 RAID는 본래 Redundant Array of Inexpensive(or Independent) Disks의 약어로, 1988년 미국 U.C.버클리 소속 과학자 David a Patterson, Garth Gibson, Randyh Kats에 의해 정의됬다. 기본적인 RAID의 개념은, 작고 값싼 드라이브들을 연결해 비싼 대용량 드라이브 하나(Single Large Expensive Disk)를 대체하자는 것이었지만, 그동안 하드 디스크를 포함한 스토리지 기술의 지속적인 발달로 인해 이제는 그 의미가 퇴색되어 버렸다.

 

# RAID의 정의
 여러 개의 하드 디스크를 하나의 Virtual Disk로 구성하여 대용량 저장장치로 사용 여러 개의 하드 디스크에 데이터를 분할·저장하여 전송속도의 향상 시스템 가동 중 생길 수 있는 하드 디스크의 에러를 시스템 정지 없이 교체(Hotswap), 데이터 자동복구

 

# RAID의 레벨
 RAID의 제안자들로부터 6개로 구분되었던 RAID의 각 레벨은 그간 보다 다양화되었으며, 그 구성과 기능면에 있어 서로 다르기 때문에, 사용자의 목적에 맞는 RAID 레벨 구성이 필수다. 현재는 이 중 RAID 0, 1, 0+1 이렇게 3개정도가 보편적으로 사용되고 있다. 

 

# RAID의 장점
1. 운영 체제에서 여러 개의 물리적 드라이브가 하나의 논리적 드라이브로 사용됨으로서 논리적 드라이브 수의 제한을 피할 수있다.
2. 여러 드라이브의 집합을 하나의 저장 장치처럼 다룰 수 있다.
3. 장애가 발생했을 때 데이터를 잃어버리지 않게 각각에 대해 독립적으로 동작한다. 
4. 다수의 하드 디스크에 데이터를 분할하여 병렬 전송함으로서 전체적인 Virtual 하드 디스크의 데이터 전송 속도는 향상된다.
5. 시스템 가동 중 하드 디스크에 문제가 발생하더라도 시스템 정지 없이 새로운 하드 디스크로 교체(Hot Swap)할 수 있다.
6. 데이터가 항상 안정적으로 유지되어야 할 때나 입출력이 많은 업무에 편리하다.


- RAID 0 (Striping)
@ 가장 기본적인 구현 방식으로 '데이터 Striping'이라고도 하며 빠른 입출력이 가능하도록 여러 드라이브에 분산 저장.
@ 추가적인 오류 교정 데이터 없이 데이터가 분산 저장되기 때문에 비교적 중요하지 않는 응용 프로그램에서 사용.
@ 성능은 매우 뛰어나지만 어느 한 드라이브에서 장애가 발생하게 되면 데이터는 손실 됨

 RAID 레벨 0에서 데이터는 빠른 입·출력이 가능하도록 여러개의 하드 디스크에 분산되어 저장된다. 즉, 하나의 디스크에 저장하는데 8분이 소요되는 데이터를 4개의 디스크에 동시분산하여 저장하면, 2분만에 모든 데이터의 저장이 완료되는 식으로, 이것은 장애 발생에 대비한 여분의 데이터 기록과 저장공간을 갖지 않기 때문에 성능이 매우 뛰어난 반면, 단 하나의 디스크에서 장애가 발생하더라도 데이터를 전부 손실할 수 있는 위험이 있다. 최소 2개의 하드 디스크만 있으면 구성 가능하다. 
 
- RAID 1 (Mirroring&Duplexing)
@ 하나의 드라이브에 기록되는 모든 데이터를 다른 드라이브에 복사해 놓는 방법으로 Mirroring'이라고도 한다.
@ 하나의 드라이브가 고장나더라도 다른 드라이브가 작동 중이므로 속도와 안정성 측면에서 상당히 우수 함.
@ 두 대의 드라이브만으로 구현이 되기 때문에 큰 볼륨을 구현하기가 어려우며 전체 공간의 50%의 용량만 데이터를 저장할 수 있으므로 설치 비용이 비싸다.
@ 복구 능력을 제공하며 읽기 능력은 뛰어나지만 쓰기 능력은 약한 편이다.

 

 흔히 Mirroring이라고도 불리는 RAID 레벨 1은 단순히 한 드라이브에 기록되는 모든 데이터를 다른 드라이브에 복사하는 방식이다. 하나의 드라이브가 고장나더라도, 또 다른 드라이브를 통해 완벽한 복구가 가능한데, 이러한 복구능력을 제외한 단순 성능에 있어선 하나의 드라이브를 사용할 때보다 큰 잇점은 없다. 두 개의 드라이브를 사용함으로 읽기성능은 하나를 사용할 때보다 빠르지만, 쓰기성능은 약간 느린편이다. 최소 두 개의 드라이브로 구성되며, 전체 하드디스크 용량의 50%만을 사용할 수 있다. 속도때문에 레이드를 사용 하는게 아닌 자료의 안전한 보관을 위해서 레이드를 사용하는데는 이와 같은 시스템이 좋다.

 

- RAID 5

@ 일반적으로 가장 많이 사용되는 RAID 방식으로 RAID 3 방식과 RAID 4 방식의 단점을 극복한 방식이다.

@ 고정적인 패리티 드라이브 대신 패리티가 모든 드라이브에 분산되어 저장되므로 병목 현상을 줄여준다.

@ RAID 3 방식의 패리티 분산 알고리즘이 없는 관계로 Sequential 읽기에서는 더 뛰어나다.


 

자료 처리 비율의 읽는 속도가 매우 빠르며, 자료 처리 비율의 쓰기 속도는 느리다. 집합의 번역 비율이 좋다. 단 출력량에 중간의 충돌이 있으면 처리가 실패할 수도 있으며, 설계하는데 매우 복잡하다.