ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • EMC DataDomain DD4200 DISK 교체하는 방법
    System of Infra/Storage And Backup 2021. 11. 13. 00:12
    728x90
    반응형

    DELL로고이미지

    EMC DataDomain DD4200 DISK 교체하는 방법

    [참고] DISK RAID 6 구성

    sysadmin@DD4200# disk show state
    Enclosure   Disk                                          
                 1  2  3  4  5  6  7  8  9  10 11 12 13 14 15 
    ---------   ----------------------------------------------
    1            .  .  .                                      
    7            .  .  .  .  .  F  .  F  .  .  .  .  .  .  -  
    ---------   ----------------------------------------------
     
    Legend   State                 Count
    ------   -------------------   -----
    .        In Use Disks          15   
    F        Failed Disks          2    
    -        Not Installed Disks   1    
    ------   -------------------   -----
    Total 17 disks
     
    Disk    Disks            Progress   Remaining
    Group   Reconstructing   (%)        (minutes)
    -----   --------------   --------   ---------
    dg1     (2 pending)      n/a        n/a      
    -----   --------------   --------   ---------

    -> 현재 EMC DD4200에서 15개 SLOT에서 14개를 사용 중이고 현재 6번과 8번에 DISK 장애가 발생한 것을 확인할 수 있습니다.

    sysadmin@DD4200# alerts show current
    Id      Post Time                  Severity   Class               Object                Message                                                                                                                          
    -----   ------------------------   --------   -----------------   -------------------   ---------------------------------------------------------------------------------------------------------------------------------
    p0-1    Tue Oct 11 06:57:44 2016   CRITICAL   Network                                   EVT-NETM-00009: Unable to communicate with configured DNS.                                                                       
    p0-2    Tue Oct 11 05:58:10 2016   ERROR      SystemMaintenance                         EVT-SMTOOL-00001: Error communicating with mail server.                                                                          
    p0-19   Thu Oct 28 22:28:39 2021   WARNING    HardwareFailure     Port Index=1          EVT-MPATH-00003: Missing disk connection from system port 7d.                                                                    
    p0-35   Thu Oct 28 23:30:33 2021   CRITICAL   Network             Interface Index=5     EVT-FCSSM-00001: SCSI Target FibreChannel Port 2a is offline.                                                                    
    p0-36   Thu Oct 28 23:31:03 2021   CRITICAL   Network             Interface Index=6     EVT-FCSSM-00001: SCSI Target FibreChannel Port 2b is offline.                                                                    
    p0-43   Sat Nov  6 22:44:57 2021   CRITICAL   Filesystem          FilesysType=2         EVT-SPACE-00004: Space usage in Data Collection has exceeded 100% threshold.                                                     
    m0-3    Thu Oct 28 22:34:52 2021   CRITICAL   HardwareFailure     Enclosure=7:Disk=15   EVT-STORAGE-00002: Unable to access a disk and the disk state is not installed.                                                  
    m0-4    Thu Oct 28 22:38:28 2021   WARNING    Storage             Tier=1                EVT-STORAGE-00013: Active tier is low on spares.                                                                                 
    m0-7    Sun Nov  7 18:33:28 2021   WARNING    Storage             Enclosure=7:Disk=6    EVT-STORAGE-00011: Disk has not been added to the system.                                                                        
    m0-8    Sun Nov  7 18:44:05 2021   CRITICAL   HardwareFailure     Enclosure=7:Disk=6    EVT-STORAGE-00002: Unable to access a disk and the disk state is failed.                                                         
    m0-9    Tue Nov  9 22:54:41 2021   CRITICAL   HardwareFailure     Enclosure=7:Disk=8    EVT-STORAGE-00002: Unable to access a disk and the disk state is failed.                                                         
    m0-12   Wed Nov 10 01:43:11 2021   CRITICAL   Filesystem          Tier=Active           EVT-GC-00001: Cleaning can not proceed.                                                                                          
    m0-14   Wed Nov 10 02:55:17 2021   ALERT      Storage             ElapsedHours=4        EVT-STORAGE-00008: Volume dg1 has been degraded for over 4 hours. If condition persists for 68 more hours, system will shut down.
    -----   ------------------------   --------   -----------------   -------------------   ---------------------------------------------------------------------------------------------------------------------------------
    There are 13 active alerts.

    -> alerts show current 명령어를 통해서 현재의 상태에서 문제가 되는 부분을 확인할 수 있습니다. m-7과 m-8행을 보게 되면 Enclosure=7이라는 것을 확인하고 Disk=6, Disk=8이 장애라는 것을 콘솔에서 확인할 수 있습니다.

    sysadmin@DD4200# disk beacon 7.6
    Start disk LED beaconing for 7.6 at slot 5 ...
    
    LED beaconing completed.

    -> beacon 옵션을 사용하게 되면 물리적인 장비 앞에서 해당 디스크의 Location을 LED 점멸등에 표시를 하여 물리적인 작업 전에 다시 한번 확인이 가능합니다. 확인 후 물리적인 DISK를 교체합니다.

    sysadmin@DD4200# disk show state
    Enclosure   Disk                                          
                 1  2  3  4  5  6  7  8  9  10 11 12 13 14 15 
    ---------   ----------------------------------------------
    1            .  .  .                                      
    7            .  .  .  .  .  U  .  F  .  .  .  .  .  .  -  
    ---------   ----------------------------------------------
     
    Legend   State                 Count
    ------   -------------------   -----
    .        In Use Disks          15   
    U        Unknown Disks         1    
    F        Failed Disks          1    
    -        Not Installed Disks   1    
    ------   -------------------   -----
    Total 17 disks
     
    Disk    Disks            Progress   Remaining
    Group   Reconstructing   (%)        (minutes)
    -----   --------------   --------   ---------
    dg1     (2 pending)      n/a        n/a      
    -----   --------------   --------   ---------

    -> 교체가 완료되면 6번 SLOT에 F로 표시되어 있던 부분이 U로 바뀌게 되면서 종속되지 않은 디스크라고 친절하게 표시를 해줍니다.

    sysadmin@DD4200# disk rescan 7.6

    -> 추가적으로 rescan 작업을 진행해주도록 합니다.

    sysadmin@DD4200# disk unfail 7.6
    
    The 'disk unfail' command will add the disk to the active storage tier 
    and mark it as a spare. Any existing data on this disk will be lost.
            Are you sure? (yes|no|?) [no]: y
    
    ok, proceeding.

    -> 디스크를 활성 스토리지 계층에 추가합니다. 예비로 표시하십시오. 이 디스크의 기존 데이터는 모두 손실됩니다. 라는 질문에 y로 표시를 합니다.

    sysadmin@DD4200# disk show state
    Enclosure   Disk                                          
                 1  2  3  4  5  6  7  8  9  10 11 12 13 14 15 
    ---------   ----------------------------------------------
    1            .  .  .                                      
    7            .  .  .  .  .  R  .  F  .  .  .  .  .  .  -  
    ---------   ----------------------------------------------
     
    Legend   State                          Count
    ------   ----------------------------   -----
    .        In Use Disks                   15   
    R        Spare (reconstructing) Disks   1    
    F        Failed Disks                   1    
    -        Not Installed Disks            1    
    ------   ----------------------------   -----
    Total 17 disks
     
    Disk    Disks            Progress   Remaining
    Group   Reconstructing   (%)        (minutes)
    -----   --------------   --------   ---------
    dg1     7.6              0          n/a      
    dg1     (1 pending)      n/a        n/a      
    -----   --------------   --------   ---------

    -> disk show state 명령어를 통해서 다음 디스크 교체할 항목을 확인합니다.

    sysadmin@DD4200# disk beacon 7.8
    Start disk LED beaconing for 7.8 at slot 7 ...
    
    LED beaconing completed.

    -> beacon 옵션을 사용하게 되면 물리적인 장비 앞에서 해당 디스크의 Location을 LED 점멸등에 표시를 하여 물리적인 작업 전에 다시 한번 확인이 가능합니다. 확인 후 물리적인 DISK를 교체합니다.

    sysadmin@DD4200# disk show state
    Enclosure   Disk                                          
                 1  2  3  4  5  6  7  8  9  10 11 12 13 14 15 
    ---------   ----------------------------------------------
    1            .  .  .                                      
    7            .  .  .  .  .  R  .  U  .  .  .  .  .  .  -  
    ---------   ----------------------------------------------
     
    Legend   State                          Count
    ------   ----------------------------   -----
    .        In Use Disks                   15   
    R        Spare (reconstructing) Disks   1    
    U        Unknown Disks                  1    
    -        Not Installed Disks            1    
    ------   ----------------------------   -----
    Total 17 disks
     
    Disk    Disks            Progress   Remaining
    Group   Reconstructing   (%)        (minutes)
    -----   --------------   --------   ---------
    dg1     7.6              0          1212     
    dg1     (1 pending)      n/a        n/a      
    -----   --------------   --------   ---------

    -> 7.8 디스크의 상태가 unknown으로 동일하게 빠지고 다음 명령어를 수행합니다.

    sysadmin@DD4200# disk unfail 7.8
    
    The 'disk unfail' command will add the disk to the active storage tier 
    and mark it as a spare. Any existing data on this disk will be lost.
            Are you sure? (yes|no|?) [no]: y
    
    ok, proceeding.

    -> 디스크를 활성 스토리지 계층에 추가합니다. 예비로 표시하십시오. 이 디스크의 기존 데이터는 모두 손실됩니다.라는 질문에 y로 표시를 합니다.

    sysadmin@DD4200# disk show state
    Enclosure   Disk                                          
                 1  2  3  4  5  6  7  8  9  10 11 12 13 14 15 
    ---------   ----------------------------------------------
    1            .  .  .                                      
    7            .  .  .  .  .  R  .  s  .  .  .  .  .  .  -  
    ---------   ----------------------------------------------
     
    Legend   State                          Count
    ------   ----------------------------   -----
    .        In Use Disks                   15   
    s        Spare Disks                    1    
    R        Spare (reconstructing) Disks   1    
    -        Not Installed Disks            1    
    ------   ----------------------------   -----
    Total 17 disks
     
    Disk    Disks            Progress   Remaining
    Group   Reconstructing   (%)        (minutes)
    -----   --------------   --------   ---------
    dg1     7.6              0          1212     
    dg1     (1 pending)      n/a        n/a      
    -----   --------------   --------   ---------

    -> 해당 디스크의 상태가 U에서 s(스페어)로 변경된 것을 확인할 수 있습니다.

    sysadmin@DD4200# disk unfail 7.15
    
    The 'disk unfail' command will add the disk to the active storage tier 
    and mark it as a spare. Any existing data on this disk will be lost.
            Are you sure? (yes|no|?) [no]: y
    
    ok, proceeding.

    -> disk unfail 7.15 기존에 사용하지 않은 슬롯에 새 디스크를 교체하도록 합니다.

    sysadmin@DD4200# disk show state
    Enclosure   Disk                                          
                 1  2  3  4  5  6  7  8  9  10 11 12 13 14 15 
    ---------   ----------------------------------------------
    1            .  .  .                                      
    7            .  .  .  .  .  R  .  s  .  .  .  .  .  .  s  
    ---------   ----------------------------------------------
     
    Legend   State                          Count
    ------   ----------------------------   -----
    .        In Use Disks                   15   
    s        Spare Disks                    2    
    R        Spare (reconstructing) Disks   1    
    ------   ----------------------------   -----
    Total 18 disks
     
    Disk    Disks            Progress   Remaining
    Group   Reconstructing   (%)        (minutes)
    -----   --------------   --------   ---------
    dg1     7.6              1          1175     
    dg1     (1 pending)      n/a        n/a      
    -----   --------------   --------   ---------

    -> 교체한 DISK에 대해서 8번 15번 SLOT은 spare로 변경이 되고 현재 6번에서는 Reconstructing 작업이 수행되고 있습니다. 대기시간이 1175분으로 소요시간이 측정됩니다.

    sysadmin@DD4200# storage show all
    Active tier details:
    Disk      Disks                    Count   Disk       Additional      
    Group                                      Size       Information     
    -------   ----------------------   -----   --------   ----------------
    dg1       7.1-7.5, 7.7, 7.9-7.14   12      2.7 TiB    2 disks degraded
    (spare)   7.8, 7.15                2       2.7 TiB                    
    -------   ----------------------   -----   --------   ----------------
     
    Disk    Disks            Progress   Remaining
    Group   Reconstructing   (%)        (minutes)
    -----   --------------   --------   ---------
    dg1     7.6              53         596      
    dg1     (1 pending)      n/a        n/a      
    -----   --------------   --------   ---------
     
    Current active tier size: 30.0 TiB
    Active tier maximum capacity: 174.6 TiB
     
    Shelf Capacity License:
    License           Model   Total       Used       Remaining
    ---------------   -----   ---------   --------   ---------
    CAPACITY-ACTIVE   ES30    109.1 TiB   32.7 TiB   76.3 TiB 
    ---------------   -----   ---------   --------   ---------

    -> storage show all 명령어를 통해서 현재 dg1 그룹에 Raid로 구성되어 있는 디스크가 7.1-7.5, 7.7, 7.9-7.14 현재 dg1 7.6의 경우 Reconstructing 작업을 통해서 멤버로 돌아가기 위한 Process를 수행 중인 상태입니다. 596분의 소요시간으로 측정, EMC DD 시스템에서 평균적인 디스크 용량에 따른 reconstructing 소요시간으로 벤더에서 아래에서 제공해주었습니다.

     

    [EMC Reconstructing 예상 소요시간]
    On average, disk reconstruction will take: 
     
    500Gb 2 Hours 
    1Tb 4 Hours 
    2Tb 8 Hours 
    3Tb 16 Hours 
     
    Your system may take more or less time based on the factios listed above. 

     

    PS. 포스팅의 내용은 제 기준으로 작성한 것이기 때문에 참고해서 보시면 감사하겠습니다.

    포스팅 과정의 오류 및 오타 그리고 궁금한 점에 대해서는 댓글 남겨주세요. 

    728x90
    반응형

    댓글

Designed by Tistory.