장애 발생 및 지속 서비스 확인

RDS DB Primary 장애

구성

스크린샷 2021-08-20 오후 11 19 37



RDS -> 작업 -> 재부팅
스크린샷 2021-08-20 오후 10 04 11

장애 조치 ~ 클릭 -> 확인 클릭
스크린샷 2021-08-20 오후 10 04 19

지켜봅시다.
스크린샷 2021-08-20 오후 10 08 43

한번 더 재부팅 시켜줍니다
스크린샷 2021-08-20 오후 10 10 08
스크린샷 2021-08-20 오후 10 10 15

IP주소가 4점대로 바뀌었습니다
스크린샷 2021-08-20 오후 10 13 08
스크린샷 2021-08-20 오후 10 10 52

정상적으로 DB 접근이 됩니다
스크린샷 2021-08-20 오후 10 14 04

리전은 a영역, 보조 영역은 c영역입니다
스크린샷 2021-08-20 오후 10 14 57
스크린샷 2021-08-20 오후 10 15 01

AZ1 장애

구성

스크린샷 2021-08-20 오후 11 19 56



WebSrv-Leader 인스턴스에서 지속적인 접속 확인

1
2
3
4
5
# 지속적으로 접속 확인
while true; do curl $WPDNS/xff.php --silent --connect-timeout 1; date; echo "---[AutoScaling]---"; sleep 1; done

(옵션)
for i in {1..100}; do curl $WPDNS/xff.php --silent;echo ; done | sort | uniq -c | sort -nr
스크린샷 2021-08-20 오후 10 17 11

VPC -> 네트워크 ACL 클릭
스크린샷 2021-08-20 오후 10 17 56

네트워크 ACL 생성 클릭
스크린샷 2021-08-20 오후 10 18 08

1
2
3
이름: AllDeny
VPC: WP-VPC1
태그: Name, AllDeny
스크린샷 2021-08-20 오후 10 18 21

네트워크 ACL 생성 클릭
스크린샷 2021-08-20 오후 10 19 07

작업 -> 서브넷 연결 편집 클릭
스크린샷 2021-08-20 오후 10 19 18

Subnet1, 3 선택 -> 변경 사항 저장 클릭
스크린샷 2021-08-20 오후 10 19 33

a 영역은 타겟그룹에서 제외되고 있습니다
스크린샷 2021-08-20 오후 10 23 42

부하분산되어지는 걸 확인하며 AutoScaling이 정상적으로 작동하는 걸 알 수 있습니다
스크린샷 2021-08-20 오후 10 25 12
스크린샷 2021-08-20 오후 10 25 29

자원 삭제

1. RDS 삭제: 최종 스냅샷 언체크 -> 인스턴스 삭제 시 ~ 체크 !

2. EC2 AutoScalingGroup 삭제

3. S3 버킷 -> 삭제 -> 비우기 -> 삭제

4. EC2 시작 템플릿 삭제

5. 위 자원들 전부 삭제 후 -> CloudFormation 스택 삭제





참고 자료: AFOS[2기] 노션 내용


[AWS] 10주차 -5 장애 발생 및 지속 서비스 확인
http://example.com/2021/08/18/2021-08-18-AFOS-last-5/
Author
Sujeong Hyeon
Posted on
August 18, 2021
Licensed under