OS [Cluster] RHEL HA의 필요성과 구축 효과
페이지 정보
작성자 Leesangwoo 아이디로 검색 전체게시물 댓글 0건 조회 3,609회 좋아요 0회 작성일 19-08-21 17:39본문
※ 서비스 다운타임이 발생하는 요소
서비스의 가용성을 떨어뜨리는 요소는 크게 두 가지로 나눌 수 있다. 계획된 다운타임(Planned Downtime)과 계획되지 않은 다운타임(Unplanned Downtime)
계획된 다운타임에는 네트워크 작업, 시스템 구성 변경, 어플리케이션 마이그레이션이 있다.
이 작업들은 서비스를 운영하는데 필수적이다. 비록 사전에 공고하더라도 고객들은 서비스를 받지 못하는 불편함을 감수해야 한다.
그리고 계획되지 않은 다운타임은 네트워크 장애, 하드웨어 장애, 정전 및 UPS 장애가 있다.
서비스를 운영 중에는 장애가 발생할 가능성을 항상 가지고 있다.
계획된 다운타임은 업그레이드나 작업이 실패할 경우 원복을 통하여 기존으로 복구가 가능하지만,
계획되지 않은 다운타임에는 장애의 원인과 심각도에 따라서 복구 기간이 짧으면 몇 초에서 길면 며칠이 걸릴 수 있다.
이로 인한 서비스 장애는 기업이나 조직에 치명적일 수 있다.
※ 서비스 장애로 발생 가능한 일들
요새는 홈페이지나 앱을 이용하여 많은 업무가 처리되고 있다. 만약 자주 이용하는 홈페이지나 앱이 장애로 접속이 불가능하다면? 그때 오는 불편함은 엄청날 것이다.
예를 들어 인터넷 쇼핑을 하다가 장애로 접속이 안되어 필요한 물건을 찾지 못하거나 카드사의 결제 서버가 장애로 카드 결제가 안된다면? 우리는 물건을 구매하려고 해도 못 구매하는 상황이 발생한다.
다른 예로 여행을 위하여 여행사 홈페이지를 보다가 장애가 발생한다면? 우리가 원하는 여행 코스나 숙박 정보 등 필요한 정보를 얻지 못하게 된다.
이때 서비스를 이용하는 우리는 큰 불편을 느끼지만, 할 수 있는 일은 서비스가 복구되기를 기다릴 뿐이다.
※ 서비스 다운타임 (= 손실)
서비스의 다운타임은 바로 직접적인 손실로 이어진다.
서비스의 중요도에 따라서 손실액은 다를 수 있으며, 만약 중요한 서비스의 다운타임이 길어지면 손실액은 천문학적일 것이다.
그것 말고도 서비스의 다운타임이 늘어나면 비지니스에도 치명타가 된다.
예를 들면 고객의 만족도, 브랜드의 가치 및 평판, 시장 점유율 순으로 떨어지며 곧 회사의 주가가 하락하게 된다.
한번 떠난 고객의 무너진 신뢰를 회복하기는 무지 어려우며 다른 기업에 정착하면 거의 돌아오지 않는다.
속담에 "소 읽고 외양간 고친다"는 말이 있다. 서비스 장애로 다운타임이 발생하고 투자하기 보다는,
장애가 발생하기 전에 미리 투자하여 서비스 장애로 인한 다운타임이 없게 하는게 다방면에서 좋다.
서비스 장애로 인한 손실을 생각하면 가용성( 장애 없는 시스템 ) 에 대한 투자는 필수라고 할 수 있다.
|
HA ( Cluster system ) |
단일 ( single system ) |
SLA |
99.999% |
97% |
application |
slave ( standby ) 에서 서비스 가능 |
장애처리나 재구성 후 서비스 가능 |
비용 및 효율 |
초기 설치 비용이 있지만 가용성 보장 |
설치 비용이 저렴하나 장애시 가용성 보장 불가 |
평가 |
중단 없는 서비스로 운영자가 안심 함 |
장애로 서비스 중단과 매출 손실으로 운영자가 불안해 함 |
※ HA의 필요성
HA(High Availability)는 말그대로 고가용성을 의미한다. HA의 목적은 운영중인 서비스의 장애가 발생시 다운타임을 최소화 함이다.
그리고 운영중인 서비스에 장애가 언제 발생할지는 예측이 불가능하다. 아무도 없는 새벽 시간에 장애가 발생할수 있다.
HA는 아무도 없는 새벽에 장애가 발생해도 모니터링하여 standby ( slave )로 즉시 서비스를 넘겨줌으로서 중단 없는 서비스를 제공한다.
댓글목록
등록된 댓글이 없습니다.