Middleware (Monitoring) Grafana를 활용한 batch cpu process minitoring 방법
페이지 정보
작성자 미들웨어 아이디로 검색 전체게시물 댓글 0건 조회 2,537회 좋아요 0회 작성일 21-03-27 17:10본문
안녕하세요 "미들웨어" 입니다.
이번 장에서는 지난번 소개해드린 Grafana 를 활용해서 batch process 모니터링 활용방법에 대해 설명해보겠습니다.
실제로 상용 모니터링툴, 오픈소스 모니터링툴에서 batch cpu porcess 모니터링하는건 찾아보기 어렵습니다.
CPU는 증가하는데 어떤 활동으로 인해서 cpu 가 증가하는지 찾기가 어려운 거조..
예를들어 8core cpu 가 있다 하면 일반적으로 sys cpu와 user cpu 만 확인되고 어던 core 에 cpu 가 증가되서 총 cpu가 80%이상 사용하는지 확인이 어렵습니다
top 으로 확인은 가능하나 java 사용정도만 확인되는게 현실인거조..
그래서 한번 만들어서 사용해봤습니다.
1. batch cpu process minitoring 을 구현
Grafana + prometheus plugin 을 활용하면 아래 차트처럼 어떤 cpu로 인해 종합 cpu가 증가됐는지 확인해볼 수 있습니다.
아래 스샷처럼 구현에 필요한 사용 도구는 grafana 로 view를 구현했고 수집은 prometheus를 사용하고 agent에는 cpu exporter를 사용했습니다.
구현됐을때 성공한 batch cpu process 모니터링 대시보드 화면 입니다. |
2. slack image 알람 구현
모니터링 구현에 도움이 되길 바라며 grafana + slack image 전송 내용을 작성해봤습니다
slack 로 알림을 보내는 기능은 grafana 를 찾아보시면 어렵지 않게 구현 가능합니다. slack hook 를 설정만 하면 되는데, 문제는 image를 아래 처럼 보내려면 이미지를 저장할 nas 가 필요합니다. 저는 AC3 아마존을 사용해서 알람 발생시 이미지를 AC3에 저장하고 그걸 slack 에 알람 내용과 함께 전송하였고 성공했습니다. 성공된 이미지는 아래처럼 나옵니다..
|
위 처럼 slack 로 임계치설정을 한뒤 사용자가 설정한 수치 (예를들면 .. cpu 50%이상시 스샷 찍어서 slack로 알람전송) 를 자동으로 보내 확인한 사례입니다.
Grafana + promethous + slack + aws 저장소를 활용해봤습니다.
Grafana 에 대한 설계 구조는 지난 번 설명해드린 가이드 참고하시면 도움이 되실것 같네요
http://www.chlux.co.kr/bbs/board.php?bo_table=board02&wr_id=117&sca=Middleware&page=2
감사합니다
댓글목록
등록된 댓글이 없습니다.