공유할 서비스 선택

TECH


TECH

OS 이슈 : sbd watchdog type stonith 사용시 메모리 누수 발생 #RHEL8.10 #RHEL9.4

페이지 정보

작성자 OSworker 아이디로 검색 전체게시물 댓글 0건 조회 48회 좋아요 1회 작성일 25-03-29 13:58

본문

안녕하세요 오늘은 고객사에서 발생한 Pacemaker 이슈기반으로  설명드리고자합니다. 

많은 고객사에서 HA를 많이 사용하시는데, Red Hat에서는 Pacemaker라는 HA 솔루션이 있습니다.

이 Pacemaker 를 사용하시면서 발생한 이슈에 대해 오늘 그 문제점과 해결방안을 알려드리도록하겠습니다. 

 

 

1. 문제점

  - sbd watchdog 유형 펜싱을 사용하는 동안 sbd: watcher: Pacemaker 스레드는 시간이 지남에 따라 꾸준히 증가하며 클러스터가 중지되거나 시스템이 재부팅될 때까지 감소하지 않습니다.

 

 

Mon Jun 17 12:01:01 PM EEST 2024 VVV

USER         PID    PPID %CPU %MEM    VSZ   RSS TT       STAT  STARTED     TIME WCHAN                            COMMAND

root         914       1  0.0  0.2  20808 20456 ?        SL     Jun 14 00:01:13 do_sigtimedwait                  sbd: inquisitor

root         915     914  0.2  5.5 450088 449472 ?       SL     Jun 14 00:07:50 do_poll.constprop.0              sbd: watcher: Pacemaker <<<===

root         916     914  0.0  0.5  43288 42884 ?        SL     Jun 14 00:00:50 do_poll.constprop.0              sbd: watcher: Cluster

 

Mon Jun 17 12:01:21 PM EEST 2024

USER         PID    PPID %CPU %MEM    VSZ   RSS TT       STAT  STARTED     TIME WCHAN                            COMMAND

root         914       1  0.0  0.2  20808 20456 ?        SL     Jun 14 00:01:13 do_sigtimedwait                  sbd: inquisitor

root         915     914  0.2  5.5 450236 449728 ?       SL     Jun 14 00:07:50 do_poll.constprop.0              sbd: watcher: Pacemaker  <<<===

root         916     914  0.0  0.5  43288 42884 ?        SL     Jun 14 00:00:50 do_poll.constprop.0              sbd: watcher: Cluster

 

 

성장 속도는 매우 느리며, 일반적으로 하루에 약 95초(또는 약 120Mb)마다 약 128kb로 관찰됩니다. 

그러나 문제가 너무 오래 지속되면 메모리 부족 상태와 메모리 압력, 심지어 메모리 부족("OOM") 이벤트로 이어질 수 있습니다.

 

2. 원인 분석 

 

   1) 진단

      - ps 명령의 출력은 sbd:watcher: Pacemaker 스레드에 대한 높은 메모리 사용량을 보여주며 이는 시간이 지남에 따라 계속 증가하나요? 

       

$ ps -eLF | grep -i -e RSS -e sbd

UID          PID    PPID     LWP     C NLWP    SZ   RSS   PSR STIME TTY          TIME CMD

root      249208       1     249208  0    1      5202 20572   0    Oct28 ?        00:00:07 sbd: inquisitor

root      249209  249208  249209  0    1    39447 157432  1    Oct28 ?        00:00:31 sbd: watcher: Pacemaker <---- 여기서 보면 메모리 증가량이 보입니다.

root      249210  249208  249210  0    1     10822 42684   1    Oct28 ?        00:00:08 sbd: watcher: Cluster

root      289101  289072  289101  0    1       1602  2432   0    19:12 pts/1    00:00:00 grep --color=auto -i -e RSS -e sbd

 

      -  heap size  사용되는 메모리의 대부분을 차지합니다.

 

$ grep -A1 \[[a-z0-9]*\] /proc/$(pidof "sbd: watcher: Pacemaker")/smaps  | grep -v "\-\-" | paste - - | column -t

563b5a781000-563b5a7c4000  rw-p  00000000  00:00                      0     [heap]    Size:  268     kB

563b5a7c4000-563b5a7c9000  rw-p  00000000  00:00                      0     [heap]    Size:  20      kB

563b5a7c9000-563b62b30000  rw-p  00000000  00:00                      0     [heap]    Size:  134556  kB  <---- 여기서도 메모리가 많이  차지하는것을 볼수있습니다. 

7ffd004a0000-7ffd004e5000  rw-p  00000000  00:00                      0     [stack]   Size:  276     kB

 

 

- 이 문제의 원인은 누수와 클러스터에 대한 cib_native_perform_op_delegate 객체를 회수하지 못한 것으로 확인되었습니다. 사용 가능한 패치는 이 문제를 피하고 이러한 객체를 정리합니다.

 


3. 방안

   

  RHEL8.10을 사용하는 고객은  "pacemaker-2.1.7-5.1.el8_10"나 그 이상의 커널로 업데이트 

  RHEL9를 사용하시는 고객은 " pacemaker-2.1.7-5.2.el9_4" 나  그이상의 커널로 업데이트  하시면 됩니다. 

         - Bug Fix(es):

            . Memory leak in pacemaker-attrd [rhel-9.4.z] (JIRA:RHEL-40118) 

            . crm_node mishandles node IDs [rhel-9.4.z] (JIRA:RHEL-49925)

 

혹, 추가적으로 궁금하신 사항이 있으시다면 댓글로 남겨주세요~

 

감사합니다. 


 참고링크 : https://access.redhat.com/solutions/7093535


 

댓글목록

등록된 댓글이 없습니다.

TECH 목록
번호 제목 작성자 작성일 조회수
열람중 OS OSworker 아이디로 검색 전체게시물 03-29 49
열람중
이슈 : sbd watchdog type stonith 사용시 메모리 누수 발생 #RHEL8.10 #RHEL9.4

카테고리 : OS

49 0
작성자 : OSworker 25/03/29
116 OS OSworker 아이디로 검색 전체게시물 03-23 98
Linux 명령어 : du vs df 차이점에 대해 알아보겠습니다.

카테고리 : OS

98 0
작성자 : OSworker 25/03/23
115 OS OSworker 아이디로 검색 전체게시물 03-15 122
아직도 헷갈려 하시는 RHEL Life-cycle에 대해 좀 더 설명드리고자 합니다. RHEL5하고 RHEL6 "ongoing"

카테고리 : OS

122 0
작성자 : OSworker 25/03/15
114 OS OSworker 아이디로 검색 전체게시물 02-28 210
3월 11일에 RedHat 코리아에서 개최하는 행사가 있습니다. 어서 등록하세요~!!

카테고리 : OS

210 0
작성자 : OSworker 25/02/28
113 OS OSworker 아이디로 검색 전체게시물 02-23 218
Extended Life Cycle Support Extension 6 RHEL6 버전의 패키지가 아직도 나온다구요?

카테고리 : OS

218 0
작성자 : OSworker 25/02/23
112 OS OSworker 아이디로 검색 전체게시물 02-17 320
Red Hat Enterprise Linux 10 Beta -> 지금 이용 가능

카테고리 : OS

320 0
작성자 : OSworker 25/02/17
111 OS OSworker 아이디로 검색 전체게시물 01-28 400
2025년 엔터프라이즈 리눅스를 시작해야 하는 10가지 이유

카테고리 : OS

400 0
작성자 : OSworker 25/01/28
110 OS OSworker 아이디로 검색 전체게시물 01-19 596
RHEL9 에서 bonding 명령어로 설정, nmtui 사용하여 설정, 스크립트로 설정하는 법

카테고리 : OS

596 0
작성자 : OSworker 25/01/19
109 OS OSworker 아이디로 검색 전체게시물 01-12 611
RHEL9 에서 달라진 Network 설정을 알아보겠습니다.

카테고리 : OS

611 0
작성자 : OSworker 25/01/12
108 OS OSworker 아이디로 검색 전체게시물 12-29 664
여러분 리눅스 무료 배포판 NAVIX를 들어보셨나요? Naver + linux ??

카테고리 : OS

664 0
작성자 : OSworker 24/12/29
Total 117건
게시물 검색

주식회사 클럭스| 대표 : 이찬호| 사업자등록번호 : 107-87-27655
주소 : 서울특별시 영등포구 국회대로 800, 여의도파라곤
E-mail : sales@chlux.co.kr
Copyright © 클럭스 chlux.co.kr All rights reserved.
상단으로Top