문제 해결
본 문서는 Monitoring 관련 문제를 해결하기 위한 가이드입니다.
Collection took longer than expected; not complete after interval of 10s 에러 발생
모니터링 에이전트를 설치한 인스턴스 내에서 아래와 같은 에러가 발생할 수 있습니다. 이 오류는 메트릭 수집 시간이 짧아 발생하는 에러입니다.
에러 메시지
Apr 01 11:03:20 ${에러가 발생한 인스턴스} kic_monitor_agent[52839]: 2024-04-01T02:03:20Z W! [inputs.disk] Collection took longer than expected; not complete after interval of 10s
▶️ 다음과 같이 메트릭 수집 시간의 interval
값을 기본값(10s
)보다 큰 값으로 수정하면 해결됩니다.
-
/etc/kic_monitor_agent/kic_monitor_agent.conf
파일 내interval
값을 기본값(10s
)보다 큰 값으로 수정 후 저장합니다.interval 값 수정[agent]
## Default data collection interval for all inputs
interval = "30s" # 기존에 설정된 시간(10s)보다 크게 입력 -
다음 명령어를 사용하여 에이전트를 재시작합니다.
에이전트 재시작sudo systemctl restart kic_monitor_agent
-
다음 명령어를 사용하여 에이전트가 정상적으로 실행되는지 확인합니다.
에이전트 실행 확인sudo journalctl -u kic_monitor_agent -f
Prometheus 데이터 소스 생성 후 Save & Test 시, 403 Forbidden 에러 발생
Prometheus 데이터 소스를 가이드대로 생성했는데, Save & Test하면 아래와 같은 403 Forbidden
에러가 발생할 수 있습니다.
이 오류는 해당 사용자가 프로젝트 멤버(Project Member)이기 때문에 표시됩니다.
에러 메시지
403 Forbidden - There was an error returned querying the Prometheus API