본문으로 건너뛰기

문제 해결

본 문서는 Monitoring 관련 문제를 해결하기 위한 가이드입니다.


Collection took longer than expected; not complete after interval of 10s 에러 발생

모니터링 에이전트를 설치한 인스턴스 내에서 아래와 같은 에러가 발생할 수 있습니다. 이 오류는 메트릭 수집 시간이 짧아 발생하는 에러입니다.

에러 메시지
Apr 01 11:03:20 ${에러가 발생한 인스턴스} kic_monitor_agent[52839]: 2024-04-01T02:03:20Z W! [inputs.disk] Collection took longer than expected; not complete after interval of 10s

▶️ 다음과 같이 메트릭 수집 시간의 interval 값을 기본값(10s)보다 큰 값으로 수정하면 해결됩니다.

  1. /etc/kic_monitor_agent/kic_monitor_agent.conf 파일 내 interval 값을 기본값(10s)보다 큰 값으로 수정 후 저장합니다.

    interval 값 수정
    [agent]
    ## Default data collection interval for all inputs
    interval = "30s" # 기존에 설정된 시간(10s)보다 크게 입력
  2. 다음 명령어를 사용하여 에이전트를 재시작합니다.

    에이전트 재시작
    sudo systemctl restart kic_monitor_agent
  3. 다음 명령어를 사용하여 에이전트가 정상적으로 실행되는지 확인합니다.

    에이전트 실행 확인
    sudo journalctl -u kic_monitor_agent -f

Prometheus 데이터 소스 생성 후 Save & Test 시, 403 Forbidden 에러 발생

Prometheus 데이터 소스를 가이드대로 생성했는데, Save & Test하면 아래와 같은 403 Forbidden 에러가 발생할 수 있습니다. 이 오류는 해당 사용자가 프로젝트 멤버(Project Member)이기 때문에 표시됩니다.

에러 메시지
403 Forbidden - There was an error returned querying the Prometheus API