장애 대응 내역

2025.06.16 - 장애 발생 및 대응 리포트

1. 현상: 서비스 이용이 전반적으로 느려지는 현상 발생 (해결 완료)

2. 보고 및 대응 내역:

  • 15:17 - 고객 제보 최초 확인

  • 15:18 - 개발팀 내부 보고

  • 15:19 - 문제 확인 및 접수

  • 15:40 - 문제 해결

  • 16:40 - 1시간 동안 안정화 여부 모니터링한 후 장애 해결 선언

3. 문제 발생 원인

웍스AI 서비스 메인에서 자주 호출하는 API에 대해 최적화되지 않은 쿼리가 있었고, 오늘 사용 고객사 증가로 트래픽이 몰리며 해당 쿼리에 병목이 발생해 DB에 부하가 심해져 서비스 지연이 발생한 것으로 파악되었습니다.

4. 해결책

쿼리 최적화를 진행하여 DB 부하를 줄여 서비스를 정상화 했습니다.

5. 재발 방지 대책

서비스에서 호출하는 API 쿼리에 대한 전반적인 성능 점검주기적인 테스트를 통해 향후 트래픽이 증가해도 서비스가 지연되는 일이 없도록 개선할 계획입니다.

서비스 이용에 불편을 드려 대단히 죄송합니다. 감사합니다.

Last updated