[쿠버네티스] CPU 기반 HPA

Posted Apr 8, 2026

By Minseok Lee 2 min read

이번 글은 K6 테스트를 한 후 CPU 기반의 HPA가 늦게 반응하는 이유에 대한 공부이다.

아래 문서를 참고하였다.

CPU 기반 HPA가 느린 이유

결론부터 간단하게 말하자면 요청량이 아니라 사용량에 기반하며 아래과 같이 동작한다.

트래픽 증가 → CPU 증가 → Threshold 초과 → scale-out

또한 실시간이 아니라고 한다.

기본적으로

이기 때문에 최악의 경우 30초 이상 뒤에 반응을 한다.

또한 우리 서비스의 경우 burst traffic이기 때문에 몇초 사이에 트래픽 증가가 2~3배까지 증가할 수 있다.

이를 해결하기 위해 공식에서도 KEDA, custom metrics, request 기반의 스케일링을 추가로 권장한다.

당연하지만 그렇지 않다.

이러한 경우를 위해서 CPU + request를 같이 사용하게 된다면 어느정도 해결이 가능하다

This post is licensed under CC BY 4.0 by the author.