Webflux 가 빠른 이유, MVC 와 비교했을 때 장단점[출처] Webflux 가 빠른 이유, MVC 와 비교했을 때 장단점|작성자 joebak

2022. 10. 21. 15:49 Spring Framework/Spring webflux

Scouter 신버전 (2.10.0) 에서 WebFlux 를 지원한다고 한다.

다음에 써봐야지!

---

많은 팀, 회사에서 Webflux 를 도입, 테스트, 실패(?) 등을 겪는 이야기를 많이 듣고 있다.

왜 도입을 시도하고, 어떤 이유로 실패를 하는지 등에 대해 정리해보고자 한다.

이론과 실전은 다르기에, 직접 스트레스 테스트를 진행해 보았고, Thread 구조, CPU 사용량, Memory 사용량, 응답시간 등을 보며 이해하고자 노력했다.

알아보고자 하는 내용

1. Webflux (nio) 는 MVC (bio) 보다 빠를까?

2. webflux 에 blocking 로직이 들어가더라도 MVC 보다 빠를까?

(blocking: JDBC query 실행 같은 Async 를 지원하지 않는 로직을 의미함.)

3. Webflux 와 MVC 의 장단점은 무엇일까?

어떤 기술도 장점만, 단점만 있진 않다.

There is no silver bullet. (https://johngrib.github.io/wiki/No-Silver-Bullet/

 

벤치마킹 머신
CPU
3.2 GHz 4core
Memory
16GB 1867 MHz DDR3
OS
MacOS Catalina
부하 Tool
Gatiling
APM Tool
Scouter

* 의미있어 보이는 수치에 빨간색 을 칠하였다.

Stress Test 조건 (non-blocking)
Async한 Reative Redis, Reative Mongo 를 사용했다는 가정
non-blocking 이라 함은 worker thread 수행시, 딜레이가 1ms 도 걸리지 않는걸 의미하기 때문에
기본 Spring Boot Initializer 에서 만들어준 걸 고대로 실행한 결과다. (hello world)
* 물론 실제 DB call 이 들어가면 이거보단 느리겠지만 ...
 
Webflux
MVC
유저수 (동시 request 수)
500
500
부하 시간
119s
119s
Stress Test 결과
 
Webflux
MVC
응답 시간
30 ~ 50 ms
50 ~ 100 ms
평균 TPS
8,571 TPS
4,400 TPS
CPU 사용량 (눈대중 평균치)
50%
90% ~ 100%
총 호출, 응답 수 (fail: 0)
1,019,959
522,128

* CPU 사용량의 차이가 크다.

- Webflux 의 Thread dump 를 보았을 때, worker thread 가 4개 밖에 안된다. (4core CPU 기준)

- 때문에 사용하는 Memory도 적다.

* Reactive 인 Webflux 는 8,571 TPS 나 나왔음에도,

CPU 사용량은 50% 밖에 나오지 않았으며 명성대로 99%의 응답은 50ms 미만으로 빠르게 수행되었다.

- thread 사용숫자, CPU 의 context-switching 의 비용이 얼마나 큰지 나타내주는 결과이다 ...

(누군가에게 내 웹서비스는 CPU는 50미만인데 10,000 TPS 가 나온다 라고 하면 너무나 뿌듯할 것 같다.)

* 의미있어 보이는 수치에 빨간색 을 칠하였다.

Stress Test 조건 (blocking 2ms)
2ms 를 넣은 이유: Blocking 을 흉내내기 위함
NIO (webflux) 를 사용하면서, Blocking DB커넥터 (JDBC, Jedis 등) 를 사용한다는 것 자체가
Non-sense 이지만, 이러한 상황에서 MVC보다도 빠를 수 있을까 비교하기 위함
단순히 코드에 Thread.sleep(2ms) 를 추가함
 
Webflux
MVC
유저수 (동시 request 수)
500
500
부하 시간
119s
119s
Stress Test 결과
 
Webflux
MVC
응답 시간
100ms 이상
50 ~ 100 ms
평균 TPS
1,600 TPS
4,400 TPS
CPU 사용량 (눈대중 평균치)
30%
90% ~ 100%
총 호출, 응답 수 (fail: 0)
186,708
523,588

* Webflux 에 blocking 로직이 들어가는 순간 CPU는 일을 안하고 놀기 시작한다. (CPU사용량: 30%)

* MVC 는 blocking 이 있든 없든 (2ms) 결과는 똑같았다.

병렬처리구조의 장점인지...

아니면 context-switching 에 비하면 2ms 는 너무나 큰 값이기에 차이가 없는건진 모르겠다...

아래는 응답속도 그래프이다.

<webflux + nonblocking>

<mvc + nonblocking>

물론 위 테스트의 작은 결함들이 몇개 있다.

1. 개인 PC에 성능테스트를 함

Java 프로세스르 띄우고는 5%~10% 점유율이었다, 대신 부하툴은 별도의 PC로 진행하였다.

2. 실무와는 차이가 있는 환경

Reative Redis, Reative Mongo 등을 직접 붙여 실행하지 않은 점

3. 둘다 Warm-up 을 하지 않음

1,000 thread 를 띄워서 수행하는 MVC에 비해

core 수 (4) 별로 worker thread 가 뜨는 webflux 가 훨씬 JVM Optimizing 에 유리했을 것으로 예상

4. 성능테스트라기에 너무 적은 부하 시간 (3분은 해줘야.. )

5. Network 환경이 너무 이상적이다.

같은 망 내에서 테스트 하였기 때문에 Gatling - Server 간 Network 비용이 없다.

실서비스에선 Network 부하도 만만치 않기 때문에 해당 내용도 추가되어야 한다.

너무 큰 응답패킷에 대해선 Gzip 설정을 해야하고, 보안을 위해서 https 암호화도 해야하는데 해당 작업들이 얼마나 성능에 영향을 끼치는진 위 테스트로는 알 수 없다.

Thread Dump로 webflux 와 MVC 차이 이해하기

< webflux: 요청이 많더라도, reator-http-nio- 스레드가 유지된다. >

< mvc: worker 스레드 수 = http-nio-8080-exec- 스레드 수>

Spring MVC 는 Thread per request 이기 떄문에 튜닝이 정말 중요하다.

때문에 1,000 worker thread 설정을 해주었고, 많은 thread 를 사용하기 때문에 Memory 설정도 꼼꼼하게 해주어야 한다. GC 튜닝 (g1gc) 및 Memory 관리 (xmx, xms 4g) 설정

하지만, webflux 는 Thread per core 이기 떄문에 따로 설정할 필요가 없다.

네개의 worker thread 로 빠른 응답시간, 낮은 CPU 사용, 낮은 Memory 사용을 하고 있다.

(위 벤치마크 표에 의하면 webflux 는 8,000 TPS 를 수행하고 있음에도 CPU 는 50%를 넘기지 않는다.)

결론

1. Webflux (nio) 는 MVC (bio) 보다 빠를까?

Webflux 프로젝트의 비지니스 로직들이 모두 Async + NonBlocking 으로 되어있다면 빠를 것. (DB connector, 외부 API 호출 등)

하지만 하나라도 Sync or Blocking 된 부분이 있거나, CPU 를 많이 쓰는 코드가 들어있다면 MVC보다 느릴 것으로 예상

2. blocking 로직이 들어가더라도 MVC 보다 빠를까?

느리다. blocking 이 하나라도 들어가면 MVC가 더 빠르다.

3. MVC와 비교한 Webflux의 의 장단점

장점
MVC 보다 빠르다. (더 빠른 응답속도)
MVC 보다 가볍다. (낮은 CPU, Memory 사용)
MVC에 비해 튜닝포인트가 적다. (Heap Memory, GC등)
단점
실수로 Blocking 코드가 들어가면 MVC 보다 느려진다.
클래스 및 메소드의 수행시간을 Hooking할수 있는 APM툴이 아직 없다.

기존 서비스의 응답속도를 높이기 위해 MVC 를 Webflux 로 고치는건 좀 무서울 것 같다.

MVC는 못해도 본전이지만, Reative 는 못하면 MVC를 적용하느니만 못하다.

(`못해도` 의 의미는 GC 튜닝, DB 튜닝, Network 튜닝을 빡세게 해서 1,000 ~ 2,000 TPS가 나오는걸 의미한다.)

만약 100ms 미만의 트래픽이 높은 서비스를 맡게 된다면 webflux + reative DB 를 사용해보겠지만,

400ms 미만의 높은 트래픽을 맡게 된다면 계속 MVC 를 사용하지 않을까 한다.