[네트워크] HTTP/2 - 새로운 구조

HTTP 2에서는 기존의 텍스트 기반 메세지를 압축해 각각의 HTTP 요청이 더욱 작은 크기로 구성되도록 했다. 이는 전송 계층(TCP)를 통해 데이터가 전송 될 때 압축되어 전송되는 것을 의미하기 때문에, 기존의 헤더나 본문 등을 그대로 사용할 수 있다. 이런 압축을 위해 바이너리 프레이밍 이라는 계층이 추가되었다.

출처 : https://web.dev/articles/performance-http2?hl=ko

기존의 HTTP 통신은 바이너리 프레이밍 레이어를 통과해 더 작은 메세지와 프레임 이라는 단위로 쪼개져 TCP 프로토콜을 통해 전송된다.

스트림, 메세지, 프레임

바이너리 프레이밍 레이어의 도입과 함께 추가된 새로운 개념들이다.

메세지

요청과 응답을 표현하는 단위다. HTTP/1.1 에서의 메세지와 동일한 의미이며, 하나 이상의 프레임으로 구성된다.

프레임

HTTP 2에서 사용하는 가장 작은 데이터 전송 단위이다. 각 프레임에는 길이, 프레임 헤더, 프레임 타입과 플래그, 스트림 구분자, 그리고 페이로드가 포함된다.

프레임 구조

프레임 타입에 따라 그 구조와 역할이 다르다. 가령 DATA 프레임은 HTTP 요청과 응답의 페이로드를 표현하고 전달하는데 사용하고, HEADERS 프레임은 스트림을 열고 닫거나, HTTP 헤더를 전달하는데 사용한다.

스트림

독립적으로 전달되는 프레임의 양방향 흐름. 하나 이상의 메세지를 전달할 수 있다.

스트림과 메세지 그리고 프레임 사이의 관계

하나의 HTTP 2 연결은 여러 스트림으로 구성된다. 각 스트림은 여러 메세지를 전송한다. 메세지는 실제로 여러 개의 프레임이라는 단위로 분할되어 전송된다. 한 쪽에서 전송된 프레임은 같은 메세지를 구성하는 프레임들이 모두 도착하면 다시 병합되어 해석된다.

스트림과 메세지, 그리고 프레임의 관계. 출처 :https://web.dev/articles/performance-http2?hl=ko

기존의 HTTP 통신 데이터를 바이너리 형태로 분할 및 압축한 프레임을 스트림이라는 논리적 흐름으로 묶어 통신하는 것이 HTTP/2 다.

HoL 블로킹 해결

스트림은 실제로 논리적인 흐름이고, 실제로 프레임은 한번에 하나 씩 전송된다. 기존과는 다르게 다른 스트림에 속한 프레임을 번갈아가며 전송할 수 있으므로, 병렬 처리가 가능해진다.

HTTP/2 의 HoL 해결 출처 :https://web.dev/articles/performance-http2?hl=ko

예를 들어 클라이언트가 1번 스트림의 데이터 프레임을 처리하는 동시에 5번 스트림의 데이터를 보낼 수 있다. 이런 스트림들은 모두 하나의 TCP 연결 위에서 전송되기 때문에 응용 계층 레벨에서 HoL 블로킹은 자연스럽게 해결된다. 오래 걸리는 요청(메세지)를 기다리지 않고 다른 요청(메세지)의 일부인 프레임을 송수신 할 수 있기 때문이다.

우선순위 기능

여러 HTTP 요청이, 동시에 여러 스트림을 통해 서버에 전달될 수 있으므로, 동시에 도달한 요청을 서버가 어떤 순서로 처리하느냐에 따라 서버와 클라이언트 모두에게 중요한 성능 문제를 야기할 수 있다. 예를 들어, CSS 파일을 요청하는 스트림이 HTML 문서를 요청하는 스트림보다 먼저 처리된다면, 브라우저는 HTML 문서가 아직 없으므로 아무것도 할 수 없다. 만약, HTML 문서를 요청하는 스트림이 먼저 처리된다면 브라우저는 CSS 파일이 도착하기를 기다리면서 HTML 문서를 분석해 DOM을 만들어, 렌더링을 할 수 있다.

우선순위 부여를 위해 스트림에는 1 ~ 256 범위의 정수를 가중치로 할당할 수 있다. 또한, 순서대로 처리를 하기 원하는 스트림들에게 종속 관계를 표시해 상위의 스트림이 먼저 처리되도록 할 수 있다.

출처 : https://web.dev/articles/performance-http2?hl=ko#stream_prioritization

위와 같은 상황에서, D 가 C 보다 먼저 서버의 자원을 할당받아야 하고, C가 A와 B 보다 먼저 서버의 자원을 할당받아야 한다. C와 E 는 같은 비율로 서버의 자원을 할당받고, A와 B는 A 가 B 보다 3배 더 많이 서버의 자원을 할당받아야 한다.

강제가 아니라 권고다

사실, 이런 우선순위나 종속 설정은 강제적인 것이 아니라 “서버님 이렇게 해주시길 바랍니다.” 정도의 강한 권고다. 따라서, 실제로 위 설정대로 처리가 되는 것을 보장하지는 않는다.

이는 서버 입장에서, 우선순위가 높은 요청을 처리하는 것이 너무 오래 걸릴 경우, 그동안 다른 요청을 처리하지 않는 것은 자원 낭비이기 때문이다.

같은 출처, 같은 TCP 연결

앞서 말한 대로 HTTP/1.1 에서는 하나의 TCP 연결을 재사용 하기 위해서는 먼저 보낸 HTTP 요청에 대한 응답이 오기를 기다려야 했다. 하지만, 웹 환경이 점점 더 커지고, 빈번히 HTTP 요청이 요구되도록 발전하면서 이런 방식으로는 대응할 수 없게 되었다. 따라서, 웹 브라우저는 아예 TCP 연결을 여러개 만들어서 HTTP 요청을 동시에 보내게 되었다.

HTTP/2 에서는 여러 스트림을 병렬로 처리하는 것이 가능하기 때문에, 여러 TCP 연결을 사용할 필요가 없어져 자연스럽게 TCP, TLS 프로토콜의 오버헤드를 줄여 더 효율적인 통신을 가능하게 했다.