부하 분산 장치

1. 개요

부하 분산 장치는 네트워크 트래픽이나 컴퓨팅 작업을 여러 서버나 컴퓨팅 리소스에 분배하는 네트워크 장비 또는 소프트웨어 솔루션이다. 이 장치의 주요 목적은 단일 서버에 과도한 부하가 집중되는 것을 방지하고, 전체 시스템의 처리 용량, 신뢰성, 가용성을 향상시키는 것이다.

부하 분산 장치는 일반적으로 클라이언트와 서버 풀 사이에 위치하여 중개자 역할을 한다. 들어오는 요청은 미리 정의된 부하 분산 알고리즘에 따라 여러 백엔드 서버 중 하나로 전달된다. 이 과정은 사용자에게 투명하게 이루어지며, 사용자는 단일 서비스에 접속하는 것처럼 느끼게 된다. 이 기술은 웹 사이트, API, 데이터베이스, 애플리케이션 서버 등 다양한 서비스에 적용된다.

부하 분산의 핵심 이점은 확장성과 장애 조치 능력이다. 트래픽 증가 시 새로운 서버를 풀에 추가하여 수평적으로 확장할 수 있으며, 한 서버에 장애가 발생하면 트래픽을 정상 서버로 자동 전환하여 서비스 중단을 최소화한다. 이는 클라우드 컴퓨팅과 마이크로서비스 아키텍처 환경에서 필수적인 구성 요소로 자리 잡았다.

용어	설명
로드 밸런서	부하 분산 장치를 지칭하는 일반적인 용어
백엔드 서버	실제 요청을 처리하는 서버 풀
가상 IP 주소	클라이언트가 접속하는 로드 밸런서의 단일 주소
세션 지속성	특정 클라이언트의 요청을 동일한 서버로 유지하는 기능

2. 부하 분산 장치의 기본 개념

부하 분산은 네트워크 트래픽이나 컴퓨팅 작업을 여러 서버나 컴퓨팅 리소스에 분배하는 과정을 의미한다. 이 과정의 핵심 목적은 단일 지점에 과도한 부하가 집중되는 것을 방지하여 전체 시스템의 처리 용량을 최대화하고, 응답 시간을 단축하며, 가용성과 신뢰성을 향상시키는 것이다. 단일 서버로 모든 요청을 처리하면 성능 병목 현상이 발생하거나 서버 장애 시 전체 서비스가 중단될 수 있기 때문에, 부하 분산은 현대적인 인터넷 서비스와 엔터프라이즈 애플리케이션의 필수 구성 요소가 되었다.

부하 분산 장치는 이러한 분산 작업을 수행하는 전용 네트워크 장비 또는 소프트웨어를 가리킨다. 이 장치는 클라이언트와 서버 풀 사이에 위치하여 모든 인바운드 네트워크 요청을 수신한 후, 미리 정의된 규칙과 알고리즘에 따라 적절한 백엔드 서버로 트래픽을 전달한다. 사용자는 단일 접점(예: 웹사이트 주소)을 통해 서비스에 접속하지만, 실제로는 보이지 않는 곳에서 부하 분산 장치가 여러 서버 중 하나로 연결을 안내하게 된다.

부하 분산 장치의 주요 기능은 트래픽 분배 외에도 다양하다. 장애 조치 기능은 특정 서버에 문제가 발생했을 때, 해당 서버로의 트래픽 전송을 중단하고 정상적인 서버로만 요청을 보내 서비스 중단을 방지한다. 세션 지속성 또는 스티키 세션 기능은 특정 클라이언트의 연속된 요청을 항상 동일한 서버로 보내어 사용자 세션 정보를 유지할 수 있게 한다. 또한, SSL/TLS 오프로딩을 통해 암호화/복호화 작업을 대신 처리하여 백엔드 서버의 부하를 줄이고 성능을 개선하는 역할도 수행한다.

2.1. 부하 분산의 정의와 필요성

부하 분산은 네트워크 트래픽이나 컴퓨팅 작업을 여러 서버나 자원에 고르게 분배하는 과정이다. 이는 단일 서버에 과도한 부하가 집중되어 성능 저하나 서비스 중단을 방지하고, 전체 시스템의 처리량, 신뢰성, 가용성을 향상시키는 것을 목표로 한다. 현대의 디지털 서비스는 수많은 사용자의 동시 접속과 대량의 데이터 처리를 요구하기 때문에, 부하 분산은 확장 가능하고 견고한 인프라를 구축하는 데 필수적인 기술이 되었다.

부하 분산의 필요성은 크게 세 가지 측면에서 설명할 수 있다. 첫째는 확장성이다. 사용자 수나 트래픽이 증가할 때 단순히 서버의 성능을 높이는 수직 확장에는 물리적, 경제적 한계가 있다. 부하 분산을 통해 여러 대의 서버를 병렬로 추가하는 수평 확장 방식은 더 유연하고 비용 효율적으로 시스템 규모를 늘릴 수 있게 한다. 둘째는 가용성과 내결함성 향상이다. 한 대의 서버에 장애가 발생하더라도 부하 분산 장치가 정상 서버로 트래픽을 전환함으로써 서비스 중단 시간을 최소화하고 연속성을 보장한다. 셋째는 성능 최적화이다. 지리적으로 분산된 서버에 사용자를 가까운 위치로 연결하거나, 서버의 현재 부하 상태에 따라 트래픽을 분배함으로써 응답 시간을 줄이고 사용자 경험을 개선할 수 있다.

필요성	설명
확장성	수평 확장을 통해 트래픽 증가에 유연하게 대응할 수 있다.
가용성	서버 장애 시 트래픽 전환으로 서비스 중단을 방지한다.
성능	응답 시간을 최소화하고 자원 활용률을 극대화한다.

따라서, 웹 애플리케이션, API, 데이터베이스 클러스터, 심지어 DNS 서버에 이르기까지 다양한 IT 인프라에서 부하 분산은 핵심 구성 요소로 자리 잡고 있다. 이는 단순한 트래픽 분배를 넘어 현대 클라우드 네이티브 아키텍처와 마이크로서비스의 기반이 되는 기술이다.

2.2. 부하 분산 장치의 주요 기능

부하 분산 장치는 단순히 트래픽을 여러 서버로 나누는 것을 넘어, 네트워크의 가용성, 안정성, 효율성을 보장하는 여러 핵심 기능을 수행합니다. 그 주요 기능은 트래픽 분배, 고가용성 제공, 성능 최적화, 그리고 보안 강화로 요약할 수 있습니다.

첫째, 트래픽 분배는 가장 기본적인 기능입니다. 사전에 정의된 부하 분산 알고리즘을 통해 들어오는 클라이언트 요청을 백엔드 서버 풀에 고르게 분산시킵니다. 이 과정에서 서버의 현재 부하 상태, 연결 수, 지정된 가중치, 지리적 위치 등 다양한 요소를 고려하여 최적의 대상 서버를 선택합니다. 이를 통해 단일 서버에 과부하가 걸리는 것을 방지하고 전체 시스템의 처리 용량을 극대화합니다.

둘째, 고가용성과 장애 조치를 제공합니다. 부하 분산 장치는 정기적으로 백엔드 서버에 헬스 체크를 수행하여 각 서버의 정상 작동 여부를 모니터링합니다. 건강하지 않은 서버를 감지하면 자동으로 트래픽 분배 대상에서 제외시켜 사용자 요청이 실패한 서버로 전달되는 것을 방지합니다. 이는 시스템의 전체적인 안정성과 무중단 서비스를 가능하게 하는 핵심 메커니즘입니다.

기능 범주	세부 기능	설명
트래픽 관리	알고리즘 기반 분배	라운드 로빈, 최소 연결 등 규칙에 따른 트래픽 분산
	세션 지속성	특정 클라이언트의 요청을 동일한 서버로 유지
가용성 보장	상태 모니터링	정기적인 헬스 체크를 통한 서버 상태 확인
	자동 장애 조치	장애 서버를 풀에서 제거하고 정상 서버로 트래픽 전환
성능 및 보안	SSL/TLS 오프로딩	암호화/복호화 작업을 장치가 처리하여 서버 부하 감소
	트래픽 필터링	기본적인 DDoS 공격 방어나 악성 트래픽 식별 지원

마지막으로, 성능 향상과 보안 강화를 위한 부가 기능을 포함합니다. 대표적으로 SSL/TLS 오프로딩은 암호화된 HTTPS 트래픽의 복호화 작업을 부하 분산 장치가 대신 처리하여 백엔드 서버의 CPU 부하를 줄이고 응답 속도를 높입니다. 또한, 네트워크 트래픽을 집중적으로 관찰하는 위치에 있기 때문에, 기본적인 수준의 트래픽 필터링이나 방화벽과 연동된 보안 정책 적용의 시작점 역할을 하기도 합니다.

3. 부하 분산 알고리즘

부하 분산 장치는 트래픽을 여러 서버에 분배할 때 사용하는 규칙인 부하 분산 알고리즘에 따라 동작한다. 알고리즘 선택은 서비스의 특성, 서버 성능, 지리적 위치 등 다양한 요소에 따라 결정되며, 효율적인 자원 활용과 사용자 경험 향상을 위해 중요하다.

가장 기본적인 알고리즘은 라운드 로빈이다. 이 방식은 들어오는 요청을 등록된 서버 목록의 순서대로 차례차례 할당한다. 모든 서버의 성능이 동일하고 연결 상태가 비슷할 때 단순하고 공정한 분배가 가능하다. 그러나 서버의 실제 처리 능력이나 현재 부하 상태를 고려하지 않아 특정 서버에 과부하가 걸릴 수 있는 단점이 있다.

서버의 현재 부하 상태를 고려하는 알고리즘도 있다. 최소 연결 알고리즘은 활성화된 연결 수가 가장 적은 서버를 선택하여, 서버의 실시간 부하를 고려한 분배를 가능하게 한다. 반면, 가중치 기반 알고리즘은 서버의 처리 능력(CPU, 메모리 등)에 따라 미리 가중치를 부여한다. 성능이 높은 서버는 더 많은 트래픽을 받도록 설계되어, 이질적인 성능의 서버 풀을 효율적으로 운영할 수 있다.

사용자의 위치나 네트워크 상태에 기반한 알고리즘도 사용된다. 지리적/지연 시간 기반 알고리즘은 클라이언트의 지리적 위치나 지연 시간을 측정하여 가장 가깝거나 응답이 빠른 서버로 트래픽을 라우팅한다. 이를 통해 전 세계에 분산된 서버를 운영하는 글로벌 서비스의 응답 속도를 최적화할 수 있다.

알고리즘 유형	주요 원리	적합한 사용 사례
라운드 로빈	요청을 서버 순서대로 순차 할당	서버 사양이 균일한 단순 웹 서비스
최소 연결	현재 연결 수가 가장 적은 서버 선택	세션 지속 시간이 길고 변동이 큰 서비스(예: FTP, 데이터베이스 연결)
가중치 기반	서버 성능에 비례한 가중치 부여	성능이 다른 서버를 혼합 사용하는 환경
지리적/지연 시간 기반	클라이언트 위치 또는 응답 속도 기반 선택	글로벌 사용자를 대상으로 하는 콘텐츠 전송 네트워크(CDN) 또는 서비스

3.1. 라운드 로빈

라운드 로빈은 가장 기본적이고 널리 사용되는 부하 분산 알고리즘이다. 이 방식은 들어오는 요청을 등록된 서버 목록에 순차적으로 할당한다. 첫 번째 요청은 첫 번째 서버로, 두 번째 요청은 두 번째 서버로 보내는 식으로 순환하며, 마지막 서버에 요청을 보낸 후에는 다시 목록의 처음으로 돌아간다.

이 알고리즘의 동작 원리는 단순하다. 로드 밸런서는 내부에 서버 풀의 순서를 유지하며, 각 새로운 연결 요청에 대해 다음 순서의 서버를 선택한다. 모든 서버가 처리 능력과 성능이 동일하다고 가정할 때, 이론적으로는 요청이 모든 서버에 균등하게 분배된다.

라운드 로빈 방식의 주요 장점은 구현이 간단하고 오버헤드가 적다는 점이다. 서버의 현재 부하 상태나 연결 수를 고려하지 않고 순서만으로 결정하기 때문에 결정 로직이 매우 빠르다. 또한 별도의 상태 정보를 유지할 필요가 없어 상태 비저장 방식에 적합하다.

그러나 모든 서버의 성능과 용량이 동일하지 않은 실제 환경에서는 한계를 보인다. 처리 능력이 낮은 서버와 높은 서버에 동일한 양의 요청이 할당되면, 성능이 낮은 서버는 과부하 상태가 될 수 있다. 또한 서버의 현재 부하나 응답 시간, 활성 연결 수 등을 전혀 고려하지 않기 때문에 최적의 분산이 이루어지지 않을 수 있다는 단점이 있다. 이러한 한계를 보완하기 위해 가중치 기반 알고리즘이나 최소 연결 알고리즘 등이 발전되었다.

3.2. 최소 연결

최소 연결 알고리즘은 부하 분산 장치가 현재 처리 중인 연결 수가 가장 적은 서버로 새 요청을 전달하는 방식이다. 이 방법은 서버마다 처리 능력이 비슷할 때 효과적이며, 각 서버의 실시간 부하 상태를 고려하여 트래픽을 분배한다. 라운드 로빈 알고리즘이 단순히 순서만을 고려하는 반면, 최소 연결 알고리즘은 서버의 현재 작업량을 기준으로 더 공정한 분배를 목표로 한다.

알고리즘은 일반적으로 다음과 같이 동작한다. 부하 분산 장치는 백엔드 서버 풀에 속한 각 서버와의 활성 TCP 연결 수를 지속적으로 추적한다. 새로운 클라이언트 연결 요청이 들어오면, 장치는 자신의 연결 테이블을 확인하여 현재 활성 연결 수가 가장 적은 서버를 선택한다. 선택된 서버로 요청을 전송한 후, 해당 서버에 대한 연결 카운트를 1 증가시킨다. 연결이 종료되면 카운트는 다시 감소한다.

이 방식은 특히 연결이 장시간 유지되는 애플리케이션에서 유리하다. 예를 들어, 데이터베이스 연결이나 긴 세션을 요구하는 실시간 스트리밍 서비스에서 특정 서버에만 연결이 집중되는 것을 방지할 수 있다. 서버의 처리 능력에 차이가 있을 경우, 가중치 기반 알고리즘과 결합된 '가중 최소 연결' 방식으로 변형되어 사용되기도 한다. 이 변형에서는 각 서버에 지정된 가중치를 고려하여, '연결 수 / 가중치' 비율이 가장 낮은 서버를 선택한다.

알고리즘	주요 기준	장점	단점
라운드 로빈	순차적 순서	구현이 단순하고 예측 가능함	서버 부하 상태를 고려하지 않음
최소 연결	현재 활성 연결 수	실시간 부하를 반영한 공정한 분배	연결 수만으로는 CPU/메모리 사용률 등 세부 부하를 정확히 반영하지 못할 수 있음

최소 연결 알고리즘은 서버의 처리 용량이 동질적이고, 연결 지속 시간이 불규칙할 때 라운드 로빈보다 더 균등한 부하 분산을 달성한다. 그러나 단순히 연결 수만을 기준으로 하기 때문에, 각 연결의 실제 리소스 소모량(예: 간단한 API 요청 vs. 대용량 파일 전송)은 고려하지 못하는 한계가 있다.

3.3. 가중치 기반 알고리즘

가중치 기반 알고리즘은 각 서버의 처리 능력이나 용량 차이를 고려하여 부하를 불균등하게 분배하는 방식이다. 단순히 순서대로 요청을 할당하는 라운드 로빈이나 현재 연결 수만을 고려하는 최소 연결 알고리즘과 달리, 사전에 설정된 가중치 값에 따라 더 많은 트래픽을 처리 능력이 높은 서버로 유도한다. 이는 이질적인 하드웨어 사양을 가진 서버 풀을 운영하거나 특정 서버가 더 많은 리소스를 보유한 환경에서 효율적인 자원 활용을 가능하게 한다.

알고리즘의 동작 방식은 일반적으로 다음과 같다. 관리자는 각 서버에 처리 능력에 비례하는 가중치(예: 1에서 10 사이의 정수)를 할당한다. 부하 분산 장치는 이 가중치를 기반으로 서버를 선택할 확률을 계산한다. 예를 들어, 세 대의 서버에 가중치 5, 3, 2가 할당되었다면, 총 가중치 합은 10이 된다. 이 경우 첫 번째 서버는 50%(5/10)의 확률로, 두 번째 서버는 30%의 확률로, 세 번째 서버는 20%의 확률로 요청을 받게 된다.

알고리즘 유형	핵심 원리	주요 적용 시나리오
정적 가중치 라운드 로빈	사전 설정된 고정 가중치에 따라 요청 분배	서버 사양(CPU, 메모리)이 상이한 경우
동적 가중치 조정[1]	서버의 실시간 성능 지표에 따라 가중치 변동	트래픽 패턴이 변동적이거나 서버 상태가 실시간으로 변경되는 환경

이 방식의 주요 장점은 인프라 투자 효율성을 높일 수 있다는 점이다. 고사양의 신규 서버에는 높은 가중치를, 구형 서버에는 낮은 가중치를 부여함으로써 전체적인 처리 성능을 최적화한다. 그러나 단점으로는 가중치 설정이 관리자의 경험과 모니터링에 의존하며, 서버의 실제 부하 상태를 실시간으로 완벽히 반영하지 못할 수 있다는 점이 있다. 따라서 초기 가중치 설정과 지속적인 성능 모니터링이 함께 수행되어야 효과를 발휘한다.

3.4. 지리적/지연 시간 기반 알고리즘

지리적/지연 시간 기반 알고리즘은 사용자와 서버 간의 물리적 거리나 네트워크 지연 시간을 주요 판단 기준으로 하여 부하 분산을 수행하는 방법이다. 이 방식은 전 세계적으로 분산된 서버 인프라를 가진 서비스에서 특히 중요성을 가진다. 사용자의 요청을 지리적으로 가장 가까운 데이터 센터나 네트워크 홉이 가장 적은 서버로 라우팅함으로써 응답 시간을 최소화하고 사용자 경험을 향상시키는 것을 목표로 한다.

지리적 기반 라우팅은 사용자의 IP 주소를 기반으로 대략적인 위치(예: 국가, 지역)를 판단하여 미리 정의된 지리적 영역에 할당된 서버 풀로 트래픽을 전달한다. 이는 콘텐츠 전송 네트워크CDN의 동작 원리와 유사하다. 반면, 지연 시간 기반 라우팅은 보다 동적인 방식으로, 주기적으로 측정된 실제 네트워크 왕복 시간RTT이나 활성 프로브를 사용하여 각 서버까지의 현재 지연 시간을 평가한다. 그 후 가장 낮은 지연 시간을 보이는 서버를 선택한다.

이 알고리즘의 구현은 복잡성이 있을 수 있다. 지리적 위치 정보 데이터베이스GeoIP DB의 정확성에 의존하거나, 지속적인 지연 시간 모니터링으로 인한 오버헤드가 발생할 수 있다. 또한, 단순히 지리적으로 가깝다고 해서 항상 네트워크 지연이 최소인 것은 아니므로, 두 방법을 결합하여 사용하는 경우도 흔하다. 주요 클라우드 제공자들의 글로벌 로드 밸런싱 서비스는 종종 이러한 지리적 및 성능 메트릭스를 종합적으로 고려한 라우팅 정책을 제공한다[2].

4. 부하 분산 장치의 유형

부하 분산 장치는 작동 계층과 구현 방식에 따라 여러 유형으로 구분된다. 가장 일반적인 분류는 OSI 모델의 계층을 기준으로 한 것으로, L4 로드 밸런서와 L7 로드 밸런서가 대표적이다. L4 로드 밸런서는 전송 계층에서 동작하며, IP 주소와 포트 번호 같은 네트워크 레벨 정보를 기반으로 트래픽을 분배한다. 이는 TCP나 UDP 패킷의 헤더만을 확인하므로 처리 속도가 빠르고 효율적이다. 반면, L7 로드 밸런서는 응용 계층에서 동작하여 HTTP 헤더, URL, 쿠키 등 애플리케이션 데이터의 내용을 분석할 수 있다. 이를 통해 특정 URL 경로를 다른 서버 그룹으로 라우팅하거나, 콘텐츠 타입에 따른 분배와 같은 더 정교한 라우팅이 가능해진다.

구현 방식에 따라서는 하드웨어 로드 밸런서와 소프트웨어 로드 밸런서로 나뉜다. 하드웨어 로드 밸런서는 전용 ASIC이나 FPGA를 사용하는 독립된 물리적 장비로, 매우 높은 처리 성능과 안정성을 제공한다. F5 Networks의 BIG-IP 시리즈나 시트릭스 시스템즈의 NetScaler가 이에 해당한다. 소프트웨어 로드 밸런서는 일반 서버 하드웨어나 가상 머신, 컨테이너 위에서 소프트웨어 형태로 실행된다. NGINX, HAProxy, Apache HTTP Server의 mod_proxy_balancer 모듈 등이 널리 사용되며, 유연성과 확장성이 뛰어나고 비용 효율적이다.

다음 표는 주요 유형의 특징을 비교한 것이다.

유형	작동 계층/구현	주요 특징	대표 예시
L4 로드 밸런서	전송 계층 (OSI 4계층)	IP/포트 기반 분배, 고속 처리, 세션 지속성 지원	F5 BIG-IP LTM, Linux Virtual Server (LVS)
L7 로드 밬런서	응용 계층 (OSI 7계층)	HTTP 헤더/콘텐츠 분석, 지능형 라우팅, SSL 오프로딩	NGINX Plus, HAProxy, F5 BIG-IP ASM
하드웨어 로드 밸런서	전용 물리 장비	고성능, 고가용성, 종종 L4-L7 기능 통합	F5 BIG-IP, Citrix ADC, A10 Networks Thunder
소프트웨어 로드 밸런서	범용 서버 소프트웨어	유연한 배포(온프레미스/클라우드), 낮은 비용, 오픈 소스 옵션 많음	NGINX (오픈 소스), HAProxy, Envoy

현대 클라우드 컴퓨팅 환경에서는 소프트웨어 정의 네트워킹 개념과 결합된 소프트웨어 로드 밸런서가 지배적이다. 특히 마이크로서비스 아키텍처에서는 서비스 메시 내의 사이드카 프록시(예: Istio의 Envoy)가 L7 로드 밸런싱 기능을 수행하는 경우가 많다. 이러한 유형들은 상호 배타적이지 않으며, 하이브리드 형태로 구성되어 시스템의 요구사항에 맞춰 최적의 성능과 기능을 제공한다.

4.1. L4 (전송 계층) 로드 밸런서

L4 로드 밸런서는 OSI 모델의 전송 계층(4계층)에서 동작하는 부하 분산 장치이다. 주로 TCP와 UDP 패킷의 헤더 정보, 즉 출발지 및 목적지 IP 주소와 포트 번호를 기반으로 트래픽을 분배한다. 이 방식은 패킷의 페이로드(실제 데이터 내용)를 확인하지 않고 네트워크 레벨의 정보만으로 빠르게 결정을 내리므로 처리 속도가 빠르고 효율적이다. 주로 단순한 연결 분산, 대용량 트래픽 처리, 기본적인 장애 조치에 적합하다.

주요 기능으로는 NAT(Network Address Translation)를 통한 트래픽 전달이 있다. 클라이언트의 요청을 받은 L4 로드 밸런서는 자신의 가상 IP(VIP)를 백엔드 서버의 실제 IP로 변환하여 전송한다. 반대로 서버의 응답도 로드 밸런서를 거쳐 클라이언트에게 전달된다. 이 과정에서 클라이언트는 백엔드 서버의 실제 주소를 알지 못한다. 또한, 헬스 체크를 통해 백엔드 서버의 상태를 모니터링하고 장애가 발생한 서버로는 트래픽을 보내지 않는다.

L4 로드 밸런서는 다음과 같은 일반적인 사용 사례를 가진다.

사용 사례	설명
웹 서버 팜 부하 분산	HTTP/HTTPS 트래픽을 여러 웹 서버에 분산시킨다.
데이터베이스 복제본 부하 분산	읽기 전용 쿼리 트래픽을 여러 데이터베이스 복제본에 분산시킨다.
게임 서버 부하 분산	대량의 UDP 기반 게임 연결을 처리한다.
이메일 서버 부하 분산	SMTP, IMAP, POP3 트래픽을 분산시킨다.

L7 로드 밸런서와 비교할 때, L4 로드 밸런서는 애플리케이션 계층의 내용(URL, 쿠키, 헤더 값)을 이해하지 못한다는 한계가 있다. 따라서 HTTP 요청의 특정 경로나 콘텐츠 유형에 따라 세부적으로 라우팅하는 콘텐츠 기반 라우팅은 수행할 수 없다. 그러나 그만큼 처리 오버헤드가 적어 초당 처리 가능한 연결 수(Connections Per Second)가 더 높고, 레이턴시가 낮은 경우가 많다.

4.2. L7 (응용 계층) 로드 밸런서

L7 로드 밸런서는 OSI 모델의 응용 계층(7계층)에서 동작하는 부하 분산 장치이다. L4 로드 밸런서가 IP 주소와 포트 번호 같은 전송 계층 정보만을 기반으로 트래픽을 분산하는 반면, L7 로드 밸런서는 HTTP 헤더, URL, 쿠키, 실제 메시지 내용과 같은 응용 계층 데이터를 분석하여 더 지능적인 라우팅 결정을 내릴 수 있다. 이로 인해 특정 URL 경로에 대한 요청을 전용 서버 풀로 보내거나, 사용자 디바이스 유형(모바일/데스크톱)에 따라 다른 서버로 연결하는 등 세밀한 트래픽 제어가 가능해진다.

주요 기능으로는 콘텐츠 기반 라우팅이 있다. 예를 들어, /images 경로로 오는 요청은 이미지 서버 풀로, /api 경로로 오는 요청은 애플리케이션 서버 풀로 분기할 수 있다. 또한, SSL/TLS 오프로딩을 수행하여 백엔드 서버의 암호화/복호화 부하를 줄이고, HTTP/1.1에서 HTTP/2로의 프로토콜 변환, 요청/응답 헤더의 수정 또는 추가 같은 기능도 제공한다. 이러한 특징은 현대적인 마이크로서비스 아키텍처 환경에서 각 서비스별로 트래픽을 라우팅할 때 특히 유용하다.

L7 로드 밸런서의 동작 방식을 간략히 나타내면 다음과 같다.

단계	설명
1. 요청 수신	클라이언트로부터 HTTP/HTTPS 요청을 받는다.
2. 내용 분석	URL, 헤더, 쿠키 등 응용 계층 정보를 심층적으로 분석한다.
3. 라우팅 결정	미리 정의된 규칙(라우팅 테이블)에 따라 적합한 백엔드 서버를 선택한다.
4. 요청 전달	선택된 서버로 요청을 전달한다. (일부 경우 변형하여 전달)
5. 응답 중계	서버의 응답을 클라이언트에게 중계한다.

그러나 패킷의 페이로드를 검사해야 하므로 L4 로드 밸런서에 비해 처리 지연이 더 길고, 컴퓨팅 리소스 소모가 크다는 단점이 있다. 또한, 암호화된 HTTPS 트래픽을 처리하려면 로드 밸런서가 SSL/TLS 복호화를 수행해야 하므로, 이에 대한 보안 및 키 관리 정책이 필수적으로 요구된다.

4.3. 하드웨어 vs. 소프트웨어 로드 밸런서

하드웨어 로드 밸런서는 ASIC이나 FPGA 같은 전용 하드웨어 칩셋 위에서 동작하는 독립형 물리적 장비이다. 고성능과 저지연 처리가 요구되는 대규모 엔터프라이즈 환경에서 전통적으로 사용되었다. 이 유형은 일반적으로 높은 처리량과 초고속 패킷 포워딩 성능을 제공하며, 내장된 보안 기능과 안정성이 특징이다. 그러나 초기 구매 비용이 높고, 확장이나 기능 업데이트에 물리적 교체나 추가 구매가 필요할 수 있다는 단점이 있다.

소프트웨어 로드 밬런서는 범용 서버 하드웨어나 가상 머신, 컨테이너 환경에서 애플리케이션 소프트웨어 형태로 실행된다. 클라우드 컴퓨팅 환경의 확산과 함께 그 활용도가 크게 증가했다. 대표적인 예로는 NGINX, HAProxy, Envoy 등이 있다. 이 유형은 하드웨어 의존성이 낮아 유연한 배포와 확장이 가능하며, 비용 효율성이 높다. 또한 DevOps 문화와 통합되어 CI/CD 파이프라인을 통해 구성 관리와 배포가 자동화되기 쉽다.

다음 표는 두 유형의 주요 특징을 비교한 것이다.

특징	하드웨어 로드 밸런서	소프트웨어 로드 밸런서
형태	전용 물리적 어플라이언스	서버에 설치되는 소프트웨어
성능	매우 높은 처리량과 낮은 지연 시간	하드웨어 성능과 소프트웨어 최적화에 의존
확장성	수직 확장(Scale-up) 위주, 제한적	수평 확장(Scale-out)에 유리, 탄력적
유연성	하드웨어에 종속, 기능 추가/변경이 어려움	구성과 배포가 유연하고 빠름
비용	높은 초기 자본 비용(CapEx)	상대적으로 낮은 운영 비용(OpEx)
주요 사용처	데이터 센터 코어, 고정적 대용량 트래픽	클라우드, 가상화 환경, 마이크로서비스

현대 트렌드는 하이브리드 접근법으로 발전하고 있다. 많은 벤더들이 소프트웨어 정의 네트워킹 원리를 적용한 어플라이언스를 제공하거나, 클라우드 서비스 형태의 완전 관리형 로드 밸런서를 출시하고 있다. 이는 하드웨어의 성능과 소프트웨어의 유연성을 결합하려는 시도이다. 최종 선택은 예산, 성능 요구사항, 운영 환경의 복잡성, 그리고 필요한 유연성 수준에 따라 결정된다.

5. 부하 분산 아키텍처

부하 분산 장치를 배치하는 구조적 설계를 부하 분산 아키텍처라고 한다. 이는 가용성, 확장성, 그리고 장애 복구 능력을 보장하기 위한 핵심 요소이다. 일반적으로 액티브-스탠바이, 액티브-액티브, 그리고 글로벌 서버 로드 밸런싱(GSLB) 방식이 널리 사용된다.

액티브-스탠바이 구성은 하나의 로드 밸런서가 활성 상태로 트래픽을 처리하고, 다른 하나는 대기 상태로 유지된다. 활성 장치에 장애가 발생하면 대기 장치가 자동으로 역할을 인수하여 서비스 중단을 방지한다. 이 방식은 구현이 비교적 간단하지만, 대기 장치가 평상시에 리소스를 활용하지 못하는 단점이 있다. 반면, 액티브-액티브 구성에서는 두 개 이상의 로드 밸런서가 모두 활성 상태로 동시에 트래픽을 분산 처리한다. 이는 자원 활용도를 높이고 처리 용량을 확장할 수 있어 고가용성과 성능 향상을 동시에 달성하는 데 유리하다.

광범위한 지리적 영역에 서비스를 제공해야 할 때는 글로벌 서버 로드 밸런싱(GSLB)이 사용된다. GSLB는 전 세계에 분산된 여러 데이터 센터의 로드 밸런서 앞단에 배치되어, 사용자의 지리적 위치나 데이터 센터의 상태, 지연 시간 등을 고려하여 최적의 데이터 센터로 트래픽을 라우팅한다. 이는 재해 복구와 지역별 로드 분산에 필수적이다.

아키텍처 유형	주요 특징	일반적 사용 사례
액티브-스탠바이	한 대는 활성, 다른 대는 대기. 장애 시 장애 조치 발생.	고가용성이 요구되지만 예산이 제한된 내부 시스템.
액티브-액티브	모든 노드가 활성 상태로 트래픽 분산 처리. 높은 처리량과 자원 활용도 제공.	대규모 웹 서비스, 실시간 트랜잭션 처리 시스템.
글로벌 서버 로드 밸런싱 (GSLB)	지리적으로 분산된 데이터 센터 간 트래픽 분배. 지연 시간 최소화 및 재해 복구 지원.	글로벌 사용자를 대상으로 하는 인터넷 서비스, 콘텐츠 전송 네트워크(CDN).

이러한 아키텍처 선택은 서비스의 규모, 가용성 요구사항, 예산, 그리고 기술적 복잡성에 따라 결정된다. 현대의 클라우드 환경에서는 이러한 아키텍처 패턴들이 서비스 형태로 제공되어 보다 쉽게 구현되고 관리된다.

5.1. 액티브-스탠바이

액티브-스탠바이는 부하 분산 장치를 이중화하여 고가용성을 확보하는 전통적인 아키텍처 방식이다. 이 구성에서는 두 대 이상의 로드 밸런서가 사용되며, 그중 한 대만 실제 트래픽을 처리하는 액티브(활성) 역할을 담당한다. 나머지 장치는 대기 상태인 스탠바이(대기) 모드로 운영되어 액티브 장치에 문제가 발생할 경우를 대비한다.

액티브 장치는 모든 클라이언트 요청을 수신하여 백엔드 서버 풀에 분배하는 주된 작업을 수행한다. 스탠바이 장치는 액티브 장치의 상태를 지속적으로 모니터링하며, 일반적으로 트래픽을 처리하지 않는다. 두 장치는 헬스 체크 신호(예: 헬로 패킷)를 주고받아 서로의 정상 작동 여부를 확인한다. 이 상태 동기화는 VRRP나 HSRP와 같은 페일오버 프로토콜을 통해 관리되는 경우가 많다.

액티브 장치에 장애가 감지되면, 사전에 정의된 페일오버 절차가 시작된다. 스탠바이 장치는 액티브 역할을 인계받아 VIP(가상 IP 주소)를 자신의 인터페이스에 연결하고, 트래픽 처리와 세션 지속성을 담당하기 시작한다. 이 전환 과정은 일반적으로 수 초 이내에 완료되어 서비스 중단 시간을 최소화한다.

이 방식의 주요 장점은 구성이 비교적 단순하고 예측 가능하다는 점이다. 그러나 단점은 스탠바이 장치가 대기 중일 때 하드웨어 리소스를 전혀 활용하지 않아 자원 효율성이 낮다는 것이다. 또한, 페일오버 시 기존 TCP 연결 중 일부가 끊어질 수 있으며, 액티브 장치가 복구된 후 다시 스탠바이 모드로 전환하는 과정(페일백)이 추가로 필요하다.

5.2. 액티브-액티브

액티브-액티브 아키텍처는 두 개 이상의 부하 분산 장치가 모두 활성 상태로 운영되어 트래픽을 동시에 처리하는 구성 방식이다. 이 방식에서는 모든 로드 밸런서가 실시간으로 서비스를 제공하며, 들어오는 요청을 공유하거나 분산된 방식으로 처리한다. 일반적으로 DNS 라운드 로빈이나 애니캐스트 같은 기술을 통해 클라이언트 요청이 여러 활성 로드 밸런서로 분배된다. 모든 노드가 활성 상태이므로 시스템 전체의 처리 용량과 자원 활용도가 극대화된다.

이 아키텍처의 주요 장점은 높은 가용성과 확장성이다. 한 대의 로드 밸런서에 장애가 발생하더라도 다른 활성 노드가 즉시 남은 트래픽을 수용하여 서비스 중단을 방지한다. 또한, 트래픽 증가 시 단순히 새로운 로드 밸런서를 액티브 풀에 추가함으로써 수평적 확장이 용이하다. 하지만 모든 노드가 상태 정보(예: 세션 지속성 테이블)를 공유하거나 동기화해야 하므로, 설계와 운영이 더 복잡해질 수 있다.

구현 방식은 주로 두 가지로 나뉜다. 첫째는 공유 IP 주소(VIP)를 사용하는 방식으로, VRRP나 GLBP 같은 프로토콜을 통해 여러 장비가 하나의 가상 IP를 공유하며 장애 조치를 수행한다. 둘째는 각 로드 밸런서가 고유 IP를 가지며, DNS를 통해 클라이언트를 여러 IP로 분산시키는 방식이다. 후자의 경우, DNS TTL 설정과 클라이언트의 DNS 캐싱 동작을 신중히 관리해야 한다.

특징	설명
자원 활용도	모든 노드가 활성 상태이므로 자원 활용도가 높다.
장애 조치 시간	장애 발생 시 다른 활성 노드가 즉시 트래픽을 처리하므로 RTO가 매우 짧다.
구현 복잡도	상태 동기화와 트래픽 분배 로직이 필요하여 상대적으로 복잡하다.
비용	하드웨어 리소스가 모두 사용되므로 효율적이지만, 동기화를 위한 네트워크 대역폭 등 추가 비용이 발생할 수 있다.

액티브-액티브 구성은 고가용성이 절실한 금융 거래 시스템, 대규모 이커머스 플랫폼, 실시간 미디어 스트리밍 서비스 등에서 널리 채택된다.

5.3. 글로벌 서버 로드 밸런싱 (GSLB)

글로벌 서버 로드 밸런싱은 지리적으로 분산된 여러 데이터 센터나 포인트 오브 프레전스에 위치한 서버 풀에 트래픽을 분배하는 기술이다. 이는 단일 데이터 센터 내의 서버 간 부하를 분산하는 전통적인 로드 밸런싱의 범위를 확장하여, 전 세계 사용자에게 가장 가까운 또는 최적의 성능을 제공하는 위치로 연결을 유도한다. 주요 목표는 사용자 경험을 향상시키는 것으로, 지연 시간을 최소화하고 가용성을 극대화하며 재해 복구 전략을 구현하는 데 필수적이다.

GSLB는 일반적으로 DNS 기반으로 작동한다. 사용자가 도메인 이름을 요청하면, GSLB 솔루션은 사전에 정의된 정책과 실시간 상태 확인 정보를 바탕으로 가장 적합한 데이터 센터의 IP 주소를 응답한다. 결정을 내리는 주요 정책 요소는 다음과 같다.

정책 유형	설명
지리적 근접성	사용자의 지리적 위치 또는 DNS 리졸버 위치를 기반으로 가장 가까운 사이트 선택
지연 시간/성능	실시간 성능 측정(예: 핑, 트레이스라우트)을 통해 가장 빠른 응답 사이트 선택
가용성/상태	각 데이터 센터의 서버 상태와 부하 수준을 확인하여 정상적인 사이트로 라우팅
부하 분산	트래픽을 여러 활성 사이트에 균등하게 분배
비용 기반	데이터 전송 비용이 가장 낮은 지역 선택

이 기술은 액티브-액티브 또는 액티브-스탠바이 아키텍처와 결합되어 사용된다. 액티브-액티브 구성에서는 여러 데이터 센터가 동시에 트래픽을 처리하여 용량과 성능을 확장한다. 반면, 액티브-스탠바이 구성에서는 주 데이터 센터가 모든 트래픽을 처리하다가 장애 발생 시에만 대기 중인 사이트로 트래픽이 전환되어 비즈니스 연속성을 보장한다.

GSLB 구현은 글로벌 서비스를 제공하는 기업에게 중요한 장점을 제공한다. 사용자는 항상 가장 반응이 빠른 사이트에 연결되어 웹 페이지 로딩 시간이나 애플리케이션 응답 시간이 개선된다. 또한 한 지역에 장애가 발생하더라도 다른 지역의 서비스로 트래픽이 자동으로 재라우팅되므로 서비스 중단 시간이 최소화된다. 이는 자연 재해나 대규모 네트워크 장애와 같은 상황에서도 서비스 가용성을 유지하는 데 결정적인 역할을 한다.

6. 주요 프로토콜 및 기술

주요 프로토콜 및 기술 섹션은 부하 분산 장치가 처리하는 다양한 네트워크 트래픽 유형과 관련된 핵심 기능을 다룬다. 이는 장치가 특정 네트워크 프로토콜에 최적화되어 작동하는 방식을 설명한다.

HTTP 및 HTTPS 부하 분산은 웹 애플리케이션에서 가장 일반적으로 사용된다. L7 (응용 계층) 로드 밸런서는 HTTP 요청의 내용(예: URL, 쿠키, 헤더)을 검사하여 특정 백엔드 서버로 라우팅하는 지능적인 결정을 내릴 수 있다. HTTPS 트래픽의 경우, 로드 밸런서는 SSL/TLS 오프로딩을 수행하여 암호화 복호화 부하를 백엔드 서버에서 제거하고 성능을 향상시킬 수 있다. 반면, TCP/UDP 부하 분산은 주로 L4 (전송 계층) 로드 밸런서에서 처리된다. 이 방식은 패킷의 페이로드 내용을 분석하지 않고, IP 주소와 포트 번호 같은 전송 계층 정보만을 기반으로 트래픽을 분산한다. 이는 데이터베이스 연결, 이메일 전송, DNS 쿼리 또는 미디어 스트리밍과 같은 프로토콜에 적합하다.

SSL/TLS 오프로딩은 중요한 성능 최적화 기술이다. 로드 밸런서가 클라이언트와의 SSL/TLS 핸드셰이크 및 트래픽 암호화/복호화를 대신 처리하면, 백엔드 서버는 평문 트래픽을 처리하는 데 집중할 수 있어 계산 리소스가 절약된다. 또한 중앙에서 SSL 인증서를 관리할 수 있어 운영 효율성이 높아진다. 일부 고급 시나리오에서는 로드 밸런서가 복호화된 트래픽을 내용 기반 라우팅에 사용한 후, 백엔드 서버로 보내기 전에 다시 암호화하는 SSL/TLS 재암호화 기능도 제공한다.

6.1. HTTP/HTTPS 부하 분산

HTTP 부하 분산은 OSI 모델의 응용 계층에서 동작하며, HTTP 요청의 내용을 분석하여 트래픽을 분배한다. 이 방식은 라운드 로빈이나 최소 연결과 같은 기본적인 방법보다 더 지능적인 라우팅이 가능하다. 예를 들어, 요청 URL 경로, 쿠키, HTTP 헤더 정보를 기반으로 특정 서버 풀로 요청을 보낼 수 있다. 이는 마이크로서비스 아키텍처에서 /api/users 경로는 A 서버 그룹으로, /static/images 경로는 B 서버 그룹으로 라우팅하는 세밀한 트래픽 관리에 필수적이다.

HTTPS 부하 분산은 SSL/TLS로 암호화된 트래픽을 처리한다. 이때 로드 밸런서는 SSL 오프로딩 기능을 수행하여 백엔드 서버의 암호화/복호화 부담을 줄일 수 있다. 클라이언트와 로드 밸런서 사이의 연결은 HTTPS로 유지되면서, 로드 밸런서와 백엔드 서버 사이에서는 일반 HTTP로 통신할 수 있다[3]. 이를 통해 서버의 CPU 리소스를 절약하고 성능을 향상시킨다.

HTTP/HTTPS 부하 분산의 주요 구성 요소와 특징은 다음과 같다.

구성 요소 / 특징	설명
가상 호스트/SNI	단일 IP 주소에서 여러 도메인(SSL 인증서)을 호스팅하고, Server Name Indication을 통해 클라이언트가 요청한 도메인에 맞는 트래픽을 라우팅한다.
컨텐츠 기반 라우팅	URL 경로, 호스트 헤더, HTTP 메서드 등을 조건으로 특정 백엔드 서버 그룹을 지정한다.
연결 관리	HTTP/1.1의 지속 연결이나 HTTP/2, HTTP/3의 멀티플렉싱을 효율적으로 관리하여 성능을 최적화한다.
세션 지속성	애플리케이션 쿠키나 특정 HTTP 헤더를 이용하여 동일 사용자의 요청을 특정 서버로 고정시킨다.

이러한 기능들은 웹 애플리케이션 방화벽 통합, 요청/응답 재작성, 콘텐츠 전송 네트워크와의 연동 등 고급 보안 및 성능 최적화의 기반을 제공한다. 현대의 클라우드 컴퓨팅 서비스는 이러한 HTTP/HTTPS 부하 분산 기능을 관리형 서비스로 제공하여 구성과 확장을 단순화한다.

6.2. TCP/UDP 부하 분산

TCP/UDP 부하 분산은 부하 분산 장치가 전송 계층에서 동작하며, TCP 또는 UDP 패킷의 헤더 정보를 기반으로 트래픽을 분배하는 방식을 의미한다. 이 방식은 주로 L4 로드 밸런서에 의해 수행되며, 패킷의 출발지 및 목적지 IP 주소와 포트 번호를 주요 판단 기준으로 사용한다. 응용 계층의 내용을 분석하지 않고 네트워크 연결 수준에서 분산을 처리하기 때문에 효율적이고 지연 시간이 짧은 것이 특징이다.

TCP 부하 분산은 가상 IP로 들어오는 클라이언트의 연결 요청(SYN 패킷)을 받아, 미리 정의된 알고리즘에 따라 백엔드 서버 중 하나로 연결을 전달한다. 이후 해당 서버와 클라이언트 간의 세션이 설정되면, 로드 밸런서는 두 방향의 패킷을 전달하는 역할을 계속 수행한다. 반면, UDP 부하 분산은 연결 지향적이지 않은 UDP 프로토콜의 특성상, 각각의 UDP 데이터그램을 독립적으로 백엔드 서버로 라우팅한다. 일반적인 사용 사례는 다음과 같다.

프로토콜	주요 사용 예시
TCP	HTTP, HTTPS, FTP, SMTP, 데이터베이스 연결
UDP	DNS 쿼리, VoIP, 실시간 스트리밍, 온라인 게임

이러한 방식의 장점은 처리 속도가 빠르고 리소스 소모가 적다는 점이다. 그러나 패킷의 페이로드 내용을 확인하지 않기 때문에, 같은 TCP 연결 내에서도 특정 URL이나 쿠키 기반의 세션을 고려한 세부적인 라우팅은 불가능하다. 이는 L7 부하 분산과 구분되는 핵심적인 차이점이다.

6.3. SSL/TLS 오프로딩

SSL/TLS 오프로딩은 부하 분산 장치가 클라이언트와의 SSL/TLS 암호화 연결을 종료하고, 복호화된 일반 텍스트 트래픽을 백엔드 서버로 전달하는 기능이다. 이 과정에서 암호화 및 복호화에 필요한 높은 수준의 CPU 연산 부담이 로드 밸런서로 옮겨지게 된다. 백엔드 서버들은 암호화 처리를 하지 않아도 되므로 컴퓨팅 자원을 핵심 애플리케이션 로직 처리에 집중할 수 있다.

주요 동작 방식은 다음과 같다. 클라이언트는 로드 밸런서와 SSL 핸드셰이크를 수행하여 안전한 연결을 수립한다. 로드 밸런서는 클라이언트의 인증서를 검증하고 세션 키를 협상하여 트래픽을 복호화한다. 이후 로드 밸런서는 선택된 부하 분산 알고리즘에 따라 복호화된 요청을 백엔드 서버로 전달한다. 일반적으로 백엔드 서버까지의 내부 네트워크는 신뢰할 수 있는 영역으로 간주되어 암호화되지 않은 HTTP 트래픽이 전송되거나, 필요에 따라 별도의 인증서를 사용해 서버와 로드 밸런서 간에 새로운 암호화 채널을 구성하기도 한다[4].

이 기술의 장점과 고려사항은 아래 표와 같다.

장점	고려사항
백엔드 서버의 CPU 부하 감소	로드 밸런서가 단일 실패 지점이 될 수 있음
중앙에서 SSL/TLS 인증서 관리 용이성	복호화된 트래픽이 내부 네트워크를 흐르므로 네트워크 보안 강화 필요
L7 수준의 콘텐츠 기반 라우팅 가능[5]	로드 밸런서 자체의 성능과 암호화 처리 능력이 중요해짐
웹 애플리케이션 방화벽 등 보안 검사 적용 용이

SSL/TLS 오프로딩은 특히 HTTPS 트래픽이 주를 이루는 현대 웹 서비스에서 서버 자원 효율화와 중앙 집중식 보안 정책 적용을 위해 널리 사용된다.

7. 상태 확인 및 장애 조치

상태 확인은 부하 분산 장치가 백엔드 서버의 가용성을 지속적으로 모니터링하는 과정이다. 일반적으로 부하 분산 장치는 정해진 간격으로 각 서버에 헬스 체크 요청을 전송한다. 이 요청은 간단한 ICMP 핑(ping)부터 특정 애플리케이션 엔드포인트에 대한 HTTP GET 요청까지 다양할 수 있다. 서버가 사전 정의된 시간 내에 정상적인 응답을 반환하면 해당 서버는 정상으로 판단되어 트래픽 풀에 유지된다. 응답이 없거나 오류 코드를 반환하면 서버는 비정상 상태로 간주되어 트래픽 분배 대상에서 제외된다. 이 과정을 통해 장애가 발생한 서버로 사용자 요청이 전달되는 것을 방지하여 서비스의 전체적인 가용성을 높인다.

장애 조치는 헬스 체크를 통해 발견된 서버 장애에 대응하는 메커니즘이다. 비정상 서버가 감지되면 로드 밸런서는 즉시 해당 서버로의 새로운 연결 생성을 중단한다. 기존 연결에 대해서는 설정에 따라 즉시 끊거나, 일정 시간 동안 유지한 후 종료할 수 있다. 이후 모든 새로운 사용자 요청은 정상적으로 동작하는 다른 서버들로만 분배된다. 일부 고가용성 구성에서는 액티브-스탠바이나 액티브-액티브 아키텍처를 통해 로드 밸런서 자체의 장애에도 대비한다.

세션 지속성은 동일한 클라이언트의 연속된 요청을 항상 같은 백엔드 서버로 보내도록 보장하는 기능이다. 이는 사용자 로그인 상태나 장바구니 정보 등 서버 메모리에 저장된 세션 데이터의 일관성을 유지하기 위해 중요하다. 일반적인 구현 방법은 다음과 같다.

방법	설명	주요 사용처
쿠키 기반 지속성	로드 밸런서가 클라이언트에 고유한 쿠키를 설정하고, 이를 통해 서버를 식별한다.	HTTP 기반 웹 애플리케이션
소스 IP 기반 지속성	클라이언트의 IP 주소를 해시하여 특정 서버에 매핑한다.	TCP/UDP 연결이 많은 환경
SSL 세션 ID 기반 지속성	SSL/TLS 핸드셰이크 시 생성된 ID를 이용한다.	암호화된 트래픽 처리

세션 지속성은 서비스의 무상태성을 해칠 수 있으며, 특정 서버에 부하가 집중될 위험이 있어 신중하게 구성해야 한다.

7.1. 헬스 체크 메커니즘

부하 분산 장치가 백엔드 서버 풀의 정상 여부를 지속적으로 확인하는 프로세스를 헬스 체크라고 한다. 이는 장애가 발생한 서버로 트래픽이 전달되는 것을 방지하여 서비스의 가용성과 안정성을 보장하는 핵심 기능이다. 헬스 체크는 주기적으로 각 서버에 프로브 요청을 보내고, 응답의 성공 여부 또는 지연 시간을 기준으로 서버의 상태를 판단한다.

헬스 체크는 크게 두 가지 방식으로 구분된다. 첫째는 액티브 헬스 체크로, 로드 밸런서가 능동적으로 서버에 정해진 간격으로 요청(예: ICMP 핑, TCP 연결 시도, 특정 HTTP 경로 요청)을 보내는 방식이다. 둘째는 패시브 헬스 체크로, 실제 사용자 트래픽을 처리하는 과정에서 서버의 응답(예: 연결 시간 초과, HTTP 5xx 오류 코드)을 모니터링하여 상태를 추론하는 방식이다. 일반적으로 두 방식을 조합하여 사용한다.

주요 헬스 체크 메커니즘은 다음과 같다.

체크 유형	프로토콜/방법	판단 기준
연결 가능성 체크	ICMP Echo Request (Ping)	서버가 네트워크에서 응답하는지 여부
포트 체크	TCP 3-Way Handshake 시도	특정 포트(예: 80, 443)가 연결을 수락하는지 여부
애플리케이션 체크	HTTP/HTTPS GET 요청	지정된 URL 경로에 대한 응답 상태 코드(예: 200 OK)와 응답 시간
커스텀 스크립트 체크	사용자 정의 스크립트 실행	애플리케이션의 특정 로직이나 의존성(예: 데이터베이스 연결) 상태를 점검

헬스 체크 결과에 따라 서버는 정상, 비정상, 또는 유예 상태로 분류된다. 비정상으로 판단된 서버는 로드 밸런싱 풀에서 자동으로 제외되며, 설정된 횟수만큼 연속해서 정상 응답을 받으면 다시 풀에 포함된다. 이 과정을 통해 서비스는 무중단 운영과 자동화된 장애 복구가 가능해진다.

7.2. 세션 지속성 (Sticky Session)

세션 지속성은 부하 분산 장치가 동일한 클라이언트로부터의 요청을 항상 동일한 백엔드 서버로 전달하도록 보장하는 메커니즘이다. 이는 클라이언트의 상태 정보(세션)가 특정 서버에 저장되어 있는 경우, 그 서버로 요청이 지속적으로 전달되어야 정상적인 서비스가 가능하기 때문에 필요하다. 예를 들어, 사용자의 장바구니 정보나 로그인 상태가 하나의 서버에 저장되어 있을 때, 이후 요청이 다른 서버로 전달되면 해당 정보를 잃게 된다. 세션 지속성은 이러한 문제를 해결하여 사용자 경험을 보장한다.

세션 지속성을 구현하는 주요 방법은 다음과 같다.

방법	설명	주요 특징
쿠키 기반	부하 분산 장치가 응답에 특정 쿠키를 설정하고, 이후 클라이언트 요청에 포함된 쿠키 값을 기반으로 서버를 식별한다.	애플리케이션 계층(L7)에서 동작하며, 사용자 정의가 용이하다.
IP 해시	클라이언트의 IP 주소를 해시 함수에 입력하여 특정 서버를 매핑한다.	전송 계층(L4)에서 동작하며, 간단하지만 동일 NAT 뒤의 여러 사용자가 같은 서버로 향할 수 있다.
SSL 세션 ID	SSL/TLS 핸드셰이크 시 생성된 세션 ID를 기반으로 서버를 매핑한다.	SSL 오프로딩 환경에서 효과적이다.

이러한 지속성은 설정된 시간 동안 유지되거나, 명시적으로 종료될 때까지 유지된다. 그러나 지나친 세션 지속성은 서버 간 부하의 불균형을 초래할 수 있다. 한 서버에 많은 세션이 고정되면 그 서버의 부하가 높아지는 반면, 다른 서버는 상대적으로 유휴 상태가 될 수 있다. 따라서 세션 지속성의 시간을 적절히 설정하거나, 세션 클러스터링이나 외부 세션 저장소(예: Redis, Memcached)를 활용하여 상태 정보를 서버에서 분리하는 아키텍처를 고려하기도 한다.

8. 클라우드 환경의 부하 분산

클라우드 환경에서 부하 분산 장치는 가상화된 형태의 관리형 서비스로 제공되는 경우가 많다. 이는 사용자가 직접 하드웨어를 구매하거나 소프트웨어를 설치할 필요 없이, 클라우드 공급자가 제공하는 서비스를 통해 손쉽게 부하 분산을 구성하고 운영할 수 있음을 의미한다. 주요 클라우드 서비스 제공자들은 각자의 플랫폼에 특화된 다양한 로드 밸런싱 서비스를 제공하며, 이들은 높은 가용성, 자동 확장성, 그리고 클라우드 네이티브 서비스와의 긴밀한 통합을 핵심 특징으로 한다.

대표적인 서비스로는 아마존 웹 서비스(AWS)의 Elastic Load Balancing(ELB)이 있다. ELB는 애플리케이션 로드 밸런서(ALB), 네트워크 로드 밸런서(NLB), 게이트웨이 로드 밸런서(GLB) 등 여러 유형을 제공하여 다양한 계층(OSI 모델의 L4 또는 L7)과 프로토콜에 대한 부하 분산을 지원한다. ALB는 HTTP/HTTPS 트래픽에 최적화되어 마이크로서비스 아키텍처에서 경로 기반 라우팅을 가능하게 한다. 마이크로소프트 애저는 Azure Load Balancer(표준 및 기본 계층)와 Azure Application Gateway(L7 부하 분산 및 웹 애플리케이션 방화벽 기능 제공)를 제공한다. 구글 클라우드 플랫폼(GCP)은 단일 Anycast IP를 통해 전 세계에 분산된 Google Cloud Load Balancing 서비스를 운영하며, 이는 글로벌 트래픽을 자동으로 가장 가까운 리전으로 라우팅한다.

이러한 클라우드 로드 밸런서는 전통적인 온프레미스 장비와 비교하여 몇 가지 뚜렷한 장점을 지닌다. 첫째, 사용한 만큼만 비용을 지불하는 종량제 모델을 따른다. 둘째, 트래픽 증가에 따라 자동으로 성능을 확장하는 탄력성을 제공한다. 셋째, 클라우드 공급자의 가용 영역이나 리전 간에 자동 장애 조치를 구성하여 시스템의 내결함성을 높이는 데 용이하다. 또한, 컨테이너 오케스트레이션 플랫폼인 쿠버네티스와의 통합을 통해 서비스 디스커버리와 연동되는 인그레스 컨트롤러 형태로도 널리 사용된다.

클라우드 공급자	주요 로드 밸런싱 서비스	주요 특징
AWS	Elastic Load Balancing (ALB, NLB, GLB)	다양한 유형 제공, AWS 서비스와의 깊은 통합, 자동 확장
Microsoft Azure	Azure Load Balancer, Application Gateway	L4 및 L7 서비스 분리, Application Gateway는 WAF 기능 포함
Google Cloud Platform (GCP)	Google Cloud Load Balancing	글로벌 Anycast IP, 자동 멀티리전 부하 분산, 사전 구성된 보안

이러한 서비스들은 관리의 편의성을 넘어, 클라우드 네이티브 애플리케이션 개발에 필수적인 인프라 구성 요소로 자리 잡았다. 사용자는 복잡한 설정 대신 선언적 방식으로 정책을 정의하고, 모니터링 대시보드를 통해 실시간 트래픽 및 상태를 확인할 수 있다.

8.1. AWS ELB/ALB

AWS Elastic Load Balancing은 아마존 웹 서비스 환경에서 제공하는 관리형 부하 분산 서비스이다. 이 서비스는 애플리케이션의 트래픽을 여러 EC2 인스턴스, 컨테이너, IP 주소와 같은 여러 대상에 자동으로 분배한다. ELB는 애플리케이션의 내결함성을 높이고 확장성을 제공하는 데 핵심적인 역할을 한다.

AWS는 애플리케이션의 요구 사항에 따라 선택할 수 있는 여러 유형의 로드 밸런서를 제공한다. 주요 유형은 다음과 같다.

유형	계층	주요 특징
Application Load Balancer (ALB)	[[OSI 모델	L7]] (응용 계층)
Network Load Balancer (NLB)	L4 (전송 계층)	TCP, UDP, TLS 트래픽을 처리하며, 초고성능과 초저지연 시간이 요구되는 경우에 사용된다.
Classic Load Balancer (CLB)	L4 & L7 (레거시)	기본적인 HTTP/HTTPS 및 TCP 부하 분산을 제공하지만, 새로운 애플리케이션에는 ALB나 NLB 사용이 권장된다.

ALB는 가장 널리 사용되는 유형으로, HTTP 요청의 내용(예: URL 경로, 호스트 헤더)을 기반으로 트래픽을 라우팅하는 고급 라우팅 기능을 제공한다. 이를 통해 단일 로드 밸런서 뒤에서 여러 애플리케이션 또는 서비스를 운영할 수 있다. 또한 웹소켓 및 HTTP/2와 같은 최신 프로토콜을 기본적으로 지원하며, SSL/TLS 암호 해독(오프로딩)을 수행하여 백엔드 서버의 부하를 줄인다.

ELB/ALB는 AWS 클라우드의 다른 서비스와 긴밀하게 통합되어 운영을 단순화한다. Auto Scaling 그룹과 연동되어 트래픽 증가에 따라 자동으로 백엔드 용량을 확장하거나 축소할 수 있다. 또한 Amazon CloudWatch를 통해 로드 밸런서와 백엔드 대상의 상태, 트래픽 지표를 모니터링할 수 있다. 사용자는 로드 밸런서를 생성하고 대상 그룹을 구성하는 것만으로 서비스를 시작할 수 있으며, 하드웨어 프로비저닝이나 소프트웨어 유지 관리에 대한 부담이 없다는 것이 관리형 서비스의 주요 장점이다.

8.2. Azure Load Balancer

Azure Load Balancer는 마이크로소프트 애저 클라우드 플랫폼에서 제공하는 완전 관리형 부하 분산 장치 서비스이다. 애저 가상 머신, 가상 머신 확장 집합, 컨테이너 인스턴스와 같은 리소스로 들어오는 트래픽을 분산하여 애플리케이션의 가용성과 확장성을 높인다.

Azure Load Balancer는 두 가지 기본 계층(SKU)으로 제공된다. Standard SKU와 Basic SKU가 있으며, 기능과 성능에 차이가 있다. Standard SKU는 고가용성, 영역 중복성, 더 높은 규모의 백엔드 풀, 가용성 영역 지원, 보안 강화를 위한 아웃바운드 연결 관리 등 향상된 기능을 제공한다. 반면 Basic SKU는 더 간단한 시나리오와 개발/테스트 환경에 적합한 기본적인 부하 분산 기능을 제공한다.

이 서비스는 OSI 모델의 전송 계층(계층 4)에서 동작하며, TCP와 UDP 프로토콜을 기반으로 트래픽을 분산한다. 주요 구성 요소는 다음과 같다.

구성 요소	설명
프런트엔드 IP 구성	부하 분산 장치에 할당된 공용 또는 내부 IP 주소이다. 클라이언트는 이 주소로 요청을 보낸다.
백엔드 풀	트래픽을 수신하는 가상 머신이나 인스턴스들의 그룹이다.
상태 프로브	백엔드 풀의 인스턴스 건강 상태를 주기적으로 확인하여 정상 인스턴스로만 트래픽을 라우팅한다.
부하 분산 규칙	프런트엔드 IP의 특정 포트와 프로토콜에서 백엔드 풀의 특정 포트와 프로토콜로 트래픽을 매핑하는 규칙이다.

Azure Load Balancer는 공용 로드 밸런서와 내부(프라이빗) 로드 밸런서로 구분된다. 공용 로드 밸런서는 인터넷에서 들어오는 트래픽을 가상 네트워크 내부의 리소스로 분산시키고, 내부 로드 밸런서는 가상 네트워크 내부의 트래픽만을 분산한다. 또한, 아웃바운드 연결을 자동으로 제공하여 백엔드 인스턴스들이 인터넷이나 다른 서비스와 통신할 수 있게 한다.

8.3. Google Cloud Load Balancing

Google Cloud Load Balancing은 구글 클라우드 플랫폼에서 제공하는 완전 관리형 부하 분산 서비스이다. 이 서비스는 단일 지역 또는 전 세계에 분산된 인스턴스 그룹, 컨테이너, 가상 머신에 트래픽을 분산시키도록 설계되었다. 사용자는 인프라를 프로비저닝하거나 관리할 필요 없이 고가용성과 확장성을 확보할 수 있다.

Google Cloud Load Balancing은 여러 유형을 제공하며, 각각 다른 계층과 사용 사례에 최적화되어 있다. 주요 유형은 다음과 같다.

유형	계층	주요 특징
글로벌 외부 부하 분산 (HTTP(S), SSL Proxy, TCP Proxy)	L7 (응용 계층)	단일 IP 주소로 전 세계에 트래픽 분산, 콘텐츠 기반 라우팅 지원
지역 외부 부하 분산 (Network Load Balancer)	L4 (전송 계층)	초고성능, 저지연 TCP/UDP 트래픽 처리, 발신자 IP 보존
지역 내부 부하 분산 (Internal Load Balancer)	L4/L7	가상 사설 클라우드 네트워크 내부 트래픽 분산
지역 외부 부하 분산 (HTTP(S))	L7	특정 리전 내에서 HTTP/HTTPS 트래픽 분산

이 서비스는 자동 확장, 통합 상태 확인, SSL/TLS 오프로딩과 같은 기능을 포함한다. 특히 글로벌 외부 부하 분산은 애니캐스트 기술을 활용하여 사용자 요청을 지리적으로 가장 가까운 정상 백엔드로 자동 라우팅하여 지연 시간을 최소화한다[6]. 또한 Cloud CDN과 통합되어 정적 및 동적 콘텐츠 전송 성능을 향상시킬 수 있다.

운영 측면에서 Google Cloud Load Balancing은 Cloud Monitoring 및 Cloud Logging과 완전히 통합되어 실시간 성능 메트릭, 로그, 추적 데이터를 제공한다. 이를 통해 운영자는 트래픽 패턴을 분석하고, 문제를 진단하며, 비용을 최적화할 수 있다. 모든 부하 분산 유형은 관리 콘솔, gcloud 명령줄 도구, 또는 Terraform과 같은 IaC 도구를 통해 구성 및 관리된다.

9. 성능 최적화 및 모니터링

부하 분산 장치의 성능 최적화는 처리량 증가, 응답 시간 단축, 자원 활용률 향상을 목표로 한다. 주요 최적화 기법으로는 커넥션 풀링을 통한 백엔드 서버 연결 관리 효율화, 캐싱을 활용한 정적 콘텐츠 제공 가속화, 그리고 압축 기술 적용을 통한 네트워크 대역폭 절감이 포함된다. 또한, 트래픽 패턴 분석을 바탕으로 적절한 부하 분산 알고리즘을 선택하고 조정하는 것이 중요하다.

모니터링은 시스템의 건강 상태와 성능을 지속적으로 평가하는 과정이다. 일반적으로 다음 지표들을 수집하고 분석한다.

모니터링 범주	주요 지표 (예시)
트래픽 및 처리량	초당 요청 수(RPS), 네트워크 입출력 대역폭, 활성 연결 수
지연 시간 및 성능	클라이언트-로드밸런서 응답 시간, 로드밸런서-백엔드 응답 시간, 총 요청 처리 시간
가용성 및 상태	백엔드 서버 헬스 체크 성공률, 장애 조치 이벤트 횟수, 가용 영역별 상태
자원 사용률	CPU 사용률, 메모리 사용률, 가상 IP 주소 연결 수

이러한 지표는 시계열 데이터베이스에 저장되고, 대시보드를 통해 시각화된다. 임계치를 초과하거나 비정상 패턴이 감지되면 운영팀에게 알림을 발송하여 신속한 대응을 유도한다. 모니터링 데이터는 용량 계획 수립과 성능 병목 현상의 사전 탐지에 핵심적인 역할을 한다.

10. 보안 고려사항

부하 분산 장치는 네트워크 트래픽의 관문 역할을 하므로 강력한 보안 정책이 필수적이다. 주요 위협으로는 분산 서비스 거부 공격을 통한 과부하 유발, 구성 오류로 인한 내부 네트워크 노출, 그리고 암호화되지 않은 트래픽을 통한 데이터 탈취가 있다. 또한, 부하 분산 장치 자체의 취약점을 악용한 공격도 가능하다.

보안을 강화하기 위해 SSL/TLS 오프로딩 기능을 활용하여 백엔드 서버의 암호화 처리 부담을 줄이고 중앙에서 강력한 인증서를 관리할 수 있다. 웹 애플리케이션 방화벽을 통합하거나 연동하여 SQL 삽입, 크로스 사이트 스크립팅 같은 애플리케이션 계층 공격을 차단하는 것이 효과적이다. 네트워크 계층에서는 접근 제어 목록을 엄격히 설정하고, 필요한 포트만 개방해야 한다.

정기적인 보안 감사와 구성 검토가 필요하다. 자동화된 취약점 스캔 도구를 사용하고, 모든 관리 접근은 다요소 인증과 암호화된 채널을 통해 이루어져야 한다. 또한, 실시간 트래픽 모니터링과 이상 징후 탐지 시스템을 구축하여 공격을 조기에 인지하고 대응할 수 있다.

11. 여담

"로드 밸런서"라는 용어는 원래 전기 공학 분야에서 전기 회로의 부하를 균등하게 분배하는 장치를 지칭했다[7]. 이 용어가 컴퓨터 네트워킹에 차용되면서, 서버나 네트워크 링크에 걸리는 트래픽 부하를 분산하는 장치를 일컫는 말로 정착되었다.

초기의 부하 분산 기술은 비교적 단순한 라운드 로빈 DNS를 이용한 방식이었다. 이 방법은 관리가 용이했지만, 서버 장애를 감지하거나 지리적 위치를 고려하지 못하는 등 한계가 명확했다. 이러한 제약을 극복하고 더 정교한 트래픽 관리를 위해 전용 부하 분산 장치가 개발되기 시작했다.

부하 분산의 개념은 컴퓨터 네트워크를 넘어 다양한 분야에서 유사한 원리로 적용된다. 예를 들어, 교통 시스템에서 차량의 흐름을 분산시키거나, 물류 창고에서 작업자에게 업무를 효율적으로 할당하는 것도 일종의 부하 분산이라 볼 수 있다. 인체의 순환계도 심장이라는 펌프와 다양한 크기의 혈관을 통해 신체 각 부분에 혈액을 균형 있게 공급하는 자연적 부하 분산 시스템의 예시가 된다.

부하 분산 장치

이름	부하 분산 장치
영문명	Load Balancer
분류	네트워크 장비
주요 기능	트래픽 분산, 서버 가용성 향상
계층	OSI 7계층 중 L4 (전송 계층), L7 (응용 계층)
배치 위치	클라이언트와 서버 사이
기술 상세
주요 알고리즘	라운드 로빈, 최소 연결, 가중치 기반, IP 해시
종류	하드웨어 기반, 소프트웨어 기반, 클라우드 서비스
상태 확인	헬스 체크를 통한 서버 모니터링
세션 지속성	쿠키 또는 IP 기반 세션 유지
SSL 오프로딩	SSL/TLS 암호화/복호화 처리
장애 조치	서버 장애 시 트래픽 자동 전환
주요 프로토콜	TCP, UDP, HTTP, HTTPS
관련 기술	리버스 프록시, CDN, 오토 스케일링
대표 제품/서비스	F5 BIG-IP, NGINX, AWS ELB, Azure Load Balancer
적용 분야	웹 서비스, 애플리케이션 서버, 데이터베이스 클러스터

부하 분산 장치

이름	부하 분산 장치
영문명	Load Balancer
분류	네트워크 장비
주요 기능	트래픽 분산, 서버 가용성 향상
계층	OSI 7계층 중 L4 (전송 계층), L7 (응용 계층)
배치 위치	클라이언트와 서버 사이
기술 상세
주요 알고리즘	라운드 로빈, 최소 연결, 가중치 기반, IP 해시
종류	하드웨어 기반, 소프트웨어 기반, 클라우드 서비스
상태 확인	헬스 체크를 통한 서버 모니터링
세션 지속성	쿠키 또는 IP 기반 세션 유지
SSL 오프로딩	SSL/TLS 암호화/복호화 처리
장애 조치	서버 장애 시 트래픽 자동 전환
주요 프로토콜	TCP, UDP, HTTP, HTTPS
관련 기술	리버스 프록시, CDN, 오토 스케일링
대표 제품/서비스	F5 BIG-IP, NGINX, AWS ELB, Azure Load Balancer
적용 분야	웹 서비스, 애플리케이션 서버, 데이터베이스 클러스터