로드스태시
1. 개요
1. 개요
로드스태시는 엘라스틱이 개발한 오픈 소스 데이터 처리 파이프라인 도구이다. 주로 로그 및 이벤트 데이터를 수집하고, 변환한 후, 지정된 목적지로 전송하는 데 사용된다. 2013년에 최초 공개되었으며, 아파치 라이선스 2.0 하에 배포된다.
이 도구의 핵심 구조는 입력(Input), 필터(Filter), 출력(Output)이라는 세 가지 주요 구성 요소로 이루어져 있다. 입력 단계에서는 다양한 소스로부터 데이터를 수집하고, 필터 단계에서 수집된 데이터를 파싱하거나 변환하며, 출력 단계에서는 처리된 데이터를 엘라스틱서치나 다른 저장소로 전송한다. 이러한 모듈식 설계 덕분에 사용자는 복잡한 데이터 흐름을 유연하게 구성할 수 있다.
2. 역사
2. 역사
로드스태시는 2013년에 엘라스틱의 공동 창립자인 조던 시셀과 시릴 미테라가 처음 개발하여 공개했다. 당시 개발의 주요 동기는 다양한 소스에서 발생하는 로그 데이터를 효율적으로 수집하고, 중앙 집중식 저장소인 엘라스틱서치로 전송하기 위한 가벼운 데이터 수집기와 파이프라인이 필요했기 때문이다. 초기에는 '로그스태시'라는 이름으로 시작했으며, 주로 로그 파일 처리에 초점을 맞췄다.
시간이 지나며 단순한 로그 수집을 넘어 다양한 형태의 데이터를 처리할 수 있는 범용 데이터 처리 파이프라인으로 진화했다. 이에 따라 2016년경 프로젝트 이름이 '로드스태시'로 변경되어 현재에 이르고 있다. 이 변화는 플러그인 아키텍처의 확장과 함께 빅데이터 처리, 메트릭 수집, 클라우드 서비스 연동 등 더 넓은 데이터 통합 시나리오를 지원하기 위한 것이었다.
로드스태시는 아파치 라이선스 2.0 하에 공개된 오픈 소스 소프트웨어로, 엘라스틱이 주도적으로 개발을 이끌고 있다. 엘라스틱 스택 (일명 ELK 스택)의 핵심 구성 요소로서, 엘라스틱서치, 키바나, 비츠 제품군과 긴밀하게 통합되어 완전한 데이터 수집, 저장, 시각화 및 모니터링 솔루션을 제공하는 데 기여하고 있다.
3. 아키텍처
3. 아키텍처
3.1. 입력(Input)
3.1. 입력(Input)
로드스태시의 입력(Input)은 데이터 파이프라인의 첫 번째 단계로, 다양한 소스로부터 데이터를 수집하는 역할을 한다. 입력 플러그인을 통해 로드스태시는 로그 파일, 표준 입력(stdin), 파일비트(Filebeat)와 같은 비츠(Beats) 제품군, 메시지 큐, 데이터베이스, HTTP 엔드포인트 등에서 데이터를 읽어들일 수 있다. 각 입력은 독립적으로 구성되며, 로드스태시는 여러 입력을 동시에 실행하여 여러 소스로부터 데이터를 병렬로 수집하는 것이 가능하다.
가장 일반적으로 사용되는 입력 플러그인 중 하나는 파일 입력(file input)이다. 이 플러그인은 지정된 파일 경로나 와일드카드 패턴을 사용하여 하나 이상의 로그 파일을 지속적으로 모니터링하고, 새로운 줄이 추가될 때마다 이를 이벤트로 변환하여 파이프라인에 전달한다. 비츠 플랫폼의 파일비트와 같은 경량 에이전트를 사용하는 경우, 비츠 입력(beats input) 플러그인을 통해 파일비트가 전송하는 데이터를 효율적으로 수신할 수 있다.
데이터베이스에서 주기적으로 데이터를 가져와야 하는 경우에는 JDBC 입력(jdbc input) 플러그인을 사용할 수 있다. 이 플러그인은 JDBC 드라이버를 통해 관계형 데이터베이스 관리 시스템(RDBMS)에 연결하여, 사용자가 정의한 SQL 쿼리를 주기적으로 실행하고 그 결과를 이벤트로 생성한다. 또한, 카프카(kafka), 래빗엠큐(RabbitMQ), 레디스(Redis)와 같은 메시지 브로커나 큐 시스템에서 데이터를 소비하기 위한 전용 입력 플러그인들도 제공된다.
입력 단계에서는 수집된 원본 데이터가 이벤트 객체의 일부로 만들어지며, 이후 필터(Filter) 단계에서 파싱, 변환, 강화 등의 처리를 거치게 된다. 입력 플러그인의 구성에는 데이터 소스의 위치, 접속 정보, 읽기 빈도, 코덱 설정 등이 포함되며, 이를 통해 데이터 수집 방식을 세밀하게 제어할 수 있다.
3.2. 필터(Filter)
3.2. 필터(Filter)
필터(Filter)는 로드스태시 파이프라인의 핵심 처리 단계로, 입력 단계에서 수집된 원시 데이터를 가공하고 변환하는 역할을 한다. 이 단계에서는 데이터가 실제로 분석 가능한 형태로 정제되며, 다양한 내장 또는 외부 플러그인을 통해 필요한 변환 작업을 수행한다. 필터는 순차적으로 연결되어 실행될 수 있어 복잡한 데이터 처리 흐름을 구성하는 것이 가능하다.
주요 필터 플러그인으로는 데이터를 구문 분석하는 grok, 필드를 추가하거나 제거하는 mutate, 데이터를 집계하는 aggregate, 그리고 지리 정보를 처리하는 geoip 등이 있다. 예를 들어, 웹 서버 로그에서 IP 주소를 추출하여 해당 위치의 국가와 도시 정보를 추가하거나, 불필요한 필드를 삭제하여 데이터를 정제하는 작업이 여기에 해당한다. 이러한 변환 작업은 이후 Elasticsearch에 색인되거나 다른 저장소로 전송되는 데이터의 품질과 유용성을 결정짓는다.
필터 단계는 선택 사항이지만, 대부분의 실제 사용 사례에서 데이터를 정규화하고 비즈니스 인텔리전스에 적합한 형태로 가공하기 위해 필수적으로 활용된다. 로드스태시의 강력한 확장성은 바로 이 필터 단계에서 제공되는 방대한 플러그인 생태계에 기반한다. 사용자는 필요에 따라 Ruby 코드를 직접 작성하는 ruby 필터와 같은 플러그인을 사용하여 완전히 사용자 정의된 변환 로직을 구현할 수도 있다.
3.3. 출력(Output)
3.3. 출력(Output)
출력은 로드스태시 파이프라인의 최종 단계로, 처리된 데이터를 최종 목적지로 전송하는 역할을 한다. 입력과 필터를 거쳐 변환 및 강화된 데이터는 출력 플러그인을 통해 다양한 외부 시스템으로 내보내진다. 로드스태시는 매우 다양한 출력 플러그인을 제공하여 사용자가 데이터의 최종 저장소나 분석 시스템을 유연하게 선택할 수 있게 한다.
가장 일반적인 출력 대상은 엘라스틱서치이다. 로드스태시는 엘라스틱서치에 데이터를 색인하도록 최적화되어 있으며, 이 조합은 ELK 스택의 핵심을 이룬다. 그 외에도 파일 시스템에 기록하거나, 표준 출력으로 콘솔에 출력하며, 이메일로 알림을 보내는 등의 기본적인 출력이 가능하다. 또한 모니터링 시스템이나 경보 시스템과의 연계를 위해 그라파나, 프로메테우스, 데이터독과 같은 도구로 데이터를 전송할 수 있다.
데이터베이스나 메시지 큐와 같은 인프라와의 통합도 광범위하게 지원된다. 관계형 데이터베이스 관리 시스템인 MySQL, PostgreSQL, 오라클 데이터베이스에 데이터를 삽입할 수 있으며, 메시지 지향 미들웨어인 아파치 카프카, RabbitMQ, 아파치 플럼으로 스트리밍 데이터를 전송할 수 있다. 클라우드 서비스로는 아마존 웹 서비스의 S3, 구글 클라우드 플랫폼의 구글 클라우드 스토리지, 마이크로소프트 애저의 저장소 서비스 등으로 출력이 가능하다.
하나의 파이프라인에서 여러 개의 출력을 동시에 정의하는 것도 가능하다. 이를 통해 동일한 데이터 스트림을 엘라스틱서치에 저장하는 동시에 아파치 카프카로 전송하거나, 아카이브 목적으로 S3 버킷에 백업하는 등의 복합적인 작업을 구성할 수 있다. 각 출력은 조건문을 사용하여 데이터의 특성에 따라 라우팅하는 고급 구성도 지원한다.
4. 주요 기능
4. 주요 기능
4.1. 데이터 수집
4.1. 데이터 수집
로드스태시는 다양한 소스로부터 데이터를 수집하는 것을 핵심 기능으로 한다. 이 과정은 주로 파이프라인의 첫 번째 단계인 입력 플러그인을 통해 이루어진다. 로드스태시는 파일, 표준 입력, 시스템 로그, 데이터베이스, 메시지 큐, 클라우드 서비스, API 등 광범위한 소스로부터 데이터를 끌어올 수 있는 풍부한 입력 플러그인 생태계를 제공한다. 이를 통해 사용자는 단일 도구로 분산된 환경에 있는 이질적인 데이터를 통합적으로 수집할 수 있다.
가장 일반적인 사용 사례는 로그 파일의 실시간 수집이다. 로드스태시는 file 입력 플러그인을 사용하여 지정된 경로의 로그 파일을 지속적으로 모니터링하고, 새로운 줄이 추가될 때마다 이를 이벤트로 변환하여 파이프라인에 전달한다. 이는 웹 서버 로그, 애플리케이션 로그, 시스템 로그 등을 처리하는 데 적합하다. 또한 beats 입력 플러그인을 통해 경량 데이터 수집기인 엘라스틱 빈츠로부터 데이터를 안전하게 수신할 수 있어 에이전트 기반의 중앙 집중식 로그 수집 아키텍처를 구성하는 데 필수적이다.
데이터베이스로부터의 배치 데이터 수집도 지원한다. 예를 들어, jdbc 입력 플러그인은 JDBC 드라이버를 지원하는 관계형 데이터베이스 관리 시스템에 주기적으로 쿼리를 실행하여 결과를 가져올 수 있다. 이를 통해 배치 처리가 필요한 데이터를 데이터 웨어하우스나 분석 시스템으로 이동시키는 ETL 작업에 활용된다. 네트워크 프로토콜을 통한 수집도 가능하여, tcp, udp, http 플러그인은 네트워크 포트를 열고 들어오는 데이터 스트림이나 HTTP 요청의 본문을 수집할 수 있다.
이러한 다각적인 수집 기능은 로드스태시가 단순한 로그 수집기를 넘어, 마이크로서비스, 서버리스 아키텍처, IoT 디바이스 등 현대적인 분산 시스템에서 발생하는 모든 형태의 이벤트 데이터를 수집하는 범용 데이터 수집 엔진으로 자리매김하는 기반이 된다. 사용자는 구성 파일에서 원하는 입력 플러그인을 선언함으로써 복잡한 코딩 없이도 강력한 데이터 수집 파이프라인을 빠르게 구축할 수 있다.
4.2. 데이터 변환
4.2. 데이터 변환
로드스태시의 필터 구성 요소는 파이프라인 내에서 데이터를 변환하는 핵심 역할을 담당한다. 이 단계에서는 수집된 원시 데이터가 분석이나 저장에 적합한 형태로 가공된다. 주요 변환 작업으로는 데이터 파싱, 필드 추가 또는 삭제, 데이터 형식 변환, 조건부 처리 등이 포함된다. 예를 들어, 복잡한 로그 문자열에서 타임스탬프, IP 주소, 에러 코드 같은 의미 있는 필드를 추출하거나, 데이터를 JSON 형식으로 표준화하는 작업이 여기에 해당한다.
로드스태시는 다양한 내장 필터 플러그인을 제공하여 강력한 변환 기능을 지원한다. 대표적인 필터로는 grok 필터가 있으며, 이는 정규 표현식을 사용하여 비정형 로그 데이터를 구조화된 필드로 파싱하는 데 특화되어 있다. 또한 mutate 필터는 필드 이름 변경, 데이터 타입 변환, 필드 제거와 같은 기본적인 조작을 수행한다. date 필터는 문자열 형태의 시간 정보를 표준화된 타임스탬프로 변환하고, geoip 필터는 IP 주소를 기반으로 지리적 위치 정보를 추가한다.
이러한 변환 과정은 사용자가 정의한 설정 파일에 명시된 순서대로 실행된다. 각 필터는 이전 단계의 출력을 입력으로 받아 처리하고, 그 결과를 다음 필터나 최종 출력 단계로 전달한다. 이를 통해 원본 데이터 소스의 형식에 구애받지 않고, Elasticsearch나 다른 저장소에 저장하기 전에 데이터를 정제하고 풍부하게 만들 수 있다. 데이터 변환은 로드스태시가 단순한 수집 도구를 넘어 강력한 ETL 도구로서 기능할 수 있게 하는 중요한 특징이다.
4.3. 데이터 전송
4.3. 데이터 전송
로드스태시의 출력 단계는 처리된 데이터를 최종 목적지로 안정적으로 전송하는 역할을 한다. 다양한 출력 플러그인을 통해 사용자는 데이터를 원하는 저장소나 서비스로 보낼 수 있다. 대표적인 출력 대상으로는 Elasticsearch, Apache Kafka, Amazon S3, Google Cloud Storage, 관계형 데이터베이스, 이메일, 그리고 표준 출력이나 파일 등이 있다. 특히 Elasticsearch, Logstash, Kibana 스택에서 로드스태시는 변환된 데이터를 Elasticsearch에 색인하도록 구성하는 것이 일반적이다.
데이터 전송 과정에서는 신뢰성과 성능을 보장하기 위한 여러 기능을 제공한다. 대용량 데이터 처리를 위해 배치 처리와 버퍼링을 지원하며, 일시적인 네트워크 장애나 목적지 서비스 장애 시 자동으로 재시도하는 내결함성 메커니즘을 갖추고 있다. 또한 특정 출력 플러그인은 데이터 전송 보안을 위해 SSL/TLS 암호화를 지원한다. 사용자는 출력 설정에서 전송 속도, 배치 크기, 재시도 정책 등을 세밀하게 조정하여 시스템 환경에 최적화된 데이터 흐름을 구성할 수 있다.
5. 설치 및 구성
5. 설치 및 구성
로드스태시는 다양한 운영 체제와 환경에 설치할 수 있다. 공식 웹사이트에서 제공하는 패키지 관리자를 통한 설치가 일반적이며, 윈도우, 리눅스, 맥OS를 모두 지원한다. 엘라스틱이 공식적으로 배포하는 RPM, DEB, MSI 패키지를 사용하거나, 도커 이미지를 활용하여 컨테이너 환경에 빠르게 배포하는 방법도 널리 사용된다.
설치 후에는 logstash.yml 파일을 통해 핵심 설정을 관리한다. 이 파일에서는 파이프라인 배치 크기, 워커 스레드 수, JVM 힙 메모리 크기 등 성능과 관련된 전역 옵션을 구성할 수 있다. 개별 데이터 처리 흐름은 파이프라인으로 정의되며, 각 파이프라인은 별도의 설정 파일(.conf)로 작성한다. 이 설정 파일은 입력, 필터, 출력 세 가지 섹션을 명시하여 데이터의 흐름을 기술한다.
로드스태시의 구성은 주로 YAML과 자체 설정 언어를 기반으로 한다. 입력 플러그인에서 데이터 소스를 정의하고, 필터 플러그인에서 Grok 패턴을 이용한 파싱이나 mutate 필터를 통한 필드 조작 등의 변환을 적용한 후, 출력 플러그인에서 엘라스틱서치, 아마존 S3, 스탠다드 아웃풋 같은 목적지로 데이터를 전송하도록 설정한다. 다수의 파이프라인을 동시에 실행하여 서로 다른 데이터 소스를 독립적으로 처리할 수도 있다.
6. 사용 예시
6. 사용 예시
로드스태시는 다양한 소스의 데이터를 수집하여 변환한 후 지정된 목적지로 전송하는 데이터 파이프라인을 구축하는 데 사용된다. 가장 대표적인 사용 예시는 로그 관리 시스템을 구축하는 것이다. 예를 들어, 다수의 웹 서버에서 생성되는 로그 파일을 실시간으로 수집하여 JSON 형식으로 변환한 후, Elasticsearch에 저장하고 Kibana를 통해 시각화하는 구조가 있다. 이 경우 로드스태시는 파일비트와 같은 Beats 계열 에이전트로부터 데이터를 입력받거나, 직접 파일을 읽어들여 필터를 통해 불필요한 데이터를 제거하거나 IP 주소를 지리적 위치 정보로 변환하는 등의 작업을 수행한다.
또 다른 주요 사용 예시는 애플리케이션 성능 관리나 사용자 행동 분석을 위한 데이터 수집 파이프라인을 구성하는 것이다. 마이크로서비스 환경에서 각 서비스가 생성하는 이벤트 데이터나 메트릭을 TCP/UDP 또는 HTTP 프로토콜을 통해 로드스태시로 전송하면, 로드스태시는 이를 정규화하고 집계하여 데이터베이스나 메시지 큐에 전송할 수 있다. 이를 통해 분산된 시스템에서 발생하는 데이터를 중앙에서 일관된 형식으로 처리하고 분석할 수 있다.
사용 사례 | 입력 소스 | 주요 처리(필터) | 출력 목적지 |
|---|---|---|---|
웹 서버 로그 분석 | 파일비트(로그 파일), 시스로그 | grok 패턴 파싱, 날짜 형식 변환, 지오아이피 필터 | Elasticsearch, 아마존 S3 |
실시간 애플리케이션 모니터링 | JSON 파싱, 필드 추가/삭제, 샘플링 | ||
데이터베이스 변경 사항 캡처 | JDBC 입력 플러그인 | 데이터 마스킹, 필드 이름 변경, 조건부 분기 |
이처럼 로드스태시는 단순한 로그 수집기를 넘어, 다양한 플러그인을 조합하여 복잡한 ETL 과정을 구성할 수 있는 유연한 도구이다. 설정 파일을 통해 입력, 필터, 출력 단계를 선언적으로 정의함으로써, 코드 작성 없이도 강력한 데이터 처리 흐름을 구현할 수 있다.
7. 장단점
7. 장단점
로드스태시는 엘라스틱 스택의 핵심 구성 요소로서, 로그 및 이벤트 데이터를 처리하는 데 널리 사용되며, 그 인기는 뚜렷한 장점들에서 비롯된다. 가장 큰 장점은 높은 확장성과 처리량이다. JRuby로 구현된 로드스태시는 Java 가상 머신 위에서 동작하며, 멀티스레딩을 통해 여러 CPU 코어를 효율적으로 활용할 수 있어, 대량의 데이터 스트림을 실시간으로 처리하는 데 적합하다. 또한, 풍부한 플러그인 생태계를 자랑한다. 공식적으로 제공되는 수백 개의 입력, 필터, 출력 플러그인 덕분에 파일 시스템, 데이터베이스, 메시지 큐, 클라우드 서비스 등 다양한 소스로부터 데이터를 수집하고, 정규 표현식을 이용한 파싱이나 Grok 필터를 통한 비정형 데이터 구조화, 그리고 Elasticsearch, Amazon S3, Kafka 등 다양한 목적지로의 전송이 가능하다. 이러한 유연성은 복잡한 데이터 파이프라인 구축을 상대적으로 쉽게 만들어 준다.
그러나 로드스태시는 몇 가지 단점도 가지고 있다. 가장 흔히 지적되는 문제는 비교적 높은 리소스 사용량, 특히 메모리 소비량이다. Java 가상 머신의 오버헤드와 함께 동작하기 때문에, 경량 에이전트가 필요한 환경에서는 부담이 될 수 있다. 이는 엘라스틱이 더 가벼운 대안으로 Beats 제품군을 개발하게 된 이유 중 하나이기도 하다. 또한, 구성 파일의 복잡성과 JRuby 기반의 아키텍처로 인한 관리 부담이 존재한다. 복잡한 데이터 변환 로직을 구성 파일(.conf)에 정의해야 하며, 이를 디버깅하고 성능을 튜닝하는 데에는 상당한 학습 곡선이 필요할 수 있다. 따라서 소규모이거나 단순한 데이터 수집 요구사항에는 과도한 도구가 될 수 있다.
8. 관련 도구
8. 관련 도구
8.1. Elasticsearch
8.1. Elasticsearch
로드스태시는 엘라스틱이 개발한 오픈 소스 데이터 처리 파이프라인 도구이다. 주로 로그 및 이벤트 데이터의 수집, 변환, 전송을 위해 사용되며, 아파치 라이선스 2.0 하에 배포된다.
로드스태시의 핵심 구조는 입력(Input), 필터(Filter), 출력(Output)이라는 세 가지 구성 요소로 이루어진 파이프라인이다. 입력 단계에서는 파일, 표준 입력, 비카운더, 카프카 등 다양한 소스로부터 데이터를 수집한다. 필터 단계에서는 수집된 데이터를 구문 분석하거나 변환하며, 출력 단계에서는 처리된 데이터를 엘라스틱서치나 아마존 S3 같은 최종 목적지로 전송한다.
이 도구는 2013년에 최초 공개되었으며, 엘라스틱서치, 키바나, 비츠와 함께 엘라스틱 스택을 구성하는 핵심 요소로 자리 잡았다. 로드스태시는 JSON 형식의 데이터를 처리하는 데 특화되어 있으며, 풍부한 플러그인 생태계를 통해 그 기능을 확장할 수 있다.
8.2. Kibana
8.2. Kibana
Kibana는 엘라스틱이 개발한 오픈소스 데이터 시각화 및 탐색 도구이다. 로드스태시나 Beats를 통해 수집된 데이터가 저장된 Elasticsearch 클러스터에 연결되어, 사용자가 웹 브라우저를 통해 대화형 대시보드를 생성하고 데이터를 탐색할 수 있게 해준다. 로드스태시, Elasticsearch, Kibana는 함께 ELK 스택이라는 강력한 로그 및 데이터 분석 플랫폼을 구성한다.
Kibana의 핵심 기능은 데이터 시각화와 데이터 탐색이다. 사용자는 직관적인 인터페이스를 통해 히스토그램, 파이 차트, 지도, 시계열 차트 등 다양한 시각화 요소를 만들 수 있다. 또한 쿼리 언어를 사용하거나 필터를 적용하여 Elasticsearch에 저장된 원본 데이터를 자유롭게 검색하고 분석할 수 있다. 이를 통해 시스템 로그, 애플리케이션 성능 지표, 비즈니스 데이터 등에서 의미 있는 인사이트를 도출하는 것이 가능해진다.
로드스태시와의 연동 관점에서 보면, Kibana는 로드스태시 파이프라인의 최종 결과물을 확인하고 활용하는 최종 단계에 위치한다. 로드스태시가 다양한 소스로부터 데이터를 수집하고 가공하여 Elasticsearch에 저장하면, Kibana는 그 데이터를 시각적으로 표현하는 프레젠테이션 레이어 역할을 한다. 이 세 가지 도구는 각각 데이터 수집 및 변환, 데이터 저장 및 색인, 데이터 시각화라는 명확한 책임을 분담하며, 함께 사용될 때 최상의 효과를 발휘한다.
8.3. Beats
8.3. Beats
Beats는 엘라스틱이 개발한 경량 데이터 수집기들의 모음이다. 로드스태시와 함께 엘라스틱 스택의 데이터 수집 계층을 구성하며, 서버나 애플리케이션에서 발생하는 다양한 유형의 데이터를 중앙 집중식으로 수집하는 데 특화되어 있다. 로드스태시가 범용적인 데이터 처리 파이프라인이라면, Beats는 특정 데이터 소스에 최적화된 단일 목적의 에이전트로 설계되었다.
Beats는 여러 가지 특화된 데이터 수집기로 구성된다. 대표적으로 시스템 메트릭을 수집하는 Metricbeat, 로그 파일을 수집하는 Filebeat, 네트워크 패킷 데이터를 수집하는 Packetbeat 등이 있다. 각각의 Beat는 Go 언어로 작성되어 경량이며, 설치와 구성이 간단하고 시스템 자원을 적게 소모하는 특징을 가진다. 수집된 데이터는 일반적으로 Elasticsearch로 직접 전송하거나, 추가 가공이 필요할 경우 로드스태시를 경유하여 전송할 수 있다.
이러한 Beats의 등장은 로드스태시의 아키텍처를 보완하는 역할을 했다. 모든 데이터 처리를 로드스태시 단일 에이전트에 의존할 경우 발생할 수 있는 자원 소모와 복잡성을 해결하기 위해, 단순 수집 작업은 Beats가, 복잡한 변환 및 풍부화 작업은 로드스태시가 담당하는 분산 아키텍처가 일반화되었다. 이는 모니터링과 보안 분석 같은 실시간성이 중요한 환경에서 효율적인 데이터 파이프라인을 구축하는 데 기여한다.
