PCI 익스프레스
1. 개요
1. 개요
PCI 익스프레스는 컴퓨터의 주요 확장 카드를 메인보드에 연결하기 위한 고속 직렬 통신 확장 버스 표준이다. 정식 명칭은 PCI Express이며, 흔히 PCIe 또는 PCI-E로 줄여 부른다. 이 표준은 PCI-SIG 컨소시엄에 의해 개발 및 관리되며, 2003년에 최초로 등장했다. 기존의 PCI 버스와 AGP 포트를 대체하는 차세대 인터페이스로 자리 잡았다.
주요 용도는 그래픽 카드, 고속 SSD, 네트워크 카드, 사운드 카드 등 다양한 확장 카드를 연결하는 것이다. 특히 고대역폭이 필요한 그래픽 카드와 저장 장치의 핵심 연결 인터페이스로 널리 사용된다. 데스크톱 컴퓨터와 노트북, 서버를 가리지 않고 현대 컴퓨터 시스템의 필수 구성 요소이다.
PCI 익스프레스는 병렬 방식의 이전 표준과 달리 점대점 방식의 직렬 통신을 채택했다. 데이터는 하나 이상의 전송로, 즉 '레인'을 통해 전송된다. 이러한 설계는 확장성과 호환성을 높이는 동시에 더 높은 데이터 전송률을 실현하는 데 기여했다. 사용 가능한 레인 수와 버전에 따라 총 대역폭이 결정된다.
이 기술은 지속적인 개정을 통해 성능이 진화해 왔으며, 컴퓨터 하드웨어의 발전을 이끄는 핵심 동력 중 하나로 평가받는다.
2. 역사와 버전
2. 역사와 버전
2.1. 버전별 규격 및 성능
2.1. 버전별 규격 및 성능
PCI 익스프레스는 2003년 첫 번째 버전인 1.0이 공개된 이후로 지속적인 발전을 거듭하며 대역폭과 효율성을 극대화해 왔다. 각 버전은 이전 버전과의 하위 호환성을 유지하면서도 레인 당 전송 속도를 두 배씩 향상시키는 것이 특징이다. 예를 들어, PCIe 1.0의 레인 당 단방향 대역폭은 250 MB/s였으나, PCIe 2.0에서는 500 MB/s, PCIe 3.0에서는 약 985 MB/s, PCIe 4.0에서는 약 1.97 GB/s로 증가했다. 최신 버전인 PCIe 5.0과 6.0은 각각 약 3.94 GB/s와 약 7.88 GB/s의 레인 당 대역폭을 제공하여 고속 저장 장치와 고성능 컴퓨팅의 요구를 충족시키고 있다.
이러한 대역폭 증가는 주로 신호 인코딩 방식의 개선을 통해 이루어졌다. PCIe 1.0과 2.0은 8b/10b 인코딩을 사용하여 실제 데이터 전송 효율이 80%였지만, PCIe 3.0부터는 128b/130b 인코딩을 도입해 효율을 약 98.5%까지 높였다. PCIe 4.0, 5.0, 6.0도 이 방식을 계승하면서 클럭 속도만을 극한으로 끌어올렸다. 결과적으로 사용자는 동일한 레인 수(x16, x8 등)의 슬롯을 사용하더라도 새 버전의 그래픽 카드나 SSD를 장착하면 훨씬 더 높은 성능을 얻을 수 있게 되었다.
버전별 규격과 성능은 다음 표와 같이 정리할 수 있다.
버전 | 공개 연도 | 레인 당 신호 속도 | 레인 당 단방향 대역폭 | 인코딩 방식 | 실제 효율 |
|---|---|---|---|---|---|
PCIe 1.0 | 2003년 | 2.5 GT/s | 250 MB/s | 8b/10b | 80% |
PCIe 2.0 | 2007년 | 5.0 GT/s | 500 MB/s | 8b/10b | 80% |
PCIe 3.0 | 2010년 | 8.0 GT/s | 984.6 MB/s | 128b/130b | 98.5% |
PCIe 4.0 | 2017년 | 16.0 GT/s | 1.969 GB/s | 128b/130b | 98.5% |
PCIe 5.0 | 2019년 | 32.0 GT/s | 3.938 GB/s | 128b/130b | 98.5% |
PCIe 6.0 | 2022년 | 64.0 GT/s | 7.877 GB/s | PAM-4, 1b/1b | 100%[6] |
PCIe 6.0은 기존과 근본적으로 다른 PAM-4 신호 변조와 1b/1b 인코딩을 채택하여 대역폭을 두 배로 늘리면서도 에너지 효율을 개선했다. 이러한 급속한 발전은 인공지능, 데이터 센터, 자율주행과 같은 첨단 분야에서 초고속 데이터 전송이 필수적이기 때문이다. 각 버전의 규격은 PCI-SIG에 의해 표준화되며, 새로운 버전이 나와도 물리적 커넥터 형태와 핀 배열은 호환성을 유지하도록 설계된다.
2.2. 호환성
2.2. 호환성
PCI 익스프레스는 하위 호환성과 상위 호환성을 모두 지원하는 것이 주요 특징이다. 하위 호환성 측면에서, 물리적으로는 PCI 익스프레스 1.0 슬롯에 PCI 익스프레스 3.0 카드를 삽입하여 사용할 수 있다. 이는 커넥터의 물리적 형태가 동일하게 유지되었기 때문이다. 다만, 이 경우 카드는 연결된 슬롯이 지원하는 최고 버전의 규격으로 속도가 제한되어 동작하게 된다.
상위 호환성도 중요한데, 예를 들어 PCI 익스프레스 4.0 메인보드의 슬롯에는 PCI 익스프레스 3.0 또는 2.0 카드를 문제없이 설치하여 사용할 수 있다. 이는 새로운 버전의 규격이 이전 버전과의 호환성을 유지하면서 개발되었기 때문이다. 이러한 호환성 정책은 사용자의 기존 장비 투자를 보호하고 업그레이드 경로를 유연하게 만들어 준다.
호환성을 결정하는 또 다른 요소는 레인 수이다. PCI 익스프레스 슬롯은 x1, x4, x8, x16 등 다양한 레인 구성을 가지며, 물리적 폼 팩터도 이에 따라 다르다. 일반적으로 더 많은 레인을 지원하는 슬롯(x16)에는 더 적은 레인의 카드(x1 또는 x4)를 삽입하여 사용할 수 있다. 반대로, 적은 레인의 슬롯에는 물리적 크기가 맞더라도 더 많은 레인이 필요한 카드는 정상적인 성능을 발휘할 수 없다.
이러한 유연한 호환성 구조 덕분에 PCI 익스프레스는 그래픽 카드부터 고속 저장 장치, 네트워크 카드에 이르기까지 수많은 확장 카드의 사실상 표준 인터페이스로 자리 잡을 수 있었다. 사용자는 자신의 시스템에 맞는 버전과 레인 구성을 선택하여 장비를 확장할 수 있으며, 이는 PCI-SIG가 장기간에 걸쳐 표준을 관리해 온 성과라고 볼 수 있다.
3. 구조 및 작동 방식
3. 구조 및 작동 방식
3.1. 레이어 구조
3.1. 레이어 구조
PCI 익스프레스의 구조는 계층적 설계를 바탕으로 한다. 이는 통신 프로토콜에서 흔히 사용되는 방식으로, 각 계층이 특정한 기능을 담당하여 하드웨어와 소프트웨어 간의 효율적인 통신을 가능하게 한다. PCI 익스프레스의 계층 구조는 크게 트랜잭션 계층, 데이터 링크 계층, 물리 계층으로 나뉜다.
가장 상위에 위치하는 트랜잭션 계층은 읽기와 쓰기 요청과 같은 트랜잭션의 생성과 처리를 담당한다. 이 계층은 운영 체제와 장치 드라이버가 보내는 명령을 패킷 형태로 포장하여 하위 계층으로 전달하거나, 하위 계층에서 올라온 패킷을 해석하여 시스템에 전달하는 역할을 수행한다. 데이터 링크 계층은 트랜잭션 계층에서 내려온 패킷의 순차적 전달과 데이터 무결성을 보장하는 데 중점을 둔다. 이 계층은 순환 중복 검사를 통한 오류 검출 및 재전송 메커니즘을 제공하여 신뢰할 수 있는 데이터 전송을 구현한다.
가장 하위의 물리 계층은 실제 전기 신호의 송수신을 담당하며, 레인 구성과 직렬 통신을 관리한다. 이 계층은 송신 측에서 인코딩을, 수신 측에서 디코딩과 클록 복원을 수행한다. 이러한 계층적 분리는 하드웨어 설계의 유연성을 높이고, 새로운 버전의 규격이 등장했을 때 특정 계층만 업데이트하여 호환성을 유지할 수 있게 한다. 예를 들어, 물리 계층의 전송 속도가 향상되어도 상위의 트랜잭션 계층 프로토콜은 크게 변경되지 않는다.
3.2. 전송 방식
3.2. 전송 방식
PCI 익스프레스는 기존의 PCI나 AGP와 같은 병렬 버스 방식이 아닌, 고속 직렬 통신 방식을 채택한다. 이는 각 장치가 독립적인 전용 통신 경로를 사용한다는 의미로, 여러 장치가 하나의 버스를 공유하며 발생하는 대역폭 경쟁과 타이밍 문제를 근본적으로 해결한다. 데이터는 이중화된 단방향 링크를 통해 송신과 수신이 동시에 이루어지는 전이중 통신 방식으로 전송된다.
기본적인 데이터 전송 단위는 '트랜잭션 계층 패킷'이다. 데이터는 송신 측에서 패킷으로 분할되어 전송되며, 수신 측에서 다시 조립된다. 이 과정에서 오류를 검출하고 재전송을 요청하는 기능을 포함하여 데이터의 정확한 전달을 보장한다. 이러한 패킷 기반의 전송 방식은 네트워크 프로토콜과 유사한 구조를 가지며, 높은 확장성과 효율성을 제공한다.
전송 속도는 '레인'이라는 개념을 통해 조절된다. 하나의 레인은 한 쌍의 송신 및 수신 신호선으로 구성된다. PCI 익스프레스는 필요에 따라 x1, x4, x8, x16과 같이 여러 레인을 묶어 사용하며, 레인 수가 많을수록 사용 가능한 총 대역폭이 선형적으로 증가한다. 예를 들어, 그래픽 카드는 일반적으로 대역폭 요구가 높아 x16 링크를 사용하는 반면, 사운드 카드나 확장 카드는 x1 링크로도 충분한 성능을 발휘할 수 있다.
3.3. 레인(Lane) 구성
3.3. 레인(Lane) 구성
PCI 익스프레스의 데이터 전송 경로는 레인(Lane)이라는 단위로 구성된다. 하나의 레인은 데이터를 송신하는 한 쌍과 수신하는 한 쌍, 총 두 쌍(4개의 신호선)으로 이루어진 전이중 통신 경로이다. 레인의 수는 'x1', 'x4', 'x8', 'x16'과 같이 표기하며, 이 숫자는 병렬로 사용되는 레인의 개수를 의미한다. 일반적으로 레인이 많을수록 이용 가능한 대역폭이 넓어져 더 높은 데이터 전송 속도를 제공한다.
마더보드의 PCIe 슬롯과 확장 카드는 물리적 크기와 전기적 레인 구성에 따라 다양한 조합으로 설계된다. 가장 흔히 볼 수 있는 그래픽 카드는 대역폭 요구가 높아 주로 x16 레인 구성을 사용한다. 반면, 사운드 카드나 저속 네트워크 카드 등은 x1 또는 x4 구성을 사용하는 경우가 많다. 호환성을 위해 물리적으로 더 긴 x16 슬롯에 레인이 적은 x4 또는 x8 카드를 삽입하여 사용할 수도 있다.
레인 구성은 시스템의 총 대역폭을 결정하는 핵심 요소이다. CPU와 칩셋은 제한된 수의 PCIe 레인을 제공하며, 이 레인들을 마더보드의 다양한 슬롯과 M.2 슬롯 등에 배분한다. 따라서 고성능 SSD와 그래픽 카드를 여러 개 장착할 경우, 사용 가능한 레인이 부족하여 각 장치가 최대 성능을 발휘하지 못할 수 있다. 이러한 레인 관리와 배분은 시스템 설계 시 중요한 고려 사항이다.
4. 폼 팩터 및 커넥터
4. 폼 팩터 및 커넥터
4.1. 내장형 (Add-in Card)
4.1. 내장형 (Add-in Card)
내장형 PCI 익스프레스 카드는 데스크톱 컴퓨터의 메인보드에 장착되는 확장 카드 형태로, 가장 전통적이고 일반적인 폼 팩터이다. 이 카드들은 메인보드의 PCI 익스프레스 슬롯에 꽂아 사용하며, 주로 그래픽 카드, 고성능 네트워크 카드, 전문가용 사운드 카드 등 높은 대역폭이 요구되는 장치에 사용된다. 표준적인 크기로는 PCI 익스프레스 x16 슬롯을 사용하는 풀-사이즈 그래픽 카드가 대표적이며, x1, x4, x8 슬롯용으로 더 작은 크기의 카드들도 존재한다.
이러한 내장형 카드의 물리적 규격은 PCI-SIG에 의해 표준화되어 있다. 가장 일반적인 것은 길이와 높이가 정의된 표준 풀-하이트, 풀-랭스 카드이다. 또한 공간이 제한된 소형 폼 팩터 시스템을 위해 낮은 프로파일(Low-Profile) 규격도 정의되어 있으며, 이는 높이가 표준 카드의 약 절반 정도로 작다. 카드의 전원 공급은 슬롯을 통해 75W까지 제공 가능하며, 고성능 그래픽 카드처럼 더 많은 전력이 필요할 경우 보조 전원 커넥터를 추가로 사용한다.
내장형 PCI 익스프레스 카드는 시스템의 확장성을 크게 높여준다. 사용자는 필요에 따라 그래픽 성능을 업그레이드하거나, 10기가비트 이더넷 네트워크 카드를 추가하거나, 전문 오디오 인터페이스를 설치하는 등 하드웨어의 기능을 자유롭게 보강할 수 있다. 특히 게이밍 및 콘텐츠 제작 분야에서는 고성능 그래픽 카드를 통한 성능 향상이 필수적이며, 이는 내장형 카드의 가장 주요한 응용 사례이다.
시간이 지남에 따라 M.2나 U.2 같은 더 컴팩트한 폼 팩터가 등장했지만, 내장형 카드는 여전히 최고의 성능과 확장성을 제공하는 주력 인터페이스로 자리 잡고 있다. 최신 PCI 익스프레스 버전의 높은 대역폭은 고속 저장 장치인 SSD를 카드 형태로 구현하는 것도 가능하게 하여, 극한의 저장 속도를 요구하는 워크스테이션 및 서버 환경에서도 널리 사용되고 있다.
4.2. M.2
4.2. M.2
M.2는 PCI 익스프레스 버스를 활용하는 소형 폼 팩터 확장 카드의 표준 규격이다. 이전에 널리 사용되던 mSATA를 대체하기 위해 개발되었으며, 주로 고속 저장 장치인 SSD를 연결하는 데 사용된다. M.2는 PCI-SIG와 SATA-IO 두 표준화 단체가 공동으로 관리하며, 컴퓨터의 메인보드에 직접 장착되는 방식으로 설계되었다.
M.2 커넥터는 단일 슬롯을 통해 PCI 익스프레스와 SATA 버스, 그리고 USB 신호를 모두 지원하는 것이 특징이다. 이는 하나의 물리적 인터페이스로 다양한 종류의 장치를 호환할 수 있게 해준다. 장치의 종류와 사용하는 버스 인터페이스는 M.2 카드의 '키'라고 불리는 커넥터 홈의 위치로 구분되며, B 키와 M 키가 가장 일반적으로 사용된다.
M.2 규격의 가장 큰 장점은 작은 크기와 높은 성능이다. 노트북과 같은 소형 PC 및 공간이 제한된 시스템에서 SSD를 장착하는 데 이상적이며, PCI 익스프레스 레인을 직접 사용하는 NVMe SSD의 경우 기존 SATA SSD를 훨씬 뛰어넘는 순차 읽기/쓰기 속도를 제공한다. 이로 인해 M.2 NVMe SSD는 현대 고성능 PC와 워크스테이션의 필수 저장 장치로 자리 잡았다.
M.2 카드는 길이와 너비에 따라 다양한 규격(예: 2230, 2242, 2280)으로 제작되며, 사용자는 자신의 메인보드가 지원하는 길이와 키 유형, 그리고 사용 가능한 PCI 익스프레스 레인 수를 확인해야 한다. 또한 M.2 슬롯은 SATA 모드와 PCI 익스프레스 모드 중 하나로 동작하도록 BIOS 설정이 필요할 수 있다.
4.3. U.2
4.3. U.2
U.2는 PCI 익스프레스 버스를 사용하는 고속 저장 장치를 위한 폼 팩터 및 커넥터 표준이다. 이전에는 SFF-8639라는 명칭으로 알려졌으며, 주로 기업용 및 고성능 SSD를 연결하는 데 사용된다. M.2 폼 팩터가 소형화와 공간 절약에 중점을 둔다면, U.2는 더 높은 전력 공급과 뛰어난 열 관리 성능을 제공하여 지속적인 고부하 작업에 적합한 설계를 지닌다.
U.2 커넥터는 기존의 SATA 및 SAS 커넥터와 유사한 형태의 케이블 연결 방식을 채택하고 있어, 서버나 워크스테이션의 베이에 쉽게 장착할 수 있다. 하나의 커넥터를 통해 PCI 익스프레스의 고대역폭 데이터 전송과 함께 SATA 호환 신호 및 더 높은 수준의 전원을 공급할 수 있다. 이는 NVMe 프로토콜을 활용하는 SSD가 SATA 인터페이스의 대역폭 한계를 극복하고 최대 성능을 발휘할 수 있도록 한다.
U.2 SSD는 일반적으로 2.5인치 폼 팩터를 가지며, 두께는 7mm 또는 15mm이다. 데이터 센터 환경에서 널리 사용되며, 고성능 컴퓨팅, 가상화, 데이터베이스 서버와 같은 응용 분야에서 선호된다. M.2에 비해 상대적으로 큰 크기 덕분에 더 큰 방열판이나 냉각 팬을 장착하기 쉬워, 고성능 SSD에서 발생하는 열을 효과적으로 관리할 수 있는 장점이 있다.
5. 주요 응용 분야
5. 주요 응용 분야
5.1. 그래픽 카드
5.1. 그래픽 카드
그래픽 카드는 PCI 익스프레스의 가장 대표적이고 중요한 응용 분야이다. PCI 익스프레스는 이전의 AGP와 PCI를 대체하며, 그래픽 카드와 메인보드 간의 고대역폭 연결을 제공한다. 고해상도 게임, 3D 렌더링, 영상 편집 등 그래픽 집약적인 작업에는 CPU와 GPU 사이에 엄청난 양의 데이터가 빠르게 전송되어야 하는데, PCI 익스프레스의 높은 전송 속도가 이를 가능하게 한다.
초기에는 PCI 익스프레스 x16 레인이 주로 사용되었으며, 이는 16개의 데이터 레인을 병렬로 사용하여 대역폭을 극대화하는 구성이다. 버전이 진화함에 따라 각 레인의 속도가 크게 향상되어, 최신 그래픽 카드는 PCI 익스프레스 4.0 또는 5.0 x16 규격을 지원한다. 이로 인해 텍스처, 지오메트리, 프레임 버퍼 데이터를 포함한 방대한 그래픽 데이터의 실시간 교환이 원활해졌다.
PCI 익스프레스의 또 다른 장점은 호환성이다. 일반적으로 하위 버전의 슬롯에 상위 버전의 카드를 설치하거나, 그 반대의 경우에도 작동이 가능하다. 또한, Resizable BAR과 같은 관련 기술은 CPU가 GPU의 전체 비디오 메모리에 직접적으로 더 효율적으로 접근할 수 있게 하여, 특정 게임과 응용 프로그램에서 성능을 추가로 향상시킨다. 결과적으로 PCI 익스프레스는 현대 개인용 컴퓨터와 워크스테이션에서 고성능 그래픽 하위 시스템의 필수적인 기반이 되었다.
5.2. 고속 저장 장치 (SSD)
5.2. 고속 저장 장치 (SSD)
PCI 익스프레스는 고속 저장 장치의 성능을 획기적으로 끌어올리는 핵심 인터페이스 역할을 한다. 기존의 SATA 인터페이스는 병목 현상으로 인해 NAND 플래시 메모리의 잠재력을 충분히 발휘하지 못했으나, PCI 익스프레스의 높은 대역폭은 이러한 한계를 극복하게 해주었다. 특히 NVMe 프로토콜과 결합되면서, PCI 익스프레스 SSD는 데이터 센터와 고성능 개인용 컴퓨터에서 빠른 데이터 접근과 대용량 파일 전송을 가능하게 하는 표준 저장 솔루션이 되었다.
주로 M.2 폼 팩터를 통해 구현되며, 이는 소형의 카드 형태로 메인보드에 직접 장착되어 공간을 효율적으로 사용한다. 고성능 워크스테이션이나 서버 환경에서는 더 많은 레인과 전력을 지원하는 U.2나 애드인 카드 형태의 PCI 익스프레스 SSD도 활용된다. 이러한 저장 장치는 PCI 익스프레스 버전과 레인 수에 따라 성능이 결정되며, 최신 버전일수록 더 빠른 순차 읽기/쓰기 속도와 더 낮은 지연 시간을 제공한다.
PCI 익스프레스 SSD의 등장은 운영 체제 부팅 시간, 응용 프로그램 로딩 속도, 그리고 대규모 데이터베이스 처리 성능에 지대한 영향을 미쳤다. 이는 가상 현실, 고해상도 비디오 편집, 그리고 과학 연산과 같이 엄청난 양의 데이터를 실시간으로 처리해야 하는 분야에서 필수적인 기술로 자리 잡았다.
5.3. 네트워크 카드
5.3. 네트워크 카드
PCI 익스프레스는 고속 네트워크 인터페이스 컨트롤러의 연결을 위한 핵심 인터페이스로 자리 잡았다. 기존의 PCI나 PCI-X 버스를 사용한 네트워크 카드는 대역폭의 한계로 인해 1기가비트 이더넷 수준이 주류를 이루었으나, PCI 익스프레스의 등장은 10기가비트 이더넷, 25기가비트 이더넷, 40기가비트 이더넷, 100기가비트 이더넷과 같은 초고속 네트워크 카드의 상용화를 가능하게 했다. 특히 데이터 센터, 서버, 고성능 워크스테이션에서는 다수의 고속 네트워크 카드를 설치해 네트워크 처리량과 가상화 성능을 극대화하는 데 PCI 익스프레스의 대역폭이 필수적이다.
네트워크 카드는 일반적으로 PCI 익스프레스 x4 또는 PCI 익스프레스 x8 슬롯을 사용하며, 최신 버전의 PCI 익스프레스를 지원함으로써 낮은 레이턴시와 높은 처리량을 보장받는다. 인텔과 AMD의 최신 플랫폼 컨트롤러 허브는 네트워크 카드용으로 PCI 익스프레스 레인을 직접 제공하기도 한다. 또한, 가상 머신 호스트에서 SR-IOV와 같은 고급 가상화 기술을 활용하려면 PCI 익스프레스의 직접 할당 기능이 필요하며, 이는 네트워크 성능을 크게 향상시킨다.
소비자 시장에서는 PCI 익스프레스 x1 슬롯을 사용하는 2.5기가비트 또는 5기가비트 이더넷 카드도 보급되고 있어, 기가비트 네트워크의 다음 단계로의 전환을 주도하고 있다. 무선 네트워크 분야에서도 최신 Wi-Fi 6 및 Wi-Fi 7 표준을 지원하는 확장 카드들은 PCI 익스프레스 인터페이스를 통해 마더보드에 연결되어 최대의 무선 대역폭을 구현한다.
6. 관련 기술 및 표준
6. 관련 기술 및 표준
6.1. NVMe
6.1. NVMe
NVMe는 PCI 익스프레스 버스를 통해 연결된 고속 저장 장치를 위한 논리적 장치 인터페이스 규격이다. SSD의 성능이 급격히 향상되면서 기존의 SATA 및 SAS 인터페이스가 병목 현상을 일으키자, 이를 해결하기 위해 PCI 익스프레스의 고대역폭을 저장 장치에 직접 활용할 수 있도록 설계되었다. NVMe는 호스트 컨트롤러와 저장 장치 간의 통신을 위한 효율적인 명령어 집합과 대기열 구조를 정의하여, SATA에 비해 훨씬 낮은 지연 시간과 높은 입출력 작업 처리량을 제공한다.
NVMe의 핵심 특징은 병렬 처리를 극대화하는 설계에 있다. 기존 AHCI 규격은 단일 명령 대기열만을 지원했으나, NVMe는 최대 64K개의 대기열를 지원하며, 각 대기열은 다시 최대 64K개의 명령을 담을 수 있다. 이로 인해 CPU의 다중 코어가 각각 독립적인 대기열를 통해 저장 장치에 명령을 전달할 수 있어, 대기 시간이 줄어들고 입출력 성능이 크게 향상된다. 또한 PCI 익스프레스의 메모리 주소 공간에 직접 매핑되는 방식으로 동작하여, 데이터 전송 시 불필요한 복사 과정을 제거한다.
이 규격은 주로 M.2나 U.2와 같은 폼 팩터를 가진 SSD에 적용된다. M.2 슬롯의 PCI 익스프레스 레인을 통해 연결된 NVMe SSD는 SATA SSD보다 수 배 빠른 순차 읽기/쓰기 속도를 보여준다. NVMe의 등장으로 데이터 센터의 서버와 고성능 개인용 컴퓨터의 저장 시스템 성능이 혁신적으로 개선되었으며, 인공지능 및 빅데이터 처리와 같은 고부하 작업에 필수적인 기술로 자리 잡았다.
6.2. Resizable BAR
6.2. Resizable BAR
Resizable BAR는 PCI 익스프레스 버스의 주소 공간을 효율적으로 활용하기 위한 고급 기능이다. 이 기술은 CPU가 그래픽 처리 장치의 전체 비디오 메모리에 한 번에 접근할 수 있도록 허용한다. 기존 방식에서는 CPU가 GPU의 프레임 버퍼에 접근할 때 256MB 단위의 작은 블록으로만 데이터를 요청할 수 있었다. Resizable BAR는 이러한 제한을 해제하여 대용량 데이터를 한 번에 전송할 수 있게 함으로써, 특정 게임 및 애플리케이션에서 시스템의 전반적인 성능과 응답성을 개선할 수 있다.
이 기능은 PCI 익스프레스 표준의 베이스 주소 레지스터 확장 메커니즘을 기반으로 한다. 마더보드의 UEFI 바이오스, CPU, 그래픽 카드의 펌웨어가 모두 이 기능을 지원해야 정상적으로 활성화될 수 있다. 활성화되면 CPU는 GPU의 전체 VRAM을 단일 연속된 메모리 공간으로 인식하게 되어, 필요한 텍스처나 지오메트리 데이터를 더 효율적으로 가져올 수 있다.
성능 향상은 워크로드에 따라 다르며, 모든 게임이나 소프트웨어에서 균일한 이점을 보장하지는 않는다. 대용량의 고해상도 텍스처를 자주 로드하는 오픈 월드 게임 등에서 더 두드러진 성능 향상을 기대할 수 있다. 엔비디아는 이 기술을 "Resizable BAR"로, AMD는 "스마트 액세스 메모리"로 명명하여 각자 자사의 플랫폼과 GPU에 도입했다.
7. 여담
7. 여담
PCI 익스프레스는 2003년에 도입된 이후, 기존의 PCI와 AGP를 성공적으로 대체하며 현대 컴퓨터 시스템의 핵심 확장 버스 표준으로 자리 잡았다. 이 표준은 그래픽 카드와 SSD를 비롯한 다양한 고성능 주변 장치의 성능 향상을 가능하게 한 기반 기술이다. 표준을 관리하는 컨소시엄인 PCI-SIG는 지속적인 규격 발전을 통해 기술의 진화를 주도해 왔다.
PCI 익스프레스의 명칭은 흔히 'PCIe'라는 약자로 더 많이 불리며, 공식 문서나 마케팅 자료에서도 이 약칭이 널리 사용된다. 초기에는 '3GIO'라는 코드명으로도 알려졌다. 이 기술의 가장 큰 특징은 레인(Lane)이라는 개념을 도입하여 유연한 대역폭 구성을 가능하게 했다는 점이다. 사용자는 필요에 따라 x1, x4, x8, x16 등 다양한 레인 수의 슬롯과 장치를 조합하여 사용할 수 있다.
컴퓨팅 역사에서 PCI 익스프레스의 등장은 병렬 버스에서 직렬 버스로의 패러다임 전환을 상징하는 중요한 사건으로 평가된다. 높은 데이터 전송률과 향상된 확장성을 바탕으로, 고성능 컴퓨팅과 데이터 센터, 그리고 일반 개인용 컴퓨터에 이르기까지 광범위한 분야에서 기술 발전의 토대를 제공했다. 특히 인텔과 AMD의 최신 CPU 및 칩셋은 PCI 익스프레스 규격을 시스템 아키텍처의 중심에 두고 설계된다.
