퀘이사존 라데온 RX 6800 XT/RX 6800 벤치마크 2015년, R9 Fury X 이후 5년 만에 하이엔드 그래픽카드 경쟁
안녕하세요. QM벤치입니다.
컴퓨터 부품 중에서도 업그레이드로 인한 체감 성능 향상이 가장 드라마틱한 건 무엇일까요? 각자 기준에 따라 조금씩 이견이 있을 수는 있겠으나, 저는 고민의 여지없이 그래픽카드를 꼽고 싶습니다. 특히 일반 사용자 기준에서는 고성능 컴퓨팅 파워가 가장 크게 요구되는 분야가 바로 PC 게이밍인데요. 현대의 3D 게임은 연산 알고리즘 특성상 그래픽카드에 달린 두뇌 GPU에 전적으로 의존하고 있으며, GPU는 병렬 연산에 특화된 장치로 소위 때려 박으면 박는 대로 성능도 향상되는 특성이 있습니다. 제조공정과 아키텍처 효율 개선에 힘입어 그래픽카드 세대가 바뀌면 꾸준히 성능 향상을 기대할 수 있게 되는 것이죠.
그리고 GPU 제조사는 여러분들이 잘 아시다시피 지포스와 라데온 즉 엔비디아와 AMD가 양대산맥으로 군림하고 있습니다. 그러나 이름만 양대산맥일 뿐, 최근 AMD 라데온 그래픽카드는 최상위 GPU 세그먼트, 플래그십/하이엔드 등급에서 엔비디아 지포스에 견줄 만한 제품을 내놓지 못하고 있습니다. 정확히 말하면 2015년 GTX 980 Ti 성능에 도전했던 R9 Fury X 출시 이후 지포스 빅칩 GPU 성능에 버금가는 제품을 만들지 못했죠. 따라서 최강의 게이밍 성능을 추구하는 유저 입장에서 선택지는 지포스, 단 하나였습니다. 비교 대상이 없었으니까요. GTX 1080 Ti 이후 출시된 RX Vega 64는 Ti가 아닌 GTX 1080에 비교되는 성능이었고, GCN 아키텍처 끝판왕 라데온 VII은 AMD 스스로도 RTX 2080 Ti가 아닌 RTX 2080과 비교했습니다. 후에 등장한 RDNA 아키텍처 나비(Navi) GPU 그래픽카드, RX 5700 시리즈는 태생부터 하이엔드가 아닌 퍼포먼스급 그래픽카드였고요. 사실상 엔비디아는 2016년 파스칼(Pascal) 아키텍처 이후 홀로 플래그십/하이엔드 유저들의 선택을 받아왔습니다.
이렇게 경쟁조차 되지 않는 상황에서 엔비디아는 튜링(Turing) 아키텍처 기반 지포스 20 시리즈를 지나 암페어(Ampere) 아키텍처 기반 지포스 30 시리즈까지 내놓게 됩니다. 특히나 RTX 3080은 빅칩 GPU 태생으로 전 세대 대비 높은 성능 향상에 예상보다 낮은 MSRP로 폭발적인 인기를 기록하게 되었고요. 이런 상황에서 소문만 무성했던 일명 빅나비(Big Navi, 거대한 빅칩 나비 GPU를 탑재한 그래픽카드)에 대한 유저들의 기대치는 결코 높지 않았습니다. RTX 3080은 커녕 RTX 2080 Ti를 능가하기만 해도 다행이라는 견해가 있었으니까요. 오랫동안 지포스와 경쟁 상대가 되지 못했기에 이런 분위기는 어쩌면 당연한 것처럼 받아들여졌습니다. 저 역시 RTX 3080과 성능으로 경쟁할 수 있을 거라는 생각은 전혀 하지 않았으니까요.
그러나,
10월 29일 새벽 1시(한국 시간 기준), AMD CEO 리사 수가 발표한 빅나비 GPU, 라데온 RX 6900 XT/RX 6800 XT/RX 6800의 성능은 너무나 놀라웠습니다. 세간의 예상을 깨고 풀칩 구성도 아닌 RX 6800 XT가 RTX 3080을 저격하고, 풀칩으로 구성된 RX 6900 XT는 $1,499에 달하는 RTX 3090을 저격했습니다. 실로 놀라운 내용이었죠. 그리고 AMD는 여기서 멈추지 않았습니다. RX 6000 시리즈를 라이젠 5000 시리즈 CPU와 조합하면 스마트 액세스 메모리(Smart Access Memory) 기술을 활성화하여 게이밍 성능이 향상(일명: 세트 효과)되는, 플랫폼 차원의 자신감 있는 포부도 밝혔습니다. 뒤이어 AMD 공식 홈페이지에는 경쟁사 RTX 3090/RTX 3080을 노골적으로 비교하여 테스트 한 10종 게임 성능 벤치마크 자료도 공개하였고요. 이전과는 완전히 다른 공격적인 마케팅이었고, 그 여파는 대단했습니다. 물론 여전히 드라이버에 대한 악평과 호평이 따라다니는 상황이고 엔비디아가 구축해놓은 RTX 생태계가 무시할 수 없는 수준이기 때문에 한 번에 모든 것이 바뀌는 지각변동까지는 아니었지만, 그동안의 라데온 상황이 너무나 처참했기에 이는 엄청난 반전이었습니다. 그리고 AMD 발표를 지켜보던 많은 분들이 놀라움을 표시하기도 했고요.
그리고 드디어 오늘이 왔습니다. 바로 빅나비 성능 엠바고(Embargo)가 해제되는 날 말이죠. AMD가 발표한 3종 그래픽카드 중 RX 6800 XT/RX 6800이 주인공이며, 퀘이사존은 엔비디아 지포스 RTX 3080과의 정확한 성능 비교를 위해 무려 25종 게임을 동원하여 대규모 벤치마크를 진행했습니다.
▲ RX 6800 시리즈 및 주요 그래픽카드 상세 스펙
RX 6800 XT/RX 6800 상세 스펙입니다. 공통적인 요소라면 빅나비라 불렸던 Navi 21 GPU를 탑재하고 있으며, 동일한 메모리 사양을 갖추고 있다는 점입니다. 비록 GDDR6X가 아닌 GDDR6를 탑재함으로써 메모리 대역폭 수치 자체는 낮으나. AMD는 인피니티 캐시 기술을 통해 실질적 메모리 대역폭을 크게 향상시켰다고 말합니다.
또한 작동 클록이 크게 높아져 2 GHz를 훌쩍 상회하는 작동 주파수를 보이며, RX 6800 XT는 RTX 3080보다 낮은 300W TBP를, RX 6800은 250W TBP로 작동합니다.
▲ RX 6800 시리즈 GPU는 RDNA 2 아키텍처를 가진다
RX 6800 시리즈는 RX 5000 시리즈의 RDNA 1 아키텍처를 개선한 RDNA 2 아키텍처가 적용되어, 개선된 클록 주파수 및 DX12 Ultimate API에 최적화된 특성을 가지고 있습니다. 실시간 레이트레이싱 게이밍을 위해 각 CU에는 RA(Ray Accelerator)도 갖추고 있죠. 이제 라데온에서도 레이트레이싱 옵션을 적용할 수 있습니다. 물론, 아직까지 많은 게임에서 지원한다고는 볼 수 없지만, 콘솔 게임기 PS5와 Xbox Series X도 레이트레이싱 지원을 표방한 만큼 앞으로 레이트레이싱 적용 게임은 점차 많아질 것으로 전망합니다.
▲ 퀘이사존 라데온 RX 6800 XT/RX 6800 벤치마크 시스템 사양
퀘이사존 그래픽카드 벤치마크 시스템은 빅나비 RX 6800 시리즈를 기점으로 AMD 라이젠 플랫폼을 사용합니다. 라이젠 5000 시리즈 프로세서 출시로 인해, 최강 게이밍 플랫폼은 이제 인텔이 아닌 AMD가 되었기 때문이죠. 물론, 오버클러킹까지 고려한다면 잠재력을 감안했을 때 여전히 인텔이 강력하지만, PCIe 4.0 인터페이스를 지원하지 않아 AMD 라이젠 플랫폼이 더 적절하다고 판단하였습니다.
그래픽카드 드라이버는 리뷰어 대상으로 배포된 버전을 사용하였으며, 특이사항으로 전체 플랫폼이 완전히 바뀌었기 때문에 기존 벤치마크 데이터와 수치를 비교하는 것은 적절하지 않습니다. 또한, 호라이즌 제로 던은 1.07 업데이트로 인해 이제 비등방성 필터링 옵션이 정상 작동합니다. 따라서 전반적인 성능이 낮아졌다는 것을 알려드립니다.
▲ 대원 CTS 제공: AMD 라이젠 7 5800X(8C/16T) ※ 벤치마크(링크)
CPU는 AMD 라이젠 7 5800X로 선정하였습니다. 인텔 코어 i9-10900K보다 높은 게이밍 성능(노오버 기준)을 보장하는 것은 물론, 라이젠 5000 시리즈 중에서도 상급 게이밍 성능을 가지고 있습니다. 참고로 라이젠 5000 시리즈는 부스트 클록 알고리즘 개선과 함께 실제 게이밍 구동 시 적용되는 클록이 상당히 높아져, 게이밍 성능 향상 목적으로는 오버클록 효용성이 극히 낮습니다. 그러나 벤치마크에서는 유동적으로 변하는 CPU 클록 주파수 변인을 최소화하기 위해 올코어 4.7 GHz OC 설정으로 고정하여 테스트를 진행했습니다.
▲ 대원 CTS 제공: ASUS TUF Gaming X570 PRO (Wi-Fi)
X570 칩세트 기반, ASUS TUF Gaming X570 PRO (Wi-Fi) 모델입니다. 3800 MHz 메모리 오버클록 및 IF 1:1 동기화도 문제가 없었으며, 전원부 온도 또한 나쁘지 않은 녀석입니다. 특히 AMD가 발표한 스마트 액세스 메모리(Smart Access Memory) 활성화를 위해서는 500 시리즈 마더보드가 필수이기도 하죠. 동일한 모델은 아니지만 ASUS TUF Gaming X570 PLUS (Wi-Fi) 제품은 QM센스가 칼럼을 진행하였으며, 좋은 평가를 받기도 하였습니다.(링크)
▲ 서린씨앤아이 제공: G.SKILL TRIDENT Z ROYAL DDR4-3,200 CL14 16GB x2(기사 링크)
일명 보석 메모리로 통하는 지스킬 트라이던트 Z 로열 시리즈. 이제는 모르는 분들을 찾기 힘들 정도로 유명한 제품입니다. 최초 해당 제품이 등장했을 때는 특유의 고급스러운 디자인에 녹아든 화려한 보석 RGB LED가 충격적이기까지 했죠. QM슈아의 가장 최신 트라이던트 Z 로열 칼럼을 통해 성능과 외형의 진면목을 확인해 보실 수 있습니다. 벤치마크에 사용된 모델은 3200 MHz CL14 모델이었으나 3800 MHz CL16까지 무리 없는 설정이 가능하였습니다. 현재 라이젠 5000 시리즈는 일부 2 슬롯 기반 마더보드를 제외하면 3800 MHz(IF: 1900 MHz)가 한계치 설정으로 파악됩니다.
▲ 서린씨앤아이 제공: PATRIOT VIPER VPN100 M.2 NVMe 2TB(기사 링크)
벤치마크 시스템은 수십 종 게임을 한꺼번에 테스트해야 하기 때문에, 고용량 SSD는 필수입니다. 특히 최신 게임은 100 GB를 넘어 200 GB를 초과하는 용량을 보이는 경우도 있고요. 그래서 준비한 SSD가 바로 PATRIOT 바이퍼 게이밍(VIPER GAMING) 저장장치, VPN100 NVMe 2TB 모델입니다. 용량도 용량이지만, 알루미늄 방열판을 기본 장착하고 있다는 점에서 발열로 인한 스로틀링 걱정을 한시름 놓게 됩니다. 또한, 해당 제품은 QM달려가 냉철한 시각으로 분석한 칼럼도 등록되었으니 참고해 주시기 바랍니다.
▲ 마이크로닉스 제공: 마이크로닉스 Classic II 850W 80PLUS GOLD 230V EU 풀모듈러(750W 기사 링크)
최신 하이엔드 그래픽카드 소비전력은 과거 250W 수준에서 벗어나 높게는 350W 수준을 보이고 있습니다.(일부 RTX 3090 비레퍼런스 모델은 전력 제한 해제 시 약 500W 에 달함) 따라서 고용량 파워서플라이는 필수라 할 수 있겠죠. 특히 AMD가 발표한 풀칩 빅나비 GPU를 탑재한 RX 6900 XT는 파워서플라이 권장 출력을 850W로 표기하기도 했습니다. 물론 그 이하 출력을 가진 파워에서도 충분히 구동은 가능하나, 파워에 가해지는 로드율이나 그로 인한 효율과 팬소음까지 고려하면 권장 출력 이상의 파워를 사용하는 것이 쾌적합니다. 벤치마크 시스템에 사용된 마이크로닉스 클래식 II 제품은 준수한 골드 등급 효율에 팬리스 모드 온/오프 스위치 제공, 풀모듈러 구성, 우수한 전압 유동폭 등 여러모로 테스트 시스템에 적합한 요건을 갖춰 선정하였습니다.
▲ AMD 라이젠 5000 시리즈 + AMD 500 시리즈 마더보드 + AMD 라데온 RX 6000 시리즈 = 세트효과 발동
▲ SAM 기술 활성화로 데이터 채널을 확장! VRAM에 접근하기까지 병목 현상을 완화하여 성능을 높이자!
스마트 액세스 메모리(Smart Access Memory, 이하 SAM) 기술은 플랫폼 차원에서 메모리 액세스 효율을 개선하는 기술입니다. 일반적으로 기존 시스템에서의 CPU 프로세서는 GPU VRAM에 접근하는 과정에서 256 MB로 제한되어 데이터 전송 효율이 좋지 않아, 최종 성능(=FPS)에도 마이너스 요소가 될 수 있습니다. 그러나 SAM을 사용하면, PCIe 인터페이스 대역폭을 통해 데이터 채널을 확장하여 VRAM 접근 효율성을 개선할 수 있습니다. AMD 설명에 따르면 프로세서에서 VRAM에 이르기까지의 효율성이 대폭 향상되어 병목 현상을 완화하고, 이를 통해 성능 향상에도 기여한다고 합니다.
▲ SAM 비활성화 상태(ASUS TUF Gaming X570 PRO)
▲ SAM 활성화 상태(ASUS TUF Gaming X570 PRO)
SAM을 활성화하는 방법은 비교적 간단합니다. 500 시리즈 마더보드에서 최신 UEFI 메뉴를 통해 조절할 수 있습니다. ASUS 마더보드를 예로 들면, Advanced 탭의 PCI Subsystem Settings 카테고리로 이동하면 Above 4G Decoding 항목이 존재합니다. 기본값은 'Disabled'이나 'Enabled'로 변경하면, Re-Size BAR Support 항목이 나타나고 이것 역시 'Enabled'로 변경해주면 됩니다. 이걸로 끝이고요. SAM 기술의 근본은 PCI Express 기능 중 하나인 Base Address Register(BAR) 기능을 활용하여 GPU 메모리 매핑을 조절하는 것입니다. SAM을 활성화하기 위한 조건은 아래와 같습니다.
하드웨어 ■ AMD 라이젠 5000 시리즈 프로세서 ■ AMD 라데온 RX 6000 시리즈 그래픽카드 ■ AMD 500 시리즈 마더보드
소프트웨어 ■ 64-bit 운영체제 ■ AMD가 제공한 SAM 지원 UEFI(AGESA 1.1.0.0. 이후) ■ AMD 라데온 소프트웨어 드라이버 20.11.2 혹은 이후 버전 ■ UEFI 'Above 4G Decoding' 옵션 활성화
▲ RX 6800 XT/RX 6800 벤치마크에 동원된 게임 목록
RX 6800 시리즈 벤치마크는 3D 게임 성능을 다방면으로 알아보기 위해 게임 타이틀 역시 수십 종으로 구성하였습니다. 소위 '깡성능'을 측정하기 위해 25종 게임을, 레이트레이싱(Raytracing) 지원 게임 성능 측정을 위해 5종 게임을 마련하였습니다. 깡성능 테스트를 위한 게임들은 그래픽카드 성능 벤치마크로 상징성이 높은 게임 타이틀, 게이머들에게 인기가 높은 게임, GPU 최적화가 좋은 게임 등 다양한 기준을 통해 선정한 결과입니다. 덕분에 게임 렌더링 API 종류도 다양성을 띠게 되었습니다. 기본적으로 3종 해상도(FHD/QHD/UHD) 조건에서 테스트를 진행하며, 레이트레이싱 게임 성능은 기술 구현에 따른 성능 변화 파악에 우선순위를 두어 QHD 해상도 한정으로 테스트를 진행하였습니다.
※ 아래 내용부터는 벤치마크 테스트 결과로 이어집니다. 항목별 구체적인 테스트 결괏값은 세부 페이지에서 확인해 주세요.
타임스파이 점수입니다. 이제는 DX11 API 기반으로 작동하는 파이어스트라이크보다 최신 게임에서의 그래픽카드별 성능을 더 잘 반영해줍니다. RX 6800 XT는 RTX 3080에 매우 근접하는 점수를 기록하였고, RX 6800은 RTX 3070/RTX 2080 Ti를 뛰어넘는 점수를 보여줍니다.
타스 기본 설정 외에도 DX12 API + 4K/UHD 해상도 성능을 측정하는 타임스파이 익스트림을 테스트에 포함하였습니다. 익스트림 옵션에서 RX 6800 XT는 RTX 3080과의 성능 격차가 조금 더 벌어지는 양상을 보여주었습니다. 4K 해상도에서 상대 성능이 약화될 수 있는 특징을 예상해볼 수 있습니다.
반면 RX 6800 시리즈의 파이어스트라이크 점수는 실로 대단합니다. 특히 RX 6800 XT는 무려 5만 1천 점을 초과하며, RTX 3090보다도 높은 점수를 기록했습니다. 하지만 파이어스트라이크 점수만 보고 게임 성능에 대한 우위를 논할 수 없습니다. 파스 점수 대비 낮은 게이밍 성능은 과거 RX 5700 XT도 동일한 특성을 가지고 있었으니까요. 여담으로 3DMark에서는 SAM 활성화로 인한 성능 향상이 없었습니다.
마이크로소프트 DirectX Raytracing, 줄여서 DXR입니다. DXR은 DX12 API 확장 기능으로써 실시간 레이트레이싱 연산을 위한 윈도우 10 표준이기도 합니다. 포트로열(Port Royal)은 DXR API로 레이트레이싱을 구현하며, 레이트레이싱 기술이 포함된 게임 성능을 대변합니다. 그동안 AMD 라데온 그래픽카드는 레이트레이싱을 지원하지 않아 측정 자체가 불가능하였으나, RX 6800 시리즈는 RDNA 2 아키텍처를 차용함으로써 AMD 라데온 그래픽카드 최초로 ‘DXR API에서 실시간 레이트레이싱 게이밍’이 가능합니다.
그리고 그 결과는 역시나 지포스에는 미치지 못하는 성능이었습니다. RX 6800 XT는 RTX 3080보다 RTX 3070에 가까운 성능이었으며, RX 6800은 RTX 3070에 미치지 못합니다.
다음은 순수 실시간 레이트레이싱 연산 능력 위주로 성능을 측정하는 DirectX Raytracing feature test입니다. 포트로열과 다른 점이라면, 포트로열은 레이트레이싱 옵션이 적용된 종합 게이밍 성능을 대변한다면, 본 테스트는 오직 실시간 레이트레이싱 연산에 집중했다는 것입니다. 따라서 아키텍처에 따라 성능 격차가 매우 선명하게 드러납니다. 결론만 말하면 빅나비는 튜링 기반 지포스에도 미치지 못하는 레이트레이싱 성능을 갖고 있습니다.
게이밍 최적화 방법의 일환으로 대두되고 있는 VRS(Variable Rate Shading) 테스트입니다. 쉽게 말하면 화면을 구성하고 있는 오브젝트 특성에 맞춰 특정 오브젝트나 영역에 대해 셰이딩 비율을 다르게 하여 성능을 향상시키는 기술입니다. PC 게이밍 분야에서는 엔비디아가 튜링 아키텍처를 발표하면서 게이머들에게 알려졌으며, DX12 Ultimate API와 함께 앞으로 더 많은 게임들에서 지원을 기대할 수 있습니다.
RX 6800 XT는 VRS 적용 시 RTX 3080에 비해 절대 성능은 낮지만, VRS로 인한 성능 향상 비율은 더 높게 나타났습니다. 이와 같은 특징은 RX 6800에도 동일하게 적용됩니다.
해당 그래프는 각 게임에서 RTX 3080 FE 성능(평균 FPS)을 100% 두었을 때, 나머지 그래픽카드 상대 성능을 계산하고 이를 25종 게임 전체로 확장하여 평균값을 도출한 그래프입니다. 레이트레이싱 적용 성능을 제외했기 속된 말로 '깡성능'입니다. 결과를 보면 RX 6800 XT는 FHD/QHD 해상도에서 RTX 3080과 동급 성능이며, 4K 해상도에서는 소폭 낮은 성능을 기록하였습니다. 또한, 평균 수치이기 때문에 SAM 적용으로 인한 성능 향상이 다소 아쉽게 느껴질 수 있는데, 이는 아래 별도 섹션에서 설명하도록 하겠습니다. RX 6800은 3종 해상도 전체에서 RTX 3070/RTX 2080 Ti를 확실히 앞서는 성능을 기록하였습니다. RTX 3070보다 높은 가격으로 출시되는 만큼, 당연히 해내야 할 성능 수준이기도 합니다.
다음은 실시간 레이트레이싱 게이밍 성능입니다. 테스트 게임 종류가 5종에 그치기 때문에 평균치에 대한 데이터 신뢰성은 상대적으로 떨어집니다. 물론, 그럼에도 불구하고 참고 가치는 있습니다. RX 6800 시리즈는 3DMark Port Royal과 DirectX Raytracing feature test에서 보여준 바와 같이 지포스 대비 상당히 낮은 레이트레이싱 연산 능력이 상당히 낮습니다. 결국 깡성능 부문에서 RTX 3080과 비교되던 RX 6800 XT는 RTX 3070보다도 소폭 낮은 성능을 기록하여, 향후 출시될 레이트레이싱 지원 게임에서도 RTX 3080 대비 경쟁력이 떨어질 것으로 예상합니다.
개인적으로도 매우 궁금했던 플랫폼별 게임 성능 비교입니다. 비록 CPU 노오버 상황에서 라이젠 5000 시리즈 CPU가 최강 자리를 차지했다고는 하나, 인텔 CPU에게는 오버클록 잠재력이라는 무기가 있기 때문이죠. 그리고 역시 무시할 수 없는 여전히 강력한 성능을 보여주었습니다.
※ 참고: 각 게임별 구체적인 데이터는 29 페이지에서 확인하실 수 있습니다.
FHD 해상도에서는 사실 i9-10850K OC 5.0 GHz 환경이나 R7 5800X OC 4.7 GHz 환경이나 대동소이합니다. 차이도 극히 미미한 수준이죠. 게다가 일명 ‘라라랜드’로 불리는 라이젠 CPU + 라데온 6000 시리즈 조합에서 활성화할 수 있는 SAM 기능 적용 시, 가장 우세한 게이밍 플랫폼으로 거듭나게 됩니다. 그리고 이러한 특징은 큰 변화 없이 QHD 해상도까지 이어집니다. 어차피 AMD 플랫폼 사용자라면 SAM 기능을 굳이 비활성화할 이유가 없기 때문에, 주황색 그래프 성능을 그대로 AMD 플랫폼 성능으로 봐도 무리 없습니다.
그러나 4K로 오면, 상황이 달라집니다. RX 6800 XT 자체가 4K 해상도에서의 성능 하락이 상대적으로 더 크기 때문에 상위 성능은 모두 RTX 3080이 차지하게 됩니다. 즉 RX 6800 XT는 SAM을 활성화하더라도 RTX 3080 성능에 미치지 못합니다.
▲ RX 6800 XT 오버클러킹 설정 - AMD 라데온 소프트웨어
▲ RX 6800 오버클러킹 설정 - AMD 라데온 소프트웨어
오버클록 잠재력도 확인해 보았습니다. 둘 다 최대 클록 주파수 2.5 GHz 이상을 달성하여 가시적으로는 대단하게 느껴졌으나, 아쉽게도 이러한 수치적 향상이 실질적인 부스트 클록 향상에 그대로 이어지지는 않습니다. 전력 제한 레벨의 경우 +15%까지 상향 조절이 가능합니다.
|