GeForce RTX 3080, análisis: la consagración del trazado de rayos
NVIDIA presentó la GeForce RTX 3080 el pasado 1 de septiembre. Las expectativas estaban muy altas, y hoy, tras analizar a fondo dicha tarjeta gráfica, podemos decir que la compañía que dirige Jen-Hsun Huang no se limitó a cumplirlas, sino que ha logrado superarlas.
Como recordarán nuestros lectores habituales, en los rumores más recientes que habíamos visto antes de la presentación de la GeForce RTX 3080 hablábamos de un conteo total de 4.352 shaders, y comentábamos la posibilidad de que NVIDIA doblase los motores de trazado de rayos, algo que, al final, no se ha cumplido, pero al contrario de lo que cabría pensar esto ha sido positivo.
La GeForce RTX 3080 utiliza una nueva arquitectura, Ampere, y esta adopta una configuración a nivel de SM (Streaming Multiprocessor) distinta a la que hemos visto en Turing. En líneas generales, la arquitectura Ampere representa un importante salto generacional, no solo por los avances que ha conseguido en términos de potencia bruta, sino también por las tecnologías avanzadas que integra, y porque representa la consagración del renderizado híbrido.
Gracias a NVIDIA he tenido la oportunidad de analizar una muestra de la GeForce RTX 3080 Founders Edition, una tarjeta gráfica que posiciona en la gama alta y que, curiosamente, llega a un precio inferior comparado con el que tuvo la RTX 2080 Founders Edition. La GeForce RTX 3080 Founders Edition cuesta 719 euros, y la RTX 2080 Founders Edition llegó al mercado con un precio de 849 euros.
Los números no mienten, la GeForce RTX 3080 Founders Edition es 130 euros más barata que la RTX 2080 Founders Edition, y según NVIDIA llega a doblar el rendimiento de aquella. Si esto se cumple, el valor calidad-precio de la GeForce RTX 3080 Founders Edition será verdaderamente rompedor, pero ahí está la cuestión, ¿se cumple? Seguid leyendo, que vamos a descubrirlo, pero antes vamos a repasar el diseño de la tarjeta gráfica y las claves de su arquitectura.
GeForce RTX 3080: primer vistazo
La GeForce RTX 3080 Founders Edition estrena un nuevo diseño y un sistema de refrigeración que adopta un concepto muy interesante. Como podemos ver en las imágenes, NVIDIA ha apostado por una terminación minimalista con elementos que contrastan de una manera bastante intensa (partes lisas con la textura «rayada» que muestra el radiador, y líneas angulosas con bordes redondeados). Por otro lado, el juego de colores en tonos negros y esa especie de gris achampanado, unido a la iluminación LED en blanco, rematan uno de los mejores diseños que he visto hasta la fecha en el sector gráfico. No tengo dudas, si quisiera comprarme una GeForce RTX 3080 me iría a por el diseño Founders Edition.
En la parte central nos encontramos con el nuevo conector de alimentación de 12 pines, y en la parte posterior tenemos un total de cuatro conectores: tres DisplayPort 1.4a y un HDMI 2.1. Para montar la tarjeta gráfica necesitamos dos ranuras de expansión, y como habréis podido imaginar el proceso no tiene mayor misterio. Si no tenéis claro cómo cambiar una tarjeta gráfica no os preocupéis, en este artículo encontraréis toda la información que necesitáis.
Como hemos dicho, la GeForce RTX 3080 utiliza el nuevo conector de alimentación de 12 pines, capaz de suministrar una potencia de hasta 600 vatios. Las fuentes de alimentación actuales carecen de dicho tipo de conector, así que NVIDIA incluye un adaptador de 12 pines que utiliza dos cables de alimentación adicional de 8 pines para resolver el problema. Es muy fácil de conectar y de utilizar, aunque abulta bastante y afea un poco la estética del PC.
La arquitectura Ampere marca un salto importante en términos de potencia, como hemos comentado, y esto se deja notar en el consumo y en el TDP de la GeForce RTX 3080. NVIDIA ha dado el salto al proceso de fabricación de 8 nm de Samsung, un avance notable frente al proceso de 12 nm que utilizó en Turing. Sin este avance en el proceso de fabricación no habría sido posible mantener unos valores de eficiencia razonables, y una relación de rendimiento por vatio superior a la RTX 2080.
Para compensar el aumento del TDP, que en la GeForce RTX 3080 sube hasta los 320 vatios, NVIDIA ha rediseñado por completo el PCB de los modelos Founders Edition, adoptando un formato irregular, y sobre él ha montado un sistema de refrigeración que utiliza un enorme radiador que hace contacto con todos los componentes fundamentales de la tarjeta gráfica, sobre el que se asientan dos ventiladores en extremos y lados opuestos.
En la imagen que os dejamos podéis ver cómo trabajan ambos ventiladores: el inferior toma aire frío de la parte baja y lo expulsa por la parte posterior de la tarjeta, mientras que el ventilador superior toma aire frío de una parte más cercana a los ventiladores frontales, y el aire caliente sale por arriba ayudado por el ventilador trasero de nuestro chasis.
Según NVIDIA, ese nuevo sistema de refrigeración mejora en gran medida el flujo de aire, y logra mantener bajo control las temperaturas de la GeForce RTX 3080. Debemos tener en cuenta que hay una diferencia importante en términos de TDP entre esta y la RTX 2080 (320 vatios frente a 215 vatios), así que no podemos hacer una comparativa directa de temperatura entre ambas. En cualquier caso, lo importante será valorar si realmente este nuevo sistema de refrigeración puede mantener temperaturas aceptables (menos de 80 grados).
GeForce RTX 3080: arquitectura y especificaciones
La base de la GeForce RTX 3080 es, como dijimos, la arquitectura Ampere. Dicha arquitectura utiliza el proceso de fabricación de 8 nm de Samsung, y mantiene la base de renderizado híbrido que vimos en Turing. Esto quiere decir que en la GPU GA102 de la GeForce RTX 3080 nos encontramos con tres grandes bloques de núcleos:
- Shaders: también conocidos en el sector profesional como núcleos CUDA, que se ocupan de las tareas de sombreado.
- Núcleos RT: aceleran la carga de trabajo asociada al trazado de rayos (cálculo de intersecciones de rayos).
- Núcleos tensor: aceleran la carga de trabajo asociada a la inteligencia artificial (algoritmos y DLSS 2.0).
A esos tres elementos debemos sumar, obviamente, las unidades de texturizado y las unidades de rasterizado.
NVIDIA ha optado por una marcada especialización de funciones en cada uno de esos bloques de núcleos que dan forma a la GPU GA102. La presencia de núcleos tensor y de núcleos RT permite liberar al resto de los componentes de la GPU de la enorme carga que representa trabajar con trazado de rayos y con tareas de inteligencia artificial en tiempo real.
Es un enfoque muy acertado, facilita una transición relativamente sencilla y «económica» a una arquitectura especializada sin tener que cambiar por completo las bases de una GPU. Ya lo he dicho en otras ocasiones y lo repito, esta arquitectura de renderizado híbrido ha sido, sin duda, el mayor salto a nivel GPU que hemos vivido desde que se produjo la transición de las unidades vertex y pixel shader a los shaders unificados, algo que, os recuerdo, tuvo lugar con la llegada de las GeForce 8000 de NVIDIA.
Como hemos dicho, la arquitectura Ampere mantiene esa idea de renderizado híbrido, pero dobla los motores de sombreado. NVIDIA ha logrado esto duplicando la cantidad de shaders por unidad SM. En Turing, una unidad SM tiene 64 shaders, y en Ampere esa cifra se eleva a 128 shaders. La cantidad de unidades de texturizado y de rasterizado se mantiene, y lo mismo ocurre con los núcleos RT, pero no con los núcleos tensor, que concurren en proporción de uno y cuatro, respectivamente, por cada SM.
Cada unidad SM Ampere suma cuatro bloques de procesamiento que comparten memoria caché L1, programador warp y un total de 128 shaders. De esos 128 shaders, la mitad pueden trabajar con operaciones FP32 e INT32 de forma concurrente, y la otra mitad trabajan se limitan a FP32. La unidad SM suma, como dijimos cuatro núcleos tensor de tercera generación y un núcleo RT de segunda generación.
Si miramos a los núcleos FP64 nos encontramos con un rendimiento 1/64, una cifra muy baja pero comprensible, ya que las operaciones de precisión doble son algo propio del sector profesional, y no tienen sentido en el mercado de consumo general.
Hemos dicho que las GeForce RTX 30 no doblan la cantidad de núcleos RT, pero obviamente esto no quiere decir que no se hayan introducido mejoras. NVIDIA ha aprovechado el desarrollo de Ampere para dar forma a núcleos RT de segunda generación que son capaces de ofrecer hasta un 70% más de rendimiento que los núcleos RT de primera generación presentes en Turing.
Ampere mantiene la división de la carga de trabajo de los núcleos RT de segunda generación en las clásicas pruebas de intersecciones transversales BVH, las intersecciones rayo-triángulo y a las intersecciones de delimitadoras de cuadro, pero añade, además, un nuevo elemento que permite interpolar la posición del triángulo en el tiempo, lo que hace que sea posible generar trazado de rayos con desenfoque de movimiento manteniendo una elevada precisión y, por tanto, una alta calidad gráfica.
Los núcleos tensor también han evolucionado. Se adopta una división de cuatro núcleos tensor por cada unidad SM, pero el salto en materia de rendimiento es muy grande. Los núcleos tensor de tercera generación (Volta = primera generación, Turing = segunda generación) que utiliza Ampere eleva el rendimiento de los 89 tensor TFLOPs que vimos en Turing hasta los 238 tensor TFLOPs.
Estos núcleos se utilizan para acelerar cargas de trabajo asociadas a inteligencia artificial. En juegos, su función principal es dar soporte a la tecnología DLSS 2.0 de NVIDIA, una técnica de reconstrucción y reescalado inteligente de la imagen que, como sabrán nuestros lectores habituales, es capaz de crear una imagen de alta calidad utilizando solo la mitad de píxeles de la resolución objetivo.
NVIDIA ha logrado un avance tan enorme con la tecnología DLSS 2.0 que dicho sistema puede crear un fotograba reescalado a 4K con una calidad de imagen superior a la que tendríamos utilizando dicha resolución de forma nativa, y en tan solo dos milisegundos. Impresionante, ¿verdad? Pero esto no es todo, NVIDIA también utiliza los núcleos tensor para otras tareas, como por ejemplo reducir el ruido en imágenes y vídeos, y en aplicaciones como NVIDIA Broadcast, que facilita la creación de fondos virtuales y el enfoque automático de la cámara.
Para maximizar el ancho de banda manteniendo unos costes controlados, NVIDIA desarrolló con Micron la memoria GDDR6X. La GeForce RTX 3080 monta un total de 10 GB de GDDR6X a 19 GHz, y tiene un bus de 320 bits, lo que nos deja un ancho de banda de 760 GB/s, una cifra que supera de largo los 448 GB/s de la RTX 2080. Ese aumento de la velocidad de la memoria hizo necesario introducir avances en el sistema de transmisión de datos y en la controladora para mantener la integridad de la señal y evitar problemas de solapamiento de datos.
Como estaba previsto, la GeForce RTX 3080 se apoya en el nuevo estándar PCIE Gen4, aunque funciona perfectamente en cualquier ranura PCIE Gen3 x16, así que no os preocupéis si vuestra placa base todavía no cuenta ese estándar de nueva generación, podréis aprovecharla sin ningún tipo de problema.
El modo turbo ha jugado un papel muy importante en las últimas generaciones de tarjetas gráficas de NVIDIA, y la GeForce RTX 3080 no es una excepción. Esta tarjeta gráfica utiliza el modo «GPU Boost 5.0», que ajusta la frecuencia de la GPU de forma dinámica en función de la temperatura y de la carga de trabajo. La GeForce RTX 3080 Founders Edition tiene una frecuencia base de 1.440 MHz, pero gracias al «GPU Boost 5.0» puede alcanzar las siguientes velocidades:
- Hasta 70 grados: 1.965 MHz.
- Hasta 75 grados: 1.950 MHz.
- Hasta 80 grados: 1.935 MHz.
- Hasta 83 grados: 1.920 MHz.
- Más de 83 grados: se reducen las frecuencias para estabilizar la temperatura.
Cuando llegamos a los 84 grados de temperatura, el modo turbo de la RTX 3080 empieza a bajar la velocidad de trabajo para proteger la integridad de la GPU y para evitar daños por exceso de calor. El sistema de refrigeración que monta la versión Founders Edition es muy efectivo, tanto que la mantiene, como veremos, siempre por debajo de los 80 grados, pero que querido compartir con vosotros los diferentes escalones del modo «GPU Boost 5.0» para que tengáis claro cómo funciona.
Por lo que respecta a la conectividad, NVIDIA ha eliminado el puerto VirtualLink, y ha montado, como adelantamos, tres conectores DisplayPort 1.4a y un HDMI 2.1. Los conectores DisplayPort 1.4a son compatibles con la tecnología de compresión VESA DSC 1.2a, lo que significa que podemos utilizar resolución 8K con una tasa de refresco de 60 Hz y HDR activado, o 4K a 240 Hz con HDR, utilizando un único cable. Si utilizamos el puerto HDMI 2.1, tendremos las mismas opciones.
En líneas generales, las características multimedia (códecs y aceleración) de Ampere son las mismas que vimos en Turing, con la particularidad de la introducción del soporte de descodificación por hardware del códec AV1, que reduce a la mitad el tamaño del archivo comparado con el códec H.265 HEVC y mantiene, sin embargo, una calidad similar. No integra soporte del estándar H.266 VVC, pero es normal, ya que su introducción se produjo de forma tardía.
No quiero terminar sin hacer una referencia a la tecnología RTX IO, ya que me parece uno de los añadidos más interesantes de la nueva arquitectura Ampere. Se trata de una tecnología que permite utilizar la GPU para acelerar la carga de trabajo derivada de la descompresión de datos provenientes del SSD, que puede llegar a liberar por completo a la CPU de dicha tarea.
La idea base de esta tecnología es similar a la que hemos visto en Xbox Series X, y cuenta con el apoyo de Microsoft. Trabaja con la API Direct Storage, presente en DirectX 12, y podría marcar un enorme punto de inflexión en la reducción de los tiempos de carga, pero tiene que ser soportada por los desarrolladores en cada juego concreto.
Antes de pasar al siguiente punto, vamos a repasar las especificaciones completas de la GeForce RTX 3080 Founders Edition de NVIDIA, y a compararlas con las especificaciones de la RTX 2080:
GeForce RTX 3080
- Núcleo gráfico GA102 en 8 nm.
- 8.704 shaders a 1.440 MHz-1.710 MHz.
- 272 unidades de texturizado.
- 96 unidades de rasterizado.
- 272 núcleos tensor.
- 68 núcleos RT.
- 29,77 TFLOPs de potencia en FP32.
- 10 GB de GDDR6X a 19 GHz.
- Bus de 320 bits.
- TDP de 320 vatios.
- Requiere un conector de 12 pines y una fuente de 700 vatios.
- Precio de lanzamiento: 719 euros.
GeForce RTX 2080
- GPU TU104 (arquitectura Turing) fabricada en proceso de 12 nm.
- 2.944 shaders a 1.515 MHz-1.710 MHz.
- 184 unidades de texturizado.
- 64 unidades de rasterizado.
- 368 núcleos ténsor.
- 46 núcleos RT.
- 10,07 TFLOPs de potencia en FP32.
- Bus de 256 bits.
- TDP de 215 vatios.
- 8 GB de memoria GDDR6 a 14 GHz efectivos.
- Requiere un conector de 8 pines y otro de 6 pines, y una fuente de 550 vatios.
- Precio de lanzamiento: 849 euros.
GeForce RTX 3080: equipo de pruebas
Para analizar la GeForce RTX 3080 hemos utilizado un PC de gama alta equipado con los siguientes componentes:
- Procesador Ryzen 9 3900X con 12 núcleos y 24 hilos a 3,8 GHz-4,4 GHz.
- 32 GB (4 x 8 GB) de RAM Corsair Dominator Platinum RGB DDR4 a 3.200 MHz (CL16).
- Placa base GIGABYTE AORUS GA-AX370-GAMING 5.
- Sistema de refrigeración Corsair iCUE H150i Elite Capellix.
- Tarjeta gráfica RTX 3080 Founders Edition con 10 GB de GDDR6X.
- SSD Samsung Evo 850 de 500 GB (sistema operativo).
- SSD PCIE NVMe Corsair Force Series MP510 de 960 GB.
- SHDD Seagate de 2 TB con 8 GB de SSD como caché.
- Windows 10 Pro de 64 bits.
- Fuente de alimentación Corsair AX1000 80 Plus Titanium con certificación 80 Plus Titanio.
Con el objetivo de mostraros unos resultados realistas, hemos montado la GeForce RTX 3080 en un chasis totalmente cerrado, es decir, hemos evitado recurrir a un banco de pruebas abierto. El PC donde la hemos montado cuenta con un total de tres ventiladores en la parte frontal, dos ventiladores en la parte superior y un ventilador en la parte trasera. Esto quiere decir que el flujo de aire es muy bueno, y que la GeForce RTX 3080 debería beneficiarse de ello.
La GeForce RTX 3080 tiene unas medidas bastante razonables, 28,5 cm x 11,2 cm, de hecho es más pequeña que la GeForce RTX 2080 Super de GIGABYTE con sistema de refrigeración Windforce 3X que utilizo en mi PC personal. En este artículo ya os ofrecimos un desglose completo de las medidas de la nueva serie RTX 30 de NVIDIA, así que si tenéis dudas os invito a echarle un vistazo.
GeForce RTX 3080: rendimiento en juegos (rasterización)
Los resultados que hemos obtenido no dejan lugar a dudas, la GeForce RTX 3080 marca un enorme salto generacional, y realmente es capaz de mover casi cualquier juego actual en 4K y calidad máxima con unas tasas de FPS muy elevadas. Esto quiere decir que los monitores 4K con tasas de refresco de más de 60 Hz por fin empiezan a tener mucho más sentido.
En términos comparativos, la diferencia de rendimiento frente a la RTX 2080 es muy marcada, y en algunos casos llega a ser enorme. Hay una tendencia curiosa que he ido viendo durante las pruebas, y es que en general la GeForce RTX 3080 ofrece en 4K, salvo contadas excepciones, un rendimiento casi idéntico al que consigue la RTX 2080 en 1440p. Impresionante, no olvidéis que en 4K la GeForce RTX 3080 tiene que manejar 8.294.400 píxeles, y que en 1440p la RTX 2080 tiene que mover «solo» 3.686.400 píxeles.
¿Logra doblar el rendimiento de la RTX 2080? De momento no, pero en algunos casos queda muy cerca de ese objetivo. Fijaos, por ejemplo, en el rendimiento en DOOM Eternal en 4K, o en el rendimiento que obtiene en Resident Evil 3, también en 4K.
Y hablando de resolución 4K, estos resultados también confirman que hay una diferencia más pequeña entre la GeForce RTX 3080 y la RTX 2080 en 1440p, y que la misma aumenta de forma notable cuando damos el salto a 2160p (4K). En general los resultados han cumplido con mis expectativas, y entran dentro de lo que cabía esperar tras ver la presentación que realizó NVIDIA, aunque debemos tener en cuenta que la arquitectura Ampere acaba de llegar, y que es probable que su rendimiento mejore con el lanzamiento de sucesivos drivers.
GeForce RTX 3080: rendimiento con trazado de rayos y DLSS
Los resultados con trazado de rayos y DLSS son mucho más interesantes. Como podemos apreciar, el salto que logra la GeForce RTX 3080 frente a la RTX 2080 trabajando con ambas tecnologías es enorme, tanto que en este caso no solo se confirma lo que dijo NVIDIA de que era capaz de doblarla en rendimiento, sino que tenemos un caso en el que la mejora de rendimiento llega a ser casi del triple (echad un vistazo a la gráfica de Control con trazado de rayos).
He querido mostraros las pruebas de rendimiento con trazado de rayos y DLSS por separado porque creo que es la mejor manera de valorar el salto generacional que realmente representa la GeForce RTX 3080. Es cierto que, en muchos casos, resulta imprescindible tirar de DLSS para conseguir una buena fluidez, pero tened en cuenta que estamos hablando de resolución 4K, configuraciones gráficas muy altas y de trazado de rayos de alta calidada años luz de lo que hemos visto en PS5 y Xbox Series X.
Sobre Fortnite quiero hacer un apunte importante por si alguien no se da cuenta de ello, y es que en la última gráfica, donde pone «RTX completo», nos referimos al rendimiento del juego con trazado de rayos aplicado a reflejos, sombras e iluminación. Con esa configuración y DLSS activado, la RTX 3080 todavía es capaz de superar a la RTX 2080 con DLSS y trazado de rayos aplicado solo a reflejos. Un resultado fantástico, sin duda.
Si los resultados obtenidos en rasterizado impresionaban, los números que hemos obtenido en las pruebas con trazado de rayos y DLSS son la guinda al pastel, y confirman que la GeForce RTX 3080 ha logrado, como anticipamos, la consagración de dicha tecnología.
GeForce RTX 3080: temperaturas y consumo
Como cabía esperar, la GeForce RTX 3080 tiene un consumo elevado. La RTX 2080 Founders Edition tiene un consumo medio en juegos que ronda casi los 250 vatios, así que la diferencia está clara. Sin embargo, debemos tener en cuenta que la primera ofrece un rendimiento muy superior, de hecho en Control con RTX activado llega casi a triplicar a la RTX 2080, así que el rendimiento por vatio de la RTX 3080 es, en general, superior al que ofrece la RTX 2080.
Si echamos un vistazo a las temperaturas de trabajo vemos que los valores son muy buenos. De media nos mantenemos en la franja de los 75 grados, y nunca llegamos a superar los 78 grados, lo que significa que el modo «GPU Boost 5.0» que utiliza Ampere mantiene la GPU en los siguientes valores:
- Hasta 75 grados: 1.950 MHz.
- Hasta 80 grados: 1.935 MHz.
He intentado hacer overclock, pero la GeForce RTX 3080 Founders Edition viene con un limitador de alimentación establecido a nivel de BIOS que reduce, y mucho, las posibilidades de overclock. Podemos elevar la frecuencia de la GPU en 80 MHz sin que la estabilidad se viese comprometida, y no hemos tenido problema en llevar la memoria GDDR6X hasta los 20 GHz.
Es una mejora discreta, y el impacto a nivel de rendimiento es bastante modesto (alrededor de un 2% de media). Los modelos con diseños personalizados de los diferentes ensambladores vendrán sin esa limitación a nivel de alimentación, lo que significa que vendrán subidas de casa y que tendrán una mayor capacidad de overclock.
GeForce RTX 3080: notas finales
La GeForce RTX 3080 no solo representa ese enorme salto que os comentamos cuando se produjo la presentación de la arquitectura Ampere, sino que además tiene todo lo necesario para convertirse en la mejor tarjeta gráfica de gama alta de la presente generación, siempre desde una perspectiva de valor precio-prestaciones.
Los resultados que hemos obtenido en las pruebas de rendimiento dejan claro que la GeForce RTX 3080 es una tarjeta gráfica que ha logrado que jugar en 4K y calidad máxima con una fluidez muy buena sea, por fin, una realidad, incluso en juegos tan mal optimizados como Red Dead Redemption 2 y Control, dos huesos duros de roer con los que ni siquiera podía una RTX 2080 Ti, como recordarán muchos de nuestros lectores.
El nuevo sistema de refrigeración que ha utilizado NVIDIA no solo tiene un diseño sublime, sino que además es capaz de mantener a la GeForce RTX 3080 en unos valores de temperatura tan buenos que el modo «GPU Boost 5.0» puede trabajar casi a su máxima capacidad, lo que significa que la velocidad de la GPU se mantiene en valores cercanos a los 2 GHz.
En general he quedado gratamente sorprendido, pero lo que más me ha impactado ha sido el rendimiento en trazado de rayos. Ver Wolfenstein Youngblood funcionando en 4K nativos con calidad máxima y trazado de rayos activo con medias de 42 FPS en una RTX 2080 y descubrir que con la GeForce RTX 3080 el rendimiento sube hasta los 90 FPS me dejo con la boca abierta.
Mi conclusión es clara, la GeForce RTX 3080 ha roto el mercado. No solo se ha convertido en la mejor tarjeta gráfica dentro de su rango de precios, sino que además ha dejado sin sentido a la RTX 2080 Ti, una tarjeta gráfica que, os recuerdo, cuesta 1.259 euros, y que sin embargo rinde mucho menos que la GeForce RTX 3080.