Conecta con nosotros

A Fondo

NVIDIA DLSS 2 y DLSS 3: cómo funcionan, en qué se diferencian y prueba de rendimiento

Publicado

el

Cyberpunk 2077 con NVIDIA DLSS

El debut de la tecnología NVIDIA DLSS fue bastante accidentado, eso es imposible negarlo. Recuerdo perfectamente que lo que prometía ser una auténtica revolución en el mundo de los videojuegos fue, al final, una enorme decepción, tanto es así que, en su primera revisión, dicha tecnología estaba incluso por debajo del FSR de AMD, y eso que aquella requería hardware dedicado (los núcleos tensor) para funcionar.

Afortunadamente el gigante verde supo darse cuenta de su error y reaccionó rápidamente con NVIDIA DLSS 2, una tecnología que superó todas mis expectativas, y que llevó a otro nivel la reconstrucción el reescalado de la imagen, dos «comodines» que llevaban mucho tiempo utilizándose en consola y que habían sido fundamentales para que sistemas como PS4 Pro, una consola que tenía una GPU al nivel de una Radeon RX 470, aproximádamente, fuese capaz de mover juegos en una resolución que sería inalcanzable para ella a nivel nativo.

NVIDIA DLSS 1 vs DLSS 2

El DLSS 2 de NVIDIA ofrecía una excelente calidad de imagen. Atrás quedó ese acabado borros y falto de detalle que incluso hacía desaparecer la geometría más pequeña y alejada, y llegó a un nivel tan bueno que el modo calidad es capaz de superar incluso a la resolución nativa en muchos aspectos, y destaca sobre todo en el suavizado de bordes y en la conservación de los detalles más lejanos y pequeños.

Con el paso del tiempo, esta tecnología ha ido recibiendo numerosas actualizaciones y mejoras que, entre otras cosas, han reducido de forma drástica ciertos fallos que pueden producirse durante el proceso de reconstrucción y reescalado. En este sentido, uno de los avances más importantes se produjo con el lanzamiento de DLSS 2.3, que redujo notablemente el «ghosting», una especie de pequeño halo que se produce en ciertos objetos en movimiento, y mejoró mucho la utilización de los vectores de movimiento.

ghosting DLSS

Parecía que NVIDIA DLSS 2 iba a ser el camino a seguir durante muchos años, y que los de verde se iban a limitar a actualizar y mejorar dicha tecnología, pero con el lanzamiento de las GeForce RTX 40 se produjo el anuncio de DLSS 3, una tecnología que a priori parecía ser una simple revisión de la interpolación de fotogramas, pero que al final ha demostrado ser algo mucho más avanzado, y se ha convertido en un avance técnico lleno de sentido no solo porque mejora la fluidez en juegos, sino porque además resuelve uno de los problemas más importantes del sector a día de hoy, los cuellos de botella a nivel de CPU.

Qué son NVIDIA DLSS 2 y DLSS 3 y en qué se diferencian

El DLSS 2 es una tecnología de reescalado y reconstrucción de la imagen apoyado por inteligencia artificial, que utiliza algoritmos y hardware especializado para crear el fotograma perfecto. Cuando activamos esta tecnología, se renderiza a una resolución inferior a la nativa y luego se reconstruye la imagen y se reescala a la resolución objetivo.

NVIDIA DLSS 2

Las tecnologías de reescalado convencional suelen utilizar elementos espaciales, y algunos también elementos temporales, para conseguir un proceso de reconstrucción y reescalado más preciso. NVIDIA DLSS 2 sube el listón al combinar vectores de movimiento y algoritmos de IA acelerados por hardware para analizar y utilizar la información presente en el fotograma actual, y en otros anteriores, y crear con todo eso un fotograma perfecto.

No se limita a rellenar píxeles estirando otros cercanos, una técnica por ejemplo empleaba el reescalado de PS4 Pro, sino que utiliza toda la información que tiene a su alcance para reconstruir y reescalar la imagen con el objetivo de lograr el fotograma perfecto. El resultado que consigue es tan bueno que, como he dicho anteriormente, es capaz de superar a la resolución nativa el modo calidad.

La tecnología DLSS 2 de NVIDIA reduce la resolución base, es decir, la cantidad real de píxeles que tiene que renderizar la GPU, y crea el resto mediante inteligencia artificial. Esto hace que el núcleo gráfico tenga que soportar una carga menor, y puede dar pie a cuellos de botella a nivel de CPU en resoluciones bajas. Para que os hagáis una idea más clara, esta es la cantidad total de píxeles que renderiza el DLSS 2 en cada modo:

  • Modo calidad: renderiza el 67% de los píxeles de la resolución objetivo.
  • Modo equilibrado: renderiza el 58% de los píxeles de la resolución objetivo.
  • Modo rendimiento: renderiza un 50% de los píxeles de la resolución obejtivo.
  • Modo ultra rendimiento: renderiza un 33% de los píxeles de la resolución objetivo.

comparativa DLSS

Si utilizamos el modo ultra rendimiento en resoluciones inferiores a 2160p la resolución de partida será tan baja que, al final, tendremos casi con total seguridad un importante cuello de botella a nivel de CPU, y no valdrá la pena activar dicho modo, ya que perderemos calidad de imagen y la mejora de rendimiento no compensará dicha pérdida. En líneas generales, lo ideal es utilizar el modo calidad en 1080p, el modo calidad o equilibrado en 1440p y el modo equilibrado o el modo rendimiento en 2160p, salvo casos muy concretos.

De lo que hemos dicho podemos sacar una cosa muy importante en claro, y es que llega un punto en el que ya no es rentable reducir más la resolución de partida para reescalar. NVIDIA era consciente de esta realidad, y por ello con el optó por seguir un camino diferente con el DLSS 3. Esta tecnología utiliza inteligencia artificial y aceleración por hardware para generar un fotograma adicional por cada dos fotogramas renderizados de manera tradicional, utilizando la información presente en estos.

NVIDIA DLSS 3 claves

La idea base es la misma que podemos encontrar en la interpolación de fotogramas, pero NVIDIA la ha llevado a otro nivel al introducir inteligencia artificial y aceleración por hardware. Esto permite superar las carencias y problemas típicos de la interpolación de fotogramas tradicional, ya que la IA es capaz de determinar de una manera mucho más precisa el movimiento de los píxeles y su posición ideal en ese fotograma generado. El hardware es clave para procesar toda la información, y el resultado final es una mayor nitidez, una calidad de imagen superior y menos fallos y artefactos gráficos.

Entonces, ¿en qué se diferencian NVIDIA DLSS 2 y DLSS 3? Pues es muy sencillo, las dos tecnologías utilizan inteligencia artificial y aceleración por hardware para aumentar la tasa de fotogramas en juegos, pero lo hacen de manera distinta. La primera reduce la resolución de renderizado y reescala y reconstruye la imagen de forma inteligente, lo que reduce la carga real que asume la GPU, y la segunda es un complemento ideal para esta, ya que utiliza la información de dos fotogramas, la IA y la aceleración por hardware para crear un fotograma adicional totalmente independiente.

generación de píxeles

Gracias a la combinación de DLSS 2 y DLSS 3 una tarjeta gráfica GeForce RTX 40 de NVIDIA es capaz de crear 7 de cada 8 píxeles mediante inteligencia artificial. Esto reduce enormemente la carga gráfica que debe soportar una GPU para alcanzar un determinado grado de calidad de imagen y de fluidez, y deja un gran margen de maniobra para implementar tecnologías tremendamente exigentes, como el path tracing.

Rendimiento de juegos con DLSS 2 y DLSS 3: ¿cómo marcan la diferencia?

Ahora que tenemos claro qué son, cómo funciona y en qué se diferencian estamos listos para entrar a ver cómo pueden mejorar la tasa de FPS en juegos. Para que podáis apreciar mejor los saltos que se producen al activar el DLSS 2 y el DLSS 3 he utilizado juegos que permiten activar trazado de rayos y títulos que sufren un marcado cuello de botella a nivel de CPU.

En cada gráfica haré una interpretación de los resultados para que no os perdáis nada, y para que podáis entenderlos adecuadamente. Con todo, si tenéis cualquier duda podéis dejarla en los comentarios y estaré encantado de ayudaros a resolverla. Antes de entrar en materia, os dejo la lista de componentes utilizados.

equipo de pruebas

Equipo de pruebas

  • Procesador Intel Core i9-13900K
  • Placa base GIGABYTE Z790 AERO G.
  • Sistema de refrigeración líquida todo en uno Corsair iCUE H150i Elite LCD con tres ventiladores de 120 mm.
  • 32 GB de memoria DDR5 Corsair Vengeance RGB a 6.000 MHz con latencias CL40.
  • Unidad SSD WD Black SN850 de 2 TB con interfaz PCIe Gen4 x4, capaz de alcanzar velocidades de 7.000 MB/s y 5.300 MB/s en lectura y escritura secuencial.
  • Tarjeta gráfica GeForce RTX 4090 Founders Edition con 24 GB de GDDR6X.
  • Fuente de alimentación Corsair HX1500i de 1.500 vatios con certificación 80 Plus Platinum.
  • Windows 11 actualizado a la última versión disponible.
  • Pasta térmica Corsair XTM70.

Empezamos con Cyberpunk 2077, uno de los juegos más exigentes que existen a día de hoy, y el único título hasta el momento que ha sido capaz de unir una geometría de la presente generación con el path tracing. Como podemos ver en la primera gráfica, el salto que conseguimos al activar el DLSS 2 es muy grande, ya que ganamos 45 FPS, y al activar el DLSS 3 conseguimos otros 43 FPS.

Con trazado de rayos activo la diferencia que marca el DLSS 2 en modo rendimiento es tan enorme que casi triplicamos el rendimiento, pero ya no sería rentable pasar al modo ultra rendimiento, porque perdemos mucha calidad gráfica y la mejora de rendimiento no compensa. Con el DLSS 3 podemos conseguir otros 43 FPS.

El dúo NVIDIA DLSS 2 y DLSS 3 se complementa a la perfección en este juego, ¿pero qué pasa si activamos el path tracing? Pues lo que cabía esperar, que en nativo tenemos solo 21 FPS, que es todo un logro teniendo en cuenta la carga gráfica que maneja la GeForce RXT 4090, pero no se puede jugar bien. Con el DLSS 2 en modo rendimiento ganamos 42 FPS, y con el DLSS 3 conseguimos 38 FPS. Gracias a ambas tecnologías podemos multiplicar el rendimiento por cinco.

cyberpunk 4k pt

Redfall no ha cumplido con las expectativas que ha generado, pero es un juego tan mal optimizado y con un cuello de botella tan enorme a nivel de CPU que nos permite demostrar a la perfección el valor que ofrece el DLSS 3 en este tipo de escenarios.

Al activar el DLSS 2 en modo rendimiento solo ganamos 39 FPS porque, al final, la GeForce RTX 4090 sufre un cuello de botella muy grande por la CPU y el pobre uso que el juego hace de esta. Como el DLSS 3 no depende de la CPU, al activarlo logramos un aumento de 53 FPS, es decir, ganamos más fluidez con la generación de fotogramas que con el reescalado y la reconstrucción de la imagen.

redfall

Dying Light 2 es, a pesar del cuestionable enfoque artístico que adoptó Techland, uno de mis juegos favoritos, y también es uno de los más exigentes. Me ha resultado complicado hacer las mediciones porque hay un pequeño fallo con el DLSS 3 que hace que, en ocasiones, esté activado cuando no debería. A pesar de todo pude contrastar bien datos y pulir las mediciones.

En este caso vemos que la diferencia entre activar o no el DLSS 2 en modo rendimiento es enorme. No hay duda de que este juego está mejor optimizado y aprovecha mejor la CPU para impulsar el rendimiento cuando se reduce la resolución base al reescalado y reconstruir la imagen, tanto que ganamos 101 FPS. Impresionante, tanto que la ganancia con el DLSS 3 resulta modesta en comparación, pero esos 32 FPS extra son la guinda al pastel.

Al activar el trazado de rayos el rendimiento cae mucho, pero con el DLSS 2 podemos ganar 72 FPS. Al activar el DLSS 3 conseguimos otros 47 FPS. Ambas tecnologías suman, y que la generación de fotogramas sea capaz de conseguir esa gran mejora de fluidez en un escenario donde ya partimos de una resolución base de 1080p reescalada y reconstruida a 2160p es simplemente fantástico.

dying light 2

A Plague Tale: Requiem es uno de los juegos más exigentes que existen, y también es uno de los que mejor calidad gráfica ofrece. No tiene nada que ver con los juegos de la generación anterior, y lo demuestra hasta en el más mínimo detalle. Esto tiene, obviamente, una contrapartida en el hardware que necesita para funcionar con fluidez en calidad máxima, y más aún con trazado de rayos.

El DLSS 2 en modo rendimiento marca una diferencia enorme tanto en 2160p sin trazado de rayos como con dicha tecnología activada, ya que nos permite sumar 52 FPS y 41 FPS, respectivamente. El DLSS 3 también marca una gran diferencia, ya que añade 45 FPS en ambos casos, y con trazado de rayos activo el salto que consigue es tan importante que nos permitiría aprovechar un monitor de 120 Hz.

requiem

F.I.S.T.: Forged In Shadow Torch es un juego bastante asequible, pero cuando activamos el trazado de rayos la penalización de rendimiento que se produce es tan grande que el DLSS 2 marca un salto de 54 FPS. En este caso el DLSS 2 funciona en modo automático. Con el DLSS 3 la mejora es de 43 FPS, un salto que nos lleva a rozar el límite de este juego, que está bloqueado a 199 FPS.

Portal RTX es un juego tan exigente que incluso una potente GeForce RTX 3090 Ti tiene problemas para moverlo en 2160p, salvo que activemos el DLSS 2 en modo rendimiento. Con una GeForce RTX 4090 el juego alcanza los 22 FPS en nativo configurado en calidad ultra y con cuatro rebotes, pero gracias al DLSS 2 en modo rendimiento podemos llegar a los 59 FPS de media. Esto representa un aumento de 37 FPS, y al activar el DLSS 3 ganamos otros 49 FPS.

portal

Destroy All Humans 2 Reprobed es otro ejemplo de juego que sufre enseguida un cuello de botella a nivel de CPU cuando bajamos la resolución base, por eso el impacto del DLSS 3 en la tasa de fotogramas por segundo es tan grande. Cuando activamos el DLSS 2 en modo rendimiento conseguimos un aumento de 71 FPS, y al activar el DLSS 3 vemos como se añaden otros 65 FPS. la mejora de rendimiento es enorme.

destroy 2

Terminamos con Microsoft Flight Simulator, un juego exigente y otro de los grandes exponentes del cuello de botella a nivel de CPU. Con DLSS 2 en modo rendimiento la mejora de rendimiento es de 45 FPS, y al activar el DLSS 3 añadimos otros 40 FPS. Si hubiéramos seguido reduciendo la resolución la mejora de rendimiento habría sido casi nula porque tendríamos un cuello de botella provocado por la CPU y la optimización del juego, pero este problema no existe con la generación de fotogramas.

msflight

Notas finales: la IA define el presente y el futuro de los videojuegos

Y lo hemos podido ver claramente en este artículo. Que NVIDIA haya sido capaz de multiplicar por cinco la tasa de fotogramas por segundo en juegos utilizando IA acelerada por hardware es un reflejo muy claro de que, al final, los de verde no solo no se equivocaron cuando apostaron por los núcleos especializados con Turing en 2018, sino que además estaban definiendo el camino a seguir en una industria que se estaba estancando de una manera muy marcada.

Generar píxeles y fotogramas mediante inteligencia artificial permite mejorar el rendimiento, pero su valor no se limita a algo tan simple. Esto también permite reducir la carga que debe soportar la GPU, cosa que puede ayudar a reducir el consumo y las temperaturas de trabajo, y deja margen de potencia para integrar tecnologías tan exigentes como el trazado de rayos.

Al mismo tiempo, la inteligencia artificial aplicada a los videojuegos a través del DLSS 3 (generación de fotogramas) nos permite minimizar un problema que nos ha hecho «tirarnos de los pelos» en más de una ocasión, el cuello de botella a nivel de CPU. No importa lo potente que sea tu tarjeta gráfica si un juego no es capaz de aprovecharla porque está mal optimizado y provoca un cuello tremendo a nivel de CPU. Esto es especialmente visible cuando vemos que la tasa de uso de nuestra GPU está por debajo del 95%.

En esos casos aplicar un reescalado no solo no mejorará el rendimiento, sino que puede llegar a empeorarlo. Con la generación de fotogramas no existe este problema porque cada fotograma se genera de forma totalmente independiente en la GPU, sin que sea necesaria ningún tipo de intervención por parte de la CPU. Es un logro muy importante, sobre todo teniendo en cuenta el buen resultado que ha conseguido NVIDIA gracias a la IA y al hardware dedicado.

Sí, la potencia bruta sigue siendo importante, pero está claro que la IA se ha convertido en uno de los pilares más importantes dentro del sector gráfico, y que debemos darle el lugar que merece. Ya no tiene sentido valorar una tarjeta gráfica solo por su rendimiento en bruto, debemos tener en cuenta todas sus capacidades, y el soporte de tecnologías como el DLSS 2 y el DLSS 3 representan un gran valor añadido porque, como hemos visto, pueden multiplicar por cinco la tasa de fotogramas por segundo.

Editor de la publicación on-line líder en audiencia dentro de la información tecnológica para profesionales. Al día de todas las tecnologías que pueden marcar tendencia en la industria.

Lo más leído