¿Se desgastan las GPU por el uso intensivo?

Una tarjeta GPU sobre un fondo azul.
Maxx-Studio/Shutterstock.com

Si planea hacer juegos intensivos, computación GPU, renderizado de gráficos,  Folding@home o minería criptográfica en su tarjeta gráfica, es posible que le preocupe que su GPU se desgaste por el uso intensivo. ¿Pero lo hará? Investigaremos.

si, pero es complicado

La mayor parte de la información sobre la vida útil de las tarjetas gráficas que encontrará en línea es anecdótica, con números que pueden variar drásticamente según a quién le pregunte. Con cientos de modelos diferentes de tarjetas gráficas lanzadas durante la última década, es difícil resumir los datos de tarjetas tan diferentes en generalizaciones simples.

Hasta ahora, sabemos esto: según un informe de 2020 de un minorista alemán , las tarjetas gráficas más recientes tienen una tasa de fallas del 2 al 5 % (medida en devoluciones al minorista) en general. Y en 2021, Nvidia aún proporcionó actualizaciones de controladores para tarjetas que tenían entre 9 y 10 años (como la serie GTX 600), por lo que posiblemente puede esperar una década de uso de una tarjeta GPU bien tratada, aunque eso podría ser valores atípicos, como veremos más adelante.

Independientemente de los números, hay algo de física dura en el trabajo. Los materiales y componentes utilizados en la composición de las tarjetas GPU no son mágicos: cuanto más los use, más rápido se degradan las piezas y es más probable que fallen por completo. Así que el uso intensivo afecta la vida útil.

Varias tarjetas GPU en un criptominero.
Como verá, la criptominería disminuirá la vida útil de una tarjeta gráfica. socrates471/Shutterstock.com

Si verá una falla en su tarjeta GPU depende de variables muy diferentes, que incluyen la cantidad exacta de uso de la GPU, la naturaleza y el grado de cambios de temperatura en el circuito, cuántas veces se encendió y apagó la tarjeta, y qué tan limpio es el entorno operativo.

Debido a que una tarjeta GPU es un dispositivo complejo con muchas partes, cada una puede fallar o degradarse de diferentes maneras. Revisaremos varias partes importantes de una tarjeta GPU y examinaremos cómo podrían desgastarse debido al uso intensivo con el tiempo.

Primero en irse: ventiladores de refrigeración

De todas las partes de una tarjeta gráfica que probablemente fallarán primero, tendríamos que señalar los ventiladores de refrigeración (o ventilador), que son partes móviles físicas. Los ventiladores mantienen la GPU fresca al alejar el aire caliente del chip GPU (con un disipador de calor ) para que pueda seguir funcionando.

Relacionado:  Cómo cambiar tu foto de perfil en Facebook
Una tarjeta GPU con ventiladores giratorios.
FeelGoodLuck/Shutterstock.com

¿Por qué es malo el calor? Con suficiente calor, los transistores no funcionan correctamente , lo que significa que la tarjeta GPU no funcionará. Con aún más calor, los transistores en los chips de la tarjeta pueden dañarse permanentemente .

Con el tiempo, los ventiladores de enfriamiento a menudo se obstruyen con polvo, lo que reduce su capacidad para mover el aire de manera eficiente. O los ventiladores pueden fallar por completo si se rompe un lubricante interno. Cualquiera de los escenarios elevará la temperatura de la GPU.

Cada GPU se protege contra el sobrecalentamiento mediante el uso de estrangulamiento térmico , que ralentiza el funcionamiento de la GPU para reducir la temperatura de funcionamiento. Hacerlo limita severamente el rendimiento. Entonces, si tiene una GPU que de repente hace más ruido de lo normal (el ventilador gira más rápido) o funciona peor, limpie a fondo los ventiladores de refrigeración y el disipador de calor de la GPU con aire comprimido.

Si un ventilador de enfriamiento de GPU ha fallado por completo, generalmente puede reemplazarlo si puede encontrar un ventilador equivalente de un proveedor de piezas de computadora.

Otro sospechoso: compuesto térmico defectuoso

Entre cada disipador de calor y el chip de la GPU hay una capa de material termoconductor , como una capa de masilla o pasta que ayuda a transferir el calor del chip de la GPU al disipador de calor.

Con el tiempo, la pasta térmica puede agrietarse o perder potencia. Cuando eso sucede, el disipador de calor no se enfría con tanta eficacia y la temperatura de la GPU aumentará. Como hemos visto en la sección de ventiladores anterior, las altas temperaturas de GPU dan como resultado un estrangulamiento térmico , lo que ralentizará su GPU.

La mejor solución en ese escenario es reemplazar la pasta térmica usted mismo. Puede comprar pasta térmica a vendedores de repuestos para computadoras.

Fallas en Otros Componentes, Soldadura

Además del chip GPU, una tarjeta gráfica incluirá docenas de otros componentes electrónicos, como condensadores, resistencias, chips de memoria y más. Cualquiera de ellos podría fallar potencialmente por el uso intensivo o la exposición a demasiado calor. Algunos tienen más probabilidades de fallar que otros.

Una foto de capacitores sueltos en una PCB.
Andréi Kuzmik/Shutterstock.com

Los capacitores en particular son propensos a fallar con el tiempo. Son sensibles a los cambios de temperatura frecuentes y algunos son defectuosos cuando se fabrican por primera vez. Si es lo suficientemente hábil para solucionar problemas de condensadores, puede reemplazar potencialmente los condensadores defectuosos en una tarjeta GPU si puede encontrar piezas de repuesto equivalentes.

Relacionado:  Cómo evitar que aparezca el menú de descarga de Firefox

Además, la soldadura que une los chips y los componentes a la placa de circuito de la tarjeta GPU puede envejecer y agrietarse con el tiempo debido a los frecuentes cambios de temperatura, la manipulación física brusca, el almacenamiento inadecuado o el exceso de temperatura. Entonces, sí, el uso intensivo de GPU podría aumentar los riesgos de fallas en las uniones de soldadura. Reparar juntas de soldadura defectuosas puede ser técnicamente difícil, pero no imposible .

Fallos en el propio chip GPU

Entonces, la pregunta sigue siendo: ¿Puede un chip de GPU eventualmente desgastarse debido al uso intensivo? La respuesta es sí, en teoría, en circunstancias extremas. Pero es probable que vea la falla de otro componente en la tarjeta gráfica mucho antes de ese momento.

El chip GPU de su tarjeta gráfica contiene millones o miles de millones de transistores, grabados en una pieza de silicio. Los transistores envejecen con el tiempo , lo que afecta su rendimiento. Cuando suficientes transistores se comportan mal, el chip fallará.

Según Semiconductor Engineering , hay varias razones importantes por las que los transistores funcionan mal con el tiempo debido al envejecimiento ( uno de los cuales es el calor ), y los errores son más probables cuanto más pequeño es el tamaño de la característica en el chip. Los expertos sospechan que los chips de computadora fabricados hoy no durarán tanto como los fabricados en la década de 1990, pero predecir una vida útil exacta sigue siendo una conjetura , ya que la tecnología es muy nueva.

Una ilustración de un chip GPU.
ZinetroN/Shutterstock.com

Actualmente, NVIDIA no publica estimaciones de MTBF (tiempo medio entre fallas) para sus tarjetas gráficas de consumo, pero la compañía las  publica para algunos de sus aceleradores de gráficos industriales y comerciales. Por ejemplo, la hoja de datos del acelerador de GPU Tesla K20X indica que el MTBF de la tarjeta (a una temperatura de 35 °C/95 °F) es de 14,7 años para un «entorno no controlado» y de 23,8 años para un «entorno controlado». (Tenga en cuenta que, en general, se espera que el hardware de gráficos industriales sea más robusto y resista mejor el uso intensivo que el hardware de gráficos de consumo).

Curiosamente, podemos comparar este número teórico con datos duros de campo. Uno de los pocos estudios empíricos sobre la vida útil de la GPU es cortesía de un artículo de 2020 titulado » GPU Lifetimes on Titan Supercomputer: Survival Analysis and Reliability » escrito por Oak Ridge National Labs. El documento informa sobre la confiabilidad de las 18 688 tarjetas GPU Nvidia K20X Kepler utilizadas en la supercomputadora Cray XK7 Titan , ahora retirada, durante un período de casi 7 años (2012-2019).

Relacionado:  ¿Qué es DisplayPort Adaptive-Sync?
La supercomputadora Titán Cray XK7
La supercomputadora Cray XK7 proporcionó datos valiosos sobre la vida útil de la GPU. ORNL

Después de algunos contratiempos iniciales debido a problemas de conexión, encontraron una confiabilidad relativamente alta con las tarjetas gráficas del XK7 hasta 2016 (alrededor de 3 o 4 años), cuando muchas comenzaron a fallar. ¿Pero adivina que? Rastrearon la mayoría de las fallas en el primer lote de tarjetas (antes del reemplazo) a una resistencia defectuosa en la placa de circuito de la tarjeta gráfica, no al chip GPU en sí. En general, los autores del estudio encontraron que el MTBF promedio de las tarjetas GPU de uso intensivo del K20X es de alrededor de 3 años (no 14-23 años, como se cita en la hoja de datos de Nvidia), y algunas de las tarjetas más populares en el núcleo fallan primero. Concluyeron: «La confiabilidad de la GPU depende de la disipación de calor».

Por lo tanto, es muy probable que si usa su tarjeta gráfica tan intensamente como una de las supercomputadoras más grandes del mundo (en ese momento), se desgastará más rápido y que otros componentes, como los ventiladores y las resistencias, fallarán mucho antes que el chip GPU. . Exactamente cuánto tiempo obtendrá depende de factores que no podemos predecir.

En última instancia, el calor es el enemigo

Al final, de todas las fuentes que hemos leído, el factor decisivo más importante para la duración de una tarjeta GPU es qué tan caliente funciona. Cuanto más caliente esté la tarjeta, más rápido se degradarán todos sus componentes. Además, cuanto más caliente está la tarjeta, más reduce su rendimiento para evitar fallas catastróficas. Una buena refrigeración prolonga la vida útil de la tarjeta y aumenta su rendimiento.

Entonces, ya sea que esté extrayendo criptografía o jugando, si mantiene su tarjeta GPU razonablemente fresca con ventiladores limpios y que funcionen y pasta térmica efectiva, es probable que tenga una tarjeta de alto rendimiento que, si tiene suerte, podría durar hasta que se agote. se vuelve obsoleto y se actualiza.

Si planea comprar una GPU usada , definitivamente debe tener en cuenta su historial, incluido cómo la trató y usó su propietario. Es probable que las tarjetas más utilizadas (que funcionan ahora) funcionen bien a corto plazo, pero son más propensas a fallar a largo plazo. No podemos poner un número exacto en la vida útil de una tarjeta, pero el uso intensivo definitivamente desgasta las tarjetas gráficas más rápido.

¡Buena suerte!