Conviene elegir un servidor GPU listo cuando la tarea está clara, el lanzamiento debe hacerse rápido y los requisitos encajan en un escenario típico: inferencia, renderizado, VDI, un proyecto piloto o el trabajo de un solo equipo. Una configuración personalizada merece la pena cuando el servidor debe cubrir una carga no estándar: 4–8 GPU, una gran cantidad de memoria de vídeo, discos NVMe rápidos, red 100/200/400G, requisitos especiales de refrigeración, alimentación, redundancia o futuras ampliaciones.
La elección entre un modelo listo y una configuración personalizada rara vez se reduce solo al precio. En los servidores GPU importa toda la arquitectura: tarjetas gráficas, procesadores, memoria RAM, discos, red, chasis, rack, refrigeración, controladores, software y el plazo en el que el servidor debe ponerse en funcionamiento.
Una configuración estándar puede ser la mejor solución si la empresa necesita lanzar el proyecto más rápido y reducir el riesgo de incompatibilidad entre componentes. Una configuración personalizada se justifica cuando existe el objetivo de ahorrar montando el sistema por cuenta propia con las competencias necesarias, cuando hay requisitos no estándar y, sobre todo, cuando un error de configuración dentro de seis meses no provocará una nueva compra, paradas del equipo o la imposibilidad de escalar el servicio.
Qué se considera un servidor GPU listo
Un servidor GPU listo no tiene por qué ser un sistema completamente fijo “de catálogo”. Más a menudo se trata de una plataforma probada en la que los parámetros principales ya están claros:
- cuántas GPU admite el chasis;
- qué fuentes de alimentación se necesitan;
- cómo está organizado el flujo de aire;
- qué procesadores y capacidades de RAM están disponibles;
- qué discos se pueden instalar;
- qué tarjetas de red son compatibles;
- qué variantes ya han sido probadas por el proveedor o el fabricante.
Un servidor así es más fácil de elegir, aprobar, entregar y mantener. Para muchas tareas, esto es suficiente.
Un modelo listo funciona bien en escenarios donde la carga ya se entiende:
- inferencia de uno o varios modelos;
- renderizado;
- edición de vídeo y procesamiento multimedia;
- VDI y estaciones de trabajo gráficas;
- banco de pruebas para un equipo;
- proyecto piloto de IA;
- laboratorio para aprendizaje y experimentos.
Si el servidor necesita 1–2 GPU, una cantidad moderada de RAM, almacenamiento NVMe o SSD estándar y una red habitual, la personalización completa suele aumentar el plazo de entrega y complicar el soporte.
Qué es una configuración personalizada de servidor GPU
Una configuración personalizada es un servidor montado para una especificación técnica concreta. En este tipo de montaje se planifica de antemano no solo la lista de componentes, sino también las limitaciones de la futura explotación.
La personalización puede afectar casi cualquier nivel:
- número de GPU;
- cantidad de memoria de vídeo;
- factor de forma de la GPU;
- procesadores;
- memoria RAM;
- discos NVMe, SAS o SATA;
- RAID y matrices separadas para datos;
- tarjetas de red;
- redundancia de alimentación;
- refrigeración;
- gestión remota;
- compatibilidad con controladores y software;
- requisitos del rack y del centro de datos.
Una configuración personalizada no se necesita simplemente para “hacerlo mejor”. Suele ser necesaria cuando un modelo estándar no ofrece la densidad, velocidad, margen de ampliación o compatibilidad que exige una tarea concreta.
Por ejemplo, un servidor para inferencia ligera y un servidor para entrenar modelos grandes pueden llamarse ambos servidores GPU, pero por dentro son sistemas distintos. En el primer caso, es más importante lanzar rápidamente una configuración estable. En el segundo, hay que calcular de antemano la memoria de vídeo, la comunicación entre GPU, la red, los discos, la alimentación y la refrigeración.
Modelo listo y configuración personalizada: comparación por criterios clave
| Criterio | Servidor GPU listo | Configuración personalizada | Qué significa en la práctica |
|---|---|---|---|
| Plazo de lanzamiento | Normalmente más rápido | Más largo por el diseño y la validación | Si el proyecto debe lanzarse en las próximas semanas, un modelo estándar suele ser más práctico |
| Precio inicial | A menudo más bajo y claro | Puede ser más alto por la selección de componentes específicos por parte del proveedor, o más bajo si el sistema se monta internamente | El custom debe evaluarse no solo por el precio de compra, sino también por la vida útil y el soporte |
| Compatibilidad | Menor riesgo | Requiere comprobaciones por separado | En servidores GPU importan la alimentación, la refrigeración, las ranuras, BIOS y controladores |
| Garantía y servicio | Normalmente más sencillos | Pueden depender de la composición del montaje | Cuanto más compleja sea la configuración, más importante es definir claramente la responsabilidad |
| Escalado | Limitado por la plataforma | Puede planificarse de antemano | El custom es útil cuando el servidor no se compra para un piloto, sino para crecer |
| Ampliación | No siempre es posible | Se pueden prever ranuras, alimentación y refrigeración | Añadir GPU más adelante solo es posible si hay margen físico y eléctrico |
| Discos | Opciones estándar | Se puede crear un esquema de almacenamiento adecuado para los datos | Para grandes datasets importan tanto la capacidad como la velocidad de lectura/escritura |
| Red | A menudo 10/25G | Se puede prever 100/200/400G | Para un clúster y almacenamiento externo, la red se convierte rápidamente en un cuello de botella |
| Refrigeración | Ya calculada para una carga estándar | Debe comprobarse para las GPU concretas | La compatibilidad formal no garantiza un régimen térmico correcto |
| Riesgo de sobrepago | Se puede comprar potencia de más “por si acaso” | Se puede sobrediseñar el sistema | En ambos casos hay que evaluar la carga real |
| Limitaciones en 6–12 meses | Probables si el proyecto crece | Se pueden reducir de antemano | Si la carga crece rápido, un modelo estándar puede convertirse en una solución temporal |
Un servidor listo gana cuando importan la velocidad, la previsibilidad y el bajo riesgo. La configuración personalizada gana cuando la tarea afecta a la arquitectura de todo el servidor, no solo a la elección de la tarjeta gráfica.
Cuándo un servidor GPU listo es la elección correcta
Dell PowerEdge XE9680.
Fuente de la imagen: DELL
Un modelo listo no significa un sistema débil o de compromiso. En muchos casos es la opción más racional: se pone en marcha más rápido, es más fácil de mantener y no requiere una larga revisión de ingeniería.
La carga se conoce de antemano
Un servidor GPU estándar es adecuado si se sabe:
- qué aplicaciones se ejecutarán;
- cuántos usuarios trabajarán con el sistema;
- cuánta memoria de vídeo se necesita;
- cuántos datos se almacenarán localmente;
- si se requiere un alto ancho de banda de red;
- si se prevé crecimiento durante el próximo año.
Por ejemplo, para VDI, renderizado, pruebas o inferencia de un modelo pequeño, a menudo bastan 1–2 GPU. En estos escenarios se pueden considerar GPU de servidor versátiles como NVIDIA A10 24GB o NVIDIA L40S 48GB, siempre que encajen por memoria de vídeo, consumo energético y perfil de carga.
Es importante una puesta en marcha rápida
La velocidad de lanzamiento a veces es más importante que una configuración perfecta. Esto se nota especialmente cuando:
- el equipo ya está listo para trabajar, pero espera la infraestructura;
- hay que mostrar un piloto a un cliente;
- un proceso de negocio depende de los plazos;
- el proyecto todavía está comprobando una hipótesis;
- el tiempo de inactividad de los ingenieros cuesta más que el posible ahorro al seleccionar componentes.
Un modelo listo es más fácil de pasar por compras, recibir del proveedor y entregar antes a operación. Tiene menos incógnitas: la plataforma, los componentes, la refrigeración y las opciones de servicio disponibles están claras.
No hay requisitos raros de discos o red
Una configuración estándar es adecuada si basta con:
- una red estándar 10/25G;
- discos NVMe o SSD locales;
- RAID habitual para la partición del sistema;
- un volumen de datos moderado;
- un solo servidor sin integrarlo en un clúster.
Si los datos no se mueven constantemente entre varios nodos y los modelos y datasets caben en discos locales, una red compleja y un subsistema de almacenamiento no estándar pueden ser excesivos.
Hay que reducir el riesgo de incompatibilidad
Un servidor GPU no puede elegirse con la lógica de “un servidor más una tarjeta gráfica potente”. Hay que comprobar:
- el tamaño físico de la tarjeta;
- el consumo energético;
- los conectores de alimentación;
- el flujo de aire disponible;
- la compatibilidad con BIOS;
- las ranuras y risers;
- la compatibilidad con controladores;
- la temperatura en el rack;
- los requisitos de las fuentes de alimentación.
Por eso las plataformas probadas y los sistemas validados son importantes no solo para grandes empresas. NVIDIA destaca por separado el enfoque de sistemas certificados, en el que los servidores se validan para cargas aceleradas, incluidos entrenamiento, inferencia, renderizado y software empresarial. Más información está disponible en la sección NVIDIA Certified Systems.
Cuándo es mejor no empezar sin una configuración personalizada
El custom es necesario cuando los requisitos de la tarea van más allá de “instalar una o dos GPU y lanzar la aplicación”. Cuanto más depende la carga de la memoria de vídeo, la comunicación entre GPU, la velocidad de los discos y la red, mayor es el coste de un error.
Se necesitan 4–8 GPU
Render oficial de producto NVIDIA DGX B200.
Fuente de la imagen: NVIDIA DOCS
Con 1–2 GPU, a menudo es posible elegir un modelo listo. Con 4–8 GPU, el servidor se convierte en un proyecto de infraestructura independiente.
Hay que comprobar:
- si hay suficientes líneas PCIe;
- si el chasis soportará la carga térmica;
- si las fuentes de alimentación son suficientes;
- cómo se colocarán las GPU;
- si las tarjetas bloquearán ranuras vecinas;
- si se necesita comunicación rápida entre GPU;
- si el rack es adecuado por potencia y profundidad;
- si hay margen para tarjetas de red y discos.
Para entrenamiento pesado, modelos grandes y alta densidad de cálculo, ya no basta con mirar solo el precio de las tarjetas gráficas. Por ejemplo, NVIDIA H100 80GB o NVIDIA H200 pueden formar parte de sistemas muy distintos: desde un servidor potente independiente hasta una infraestructura de clúster con red de alta velocidad y almacenamiento separado.
La capacidad de memoria de vídeo es crítica
La memoria de vídeo suele convertirse en la primera limitación en tareas de IA. Si el modelo no cabe en la memoria de la GPU, el servidor puede parecer potente sobre el papel, pero ser incómodo en el trabajo real.
Una gran cantidad de VRAM es importante para:
- grandes modelos de lenguaje;
- modelos con contexto largo;
- procesamiento de imágenes grandes;
- ajuste fino;
- ejecución simultánea de varios modelos;
- servicio a un gran número de usuarios;
- experimentos con versiones más pesadas de los modelos.
A veces una GPU con mucha memoria de vídeo es más útil que varias tarjetas menos adecuadas. En otros casos importa más el paralelismo, y entonces se necesitan varias GPU. Por eso la elección no debe empezar solo por la pregunta “qué tarjeta gráfica es más rápida”. Primero hay que entender cuánta memoria se necesita ahora y cuánta puede hacer falta dentro de un año.
Para tareas en las que la memoria de vídeo y el entrenamiento de modelos son críticos, tiene sentido considerar por separado soluciones como NVIDIA A100 80GB y compararlas no solo por rendimiento, sino también por compatibilidad con la plataforma del servidor.
Se requiere un esquema de discos especial
Los discos de un servidor GPU no solo se encargan del almacenamiento. Afectan a la velocidad de preparación de datos, la carga de datasets, los archivos temporales y la estabilidad del pipeline.
Se necesita una configuración personalizada si:
- los datasets ocupan decenas o cientos de terabytes;
- los datos se leen y escriben con frecuencia;
- se requiere una caché local rápida;
- se necesita una matriz separada para el sistema operativo, los datos y los archivos temporales;
- se necesitan NVMe U.2/U.3;
- es importante el intercambio en caliente de discos;
- se necesita redundancia de la partición del sistema;
- el servidor trabaja con almacenamiento externo.
Un subsistema de discos débil puede provocar una situación en la que las GPU estén inactivas esperando datos. Esto es especialmente desagradable en configuraciones caras: se ha invertido dinero en tarjetas gráficas, pero el rendimiento lo limita no la GPU, sino el almacenamiento.
El servidor formará parte de un clúster
Si un servidor se conecta a otros nodos GPU o a almacenamiento externo, la red se convierte en parte de la arquitectura.
Merece la pena elegir custom si se necesitan:
- tarjetas de red 100/200/400G;
- varios puertos de red;
- una red separada para almacenamiento;
- una red separada para gestión;
- intercambio rápido entre nodos;
- escalado a varios servidores;
- un clúster único para entrenamiento o inferencia.
En sus arquitecturas de referencia empresariales, NVIDIA describe la infraestructura de IA no como un solo servidor, sino como una combinación de nodos de cálculo, red de alta velocidad, almacenamiento, monitorización y pila de software. Este enfoque es especialmente importante cuando el proyecto crece desde un servidor hasta una infraestructura completa. Un ejemplo está disponible en NVIDIA Enterprise Reference Architectures.
Hay limitaciones de rack, alimentación y refrigeración
Un servidor GPU puede ser compatible por componentes, pero no ser adecuado para el centro de datos real.
Antes de comprar hay que comprobar:
- cuántos kilovatios hay disponibles por rack;
- qué PDU se utilizan;
- cuántas líneas de alimentación se pueden asignar;
- la profundidad del rack;
- si el rack soportará el peso del servidor;
- qué flujo de aire se necesita;
- la temperatura del pasillo frío;
- si hay margen de refrigeración;
- si se permite refrigeración líquida;
- qué nivel de ruido es aceptable si el servidor no está en un centro de datos.
Los sistemas GPU de alta densidad muestran hasta qué punto están conectados el cálculo, la red, la alimentación y la refrigeración. En la arquitectura de referencia NVIDIA DGX SuperPOD con DGX B200, estos parámetros se consideran una infraestructura única, no un conjunto de componentes separados.
Existe el objetivo de ahorrar
Una configuración personalizada puede montarse incluso más barata que un servidor “listo” si se eligen:
- componentes menos caros, por ejemplo OEM en lugar de soluciones de marca del fabricante;
- componentes del mercado secundario;
- componentes más antiguos en lugar de opciones de última generación.
Al mismo tiempo, este tipo de montaje requiere experiencia, y la garantía puede ser dudosa. Pero con limitaciones de presupuesto y para proyectos piloto, esta opción puede estar justificada.
Dónde se cometen más errores al elegir un servidor GPU
Los errores al elegir un servidor GPU rara vez parecen dramáticos en la fase de compra. Normalmente aparecen después: el servidor funciona, pero no tan rápido como se esperaba, no escala, se sobrecalienta, no admite nuevas GPU o exige rehacer la infraestructura.
Solo se cuenta el precio de las tarjetas gráficas
El coste del proyecto incluye más que las GPU. El presupuesto real incluye:
- la plataforma del servidor;
- tarjetas gráficas;
- procesadores;
- memoria RAM;
- discos;
- tarjetas de red;
- cables;
- fuentes de alimentación;
- rack y alimentación;
- refrigeración;
- puesta en marcha;
- licencias y soporte;
- tiempo de ingeniería;
- posibles tiempos de inactividad.
Un servidor barato puede salir caro si hay que reconstruirlo o sustituirlo dentro de seis meses. Y también ocurre lo contrario: una configuración personalizada puede justificarse si cubre el crecimiento durante 2–3 años y no exige otra compra después de las primeras pruebas exitosas.
Se compra “lo máximo” sin perfil de carga
El margen es útil solo cuando está claro para qué se reserva. Sin un perfil de carga, se puede pagar de más por algo que no aumentará el rendimiento.
Ejemplos habituales:
- se compraron más GPU, pero la memoria de vídeo de cada tarjeta se convirtió en el cuello de botella;
- se eligieron procesadores caros, pero la tarea depende casi por completo de la GPU;
- se instalaron discos rápidos, pero los datos llegan por una red lenta;
- se instaló mucha RAM, pero el modelo está limitado por la VRAM;
- se compró un servidor sin margen de alimentación, lo que hizo imposible la ampliación.
Antes de comprar, conviene determinar qué limita exactamente la tarea: memoria de vídeo, número de GPU, procesador, RAM, discos, red o refrigeración.
No se piensa en el crecimiento en 6–12 meses
Un modelo estándar puede ser perfecto para un piloto y débil para producción. No es un error si el servidor se compra precisamente para un piloto. El error es asumir que una configuración piloto servirá automáticamente para un servicio en crecimiento.
Las limitaciones aparecen cuando:
- aumenta el número de usuarios;
- hay que ejecutar varios modelos al mismo tiempo;
- el modelo se hace más grande;
- se requiere más almacenamiento local;
- aparece la necesidad de otra GPU;
- las ranuras ya están ocupadas;
- la GPU compatible u otro componente no está disponible para la compra;
- las fuentes de alimentación no se dimensionaron para una ampliación;
- el rack no soporta el aumento de consumo;
- se necesita virtualización de GPU;
- el servidor debe incorporarse a un clúster.
Si hoy el servidor se necesita para pruebas y dentro de seis meses se planea un servicio comercial, es mejor prever al menos un margen básico desde el principio: chasis, alimentación, ranuras, RAM, discos y red.
No se comprueba la compatibilidad de software
Un servidor GPU debe ajustarse no solo a los requisitos de hardware. También hay que comprobar de antemano la pila de software:
- sistema operativo;
- controladores;
- CUDA;
- contenedores;
- hipervisor;
- Kubernetes;
- virtualización de GPU;
- bibliotecas de machine learning;
- monitorización;
- copias de seguridad;
- gestión remota.
Hay que actuar con especial cuidado si el servidor se compra para un producto ya existente. En ese caso, el hardware no puede elegirse separado de la aplicación: hay que comprobar qué versiones de controladores y bibliotecas son compatibles, cómo utiliza la aplicación las GPU y si existen requisitos para modelos concretos de tarjetas gráficas.
Qué incluir en una especificación técnica para un servidor GPU personalizado
Si se ha elegido custom, el punto de partida debe ser la tarea, no la lista de componentes. Cuanto más exactamente se describa la carga, menor será el riesgo de montar un sistema caro pero desequilibrado.
| Bloque de especificación | Qué indicar | Por qué es importante | Ejemplo de formulación |
|---|---|---|---|
| Tarea | Inferencia, entrenamiento, ajuste fino, renderizado, VDI, cálculo | Distintas tareas cargan GPU, CPU, RAM, discos y red de forma diferente | Inferencia de modelo para un servicio interno, hasta 30 usuarios en el lanzamiento |
| Modelos y software | Modelos, frameworks, sistema operativo, contenedores, controladores | El hardware debe ajustarse a la pila de software real | Ubuntu, Docker, PyTorch, varios modelos, margen para actualizaciones |
| Memoria de vídeo | Capacidad mínima y deseada de VRAM | Los modelos grandes suelen estar limitados precisamente por la memoria de vídeo | Mínimo 48 GB por GPU, preferiblemente 80 GB para crecimiento |
| Número de GPU | 1, 2, 4 u 8 GPU, crecimiento futuro | Esto determina el chasis, la alimentación, la refrigeración y la red | 2 GPU en el lanzamiento, posibilidad de pasar a 4 GPU |
| CPU | Número de procesadores, núcleos, frecuencia | La CPU no debe frenar la preparación de datos ni las solicitudes | Procesador con margen para preprocesamiento y tareas paralelas |
| RAM | Capacidad actual y opciones de ampliación | La RAM se necesita para datos, servicios, cachés y virtualización | 512 GB en el lanzamiento, ampliación a 1–2 TB |
| Discos | Sistema operativo, caché, datasets, RAID, hot swap | Unos discos débiles pueden dejar a las GPU sin datos | 2 NVMe para el sistema operativo en espejo, pool NVMe separado para datos |
| Red | 10/25/100/200/400G, número de puertos | Para un clúster y almacenamiento externo, la red es crítica | 2×25G en el lanzamiento, opción 100G para almacenamiento |
| Redundancia | Fuentes de alimentación, RAID, discos de repuesto, gestión remota | El servidor debe ser mantenible, no solo potente | Fuentes de alimentación redundantes, gestión remota, ventiladores de repuesto |
| Rack | Altura, profundidad, peso, potencia, refrigeración | El centro de datos puede limitar la configuración real, especialmente por alimentación | No más de 4U, refrigeración por aire, compatibilidad con el rack actual |
| Presupuesto | Compra, servicio, horizonte de explotación | Ayuda a elegir entre precio inicial y larga vida útil | Presupuesto para la primera etapa, ampliación en 12–18 meses |
Una especificación así ayuda al proveedor no solo a seleccionar un “servidor potente”, sino a montar un sistema para un escenario real. Esto es especialmente importante para proyectos en los que un servidor GPU se compra para 3–5 años, no para un único experimento.
Cuándo no hace falta custom
La personalización puede parecer atractiva porque da sensación de control total. Pero en muchos casos no aporta valor.
Proyecto piloto
Si el equipo solo está comprobando una hipótesis, es mejor no empezar con la configuración máxima. Para un piloto suele bastar con:
- 1–2 GPU;
- una cantidad moderada de RAM;
- discos NVMe estándar;
- una red habitual;
- una garantía clara;
- la posibilidad de sustituir o ampliar rápidamente el servidor más adelante.
Un piloto debe responder rápido a una pregunta: si la idea funciona o no. Un montaje demasiado complejo puede retrasar el proyecto antes de que aparezcan los primeros resultados.
Inferencia de un modelo pequeño
Si el modelo cabe en la memoria de vídeo, la carga es predecible y se conoce el número de usuarios, un modelo estándar será más sencillo. En este escenario importan más la estabilidad, la refrigeración, la garantía y una puesta en marcha clara.
Para seleccionar una GPU, se puede empezar por la categoría general de GPU NVIDIA para servidores y pasar después de la tarea a tarjetas concretas: por ejemplo, modelos versátiles para inferencia, gráficos, VDI o soluciones más pesadas para entrenamiento.
Renderizado, VDI y estaciones de trabajo gráficas
En estas tareas, los requisitos suelen estar claros de antemano:
- qué software se utiliza;
- cuántos usuarios trabajarán;
- cuánta memoria de vídeo se necesita por usuario;
- si se requiere virtualización;
- qué monitores y resoluciones se utilizan;
- qué red se necesita para el trabajo remoto.
Si se conoce el perfil de carga, un servidor GPU estándar puede cubrir la tarea sin un largo diseño de ingeniería.
Presupuesto estricto
Cuando el presupuesto es limitado, el custom no siempre ayuda. A veces es mejor elegir un modelo estándar equilibrado que montar una configuración compleja con componentes que no se utilizarán.
En esta situación es más razonable elegir un servidor con margen claro:
- no el número máximo de GPU, sino el necesario;
- no la CPU más cara, sino una suficiente;
- no una RAM excesiva, sino una configuración ampliable;
- no una tarjeta de red rara, sino una red acorde con la carga real;
- no la mayor matriz de discos posible, sino un esquema de almacenamiento claro.
Cuándo un modelo estándar se convertirá en una limitación en 6–12 meses
Un modelo estándar puede ser un buen punto de partida, pero una base débil para crecer. Esto es especialmente cierto cuando el servidor se compra para un proyecto que pasa rápidamente de pruebas a producción.
Conviene prestar atención si ya existen estas señales:
- el equipo planea ejecutar varios modelos al mismo tiempo;
- el número de usuarios puede multiplicarse varias veces;
- se necesitará una GPU con más memoria;
- el modelo actual será sustituido por uno más pesado;
- los datasets crecen rápidamente;
- se planea almacenar los datos localmente;
- habrá que conectar almacenamiento externo;
- se requerirá una red 100G;
- el servidor formará parte de un clúster;
- se planea virtualización de GPU;
- los requisitos de tolerancia a fallos serán más estrictos.
Por ejemplo, un modelo estándar con 2 GPU puede ser adecuado para un prototipo interno. Pero si dentro de seis meses debe atender a decenas o cientos de usuarios, ejecutar varios modelos y almacenar grandes datasets, las limitaciones no aparecerán solo en las GPU. Puede no haber suficiente RAM, discos, red, alimentación o ranuras libres.
En ese caso, es mejor elegir de antemano una plataforma que permita crecer. Aunque al inicio no se utilicen todas sus capacidades, no habrá que sustituir el servidor por completo después de las primeras etapas exitosas del proyecto.
Opción intermedia: una base estándar con personalización puntual
En la práctica, la elección no siempre es “servidor listo o configuración completamente personalizada”. A menudo la mejor opción es una intermedia: se toma una plataforma de servidor probada como base, pero se cambian algunos parámetros para la tarea.
Se puede cambiar de forma puntual:
- el modelo de GPU;
- la capacidad de RAM;
- el número de discos NVMe;
- la tarjeta de red;
- el controlador RAID;
- las fuentes de alimentación;
- el sistema de refrigeración;
- la configuración de gestión remota;
- el margen para futuras ampliaciones.
Este enfoque reduce riesgos. El servidor sigue estando en una plataforma clara, pero no limita el proyecto de forma demasiado rígida. Es una buena opción cuando la tarea ya se entiende, pero tiene algunos requisitos no estándar.
Por ejemplo, para un servidor universal de inferencia, visualización y parte de las tareas de trabajo, puede ser adecuada una base estándar con una GPU más potente, más RAM y discos NVMe rápidos. Para cargas gráficas y de IA más modernas, se pueden considerar tarjetas como NVIDIA RTX PRO 6000 Blackwell Server Edition, pero solo después de comprobar la compatibilidad con el chasis, la alimentación, la refrigeración y el software.
Cómo tomar la decisión
Antes de comprar un servidor GPU, conviene seguir un algoritmo sencillo.
- Describir la tarea principal: inferencia, entrenamiento, ajuste fino, renderizado, VDI, cálculo o una carga mixta.
- Determinar la cantidad mínima de memoria de vídeo.
- Entender cuántas GPU se necesitan ahora.
- Estimar cuántas GPU pueden hacer falta en 12 meses.
- Comprobar los requisitos de CPU, RAM, discos y red.
- Evaluar las limitaciones de rack, alimentación y refrigeración.
- Comparar el plazo de lanzamiento, el riesgo de incompatibilidad y el coste de un error.
- Elegir un modelo listo, custom o una base estándar con cambios puntuales.
Si la tarea es típica y los plazos importan, es mejor empezar con un servidor GPU listo. Si el servidor debe convertirse en parte de una infraestructura a largo plazo, es mejor preparar primero una especificación técnica y comprobar todas las limitaciones. Si los requisitos son parcialmente no estándar, es más razonable tomar una plataforma probada y adaptarla a la carga.
Checklist antes de comprar
Antes de hacer el pedido, conviene responder a estas preguntas:
- cuál es la tarea principal del servidor;
- qué aplicaciones y modelos se ejecutarán;
- cuánta memoria de vídeo se necesita ahora;
- cuánta memoria de vídeo puede hacer falta dentro de un año;
- cuántas GPU se necesitan al inicio;
- si será posible añadir GPU más adelante;
- si la CPU bastará para preparar datos;
- cuánta RAM se necesita;
- si se requieren NVMe locales;
- qué volumen de datos se almacenará;
- qué red se necesita;
- si el servidor formará parte de un clúster;
- si hay limitaciones de rack;
- si hay suficiente alimentación;
- si hay margen de refrigeración;
- quién mantendrá el servidor;
- qué es más importante: lanzamiento rápido o ajuste exacto a la tarea;
- qué ocurrirá si la carga crece 2–3 veces.
Si no hay respuesta a parte de estas preguntas, es mejor no comprar un servidor “por las características máximas”. Primero hay que entender dónde estará el cuello de botella. Para unas tareas será la memoria de vídeo; para otras, los discos, la red, la RAM o la refrigeración.
Preguntas frecuentes
¿Qué es más barato: un servidor GPU listo o uno personalizado?
Al inicio, un modelo listo suele ser, aunque no siempre, más barato y rápido. Pero si la tarea es no estándar, una configuración personalizada puede ser más rentable en un horizonte de 1–3 años: reduce el riesgo de compras repetidas, rediseños y paradas.
¿Puedo comprar un servidor listo y añadir GPU después?
Sí, pero no siempre. Hay que comprobar de antemano el chasis, las fuentes de alimentación, la refrigeración, las ranuras libres, los risers, BIOS y la compatibilidad con GPU concretas. Si ese margen no se planificó, la ampliación puede ser imposible o no tener sentido económico.
¿Cuándo bastan 1–2 GPU?
Normalmente, 1–2 GPU bastan para pilotos, inferencia, renderizado, VDI, bancos de prueba y pequeñas tareas de ML. Pero la decisión depende no solo del número de GPU, sino también de la memoria de vídeo, la carga, el número de usuarios y los requisitos de latencia.
¿Cuándo se necesitan 4–8 GPU?
Se necesitan 4–8 GPU para entrenamiento pesado, modelos grandes, alta carga paralela, un servicio con muchos usuarios o un clúster. En ese caso hay que diseñar de antemano la alimentación, la refrigeración, la red, los discos y el espacio en el rack.
¿Qué es más importante: la GPU o la memoria de vídeo?
Depende de la tarea. Para modelos grandes, la memoria de vídeo suele ser crítica. Para procesamiento paralelo y alto rendimiento, importan más el número de GPU, la red y la comunicación entre nodos. Por eso es incorrecto elegir un servidor solo por el nombre de la tarjeta gráfica.
¿Qué hay que comprobar obligatoriamente antes de hacer el pedido?
Hay que comprobar la compatibilidad de la GPU, alimentación, refrigeración, ranuras físicas, red, discos, controladores, software, opciones de ampliación y limitaciones del rack. Cuanto más caro sea el servidor, más importante es describir de antemano la carga y el escenario de crecimiento.
Conclusión
Un servidor GPU listo es la mejor elección cuando la tarea está clara, los plazos importan y los requisitos encajan en una configuración estándar. Una configuración personalizada es necesaria cuando el servidor debe convertirse en parte de una infraestructura a largo plazo y soportar el crecimiento de la carga: más GPU, más memoria de vídeo, discos más rápidos y mayores requisitos de red, alimentación, refrigeración y servicio.
Una buena elección no empieza con la pregunta “qué tarjeta gráfica es más potente”, sino con una breve especificación técnica: qué carga, qué modelos, cuánta memoria de vídeo, cuántas GPU, qué datos, qué red, qué limitaciones de rack y qué margen debe quedar disponible dentro de un año.
Índice:
Modelo listo y configuración personalizada: comparación por criterios clave
Cuándo es mejor no empezar sin una configuración personalizada
Qué incluir en una especificación técnica para un servidor GPU personalizado
Cuándo un modelo estándar se convertirá en una limitación en 6–12 meses
Opción intermedia: una base estándar con personalización puntual